This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
der moglichen Zustande des Systems denselben Wert EQ £ K.
1.3 Funktionen
17
1.3.2 Elementare Klassifizierung von Abbildungen Wird eine Funktion f : X ^ Y Abbildung genannt, dann wird der Wert f{x) £ F , den sie im Element x £ X annimmt, iiblicherweise das Bild von x genannt. Das Bild einer Menge A C X unter der Abbildung f : X ^ Y wird als die Menge f(A):={yGY\3x{(xGA)A(y = f{x)))} definiert, die aus den Elementen von Y bestelit, die Bilder von Elenienten von A sind. Die Menge f-\B):={xGX\f{x)GB}, die aus den Elementen von X besteht, deren Bilder zu B gelioren, wird Urhild der Menge B CY genannt (Abb. 1.6).
Abb. 1.6. Eine Abbildung f : X ^ Y heifit -
surjektiv (eine Abbildung von X auf Y), falls f{X) = Y; injektiv (oder Injektion oder eindeutige Abbildung), falls fiir je zwei Elemente a;i,a;2 von X gilt: (/(a;i) = fix2)) => {xi = X2) ,
-
d.h., verschiedene Elemente erzeugen unterscliiedliche Bilder; bijektiv (oder eine Bijektion, eine eins-zu-eins Abbildung oder eineindeutige Abbildung), wenn sie sowohl surjektiv als auch injektiv ist.
1st die Abbildung f : X ^ Y bijektiv, d.h., es existiert eine eineindeutige Zuordnung zwisclien den Elementen der Mengen X und Y, dann gibt es natiirlicherweise eine Abbildung f-':Y^X
,
18
1 Allgemeine mathematische Begriffe und Schreibweisen
die wie folgt definiert ist: Sei f{x) = y, dann ist f~^{y) = x, d.h., jedem Element y € Y wird das Element x G X zugewiesen, dessen Bild unter der Abbildung / genau y ist. Da / surjektiv ist, existiert ein solches Element und wegen den Injektivitat von / ist es eindeutig. Somit ist die Abbildung f~^ wolil definiert. Diese Abbildung wird die Inverse der urspriinglichen Abbildung / genannt. Aus der Konstruktion der inversen Abbildung ist klar, dass f~^ : Y ^ X selbst wieder bijektiv ist, und dass ilire Inverse (/~^)~^ : X ^ Y mit der urspriinglichen Abbildung f : X ^ Y identisch ist. Daher ist die Eigenschaft zweier Abbildungen, dass sie zueinander invers sind, gegenseitig: Ist f~^ invers zu / , dann ist / die Inverse zu f~^. Wir weisen darauf bin, dass das Symbol f~^{B) fiir das Urbild einer Menge B CY das Symbol f~^ der inversen Funktion beinhaltet. Wir soUten uns aber im Klaren sein, dass das Urbild einer Menge fiir jede Abbildung f : X ^ Y definiert ist, selbst dann, wenn diese nicht bijektiv ist und somit keine Inverse besitzt. 1.3.3 Zusammengesetzte Funktionen und zueinander inverse Abbildungen Zusammengesetzte Funktionen bieten auf der einen Seite eine ergiebige Quelle neuer Funktionen, aber auf der anderen Seite auch eine Moglichkeit, um komplizierte Funktionen in einfacliere zu zerlegen. Seien f : X ^ Y und g : Y ^ Z Abbildungen, wobei eine von ihnen (in unserem Fall g) auf dem Wertebereicli der anderen (/) definiert ist. Dann konnen wir eine neue Abbildung konstruieren: gof:X^Z.
Die Werte fiir Elemente aus der Menge X sind durch die Formel (9of)ix):=g{f(x)) definiert. Die so konstruierte zusammengesetzte Abbildung g o f wird auch Verkettung oder Kombination der Abbildung / mit der Abbildung g (in der Reihenfolge!) genannt. Abbildung 1.7 veranschaulicht die Konstruktion der Verkettung der Abbildungen / und g. Wir sind bereits vielfach auf die Kombination von Abbildungen gestoBen, sowohl in der Geometric, wenn wir die Kombination von starren Bewegungen einer Ebene oder Raumes untersuchen, als auch in der Algebra bei der Untersuchung „komplizierter" Funktionen, die durch Verkettung einfachster Elementarfunktionen erhalten werden. Manchmal muss der Vorgang der Verkettung mehrfach hintereinander ausgefiihrt werden. Fiir den Fall ist es gut zu wissen, dass dieser Vorgang assoziativ ist, d.h., ho{go
f) = {hog)o
f .
1.3 Funktionen
19
Abb. 1.7. Beweis. In der Tat gilt: ho (go f)ix)
= h{{9 o / ) ( x ) ) = h{9{f{x))) = ih-9){fix))
= = {{hog)of)ix).
a
Dieser Umstand, den wir von der Addition und Multiplikation niehrerer Zahlen kennen, erlaubt es uns, auf Klanimern zu verzichten, um die Reihenfolge der Kombination anzugeben. Sind alle Bestandteile einer Verkettung / „ o • • • o /^ gleich derselben Funktion / , so kiirzen wir sie durch / " ab. Es ist beispielsweise bekannt, dass die Quadratwurzel einer positiven Zahl a sukzessive mit Hilfe der Forniel 2\
a;„ /
mit jedem Anfangswert a;o > 0 angenahert werden kann. Dies ist nichts anderes als die sukzessive Berechnung von /"(a;o) mit f{x) = ^(a; + - ) . Eine derartige Prozedur, bei der der in jedem Schritt berechnete Funktionswert zum Argument fiir den nachsten Schritt wird, wird rekursive Prozedur genannt. Rekursive Prozeduren sind in der Mathematik weit verbreitet. Wir woUen noch darauf hinweisen, dass, selbst wenn sowohl g o / als auch f ° g definiert sind, im AUgemeinen gilt:
9°f¥'f°9Als Beispiel betrachten wir die Menge mit zwei Elementen {a, b} und die Abbildungen f : {a,b} ^ a und g : {a, b} -^ b. Dann ist es offensichtlicli, dass g o f : [a, b} -^ b, woliingegen fog: {a, b} -^ a. Die Abbildung f : X ^ X, bei der jedes Element von X in sicli abgebildet wird, d.li. X i—> x, werden wir mit ex bezeichnen und Identitat von X nennen. Lemma. [g o f = ex) ^ {g ist surjektiv) A (/ ist injektiv) .
20
1 Allgemeine mathematische Begriffe und Schreibweisen
Beweis.
Seien f : X ^ Y, g : Y ^ X und g ° f = ex : X ^ X. Dann gilt: X = exiX)
= {g o f){X)
= g{f{X))
C
giY)
und folglich ist g surjektiv. Seien ferner xi G X und X2 £ X, dann gilt: (xi ^ X2) ^
{ex{xi)
^ ex{x2))
^
=> [gifixi)))
{{g ° f){xi)
^ {g o f){x2))
=>
+ 9{f{x2)) => {f{xi) + !{X2))
und daher ist / injektiv.
D
Mit der Hilfe verketteter Abbildungen konnen wir zueinander inverse Abbildungen beschreiben. S a t z . Die Abbildungen f : X ^ Y und g : Y ^ X sind genau dann und zueinander invers, wenn g ° f = ex und f o g = eyBeweis. Nacli dem gungen g ° f = ex injektiv und somit dann y = f{x) gilt,
bijektiv
Lemma bedeutet die gleiclizeitige Erfiillung der Bedinund fog = ey, dass beide Abbildungen surjektiv und bijektiv sind. Dieselben Bedingungen zeigen, dass genau wenn x = g{y). U
Bei der vorangegangenen Untersuchung begannen wir mit einer expliziten Konstruktion einer inversen Abbildung. Aus dem eben bewiesenen Satz folgt, dass wir eine weniger intuitive und docli symmetriscliere Definition zueinander inverser Abbildungen b a t t e n geben konnen: Es sind die Abbildungen, die die beiden Bedingungen g ° f = ex und f ° g = ey erfiillen. (Beachten Sie in diesem Zusammenhang die Aufgabe 6 am Ende des Abschnitts.) 1.3.4 F u n k t i o n e n als R e l a t i o n e n . D e r G r a p h e i n e r F u n k t i o n Zum Abschluss kehren wir noclimals zum Begriff einer Funktion zuriick, der eine lang anhaltende und selir komplizierte Entwicklung hinter sicli hat. Der Ausdruck Funktion tritt zuerst in den Jaliren 1673 bis 1692 in Arbeiten von G. Leibniz (in einem etwas engeren Sinne, um genau zu sein) auf. Ab 1698 wurde der Ausdruck in einer zu lieute vergleiclibaren Weise durch die Korrespondenz zwischen Leibniz und Joliann Bernoulli^^ etabliert. (Der in diesem Zusammenhang iiblicherweise zitierte Brief von Bernoulli, ist auf dieses J a h r datiert.) Viele grofie Mathematiker haben ihren Anted am modernen Begriff der funktionalen Abhangigkeit. ^^ Johann Bernoulli (1667-1748) - einer der friihen Mitglieder der angesehenen schweizerischen Gelehrtenfamilie Bernoulli. Er untersuchte Analysis, Geometrie und Mechanik. Er legte zusammen mit seineni Bruder Jacob den Grundstein der Variationsrechnung und erstellte die erste systematische Darstellung der Differential- und Integralrechnung.
1.3 Funktionen
21
Eine Beschreibung einer Funktion, die nahezu mit der identisch ist, die wir zu Beginn dieses Abschnitts gegeben haben, findet sich bereits in den Arbeiten von Euler (Mitte des achtzehnten J a h r h u n d e r t s ) . Er fiihrte auch die Schreibweise f{x) ein. Zu Beginn des neunzehnten J a h r h u n d e r t s wird der BegrifF in den Lehrbiichern von S. Lacroix^'* verwendet. Ein Verfechter dieses BegrifFs einer Funktion war N . I . Lobachevski^^, der festhielt: „Eine voUstandige umfassende Durchdringung der Theorie wird nur durch die Abhangigkeitsbeziehungen nioghch, in denen die miteinander verbundenen Zahlen so verstanden werden, als ob sie eine Einheit bilden."^^ Es ist diese Vorstehung einer genauen Definition des Konzepts einer Funktion, die wir hier erklaren wohen. Die Formuherung des Konzepts einer Funktion, den wir zu Beginn dieses Abschnitts gegeben haben, ist ziemhch dynamisch und beinhaltet das Wesenthche. Sie kann jedoch nach modernen Anforderungen an Strenge nicht Definition genannt werden, da es den Begriff einer Zusammengehorigkeit verwendet, der zum Begriff einer Funktion aquivalent ist. Zur Information des Lesers woUen wir hier zeigen, wie die Definition einer Funktion in der Sprache der Mengenlehre lauten konnte. (Es ist interessant, dass das Konzept einer Relation, zu dem wir so gelangen, selbst bei Leibniz dem Konzept einer Funktion voranging.) a. R e l a t i o n e n D e f i n i t i o n 1. Eine Relation
TZ ist jede Menge geordneter P a a r e
{x,y).
Die Menge X der ersten Elemente der geordneten Paare, die TZ bilden, wird Definitionsbereich von TZ genannt und die Menge Y der zweiten Elemente dieser geordneten P a a r e der Wertebereich von 7^. Daher kann eine Relation als eine Teilmenge TZ des direkten P r o d u k t s X X Y betrachtet werden. Gilt X C X' und Y C Y', dann ist natiirlich TZ C X X Y C X' X Y', so dass eine vorgegebene Relation als Teilmenge verschiedener Mengen definiert werden kann. Jede Menge, die den Definitionsbereich einer Relation enthalt, wird Ausgangsbereich der Relation genannt und jede Menge, die den Wertebereich als Teilmenge enthalt, Zielbereich der Relation. Anstelle (x, y) G TZ zu schreiben, schreiben wir meist xTZy und sagen, dass X mit y durch die Relation TZ verbunden ist. Ist TZ C X'^, so sagen wir, dass die Relation TZ auf X definiert ist. S.F.Lacroix (1765-1843) - franzosischer Mathematiker und Lehrer (Professor an der Ecole Normale und der Ecole Polytechnique und Mitglied der Pariser Akademie der Wissenschaften). N. I. Lobachevskii (1792-1856) - grofier russischer Gelehrter. Ihm gebiihrt zusammen mit dem groflen deutschen Wissenschaftler C. F. Gauss (1777-1855) und dem hervorragenden ungarischen Mathematiker J. Bolyai (1802-1860) die Ehre, die nicht-euklidische Geometrie begriindet zu haben. Lobachevskii, N. I. Gesamte Werke, Bd. 5, Moskau-Leningrad: Gostekhizdat, 1951, S. 44 (russisch).
22
1 Allgemeine mathematische Begriffe und Schreibweisen Wir woUen einige Beispiele geben.
Beispiel
13. Die Diagonale -2| A = {{a,h) eX^
ist eine Teilmenge von X'^. Sie definiert die Gleichheitsrelation zwischen Elementen von X. Tatsachlich bedeutet aAh, dass (a, &) £ A, d.h., a = b. Beispiel 14- Sei X die Menge aller Geraden in einer Ebene. Zwei Geraden a G X und b G X stehen zueinander in der Relation 7^ und wir schreiben dann aTZb, wenn & zu a parallel ist. Offensiclitlich fiihrt diese Bedingung zu einer Menge TZ von P a a r e n (a, b) in X'^, so dass aTZb. Aus der Geometrie wissen wir, dass die Parallelitat zwischen Geraden die folgenden Eigenscliaften besitzt: aTZa (Reflexivitat), aTZb =^ bTZa (Symmetrie) und (aTZb) A (bTZc) ^ aTZc (Transitivitat). Eine Relation mit den eben angefiihrten drei Eigenscliaften, d.h. der Reflexivitat^^, der Symmetrie und der Transitivitat, wird iiblicherweise auch als Aquivalenz-Relation bezeichnet. Eine Aquivalenz-Relation wird durch das spezieUe Symbol ~ gekennzeichnet, das den Buchstaben TZ ersetzt. Daher schreiben wir bei einer Aquivalenz-Relation auch a ~ & anstelle von aTZb und sagen, dass a zu & dquivalent ist. Beispiel 15. Sei M eine Menge und X = T'{M) die Menge ihrer Teilmengen. Fiir zwei beliebige Elemente a und b von X = T'(M), d.h. fiir zwei Teilmengen a und b von M , ist stets eine der drei Moglichkeiten wahr: a ist in b enthalten; b ist in a enthalten; a ist keine Teilmenge von b und b ist keine Teilmenge von a. Als Beispiel einer Relation TZ auf X"^ betrachten wir die Inklusion von Teilmengen von M , d.h., wir treffen die Definition aTZb := (a C b) . Diese Relation besitzt offensichtlich die folgenden Eigenschaften: aTZa (Reflexivitat), (aTZb) A (bTZc) ^ aTZc (Transitivitat) und (aTZb) A (bTZa) ^ aAb, d.h. a = b (Antisymmetric). Eine Relation zwischen Elementpaaren einer Menge X mit diesen drei Eigenschaften wird normalerweise als Halbordnung oder als partielle Ordnung bezeichnet und wir schreiben dafiir oft a ^ & und sagen, dass b auf a folgt. ^"^ Der Vollstandigkeit halber woUen wir festhalten, dass eine Relation TZ reflexiv ist, falls ihr Definitionsbereich und ihr Wertebereich identisch sind und die Relation aTZa fiir jedes Element a ini Definitionsbereich von 7?, gilt.
1.3 Funktionen
23
Wenn die Bedingung \/aVb{{anb) V (bTZa)) zusatzlich zu den beiden letzten Eigenschaften, die eine Halbordnung definieren, gilt, d.h., wenn je zwei Eleniente von X vergleichbar sind, wird die Relation TZ eine Totalordnung oder lineare Ordnung genannt und die Menge X zusammen mit der auf ihr definierten Ordnung wird als linear angeordnet bezeiclinet. Dieser Ausdruck stammt von dem intuitiven Bild der reellen Geraden ffi, auf der die Bezieliung a < b zwisclien jedem Paar reeller Zahlen gilt. b. Funktionen und ihre Graphen. Eine Relation TZ wird funktional genannt, falls (xTZyi) A (a;7^2/2) ^ ( 2 / 1 = 2 / 2 ) Eine funktionale Relation wird als Funktion bezeichnet. Insbesondere ist, falls X und Y zwei nicht notwendigerweise verscliiedene Mengen sind, eine Relation TZ C X xY zwischen Elementen x von X und y von Y eine funktionale Relation auf X, falls fiir jedes x & X ein eindeutiges Element y & Y mit der vorgegebenen Relation existiert, d.h., so dass xTZy gilt. Eine derartige funktionale Relation TZ C X xY \st eine Abbildung von X nach Y oder eine Funktion von X nach Y. Nornialerweise bezeichnen wir Funktionen mit dem Buclistaben / . Ist / eine Funktion, so sclireiben wir y = f{x) oder x 1—> y wie zuvor, anstelle von X f y und wir bezeichnen y = f{x) als den Wert von / in a; oder als das Bild von X unter / . Wie wir nun sehen, ist das Zuweisen eines Elements y GY „zugeh6rig" zu a; £ X in Ubereinstimmung mit der „Regel" / , die wir urspriinglich fiir den Begriff einer Funktion formuliert haben, gleich der Relation fiir jedes x G X existiert ein eindeutiges y GY, so dass x fy, d.h. {x,y) G f C X xY. Mit unserem urspriinglichen Verstandnis ist der Graph einer Funktion f : X ^ Y die Teilmenge F des direkten Produkts X x Y, deren Elemente die Gestalt (a;,/(a;)) besitzen. Somit also: F:={{x,y)GXxY\y
=
f{x)}.
In der neuen Beschreibung einer Funktion, in der wir eine Untermenge f C X X Y definieren, verschwindet natiirlich die Unterscheidung zwischen einer Funktion und ihrem Graphen. Wir haben hier die theoretische Moglichkeit einer formalen mengentheoretischen Definition einer Funktion vorgestellt, die sich letztendlich auf die Identifikation einer Funktion mit ihrem Graphen reduzieren lasst. Wir woUen uns jedoch nicht mit dieser Art der Definition einer Funktion einschranken. Manchmal ist es bequemer, eine funktionale Relation analytisch zu definieren.
24
1 Allgemeine mathematische Begriffe und Schreibweisen
manchmal geniigt eine einfache Wertetabelle und an anderen Stellen kann es wiederuni von Vorteil sein, eine verbale Beschreibung einer Prozedur (Algorithnius) zu geben, um es zu ermoglichen, ein Element y G Y zu finden, das einem vorgegeben x G X zugeordnet ist. Bei jeder Beschreibungsart einer Funktion ist es niitzlich, sich zu vergegenwartigen, wie die Funktion mit Hilfe ihres Graphen h a t t e definiert werden konnen. Dieses Problem kann als die Frage nacli der Konstruktion des Graphen formuliert werden. Die Definition einer numerischen Funktion durcli eine gute grapliische Darstellung ist oft hilfreicli, da dadurch die wichtigen qualitativen Eigenscliaften der funktionalen Bezieliung siclitbar werden. Wir konnen aucli fiir Berechnungen Graphen (Nomogramme) benutzen; aber als Faustregel nur in Fallen, in denen hohe Genauigkeit nicht notwendig ist. Fiir exakte Berechnungen benutzen wir die Definition einer Funktion als Wertetabelle, aber noch offer benutzen wir eine algorithmische Definition, die direkt auf einem Computer implementiert werden kann.
1.3.5 Ubungen 1. Die Komposition TZi o 7?,i der Relationen TZi und TZi wird wie folgt definiert: 7^2 o 7^l := |(a;, z)\ 3y (xUiy A yU-zz)^ . Sind Til C X xY und
und TZz CY
x Z, dann gilt insbesondere Tl = Tlz oTZi C X x Z
xTlz := 3y (^{y G Y) A {xTZiy) A (y-^2^)) . a) Sei Ax die Diagonale von X'^ und Ay die Diagonale von Y^. Seien 7?,i C X xY und 7^2 C y X X, so dass (7^2 o 7^l = Ax) A (7^l o 7^2 = Ay). Zeigen Sie, dass dann beide Relationen funktional sind und zueinander inverse Abbildungen von X und Y definieren. b) Sei 7?. C X'^. Zeigen Sie, dass die Transitivitatsbedingung der Relation 7?, zur Bedingung 7?. o 7?. C 7?. aquivalent ist. c) Die Relation TZ' C Y x X wird Transponierte der Relation TZ C X xY genannt, falls (yTZ'x) <^ (xTZy). Zeigen Sie, dass eine Relation 7?, C X'^ genau dann antisymmetrisch ist, wenn TZCiVJ C Axd) Zeigen Sie, dass je zwei Elemente von X genau dann durch die Relation TZ C X"^ (in irgendeiner Ordnung) verbunden sind, wenn TZyjTZ' = X'^. 2. Sei / : X ->• y eine Abbildung. Das Urbild f~^{y) auch Faser iiber y genannt.
C X des Elements y €Y
wird
a) Bestimmen Sie die Fasern fiir die folgenden Abbildungen: prj : Xi X X-z ^ Xi,
pr^ : Xi x X-z ^ X-z .
b) Das Element xi £ X sei durch die Relation 7?, C X'^ mit einem Element xz G X verbunden. Wir schreiben xi7?,a;2, falls f{xi) = f{xz), d.h., xi und xz liegen beide in derselben Faser. Zeigen Sie, dass TZ eine Aquivalenzrelation ist.
1.3 Funktionen
25
c) Zeigen Sie, dass die Faserii einer Abbildung / : X —>• F sich iiicht schneiden und dass die Vereinigung aller Faserii die gesamte Menge X ergibt. d) Zeigen Sie, dass jede Aquivalenzrelation zwischen Elementen einer Menge es ernioglicht, eine Menge als eine Vereinigung von gegenseitig disjunkten Aquivalenzklassen von Elementen darzustellen. 3. Sei / : X —>• y eine Abbildung von X auf Y. Zeigen Sie, dass fiir Untermengen A und B von X gilt: a) {AdB)^
(f{A)
C / ( B ) ) ^{Ad
B),
h)iA^0)^[fiA)^0), c)/(AnB)c/(A)n/(B), d)/(AUB) = /(A)U/(B). Sind A' und B' Untermengen von Y, dann gilt: e){A'cB')^[f-'{A')cf-'{B')), f-'{A')nf-HB'), i)f-'{A'nB') = g)f-'{A'UB') = f-'{A')Uf-HB'). Gilt Y D A' D B', dann ist:
h)r'(A'\B') i)f-'{CYA')
= f-\A')\f-\B'), = Cxf-HA').
Fiir jedes Ac
X und B' CY
gilt:
J)r'{fiA))DA,
k)/(r'(B'))cB'. 4. Zeigen Sie, dass fiir die Abbildung f : X ^ Y gilt: a) / ist genau dann surjektiv, wenn f [f~^{B')j
= B' fiir alle Mengen B' C Y,
b) / ist genau dann bijektiv, wenn
{r'{fiA))=A)A[f(f-\B'))=B') fiir jede Menge A C X und jede Menge B' C Y. 5. Zeigen Sie, dass die folgenden Aussagen iiber eine Abbildung / : X —> Y Equivalent sind: a) / ist injektiv, b) c) d) e)
/ " ' ( / ( ^ ) ) = A fui' jedes AcX, f{A n B) = f{A) n f{B) fiir beliebige Teilmengen A und B von X, /(A) n / ( B ) = 0 ^ AnB = 0, / ( A \ B) = /(A) \ / ( B ) , falls X D A D B.
26 6.
1 Allgemeine mathematische Begriffe und Schreibweisen a) Fiir die Abbildungen f : X ^ Y und g : Y ^ X gelte g o f = ex, wobei ex die Identitat auf X ist. Danii wird g eine linke Inverse von / und / eine rechte Inverse von g genannt. Zeigen Sie, dass im Gegensatz zur Eindeutigkeit der inversen Abbildung mehrere einseitige inverse Abbildungen existieren konnen. Betrachten Sie zum Beispiel die Abbildungen / : X —>• Y und g : Y ^ X, wobei X eine Menge mit einem Element ist und Y eine Menge mit zwei Elenienten oder die Abbildungen von Folgen, die durch f
yXl,
. . . , Xn,
{y2,...,y„,...)
• • •} ^
^
'
yOj, Xl,
. . . , X'a, • • •) ,
{yi,y2,...,yn,---)
•
gegeben sind. b) Seien / : X —>• Y und g : Y ^ Z bijektive Abbildungen. Zeigen Sie, dass die Abbildung g o f : X ^ Z bijektiv ist und dass {g ° f)~^ = f~^ ° g~^• c) Zeigen Sie, dass die Gleicliung
.f)-\c) = r'{9-\c))
fiir jede Abbildung / : X —>• Y und g -.Y ^ Z und jede Menge C d Z gilt, d) Beweisen Sie, dass die Abbildung F : X x Y — > - Y x X , die durch die Bezieliung (x, y) I—> (y, x) definiert ist, bijektiv ist. Beschreiben Sie die Verbindung zwischen den Graphen zueinander inverser Abbildungen / : X —> Y und /~^ : Y —> X. 7.
a) Zeigen Sie, dass fiir jede Abbildung / : X —>• Y die Abbildung F : X —>• X x Y,
die durch die Beziehung x i—> {x,f{x)\ definiert wird, injektiv ist. b) Nehmen Sie an, dass sich ein Teilchen mit gleichformiger Geschwindigkeit auf einem Kreis Y bewegt. Sei X die Zeitachse und x i—> y die Beziehung zwischen der Zeit x £ X und der Position y = f[x) G Y des Teilchens. Beschreiben Sie den Graphen der Punktion / : X — > - Y i n X x Y . 8.
a) Bestimmen Sie fiir jedes der Beispiele 1-12 im Abschnitt 1.3, ob die darin definierten Abbildungen surjektiv, injektiv oder bijektiv sind oder zu keiner dieser Klassen gehoren. b) Das Ohmsche Gesetz / = V/R verbindet den Strom / in einem Leiter mit der Potentialdifferenz V an den Enden des Leiters und dem Widerstand R des Leiters. Formulieren Sie Mengen X und Y, fiir die eine Abbildung O : X ^ Y dem Ohmschen Gesetz entspricht. Von welcher Menge ist die entsprechende Relation eine Teilmenge? c) Finden Sie die Abbildungen G~^ und L"^, die zur Galilei- und zur LorentzTransformation invers sind.
9.
a) Eine Menge S C X ist unter einer Abbildung / : X —>• X stahil, wenn f{S) C S. Beschreiben Sie die Mengen, die unter einer Verschiebung der Ebene um einen vorgegebenen Vektor, der in der Ebene liegt, stabil sind. b) Eine Menge / C X ist unter einer Abbildung / : X —> X invariant, wenn / ( / ) = / . Beschreiben Sie die Mengen, die hinsichtlich einer Rotation der Ebene um einen Fixpunkt invariant sind. c) Ein Punkt p £ X ist ein Fixpunkt einer Abbildung / : X —> X, falls f{p) = p. Beweisen Sie, dass jede Komposition einer Verschiebung, einer Rotation und einer Ahnlichkeitstransformation der Ebene einen Fixpunkt besitzt, falls der Koeffizient der Ahnlichkeitstransformation kleiner als 1 ist.
1.4 Erganzungen d) Betrachten der Ebene den Punkt invarianten
27
Sie die Galilei- und die Lorentz-Transformationen als Abbildungen auf sich selbst, wobei der Punkt mit den Koordinaten {x,t) auf mit den Koordinaten {x',t') abgebildet wird. Bestimnien Sie die Mengen dieser Transformationen.
10. Betrachten Sie den gleichmafiigen Fluss einer Fliissigkeit (d.li., die Geschwindigkeit in jedem Punkt der Fliissigkeit andert sich mit der Zeit nicht). Zur Zeit t bewege sich ein Teilchen im Punkt x der Fliissigkeit zu einem neuen Raumpunkt ft(x). Die Abbildung x — i > ft{x), die dadurch auf den Raumpunkten, die die Fliissigkeit einnimmt, definiert wird, hangt von der Zeit ab und wird Abbildung nach der Zeit t genannt. Zeigen Sie, dass ft^ ° fti = fti ° /ta = fti+t2 und ft o f-t = ex-
1.4 Erganzungen 1.4.1 D i e M a c h t i g k e i t e i n e r M e n g e ( K a r d i n a l z a h l e n ) Die Menge X lieiBt dquipotent oder gleichmachtig zur Menge Y, falls es eine bijektive Abbildung von X auf Y gibt, d.h., jedem x G X wird ein Element y G Y zugewiesen, die Elemente von Y, die verscliiedenen Elementen von X zugewiesen werden, sind unterscliiedlich und jedes Element von Y wird einem Element von X zugewiesen. Bildlicli gesproclien, besitzt jedes Element x G X in Y iiiT sich alleine einen Stulil und es gibt in Y keine freien Stiihle. Es ist klar, dass die so eingefiilirte Relation XTZY eine Aquivalenzrelation ist. Aus diesem Grund werden wir in Ubereinstimmung mit unserer vorhergehenden Konvention X ^ Y s t a t t XTZY schreiben. Die Aquivalenzrelation unterteilt die Ansammlung aller Mengen in Klassen zueinander aquivalenter Mengen. Die Mengen einer Aquivalenzklasse besitzen dieselbe Anzalil von Elementen (sie sind aquipotent), woliingegen Mengen verschiedener Aquivalenzklassen unterschiedlicli viele Elemente liaben. Die Klasse, zu der eine Menge X gehort, wird Kardinalzahl von X genannt und mit \X\ bezeichnet. Sind AT ~ F , so schreiben wir \X\ = \Y\. Ein Gedanke hinter dieser Konstruktion ist, dass wir so die Anzahl von Elementen in Mengen vergleichen konnen, ohne direkt eine Vorschrift zum Zahlen vorzugeben, d.h., ohne die Elemente zu zahlen, sondern durch den Vergleich mit den natiirlichen Zahlen N = {1, 2 , 3 , . . . } . Das Letztere ist manchmal, wie wir gleich sehen werden, nicht nur theoretisch moglich. Ist X aquipotent zu einer Teilmenge von Y, so nennen wir die Kardinalzahl einer Menge X nicht grofier als die Kardinalzahl der Menge Y und wir schreiben \X\ < \Y\. Somit ist: {\X\<\Y\):=3ZCY(\X\ = \Z\). Ist X C Y, so ist offensichtlich \X\ < \Y\. Es stellt sich jedoch heraus, dass die Beziehung X C F die Gleichheit in | y | < \X\ nicht ausschhefit, selbst dann nicht, wenn X eine echte Teilmenge von Y ist.
28
1 Allgemeine mathematische Begriffe und Schreibweisen
So ist zum Beispiel die Zuordnung x ^ i-\x\ ^™^^ bijektive Abbildung des Intervalls — 1 < a; < 1 der reellen Achse M auf die ganze reelle Zahlengerade. Die Moglichkeit, dass eine Menge zu einer echten Teilnienge aquipotent ist, ist eine Charakteristik unendlicher Mengen. Sie veranlasste Dedekind^^ dazu, diese sogar als Definition unendlicher Mengen vorzuschlagen. Demnach wird eine Menge endlich genannt (im Sinne von Dedekind), falls sie nicht zu irgendeiner echten Teilnienge von sich selbst aquipotent ist; ansonsten heifit sie unendlich. So wie die Ungleichheitsrelation die reellen Zahlen auf einer Geraden anordnet, so fiihrt die eben eingefiihrte Ungleichheit zu einer Ordnung der Kardinalzahlen von Mengen. Um genauer zu sein, so kann gezeigt werden, dass die eben konstruierte Relation die folgenden Eigenschaften besitzt: 1°. {\X\ < \Y\) A ( | y | < \Z\) ^ {\X\ < \Z\) (offensichtlich). 2°. {\X\ < \Y\) A ( | r | < \X\) => (\X\ = \Y\) (der Satz von SchroderBernstein.^®). 3°. V X V r (|X| < | y | ) V ( | y | < \X\) (Satz von Cantor). Daher ist die Klasse der Kardinalzahlen hnear angeordnet. Wir sagen, dass die Machtigkeit von X geringer ist als die Machtigkeit von Y und schreiben \X\ < \Y\, falls \X\ < \Y\ und \X\ ^ \Y\. Somit gilt:
(|x|<|r|):=(|x|<|r|)A(|x|^|y|). Wie zuvor ist 0 die Menge und 'P{X) die Menge aller Teilmengen (Potenzmenge) der Menge X. Cantor machte die folgende Entdeckung: S a t z . \X\ <
\V{X)\.
Beweis. Die Annahnie gilt offensichtlich fiir eine leere Menge, so dass wir von nun an annehnien, dass X ^ 0. Da ViX) alle Teilmengen von X mit einem Element enthalt, gilt: |-^| < \V{X)\. Zum Beweis des Satzes geniigt es nun zu zeigen, dass \X\ ^ | P ( X ) | , faUs X y^0. Angenommen, es gebe entgegen der Annahme eine bijektive Abbildung / : AT —>• ViX). Wir betrachten die Menge A = {x £ X : x ^ / ( a ; ) } , die aus den Elementen x £ X besteht, die nicht der Menge f{x) £ V{X), die durch die bijektive Abbildung zugeordnet wird, angehoren. Ba A £ ViX), gibt es ein a G X, so dass / ( a ) = A. AUerdings ist nach der Definition von A die Aussage a G A unmoglich, ebenso wie die Aussage a ^ A. Somit haben wir einen Widerspruch, weswegen es keine bijektive Abbildung / geben kann. D R. Dedekind (1831-1916) - deutscher Algebraiker, der eine aktive RoUe bei der Entwicklung der Theorie der reellen Zahlen spielte. Er war der Erste, der vorschlug, die Menge der natiirlichen Zahlen durch Axiome zu beschreiben. Diese Axiome werden iiblicherweise Peano-Axiome nach dem italienischen Mathematiker G. Peano (1858-1932) genannt, der dies etwas spater formulierte. F. Bernstein (1878-1956) - deutscher Mathematiker, ein Student von G. Cantor. E. Schroder (1841-1902) - deutscher Mathematiker.
1.4 Erganzungen
29
Dieser Satz zeigt insbesondere, dass „Unendlich" nicht immer gleich viel ist, falls unendliche Mengen existieren.
1.4.2 Axiome der Mengenlehre Das Ziel dieses Abschnitts ist es, dem interessierten Leser eiii Bild eines Axiomensystems zu geben, das die Eigenschaften des mathematischen Objekts, das Menge genannt wird, beschreibt und die einfachsten Konsequenzen dieser Axiome aufzeichnet. l". ( E x t e n s i o n a l i t a t s a x i o m ) Die Mengen A und B sind genau dann gleich, wenn sie dieselben Elemente besitzen. Dies bedeutet, dass wir alle Eigenschaften des Objekts „Menge" ignorieren, aufler ihrer Eigenschaft, Elemente zu besitzen. Praktisch bedeutet dies, dass wir, um A = B festzustellen, zeigen miissen, dass \fx l{x £ A) <^ (x £ B)). 2°. ( A u s s o n d e r u n g s a x i o m ) Zu jeder Menge A und jeder Eigenschaft P existiert eine Menge B, deren Elemente genau die Elemente von A sind, die die Eigenschaft P besitzen. Kurz gefasst wird damit siclier gestellt, dass, wenn A eine Menge ist, auch B = {x G A\ P{x)} eine Menge ist. Dieses Axiom wird selir haufig bei mathematischen Konstruktionen benutzt, wenn wir aus einer Menge die Teilmenge auswahlen, die aus Elementen mit einer gewissen Eigenschaft besteht. So folgt beispielsweise aus dem Aussonderungsaxiom, dass in jeder Menge X eine leere Teilmenge 0x = {x G X\x ^ x} existiert. Mit Hilfe des Extensionalitatsaxioms folgern wir, dass 0x = 0Y fiir alle Mengen X und Y, d.h., die leere Menge ist eindeutig. Wir bezeichnen diese Menge als 0 . Ferner folgt aus dem Aussonderungsaxiom, dass fiir zwei Mengen A und B auch A\ B = {x G A\ x ^ B} eine Menge ist. Ist insbesondere M eine Menge und A eine Teilmenge von M, dann ist auch CM A eine Menge. 3". ( V e r e i n i g u n g s a x i o m ) Zu jeder Menge M, deren Elemente Mengen sind, existiert eine Menge |J M, die wir Vereinigung von M nennen und die genau aus den Elementen besteht, die zu einem Element von M gehoren. Wenn wir die Formuberung „Familie von Mengen" anstatt „eine Menge, dessen Elemente Mengen sind" wahlen, klingt das Vereinigungsaxiom vertrauter: Es existiert eine Menge, die aus Elementen der Mengen einer Familie besteht. Somit ist eine Vereinigung von Mengen eine Menge und x G[jM <:^ 3X ({XG M) f\(x G X)\. Wenn wir das Aussonderungsaxiom beriicksichtigen, dann erlaubt uns das Vereinigungsaxiom den Durchschnitt der Menge M (oder Familie von Mengen) als die Menge P I M := | x G y M| VX ( ( X G M) ^ (x G X ) ) j zu definieren. 4". ( P a a r u n g s a x i o m ) Zu jeden Mengen X und Y existiert eine Menge Z, die genau X und Y als Elemente besitzt.
30
1 Allgemeine mathematische Begriffe und Schreibweisen
Die Menge Z wird {X, Y} geschrieben und ein ungeordnetes Paar der Mengeii X und Y genannt. Gilt X = Y, so besitzt die Menge Z ein Element. Wie wir sclion betont liaben, untersclieidet sich das ungeordnete Paar von dem geordneten Paar {X, Y). Bei dieseni besitzt eine der Mengen im Paar eine besondere Eigenschaft. Beispielsweise {X,Y) •= {{X,X}, {X,Y}}. Somit ermoglicht das ungeordnete Paar die Einfiilirung des geordneten Paares, und das geordnete Paar erlaubt die Einfiihrung des direkten Produkts von Mengen mit Hilfe des Aussonderungsaxioms und dem folgenden wiclitigen Axiom. 5". ( P o t e n z m e n g e n a x i o m ) Zu jeder Menge X existiert eine Menge 'P(X), deren Elemente genau die Teilmengen von X sind. Kurz formuliert, so existiert eine Menge, die aus alien Teilmengen einer vorgegebenen Menge besteht. Wir konnen nun zeigen, dass die geordneten Paare (x,y), mit x G X und y €Y tatsaclilich eine Menge bilden und zwar: X
{p G V[V{X)
xY
U ViY))
I (p = (x, y)) A (x G X) A (2/ G Y ) }
Die Axiome l^-S" schranken die Moglichkeiten zur Bildung neuer Mengen ein. Nacli dem Satz von Cantor (nach dem |X| < |'P(Ar)| gilt) gibt es folglich ein Element in der Menge V{X), das nicht zu X geliort. Dalier existiert die „Menge aller Mengen" niclit. Und genau auf dieser „Menge" beruhte das Paradoxon von Russell. Um das nacliste Axiom zu formulieren, fiihren wir zunachst den Begriff des Nachfolgers X"*" einer Menge X ein. Wir definieren X^ = X U {X}. Kurz, es wird die einelementige Menge {X} mit X vereinigt. Ferner wird eine Menge induktiv genannt, falls die leere Menge eines ihrer Elemente ist und der Nachfolger jedes ihrer Elemente auch in ilir enthalten ist. 6". ( U n e n d l i c l i k e i t s a x i o m ) Induktive Mengen existieren. Wenn wir die Axiome 1 -4 beriicksiclitigen, so konnen wir mit dem Unendliclikeitsaxiom ein Modell fiir die Menge No der natiirliclien Zalilen (im Sinne von von Neumann^") konstruieren, indem wir No als Sclinittmenge aller induktiven Mengen definieren, d.h. als die kleinste induktive Menge. Die Elemente von No sind: 0,
0 + = 0 U { 0 } = {0},
{0}+ = { 0 } U { { 0 } } , . . . ,
Diese Elemente sind Modelle dafiir, was wir mit den Symbolen 0,1, 2 , . . . bezeichnen und die natiirlichen Zalilen nennen. 7". ( E r s e t z u n g s a x i o m ) Sei J-{x, y) eine Aussage (genauer gesagt eine Formel), so dass fiir jedes xo in der Menge X ein eindeutiges Objekt yo existiert, so dass J-{xo,yo) wahr ist. Dann bilden die Objekte y, fiir die ein Element x € X existiert, so dass J-(x,y) wahr ist, eine Menge. Wir werden dieses Axiom bei unserer Konstruktion der Analysis nicht einsetzen. ^^ J. von Neumann (1903-1957) - amerikanischer Mathematiker, der auf den Gebieten Funktionalanalysis, mathematische Grundlagen der Quantenmechanik, topologische Gruppen, Spieltheorie und mathematische Logik arbeitete. Er war einer der fiihrenden Personlichkeiten bei der Entwicklung des ersten Computers.
1.4 Erganzungen
31
Die Axiome l"-?" bildeii das Axiomensystem, das als Zermelo-Fraenkel-Mengenlehre^'^ bekannt ist. Dieses System wird iiblicherweise um ein Axiom erganzt, das unabhangig von den Axionien l"-?" ist und sehr haufig in der Analysis verwendet wird. 8". ( A u s w a h l a x i o m ) Zu jeder Familie von nicht leeren Mengen existiert eine Menge C, so dass fur jede Menge X der Familie X C\C genau aus eineni Element besteht. Anders formuliert, so kann man aus jeder Menge der Familie genau einen Vertreter herausgreifen, so dass die so gewahlten Vertreter eine Menge C bilden. Das Auswahlaxiom, das als Zermelo Axiom in der Mathematik bekannt ist, war unter Spezialisten Gegenstand heifier Debatten. 1.4.3 A n m e r k u n g e n zur S t r u k t u r m a t h e m a t i s c h e r S a t z e u n d ihrer Formulierung in der Sprache der M e n g e n l e h r e In der Sprache der Mengenlehre gibt es zwei grundlegende oder atomare Typen von mathematischen Aussagen: die Annahme x G A, dass ein Objekt x ein Element einer Menge A ist und die Annahme A = B, dass die Mengen A und B identisch sind. (Unter Verwendung des Extensionalitatsaxioms ist die zweite Aussage eine Kombination von zwei ersten Aussagen: (x £ A) <=> (a; € B).) Eine komplexe Aussage oder eine logische Formel kann aus atomaren Aussagen mit Hilfe logischer Operatoren - den Bindewortern -i. A, V, =^ und den Quantoren V, 3 - mit Hilfe von Klamniern ( ) konstruiert werden. So geschehen, wird jede Aussage, egal wie kompliziert sie sein mag, darauf reduziert, die folgenden elementaren logischen Operationen auszufiihren: a) Bildung einer neuen Aussage durch das Setzen des Negierungszeichens vor eine Aussage und Klammerung des Ergebnisses; b) Bildung einer neuen Aussage durch Ersetzen eines notwendigen Bindeworts A, V und =^ zwischen zwei Aussagen und Klammerung des Ergebnisses; c) Bildung der Aussage „fur jedes Objekt x gilt die Eigenschaft P " (geschrieben: \lxP{x)) oder der Aussage „es gibt ein Objekt x mit der Eigenschaft P " (geschrieben: 3xP{x)). So bedeutet der kopfzerbrechende Ausdruck 3x{P{x)h{^y{P{y)^{v
= x))))
,
dass ein Objekt mit Eigenschaft P existiert, derart dass, wenn y ein beliebiges Objekt mit dieser Eigenschaft ist, dann y = x gilt. In Kiirze: Es existiert ein eindeutiges Objekt x mit der Eigenschaft P . Diese Aussage wird iiblicherweise als 3\xP{x) geschrieben und wir werden diese Kurzform benutzen. ^^ E. Zermelo (1871-1953) - deutscher Mathematiker. A. Fraenkel (1891-1965) - deutscher (spater israelischer) Mathematiker.
32
1 Allgemeine mathematische Begriffe und Schreibweisen
Wir haben bereits darauf hingewiesen, dass so viele Klammern wie moglich weggelassen werden, um zwar die Aussage unzweideutig zu erhalten, aber dennoch die Schreibweise zu vereinfachen. An dieser Stelle werden wir zusatzlich zu der bereits eingefiihrten Ordnung der Operatoren -i, A, V, ^ annehmen, dass die Symbole in einer Formel am starksten durch die Symbole €, = und dann 3, V und dann die Bindeworter -i, A, V, =^ verbunden werden. Mit Hilfe dieser Konvention konnen wir nun schreiben: 3\xP{x)
:= 3x{P{x) A Vy {P{y) ^ y = x)) .
Wir werden auch die folgenden weit verbreiteten Abkiirzungen verwenden: (Va;
GX)P
Vx (a; e
{3x
GX)P
3a; (a; £ AT A P(a;)) ,
A:
^ P{x)) ,
(Va; >a)P
V a ; ( a ; e K A a ; > a = ^ P{x)) ,
{3x > a)P
3x{x &W.^x>
a^ P{x)) .
Wie imnier bezeichnet hierbei ffi die Menge der reellen Zahlen. Mit Hilfe dieser Abkiirzungen und den Regeln a), b) und c) zur Konstruktion komplizierter Aussagen konnen wir beispielsweise eine unzweideutige Forniulierung ( lim f{x) = a) : = V e > 0 3 ( 5 > 0 V a ; e K ( 0 < | a ; - a | < ( 5 ^ \f{x)-
A\ < e)
aufstellen und damit zum Ausdruck bringen, dass die Zahl A Grenzwert einer Funktion / : K ^ M im Punkt a € K ist. Das fiir uns wahrscheinlich wichtigste Ergebnis aus dem oben Ausgefiihrten sind die Regeln, um eine Negierung einer Aussage mit Quantoren zu bilden. Die Negierung der Aussage „fur ein x ist P{x) wahr" lautet „fiir jedes x ist P{x) falscli", wohingegen die Negierung der Aussage „fur jedes x ist P{x) wahr" lautet, dass „ein x existiert, so dass P{x) falscli ist". Somit also: ^3a;P(a;) <^ Va;^P(a;) , -NxP{x) ^ 3x^P{x) . Wir wiederholen ferner (vgl. die Ubungen in Abschnitt 1.1), dass ^ ( P A Q ) <^ ^ P V ^ g , ^ ( P V Q ) <^ ^ P A ^ g , ^(P^g) ^ PA^g. Aus dem Gesagten kann beispielsweise gefolgert werden, dass ^((Vx >a)P)
^ {3x > a)^P .
1.4 Erganzungen
33
Es ware allerdings falsch, die rechte Seite dieser Relation als (3a; < a) - i P zu schreiben, denn tatsachlich gilt: ^((Va; > a)P)
:= ^(Va;(a; £ M A a; > a ^ P{x)))
<^
<^ 3a;-i(x e M Aa; > a ^ P{x)))
<^
<^ 3a; ((a; e K A X > a) A ^P{x))
=: (3a; > a)^P
.
Wenn wir die oben erwalinte Struktur einer beliebigen Aussage beriicksiclitigen, konnen wir nun die Negierungen, die wir eben fiir die einfachsten Aussagen konstruiert haben, benutzen, um die Negierung jeder Aussage zu bilden. Beispielsweise: ^ ( lim fix)
= A) <^ 3e > 0V(5 > 0 3a; e K ( 0 < \x-a\
<6A\f{x)
-A\>e).
Die praktische Bedeutung der Regel zur Bildung einer Negierung ist insbesondere mit der Methode der Widerspruchsbeweise verbunden, bei welclier die Wahrheit einer Aussage P aus der Tatsache abgeleitet wird, dass die Aussage - i P falsch ist. 1.4.4
Ubungen
1.
a) Zeigen Sie die Aquipotenz des geschlossenen Intervalls { a ; G R | 0 < a ; < l } und des ofFenen Intervalls { a ; e R | 0 < a ; < l } auf der reellen Geraden R sowolil mit Hilfe des Satzes von Schroder-Bernstein wie durcli direkte Formulierung einer geeigneten Bijektion. b) Analysieren Sie den folgenden Beweis des Satzes von Schroder-Bernstein: ( | x | < | y | ) A ( | y | < | x | ) ^ ( | x | = |y|). Beweis. Es geniigt zu zeigen, dass fiir die Mengen X, Y und Z, fiir die X D Y D Z und \X\ = \Z\ gilt, auch |X| = | y | . Sei f : X ^ Z eine Bijektion. Eine Bijektion g : X ^ Y kann beispielsweise wie folgt definiert werden: ( ) - I f(^)' \ X
fallis X G P{X)
\ f"{Y) fiir ein n G N , sonst.
Hierbei ist / " = / o • • • o / die n-te Iteration der Abbildung / und N die Menge der natiirlichen Zahlen. D 2.
a) Beginnen Sie mit der Definition eines Paares und beweisen Sie, dass die in 1.4.2 gegebene Definition des direkten Produkts X x Y von Mengen X und Y unzweideutig ist, d.h., dass die Menge V(V{X) U V{Y)) alle geordneten Paare (x, y) enthalt, mit x £ X und y &Y. b) Zeigen Sie, dass die Abbildungen / : X —>• F aus einer vorgegebenen Menge X in eine andere vorgegebene Menge Y ihrerseits eine Menge M{X, Y) bilden.
34
1 Allgemeine mathematische Begriffe und Schreibweisen
c) Sei TZ eine Menge von geordneten Paareii (d.h. eine Relation). Uberpriifen Sie, ob die ersten Elemente der Paare in TZ (wie auch die zweiten) eine Menge bilden. 3.
a) Priifen Sie mit Hilfe der Extensionalitats-, Paarungs-, Aussonderungs-, Vereinigungs- und Unendlichkeitsaxiome, dass die folgenden Aussagen fiir die Elemente der Menge No der natiirlichen Zahlen im Sinne von von Neumann zutreffen: l" a; = 2/ => x'^ = y"*", 2° ( V i G N o ) ( i + 7^0), 3" x'^ = y'^ ^ X = y, 4° (Vi G No) ( i ^ 0 ^ (3y G No) (x = ?/+)).
b) Zeigen Sie unter Ausnutzung, dass genden Aussagen fiir jedes Element gelten: 1° \x\ < \x+\, 2° | 0 | < \x+\, 3° |x| < |2/| ^ | x + | < I2/+I, 4° \x\ < \x+\, 5° \x\<\y\^\x+\<\y\, 6° x = y^\x\ = \y\, 7° ixCy)VixD y). c) Zeigen Sie, dass in jeder Teilmenge tiert, so dass (Vx G X) {\xm\ < \x\). zunachst Kapitel 2.)
No eine induktive Menge ist, dass die folx und y (die ilirerseits selbst Mengen sind)
X von No ein (kleinstes) Element (Wenn Sie dabei Probleme liaben, lesen Sie
4. Wir betrachten nur Mengen. Da eine Menge, die aus verscliiedenen Elementen besteht, selbst ein Element einer anderen Menge sein kann, bezeichnen Logiker iibliclierweise alle Mengen durch Kleinbuchstaben. Dies vereinfaclit diese Aufgabe. 1. Zeigen Sie, dass die Aussage VxByVa iz £ y -^ 3w {z G vj A vj G x] dem Vereinigungsaxiom entspricht, nacli dem y eine Vereinigung der Mengen ist, die zu x gehoren. 2. Bestimmen Sie, welclie Axiome der Mengenlelire durch die folgenden Aussagen wiedergegeben werden: Vx^y^z yxVyBz^v yx3yVz
[{zGx<^zGy)^x {vGz<^{v
= y] , = x\/v
= y)
{z G y <^ yu {u G z ^ u G x]
3x (Vy (-<3z {z G y) ^ y G xj A Vw (w G x => = ^ V M ( V W ( W G M < ^ ( I ' = U ' V W G U ' ) ) =^ U G
x)jj
1.4 Erganzungen
35
3. Beweisen Sie, dass die Formel yz (z € f ^
f 3x1 3yi {xi € X A yi G y A z = {xi,yi))]]
A V X I ( X I G X = > 3yi 3z (yi G y A z = {xi,yi)
A
A z G fj]
A Vxi Vyi V2/2 f 3ai 3a2 (ai G / A 2:2 G / A ai = (xi,yi) Az2 = ixi,y2)J
^yi
A
A = 2/2j
der Menge / drei aufeinander folgende Einschrankungen aufzwingt: / ist eine Teilmenge von x x y; die Projektion von / auf x ist gleich x; zu jedem Element xi von X gehort genau ein yi in y, so dass {xi, yi) G f. Daher liegt eine Definition einer Abbildung f : x ^ y vor. Dieses Beispiel zeigt wiederum, dass die formale Schreibweise einer Aussage verglichen niit einer verbalen Formulierung bei weitem nicht inimer die kiirzeste und iibersichtlichste ist. Da wir dies beriicksichtigen, werden wir zukiinftig logischen Symbolismus nur soweit benutzen, wie uns fiir eine groflere Kompaktheit oder Klarheit in der Formulierung sinnvoU ersclieint. 5. Sei / : X —>• Y eine Abbildung. Formulieren Sie die logisclie Negierung jeder der folgenden Aussagen: a) / ist surjektiv, b) / ist injektiv, c) / ist bijektiv. 6. Seien X und Y Mengen und f C X x Y. Formulieren Sie, was es bedeutet, dass die Menge / keine Funktion ist.
Die reellen Zahlen
Mathematische Theorien werden in der Regel benutzt, well sie es ermoglichen, eine Zahlenmenge (die Ausgangsdaten) in eine andere Zahlenmenge fiir ein Zwischen- oder ein Endergebnis umzuformen. Aus diesem Grund nehmen Funktionen mit numerischen Werten einen besonderen Platz in der Mathematik und ihren Anwendungen ein. Diese Funktionen (genauer, die so genannten differenzierbaren Funktionen) nehmen den Hauptteil der Untersuchungen in der klassischen Analysis ein. Aber, wie Sie bereits mit ihrer Schulerfahrung erahnt haben und wie wir in Kiirze bestatigen werden, jede aus der Sicht der modernen Mathematik iiberhaupt vollstandige Beschreibung der Eigenschaften dieser Funktionen ist unmoglich ohne eine exakte Definition der Menge der reellen Zahlen, auf die diese Funktionen einwirken. Zahlen sind in der Mathematik, was die Zeit in der Physik ist: Jeder kennt sie und nur Experten haben Miihe, sie zu verstehen. Sie sind eine der wichtigen mathematischen Abstraktionen, die dazu bestimmt zu sein scheinen, weiteren deutlichen Entwicklungen unterworfen zu sein. Diesem Thema konnte eine sehr voile eigenstandige Lehrveranstaltung gewidmet sein. Wir beabsichtigen zum jetzigen Zeitpunkt nur, das dem Leser aus der hoheren Schule bisher iiber reelle Zahlen Bekannte zu vereinheitlichen. Wir stellen dabei die zentralen und unabhangigen Eigenschaften von Zahlen als Axiome vor. Wir haben vor, eine genaue Definition der reellen Zahlen zu geben, die fiir den spateren mathematischen Gebrauch geeignet ist. Deswegen legen wir besonderen Wert auf ihre Eigenschaft der Vollstandigkeit oder Kontinuitat, die den Keim zur Idee fiir den Ubergang zu Grenzwerten - die zentrale nicht arithmetische Operation der Analysis - enthalt.
38
2 Die reellen Zahlen
2.1 Das Axiomensystem und einige allgemeine Eigenschaften der Menge der reellen Zahlen 2.1.1 D e f i n i t i o n d e r M e n g e d e r r e e l l e n Z a h l e n D e f i n i t i o n 1. Eine Menge M wird als Menge der reellen Zahlen bezeichnet und ihre Elemente sind reelle Zahlen, wenn die folgenden Bedingungen, die das Axiomensystem der reellen Zahlen genannt werden, erfiillt sind. (I) AxiOME DER A D D I T I O N
Eine
Operation
(die Operation der Addition) wird definiert, indem wir jedem geordneten Paar (a;, y) von Elementen x, y aus ffi ein bestimmtes Element x+y £ ffi, das Summe von X und y genannt wird, zuordnen. Diese Operation erfiillt die folgenden Bedingungen: 1+. Es existiert
ein neutrales
Element
0 (genannt
Null), so dass
x + 0 = {) + x = x fur jedes x GW. ^+. Zu jedem Element x GW existiert X genannt, so dass
ein Element
—x £ M, das Negative
von
X + (—x) = (—x) + X = 0 . 3-^-. Die Operation + ist assoziativ,
d.h., die
Gleichung
X + {y -\- z) = {x + y) -\- z gilt fur alle Elemente x,y,z G M. 4+- Die Operation + ist kommutativ,
d.h.,
X+ y = y + X fur alle Elemente
x,y
GB..
Wenn eine Operation, die die Axiome 1+, 2+ und 3+ erfiillt, auf einer Menge G definiert ist, dann sagen wir, dass eine Gruppenstruktur auf G definiert ist oder dass G eine Gruppe ist. Wird die Operation Addition genannt, so nennt m a n die Gruppe eine additive Gruppe. Ist die Operation auBerdem kommutativ, d.h., wird die Bedingung 4_|_ erfiillt, dann nennt m a n die Gruppe kommutativ oder Abelsche^ Gruppe. ^ N. H. Abel (1802-1829) - herausragender norwegischer Mathematiker, der bewies, dass eine algebraische Gleichung hoheren als vierten Grades nicht allgemein losbar ist, d.h., es gibt fiir sie keine Losungsformel.
2.1 Axiome und Eigenschaften der reellen Zahleii
39
Daher stellen die Axiome 1+-4+ sicher, dass ffi eine additive Abelsche Gruppe ist. (II)
AXIOME DER MULTIPLIKATION
Eine Operation • : K x M-i^K (die Operation der Multiplikation) wird definiert, indem wir jedem geordneten Paar {x,y) von Elementen x,y aus ffi ein bestimmtes Element x • y £ M, das wir Produkt von x und y nennen, zuordnen. Diese Operation erfiillt die folgenden Bedingungen: 1,. Es gibt ein neutrales Element 1 e M (Eins genannt), so dass
fiir jedes a; € ffi \ 0. 2,. Zu jedem Element a; £ ffi \ 0 existiert ein Element x~^ £ M, das wir das Inverse oder den Kelirwert von x nennen, so dass tAj
*X-'
—
*X-'
*X-'
—
X
•
3,. Die Operation • ist assoziativ, d.li., die Gleichung X- {y • z) = {x-y)-
z
gilt fiir alle Elemente x,y,z £ ffi. 4,. Die Operation • ist kommutativ, d.h., X •y =
y • X
gilt fiir alle Elemente x,y £ ffi. Wir betonen, dass die Menge ffi \ 0 hinsichtlicli der Operation der Multiplikation eine (multiplikative) Gruppe ist. (I, II) ADDITION UND MULTIPLIKATION
Die Multiplikation ist beziiglich der Addition distributiv, d.h., (x + y)z = xz + yz fiir alle x,y,z
£ M.
Wir betonen, dass aufgrund der Kommutativitat der Multiplikation diese Gleichung auch gilt, wenn die Reihenfolge der Faktoren auf jeder Seite vertauscht wird. Sind zwei Operationen, die diese Axiome erfiillen, auf einer Menge G definiert, dann wird G ein Korper genannt.
40
2 Die reellen Zahlen (III)
ANORDNUNGSAXIOME
Zwischen Elementen von M. existiert eine Relation <, d.h., fiir Elemente x,y G M. lasst sich entscheiden, oh x < y gilt oder nicht. Hierbei gelten die folgenden Bedingungen: 0<. Va;e M(a; <x). 1<. {x
^{x
3<. Mx e Wiy e K(a; < y) V {y < x). Die Relation < auf M wird Ungleichheit genannt. Eine Menge, auf der es eine Relation zwischen Paaren von Elementen gibt, die die Axiome 0<, 1< und 2< erfiillt, wird, wie Sie wissen, teilweise angeordnet genannt. Gilt auBerdem Axiom 3<, d.h., sind je zwei Elemente vergleichbar, dann ist die Menge linear angeordnet. Daher ist die Menge der reellen Zahlen durch die Relation der Ungleichheit zwischen ihren Elementen linear angeordnet. (I, III) ADDITION UND ANORDNUNG AUF M
Seien x,y,z Elemente von ffi, dann gilt: {x < y) ^ (x + z < y + z) .
( I I , I I I ) MULTIPLIKATION UND A N O R D N U N G AUF M
Seien x,y Elemente von M, dann gilt: {0<x)
A{0
{0<x-y)
.
(IV) D A S VOLLSTANDIGKEITSAXIOM
Seien X und Y nicht leere Teilmengen von M. mit der Eigenschaft, dass x < y fiir jedes x G X und jedes y G Y. Dann gibt es ein c £ ffi, so dass x < c < y fiir alle x G X und y GY . Wir haben nun eine voUstandige Aufstellung der Axiome, so dass jede Menge, auf der diese Axiome gelten, als eine konkrete Realisierung oder als Modell der reellen Zahlen betrachtet werden kann. Diese Definition erfordert formal keinerlei Vorkenntnisse iiber Zahlen. Ausgehend von ihr sollten wir „durch Einschalten mathematischen Denkens", wiederum rein formal, all die anderen Eigenschaften reeller Zahlen als Theoreme erhalten. Uber diesen axiomatischen Formalismus mochten wir gerne einige nicht formale Bemerkungen machen.
2.1 Axiome und Eigenschaften der reellen Zahleii
41
Stellen Sie sich vor, Sie hatten nicht iiber die Stufe des Zusammenzahlens von Apfeln, Wiirfeln oder anderen bekannten Gegenstanden die Addition abstrakter natiirlicher Zahlen kennen gelernt; Sie hatten nicht die Langen von Strecken gemessen und waren so zu den rationalen Zahlen gelangt; Sie wiirden nicht die groBe Entdeckung unserer Vorfahren kennen, dass die Diagonale eines Quadrats inkommensurabel mit seinen Seiten ist, so dass ihre Lange keine rationale Zahl sein kann, d.h., dass irrationale Zahlen notwendig sind; Sie hatten keine Vorstellung von den Begriffen „gr66er" oder „kleiner", wie sie bei Messungen auftreten; Sie wiirden sich kein Bild von einer Anordnung machen, indeni Sie die reelle Gerade zeichnen. Ohne alle diese Vorkenntnisse wiirden Ihnen die gerade vorgestellten Axiome nicht als das Produkt eines intelligenten Fortschritts vorkomnien, sondern zumindest als sehr seltsames und in jeder Hinsicht willkiirliches Ergebnis der Einbildung. In Verbindung mit jedem abstrakten Axiomensystem tauchen zumindest sofort zwei Fragen auf. Zunachst einmal, ob diese Axiome in sich konsistent sind? D.h., gibt es eine Menge, die alle diese eben aufgefiihrten Bedingungen erfiillt? Dies ist das Konsistenzproblem der Axiome. Ferner, ob das vorgestellte Axiomensystem das mathematische Objekt eindeutig beschreibt? D.h., wie die Logiker sagen wiirden, ist das Axiomensystem kategorisch? Hierbei muss Eindeutigkeit folgendermafien verstanden werden. Falls zwei Menschen A und B unabhangige Modelle konstruieren, etwa die Zahlensysteme WA und WB , die diese Axiome erfiillen, dann muss ein bijektiver Zusammenhang zwischen den Systemen WA und WB hergestellt werden konnen, etwa / : M^ —>• WB , die die arithmetischen Operationen und die Anordnung erhalt, d.h., fix + y) =
f{x)+fiy),
fix • y) = fix) • fiy) , x
<^ fix) < fiy) .
Mathematisch betrachtet sind in diesem Fall M.A und RB blofi verschiedene, aber gleichermai3en giiltige Reahsierungen (Modelle) der reellen Zahlen (beispielsweise kann M^ die Menge der unendlichen Dezimalzahldarstellungen und M.B die Menge der Punkte auf der reeUen Gerade sein). Derartige Reahsierungen werden isomorph genannt und die Abbildung / ein Isomorphismus. Das Ergebnis dieser mathematischen Ausfiihrungen handelt also nicht von einer speziellen Realisierung, sondern von jedem Modell in der Klasse isomorpher ModeUe des vorgegebenen Axiomensystems. Wir woUen die oben gestellten Fragen nicht diskutieren, sondern sie stattdessen nur aufschlussreich beantworten. Eine positive Antwort auf die Frage nach der Konsistenz eines Axiomensystems bleibt immer hypothetisch. Im Zusammenhang mit Zahlen nimmt sie die folgende Gestalt an: Wenn wir mit den formulierten Axiomen der Mengenlehre beginnen (vgl. 1.4.2), dann konnen wir die Menge der natiirlichen
42
2 Die reellen Zahlen
Zahlen konstruieren, daraus dann die rationalen Zahlen und schlieBlich die Menge ffi der reellen Zahlen, die alle angefiihrten Eigenschaften besitzt. Die Frage, ob das Axiomensystem fiir die reellen Zahlen kategorisch ist, kann bewiesen werden. Diejenigen, die dies woUen, konnen die Frage unabhangig durch die Losung der Aufgaben 23 und 24 am Ende dieses Abschnitts beantworten. 2.1.2 E i n i g e a l l g e m e i n e a l g e b r a i s c h e E i g e n s c h a f t e n d e r r e e l l e n Zahlen Wir woUen durch Beispiele zeigen, wie wir die bekannten Eigenschaften der Zahlen aus diesen Axiomen erhalten konnen. a. F o l g e r u n g e n a u s d e n A d d i t i o n s a x i o m e n 1°. Es gibt in der Menge der reellen Zahlen nur eine Beweis. Null:
Null.
Seien Oi und O2 beides Nullen in M. Dann folgt aus der Definition der
Oi = 0 i + 0 2 = 0 2 + 0 i = 0 2 . 2°. Jedes Element tives. Beweis.
D
der Menge der reellen Zahlen besitzt ein eindeutiges
Nega-
Seien xi und X2 zwei Negative zu a; € ffi, dann gilt:
xi = x i + O = xi + {x+X2) = (a;i+a;)+a;2 = 0+a;2 = X2 .
•
Hierbei haben wir erfolgreich die Definition der Null, die Definition des Negativen, die Assoziativitat der Addition, wieder die Definition des Negativen und schlieBhch wieder die Definition der NuU ausgenutzt. 3°. In der Menge der reellen Zahlen M. besitzt die
Gleichung
a +X= b die eindeutige
Losung X = b + (—a) .
Beweis. Dies folgt aus der Existenz und der Eindeutigkeit des Negativen zu jedem Element a € M: (a + x = b) ^
{(x + a) + (-a)
=b+
( - a ) ) <^
<^ (a; + (a + ( - a ) ) = b+ ( - a ) ) <^ {x + 0 = b+ ( - a ) ) <^
<^ (a; = 6 + (-a)) .
D
Der Ausdruck b + (—a) kann auch als & — a geschrieben werden. Dies ist die kiirzere und allgemein iibliche Schreibweise, der auch wir uns anschliefien wollen.
2.1 Axiome und Eigenschaften der reellen Zahleii
43
b. Folgerungen aus den Multiplikationsaxiomen 1°. Es gibt nur ein multipUkatives Zahlen.
neutrales Element
2°. Zu jedeni x ^ 0 gibt es nur ein Inverses
in der Menge der reellen
x~^.
3°. Fiir a € ffi\0 besitzt die Gleichung a-x = b die eindeutige Losung x = b-a~^. Die Beweise dieser Satze wiederholen natiirlich die Beweise der entsprechenden Satze der Addition (abgesehen von einem veranderten Symbol und einem anderen Namen fiir die Operation) und wir lassen sie deswegen weg. c. F o l g e r u n g e n a u s d e m A x i o m d a s A d d i t i o n u n d M u l t i p l i k a t i o n verbindet Die Anwendung des zusatzlichen Axioms (I, II), durch das Addition und Multiplikation verbunden ist, liefert weitere Folgerungen. 1°. Fiir die x GW gilt: a;-0 = 0-a; = 0 .
Beweis. (a;-0 = a;-(0 + 0) = a;-0 + a ; - 0 ) ^ ( a ; - 0 = a ; - 0 + {-{x
• 0)) = O) .
D
An diesem Ergebnis kann m a n iibrigens erkennen, dass fiir a; £ M \ 0 gilt: a;-i e M \ 0 . 2°.
{x-y
= 0)^{x
= 0)V{y
= 0).
Beweis. Sei etwa y 7^ 0, so folgt wegen der eindeutigen Losbarkeit der Gleichung X • y = 0 fiir x, dass x = 0 • y~^ = 0 . D 3°. Fiir jedes x £ K gilt: —X = ( — 1 ) • X .
Beweis. a; -I- (—1) • a; = ( l -I- (—1)) • a; = 0 • a; = a; • 0 = 0. Die Annalime folgt nun aus der Eindeutigkeit des Negativen einer Zahl. D 4°. Fiir jedes x GW gilt: (—1)(—x) = X .
Beweis.
Dies folgt aus 3° und der Eindeutigkeit des Negativen —x.
5°. Fiir jedes x GW gilt:
D
44
2 Die reellen Zahlen
Beweis. {—x){—x) = ((—1) • x){—x)
= [x • (—1))(—x) = x[{—l){—x))
= X•X.
Hierbei haben wir wiederholt den vorherigen Satz, die K o m m u t a t i v i t a t und die Assoziativitat der Multiplikation, angewendet. D
d. F o l g e r u n g e n a u s d e n A n o r d n u n g s a x i o m e n Wir beginnen mit der Feststellung, dass die Relation x < y (sprich: „x ist kleiner oder gleich y") ebenso als y > a; (sprich: „y ist groBer oder gleich a;") geschrieben werden kann. Gilt x ^ y, dann wird die Relation x
X = y,
Relationen:
X > y .
Beweis. Dies folgt aus der obigen Definition der strengen Ungleichheit und den Axionien 1< und 3<. D 2°. Fiir jedes x,y,z
G ffi gilt: {x
(x < z) ,
{x
(x < z) .
Beweis. Die zweite Annahme wird als Beispiel bewiesen. Nach Axiom 2<, nach dem die Ungleichheitsrelation transitiv ist, gilt: (x
{z
{z
Nach Axiom 1< wiirde daraus (y = z) A (y 7^ z) , was ein Widerspruch ist.
D
2.1 Axiome und Eigenschaften der reellen Zahleii
45
e. Folgerungen aus den Axiomen, die eine Anordnung mit Addition und Multiplikation verbinden Wenn wir zusatzlich zu den Axiomen der Addition, Multiplikation und Anordnung die Axiome (1,111) und (II,III) benutzen, in denen die Anordnung mit den aritlimetischen Operationen verbunden wird, konnen wir beispielsweise die folgenden Satze erhalten: 1°. Fiir jedes x,y,z,w
G M. gilt:
(x
^ ^ ^ ^
(x + z) <(y + z) , {-X < 0) , {x + z) < (y + w) , (x + z < y + w) .
Beweis. Wir woUen die Erste dieser Annahnien zeigen. Nacli Definition der strengen Ungleicliheit und dem Axiom (I,III) gilt: {x
+ z)<{y
+ z) .
Nun bleibt zu zeigen, dass x + z ^^ y + z. Tatsachlicli ist {{x + z) = {y + z)) => [x = {y + z) - z = y + {z- z) =y) , was im Widersprucli zur Annalime x < y steht. 2°. Fiir jedes x,y,z
D
G ffi gilt: (0 < x) A (0 (x < 0) A (y {x <0)A{0 (x
< y) < 0)
^ (0 < xy) , ^ (0 < xy) , => {xy < 0) , ^ (xz < yz) ,
{x
{yz < xz) .
Beweis. Wir woUen die Erste dieser Annahnien zeigen. Nacli Definition der strengen Ungleicliheit und dem Axiom (II,III) gilt: (0 < a;) A (0 < 2/) ^ (0 < a;) A (0 < 2/) ^ (0 < xy) .
Es ist sogar 0 ^ xy, da, wie bereits gezeigt, (x • 2/ = 0) ^ (x = 0) V (y = 0) . Wir woUen auBerdem die dritte Annahme zeigen: (a; < 0) A (0 < 2/) ^ (0 < -x) A (0 < y) ^ ^ {0 < i-x) • y) ^ {0 < {{-1) • x)y) ^ (0 < (-1) • (xy)) ^ (0 < -{xy))
^ ^ {xy < 0) .
D
46
2 Die reellen Zahlen
Der Leser ist nun gebeten, die verbleibenden Relationen selbst zu zeigen und ferner zu beweisen, dass fiir nicht strenge Ungleichheit in einer der Klaniniern auf der linken Seite auch die Ungleichheit auf der rechten Seite nicht streng wird. 3°.
0<1.
Beweis. Wir wissen, dass 1 £ ffi \ 0, d.h. 0 7^ 1. Wenn wir annehmen, dass 1 < 0, dann ergibt sich aus dem eben Gezeigten: ( 1 < 0) A ( 1 < 0) ^
(0 < 1 • 1) ^ (0 < 1) .
Aber wir wissen, dass fiir jedes Zahlenpaar x,y G W genau eine der drei Moghchkeiten x
(0 < x) ^ (0 < x - i ) und {0 < x) A {x < y) ^
{0 < y'^)
A (y'^
<
x''^).
Beweis. Wir wollen die Erste dieser Annahnien beweisen. Zunachst einmal ist x~^ ^ 0. Sei x~^ < 0, so erhalten wir (a;-^ < 0) A (0 < a;) ^
(x • x"^ < 0) ^
(1 < 0) .
Mit diesem Widerspruch ist der Beweis erbracht.
D
Wir erinnern daran, dass Zahlen, die grofier als Null sind, positiv genannt werden und diejenigen kleiner als Null, negativ. Somit haben wir beispielsweise gezeigt, dass 1 eine positive Zahl ist, dass das P r o d u k t einer positiven mit einer negativen Zahl eine negative Zahl ergibt und dass das Inverse einer positiven Zahl wiederum positiv ist. 2 . 1 . 3 D a s V o U s t a n d i g k e i t s a x i o m u n d die E x i s t e n z e i n e r k l e i n s t e n o b e r e n ( o d e r grofiten u n t e r e n ) S c h r a n k e D e f i n i t i o n 2. Eine Menge X C M heiBt von oben beschrankt (bzw. von unten beschrankt), falls eine Zahl c € ffi existiert, so dass x < c (bzw. c < x) fiir alle X G X. Die Zahl c wird in diesem Fall eine obere Schranke (bzw. untere Schranke) der Menge X genannt oder auch als Majorante (bzw. Minorante) von X bezeichnet. D e f i n i t i o n 3 . Eine Menge, die von oben und unten beschrankt ist, heifit beschrankt. D e f i n i t i o n 4. Ein Element a G X wird grofltes oder maximales (bzw. tes oder minimales) Element von X genannt, falls x < a (bzw. a < x) fiir alle X G X.
2.1 Axiome und Eigenschaften der reellen Zahleii
47
Wir stellen nun eine Schreibweise vor und fiihren gleichzeitig einen fornialen Ausdruck fiir die Definition der niaxinialen und mininialen Elemente ein: (a = m a x X ) := (a £ AT A Vx e AT (a; < a)) , (a = m i n X )
:= {a G X A\fx G X (a < x)) .
Neben der Schreibweise max X (sprich: „das Maximum von X") und min X (sprich: „das Minimum von X " ) benutzen wir auch die entsprechenden Ausdriicke max a; und min a;. x€X
xeX
Aus dem Anordnungsaxiom 1< folgt sofort, dass das maximale (bzw. minimale) Element in einer Menge von Zahlen, falls es existiert, eindeutig ist. Jedoch besitzt nicht jede Menge, niclit einmal jede besclirankte Menge, ein maximales oder minimales Element. So besitzt beispielsweise die Menge X = {a; £ ffi| 0 < a; < 1} ein kleinstes Element, aber, wie m a n einfach zeigen kann, kein grofites Element. D e f i n i t i o n 5. Die kleinste Zalil, die eine Menge X C M von oben beschrankt, wird die kleinste obere Schranke (oder die exakte obere Schranke) von X genannt und als sup AT (sprich: „Supremum von AT") oder sup x bezeichnet. x€X
Dies ist der zentrale Begriff des gegenwartigen Abschnitts. Daher gilt: (s = s u p X ) : = V a ; e X ( ( a ; < s) A (Vs' <s 3x' G X (s' < x')))
.
Der erste Klammerausdruck auf der rechten Seite besagt, dass s eine obere Schranke von X ist; der Ausdruck im zweiten Teil besagt, dass s die kleinste Zahl mit dieser Eigenschaft ist. Genauer formuhert, so stellt der Ausdruck im zweiten Teil sicher, dass jede Zahl, die kleiner als s ist, keine obere Schranke von X ist. Der Begriff der grofiten unteren Schranke (oder die exakte untere Schranke) einer Menge X wird ahnlich eingefiihrt wie die groBte untere Schranke von X. D e f i n i t i o n 6. {i = iniX)
:= Vx e X {{i < x) A {W > i 3x' G X {x' < i')))
.
Zusammen mit der Schreibweise inf AT (sprich: „das Infimum von AT") benutzt m a n auch die Schreibweise inf x fiir die groBte untere Schranke von X. xex Somit haben wir die folgenden Definitionen getroffen: sup AT := min {cGM\yx
G X{x
< c)} ,
inf A: := m a x { c e K| Vx £ AT (c < x)}
48
2 Die reellen Zahlen
Aber bereits oben haben wir gesagt, tes oder groBtes Element besitzt. Daher tionen zur kleinsten oberen Schranke und Ausfiihrung, die wir ini folgenden Lemma
dass nicht jede Menge ein kleinserfordern die vorgestellten Definider groi^ten unteren Schranke eine geben wollen.
Lemma. (Das Prinzip der kleinsten oberen Schranke). Jede nicht leere Menge reeller Zahlen, die von oben beschrdnkt ist, besitzt eine eindeutige kleinste obere Schranke. Beweis. Da wir bereits wissen, dass das groBte Element einer Zahlenmenge eindeutig ist, miissen wir nur zeigen, dass die kleinste obere Schranke existiert. Sei A: C ffi eine gegebene Menge und Y = {y G M\\fx G X (x < y)}. Laut Voraussetzung ist X 7^ 0 und Y ^ 0. Dann existiert nach dem VoUstandigkeitsaxiom ein c £ M, so dass \/x G X \/y £ Y (x < c < y). Die Zahl c ist daher sowohl eine Majorante von X als auch eine Minorante von Y, wobei c als Majorante von X ein Element von Y ist. Andererseits muss c als Minorante von Y das kleinste Element von Y sein. Daher gilt c = m i n F = sup X. D Natiirlich verhalt es sich mit der Existenz und Eindeutigkeit der grofiten unteren Schranke einer Zahlenmenge, die von unten beschrankt ist, analog, d.h., es gilt das folgende Lemma: Lemma.
(X von unten beschrankt) => (3! inf AT).
Wir iibergehen diesen Beweis. Wir kehren nun zur Menge A' = { a ; e M | 0 < a ; < l } zuriick. Nach dem eben bewiesenen Lemma muss sie eine kleinste obere Schranke besitzen. Nach der Definition der Menge X und der Definition der kleinsten oberen Schranke ist klar, dass sup AT < 1. Um zu zeigen, dass supX = 1, miissen wir daher nachweisen, dass fiir jede Zahl q < 1 ein x G X existiert, so dass q < x; einfach formuhert, so bedeutet dies ledighch, dass es Zahlen zwischen q und 1 gibt. Dies zu zeigen, ist natiirlich einfach (indem man beispielsweise zeigt, dass q < 2~^{q+l) < 1), aber wir verzichten im Augenblick darauf, da derartige Fragen systematisch und ausfiihrlich im nachsten Abschnitt untersucht werden. Die grofite untere Schranke fallt immer mit dem kleinsten Element einer Menge zusammen, falls solch ein Element existiert. Daher erhalten wir allein aus dieser Betrachtung fiir das gegenwartige Beispiel, dass inf X = 0. Andere, stichhaltigere Beispiele fiir den Einsatz der hier eingefiihrten Begriffe werden wir im nachsten Abschnitt kennen lernen.
2.2 Klassen reeller Zahleii und Berechnungen
49
2.2 Die wichtigsten Klassen reeller Zahlen und Gesichtspunkte fiir das Rechnen mit reellen Zahlen 2.2.1 Die natiirlichen Zahlen und das Prinzip der mathematischen Induktion a. Definition der natiirlichen Zahlen Die Zahlen der Gestalt 1, 1 + 1, (1 + 1) + 1, usw. werden 1,2,3,... usw. bezeichnet und natiirliche Zahlen genannt. Eine derartige Definition ist nur fiir jemanden sinnvoll, der bereits iiber ein vollstandiges Bild der natiirlichen Zahlen inklusive ihrer Schreibweise verfiigt, wie etwa bei Berechnungen im Dezimalsysteni. Die Fortsetzung einer derartigen Entwicklung ist bei Weitem nicht eindeutig, so dass das allgegenwartige „und so welter" eine Erklarung notig macht, die das zentrale Prinzip der mathematischen Induktion liefert. Definition 1. Eine Menge X C ffi ist induktiv, falls mit jeder Zahl x G X auch a; + 1 in ihr enthalten ist. So ist beispielsweise ffi eine induktive Menge, ebenso wie die Menge der positiven Zahlen. Der Durchschnitt X = f] Xa jeder Familie von induktiven Mengen Xa ist, falls er nicht leer ist, eine induktive Menge, denn tatsachhch gilt:
ixex \
= f] xA ^ {yaeA{xG x„)) => aeA
J ^ (Va e A ((a; + 1) e X„)) => [ (x + 1) £ p | X„ = X | . \
aeA
/
Wir wenden uns nun der folgenden Definition zu. Definition 2. Die Menge der natiirlichen Zahlen ist die kleinste induktive Menge, die die 1 enthalt, d.h., sie ist der Durchschnitt aller induktiven Mengen, die die 1 enthalten. Die Menge der natiirlichen Zahlen wird mit N bezeichnet und ihre Elemente heiBen natiirliche Zahlen. Aus dem Blickwinkel der Mengenlehre mag es verniinftiger sein, die natiirlichen Zahlen bei 0 beginnen zu lassen, d.h., die Menge der natiirlichen Zahlen als die kleinste induktive Menge, die die 0 enthalt, zu definieren. Es ist jedoch fiir uns bequemer, Nummerierungen mit 1 zu beginnen. Das folgende zentrale und haufig benutzte Prinzip ist ein direktes KoroUar zur Definition der Menge der natiirlichen Zahlen.
50
2 Die reellen Zahlen
b. D a s Prinzip der m a t h e m a t i s c h e n Induktion Enthalt eine Teilmenge E der natiirlichen Zahlen N die 1 und zusdtzUch jeder Zahl x G E die Zahl x -\- 1, dann gilt i? = N. In symbolischer Schreibweise: (E CN) A (1 G E) A {yx G E {x G E ^
zu
{x + 1) G E)) ^ E = N .
Wir woUen dieses Prinzip beim Beweis mehrerer niitzlicher Eigenschaften der natiirlichen Zahlen, die wir von nun an immer wieder benutzen werden, veranschaulichen. 1°. Die Summe
und das Produkt natiirlicher
Zahlen sind natiirliche
Zahlen.
Beweis. Seien mjU GW, wir wollen zeigen, dass (m + n) G N. Sei E die Menge der natiirlichen Zahlen n, fiir die (m + n) £ N fiir alle m € N. Dann ist 1 G E, da (m e N) ^ ((m + 1) £ N) fiir jedes m G K 1st n G E, d.h. (m + n) G N, dann ist auch (n + 1) G E, da {^m + {n + 1)) = ((m + n) + l ) £ N. Nach dem Induktionsprinzip gilt E = fi und wir haben bewiesen, dass uns die Addition nicht aufierhalb von N fiihrt. Sei E die Menge der natiirlichen Zahlen n, fiir die (m • n) € N fiir alle m G N. Dann ist 1 £ -E, da m • 1 = m. Sei n G E, d.h. m • n G N, dann ist m • (n + 1) = mn + m die Summe zweier natiirlichen Zahlen, die nach dem eben Bewiesenen in N liegt. Somit gilt {n G E) ^ ((n + 1) £ i?) und somit nach dem Induktionsprinzip, dass _E = N. D 2°.
(n £ N) A (n ^ 1) ^
((n - 1) £ N ) .
Beweis. Sei E die Menge aller Zahlen n — 1, ungleich 1 ist. Wir wollen zeigen, dass i? = (1 + 1) £ N und daher ist 1 = (2 - 1) £ £;. Sei m G E, dann ist m = n — 1 mit n £ N. und da n + 1 £ N, gilt (m + 1) £ E. Nach dem folgern, dass E = N.
wobei n eine natiirliche Zahl N. Da 1 £ N ist auch 2 := Dann gilt m + l = (n + l ) — 1 Induktionsprinzip konnen wir D
3°. Zu jedem n £ N enthalt die Menge {a; £ N| n < x} ein kleinstes namlich m i n j x £ N | n < x} = n + 1 .
Element,
Beweis. Wir werden zeigen, dass die Menge E, die aus Elementen n G N besteht, fiir die diese Annahme gilt, mit N iibereinstimmt. Zunachst zeigen wir, dass 1 G E, d.h., m i n j x £ N| 1 < a;} = 2 . Wir werden auch diese B e h a u p t u n g mit dem Induktionsprinzip beweisen. Sei M = {a;£ N|(a; = 1) V ( 2 < x)} .
2.2 Klassen reeller Zahleii und Berechnungen
51
Laut Definition von M gilt 1 £ M. 1st namlich a; £ M, so ist entweder x = 1, woraus folgt, dass x + 1 = 2 £ M oder es gilt 2 < x, womit 2 < (a; + 1) und wiederum, dass (x + 1) £ M. Somit ist M = N. 1st daher (a; ^ 1) A (a; e N), dann gilt 2 < x, d.h. tatsachlicli, dass min{a; £ N| 1 < x} = 2. Daher ist 1 £ E. Wir zeigen nun, dass fiir n G E aucli (n + l) £ E. Dazu lialten wir zunaclist fest, dass fiir a; £ {x £ N| n + 1 < a;} gilt: ix-l)=yG{yGN\n
D
Als unmittelbare Korollare aus 2° und 3° erhalten wir die folgenden Eigenschaften 4°, 5*^ und 6° der natiirlichen Zahlen: 4°. (m £ N) A (n £ N) A (n < m) =^ (n + 1 < m). 5°. Die Zahl (n + l) £ N ist der unmittelbare Nachfolger der Zahl n £ N, d.h., ist n £ N, dann gibt es keine natiirliche Zahl x, fiir die gilt: n < x < n + 1. 6°. Sei n £ N und n ^ 1. Dann ist (n — 1) der unmittelbare Vorgdnger von n in N, d.h., ist n £ N, dann gibt es keine natiirliche Zahl x, fiir die gilt: n — 1 < X < n. Wir woUen eine weitere Eigenschaft der natiirlichen Zahlen beweisen. 7°. In jeder nicht leeren Teilmenge der Menge der natiirlichen Zahlen gibt es ein kleinstes Element. Beweis. Sei M C N. Ist 1 £ M, dann ist m i n M = 1, da Vn £ N(l < n). Angenommen, 1 ^ M, d.h. 1 £ _E = N \ M. Die Menge E muss eine natiirliche Zahl n enthalten, so dass alle natiirlichen Zahlen, die nicht grofier als n sind, zwar zu E gehoren, aber (n + l) £ M. Gabe es kein derartiges n, wiirde die Menge i? C N, in der 1 enthalten ist, zusammen mit jedem seiner Elemente n auch die Zahl (n + 1) enthalten und ware daher nach dem Induktionsprinzip gleich N. Dies ist jedoch unmoglich, da N \ -E = M ^ 0 . Die so gefundene Zahl (n + l) muss das kleinste Element von M sein, da es zwischen n und n + l , wie bewiesen, keine weiteren natiirlichen Zahlen gibt. D
52
2 Die reellen Zahlen
2.2.2 R a t i o n a l e u n d i r r a t i o n a l e Z a h l e n a. D i e g a n z e n Z a h l e n D e f i n i t i o n 3 . Die Vereinigung der Menge der natiirlichen Zahlen niit der Menge der Negativen der natiirlichen Zahlen und der Null wird die Menge der ganzen Zahlen genannt und mit Z bezeichnet. Da, wie bereits bewiesen, Addition und Multiplikation natiirlicher Zahlen nicht aufierhalb von N fiihren, folgt sofort, dass die Anwendung dieser Operationen auf ganze Zahlen auch nicht auBerhalb von Z fiihrt. Beweis. Seien 7n,n £ "L und einer dieser Zahlen gleich Null. Dann entspricht die Summe m+n der anderen Zahl, so dass also {m+n) £ Z und m-n = 0 € Z . Sind beide Zahlen von NuU verschieden, so ist entweder m, n € N und folghch {m -\- n) £ N C Z und [m-n) £ N C Z oder es ist (—m), (—n) £ N mit m-n = ((—l)m) ((—l)n) £ N oder aber {—m),n £ N und somit (—m-n) £ N, d.h., m • n £ Z oder schliefilich m, (—n) £ N und somit (—m • n) £ N und wiederum m • n £ Z . D Somit ist Z eine Abelsche Gruppe beziiglich der Addition. Beziiglich der Multiplikation ist weder Z eine Gruppe noch Z \ 0, da (auBer 1 und —1) die Kehrwerte der ganzen Zahlen nicht in Z enthalten sind. Beweis. Sei m G li und m 7^ 0 , 1 . Wenn wir zunachst annehmen, dass m £ N, dann gilt 0 < 1 < m und da m • m~^ = 1 > 0, muss 0 < m~^ < 1 gelten (wie aus den Anordnungsaxiomen im vorherigen Absatz folgt). Daher ist m~^ ^ Z . Der Fall, dass m eine negative Zahl ungleich —1 ist, lasst sich sofort auf das bereits Betrachtete reduzieren. D Gilt k = 'm-n~^ £ Z fiir zwei ganze Zahlen 171,71 £ Z , d.h. m = k-n fiir ein k G li, dann sagen wir, dass m durch n oder einem Vielfachen von n teilhar ist oder dass n ein Teller von m ist. Die Teilbarkeit von ganzen Zahlen lasst sich nach geeignetem Vorzeichenwechsel, d.h. durch Multiplikation mit —1, sofort auf die Teilbarkeit der entsprechenden natiirlichen Zahlen zuriickfiihren. In diesem Zusammenhang wird sie in der Zahlentheorie untersucht. Wir wiederholen ohne Beweis den sogenannten Fundamentalsatz der Arithmetik, den wir bei der Untersuchung einiger Beispiele benutzen werden. Eine Zahl p £ N, p ^ 1 ist eine Primzahl, wenn es keinen Teller aufier 1 und p in N gibt. F u n d a m e n t a l s a t z d e r A r i t h m e t i k . Jede natiirliche stellung als Produkt n=pi---pk , wohei pi,... ,pk Primzahlen der Faktoren eindeutig.
sind. Diese Darstellung
Zahl erlaubt eine Dar-
ist bis auf die
Anordnung
2.2 Klassen reeller Zahleii und Berechnungen
53
Die Zahlen 711,71 ^IJ werden teilerfremd genannt, falls sie aufier 1 und —1 keine gemeinsamen Teller besitzen. Aus diesem Satz folgt insbesondere, dass eine von zwei teilerfremden Zahlen m und n durcli die Primzahl p teilbar sein muss, falls das P r o d u k t m • n durch p teilbar ist.
b. Die rationalen Zahlen D e f i n i t i o n 4. Zahlen der Gestalt m • n~^ mit m , n € Z werden ratio7iale Zahlen genannt. Wir bezeichnen die Menge der rationalen Zahlen mit Q. Somit wird durch das geordnete P a a r ganzer Zahlen (m, n) die rationale Zahl q = m • 7i~^ definiert, falls n ^ 0. Die Zahl q = 711 •7i~^ kann auch als ein Quotient^ von m und n geschrieben werden, d.h. als sogenannter rationaler Bruch —. Die in der Schule vermittelten Regeln fiir den Umgang mit rationalen Zahlen in ihrer Darstellung als Bruch, folgen sofort aus der Definition einer rationalen Zahl und den Axiomen fiir die reellen Zahlen. Insbesondere „bleibt der Wert eines Bruchs unverandert, wenn sowohl der Zahler als auch der Nenner mit derselben von Null verschiedenen ganzen Zahl multipliziert wird", d.h., die Briiche ^ und — reprasentieren dieselbe rationa1
1
"
"
1
1
1
le Zahl. Da {nk){k 71 ) = 1, d.h. (n • k) = k • n ~ , gilt tatsachlich {m,k){nk)~^ = {7nk){k~^n~^) = m • 7i~^. Also definieren die verschiedenen geordneten P a a r e (m, n) und (mfc, nk) dieselbe rationale Zahl. Folghch kann jede rationale Zahl nach geeigneter Reduktion als ein geordnetes P a a r teilerfremder Zahlen dargestellt werden. Auf der anderen Seite gilt m i n 2 = r7i27ii, wenn ( m i , n i ) und (m2,n2) dieselbe rationale Zahl definieren, d.h. m i • nj~ = 777-2 • n^ • Sind andererseits beispielsweise m i und Tii teilerfremde Zahlen, so folgt aus dem oben angefiihrten KoroUar des Fundamentalsatzes der Arithmetik, dass 712 • nj~ = 7772 • nil
= k £
Z.
Somit haben wir gezeigt, dass zwei geordnete Paare (mi,7ii) und (m2,7i2) genau dann dieselbe rationale Zahl definieren, wenn sie proportional sind, d.h., es existiert eine ganze Zahl fc £ Z , so dass etwa m2 = fc7ni und 772 = fcrii.
c. D i e i r r a t i o n a l e n Z a h l e n D e f i n i t i o n 5. Die reellen Zahlen, die nicht rational sind, werden genannt.
irrational
^ Die Schreibweise Q riihrt vom ersteii Buchstaben des Wortes Quotient her, das seinerseits vom lateinischen quota, das den Einheitsteil von etwas bedeutet, und quot, das wie viele bedeutet, stamnit.
54
2 Die reellen Zahlen
Das klassische Beispiel fiir eine irrationale reelle Zahl ist \/2, d.h., die Zahl s £ M mit s > 0, fiir die s^ = 2 gilt. Nach dem Satz von Pythagoras ist die Irrationalitat von \/2 aquivalent zu der Behauptung, dass die Diagonale und die Kante eines Quadrats inkommensurabel sind. Daher beginnen wir mit dem Beweis der Existenz einer reellen Zahl s £ M, deren Quadrat gleich 2 ist und zeigen dann, dass s ^ Q. Beweis. Seien X und Y die Mengen positiver reeller Zahlen, so dass \/x G X (a;2 < 2), Vy e r (2 < 2/2). Da 1 e X und 2 e y folgt, dass X und Y keine leeren Mengen sind. Da aufierdem fiir positive Zahlen x und y gilt, dass (x < y) <^ (a;^ < y"^), ist jedes Element in X kleiner als jedes Element in Y. Nach dem VoUstandigkeitsaxiom existiert ein s € M, so dass a; < s < y fiir alle x £ X und alle yGY. Wir werden zeigen, dass s^ = 2. Sei s^ < 2, dann hatte beispielsweise die Zahl s + ^37-, die groBer als s ist, ein Quadrat, das kleiner als 2 ist. Tatsachlich wissen wir, dass 1 € X, so dass 1'^ < s"^ <2 und 0 < Z\ := 2 - s^ < 1. Daraus folgt, dass
Folglich gilt (s + ^ ) G X, was im Widerspruch steht zur Ungleichung x < s fiir alle x £ X. Ist 2 < s , dann hatte beispielsweise die Zahl s — ^-3^, die kleiner als s ist, ein Quadrat, das groBer als 2 ist. Tatsachlich wissen wir, dass 2 £ F , so dass 2 < s^ < 2^ oder 0 < A := s"^ -2 < 3 und 0 < y < 1. Daraus folgt, dass - — 6s J
=s^-2
•— + [ - ] 6S \6S/
> s ^ - 2 - - > s ' - 3 s 6S
— = s^-A 6S
=
2,
was der Tatsache widerspricht, dass s eine untere Schranke von Y ist. Daher verbleibt nur die Moghchkeit, dass s^ = 2. Nun woUen wir abschlieBend zeigen, dass s ^ Q. Sei dazu s £ Q und sei — eine teilerfremde Darstellung von s. Dann gilt m^ = 2 • n^, so dass m^ durch 2 teilbar sein muss und folglich auch m. Ist jedoch m = 2k, dann ist 2fc2 = 77,2, -^veswegen mit denselben Argumenten n durch 2 teilbar sein muss. Dies widerspricht jedoch der Annahme, dass m und n teilerfremd sind. D Wir haben eben fiir den Nachweis, dass es irrationale Zahlen gibt, hart gearbeitet. Wir werden gleich sehen, dass in einem gewissen Sinne fast aUe reellen Zahlen irrational sind. Wir werden zeigen, dass die Machtigkeit der Menge der irrationalen Zahlen groBer ist als die der Menge der rationalen Zahlen und dass in der Tat die Machtigkeit der irrationalen Zahlen der der reellen Zahlen entspricht.
2.2 Klassen reeller Zahleii und Berechnungen
55
Bei den irrationalen Zahlen niachen wir eine weitere Unterscheidung zwischen den so genannten algebraischen irrationalen Zahlen und den transzendenten Zahlen. Eine reelle Zahl wird algebraisch genannt, falls sie eine Losung der algebraischen Gleichung aox" + • • • + Qn-ix + a„ = 0 mit rationalen (oder ganzen) Koeffizienten ist. Ansonsten wird die Zahl transzendent genannt. Wir werden sehen, dass die Machtigkeit der Menge der algebraischen Zahlen gleich ist mit der der rationalen Zahlen, wohingegen die Machtigkeit der Menge der tranzendenten Zahlen mit der der reellen Zahlen iibereinstimmt. Aus diesem Grund scheinen die Schwierigkeiten beim Nachweis gewisser transzendenten Zahlen - genauer gesagt, beim Beweis, dass eine gewisse Zahl transzendent ist - auf den ersten Blick paradox und widersinnig. So konnte beispielsweise bis 1882 nicht gezeigt werden, dass die klassische geometrische Zahl TT transzendent ist^ und eines der beriihmten Probleme von Hilberf* bestand darin, die Transzendenz der Zahl a^ zu zeigen. Dabei ist a mit (cc > 0) A ( a ^ 1) algebraisch und /3 eine irrationale algebraische Zahl (beispielsweise a = 2, /? = ^/2).
2.2.3 Das archimedische Prinzip Wir wenden uns nun dem archimedischen^ Prinzip zu, das sowohl in theoretischer Hinsicht als auch fiir die Benutzung von Zahlen in Messungen und Berechnungen wichtig ist. Wir werden es mit Hilfe des Vollstandigkeitsaxioms Die Zahl TT entspricht in der euklidischen Geometrie dem Verhaltnis zwischen Umfang und Durchmesser eines Kreises. Aus diesem Grund wird diese Zahl seit dem achtzehnten Jahrhundert nach eineni Vorschlag von Euler mit TT bezeichnet, denn dies ist der Anfangsbuchstabe des griechischen Wortes Trepupipba - Peripherie (Umfang). Die Transzendenz von TT wurde durch den deutschen Mathematiker F. Lindemann (1852-1939) bewiesen. Insbesondere folgt aus der Transzendenz von TT, dass es unmoglich ist, eine Strecke der Lange TT mit Zirkel und Lineal (das Problem der Rektifizierung des Kreises) zu konstruieren, genauso wie das uralte Problem der Quadratur des Kreises nicht mit Zirkel und Lineal gelost werden kann. D.Hilbert (1862-1943) - herausragender deutscher Mathematiker, der 1900 auf dem internationalen Kongress der Mathematiker in Paris 23 Probleme aus verschiedenen Bereichen der Mathematik formulierte. Diese Probleme wurden als die „Hilbert Probleme" bekannt. Das hier genannte Problem (das siebzehnte der Hilbert Probleme) wurde 1934 durch den russischen Mathematiker A. O. Gel'fond (1906-1968) und den deutschen Mathematiker T.Schneider (1911-1989) gelost. Archimedes (287-212 v.Chr.) - brillanter griechischer Gelehrter, iiber den Leibniz, einer der Begriinder der Analysis, sagte: „Beim Studium der Arbeiten von Archimedes verblassen die Leistungen moderner Mathematiker."
56
2 Die reellen Zahlen
beweisen (genauer gesagt, dem Satz zur kleinsten oberen Schranke, der zum VoUstandigkeitsaxiom aquivalent ist). Dieses zentrale Prinzip ist in anderen Axiomensystenien der reellen Zahlen haufig eines der Axionie. Wir halten fest, dass die bisher bewiesenen Satze zu den natiirlichen Zahlen und den ganzen Zahlen iiberhaupt keinen Gebrauch vom VoUstandigkeitsaxiom machten. Wie wir unten sehen werden, werden die mit der Vollstandigkeit zusanimenhangenden Eigenschaften der natiirlichen und ganzen Zahlen im Wesentlichen durch das archimedische Prinzip widergespiegelt. Wir beginnen bei diesen Eigenschaften. 1°. Jede von oben beschrankte, enthalt ein grofites Element.
nicht leere Teilmenge
der natiirlichen
Zahlen
Beweis. Sei E C 'N die zu untersuchende Teilmenge. Dann gilt nach dem Lemma zur kleinsten oberen Schranke, dass 3 ! s u p i ? = s g M. Nach der Definition der kleinsten oberen Schranke existiert eine natiirliche Zahl n G E, fiir die gilt: s — 1 < n < s. Aber dann ist n = maxE, da eine natiirliche Zahl, die groBer als n ist, mindestens n + 1 sein muss und n + 1 > s. D KoroUare 2°. Die Menge der natiirlichen Beweis.
Zahlen ist nicht von oben
beschrdnkt.
Ansonsten gabe es eine grofite natiirhche Zahl. Aber n < n - | - l £ N . D
3°. Jede nach oben beschrankte, ein grofites Element.
nicht leere Teilmenge
ganzer Zahlen
enthalt
Beweis. Der Beweis von 1° kann wortlich iibernommen werden, wenn wir N durch Z ersetzen. D 4°. Jede nach unten beschrankte Element.
Teilmenge ganzer Zahlen enthalt ein
kleinstes
Beweis. Wir konnten den Beweis von 1° wiederholen und dabei N durch Z ersetzen und das Prinzip der groBten unteren Schranke anstelle des der kleinsten oberen Schranke benutzen. Alternativ konnten wir das Negative der Zahlen betrachten („Vorzeichenwechsel") und 3° anwenden. 5°. Die Menge der ganzen Zahlen ist nach unten und oben Beweis.
Dies folgt aus 3° und 4° oder direkt aus 2°.
unbeschrdnkt. D
Nun konnen wir das archimedische Prinzip formulieren. 6°. (Das a r c h i m e d i s c h e P r i n z i p ) . Zu jeder festen positiven Zahl h und jeder reellen Zahl x gibt es eine eindeutige ganze Zahl k, so dass (k — l)h < X < kh.
2.2 Klassen reeller Zahleii und Berechnungen
57
Beweis. Da Z nicht von oben beschrankt ist, ist die Menge {n £ Z | | < nj eine nicht leere, nach unten beschrankte Teilnienge der ganzen Zahlen. Somit (vgl. 4°) enthalt sie ein kleinstes Element k, d.h., (fc — 1) < x/h < k. Da h > 0, sind diese Ungleichungen zu denen im archimedischen Prinzip aquivalent. Die Eindeutigkeit von k G Z, das diese Ungleichungen erfiillt, folgt aus der Eindeutigkeit des kleinsten Elements in einer Zahlenmenge (vgl. Absatz 2.1.3). D Nun einige Korollare: 7°. Zu jeder positiven
Zahl e gibt es eine natiirliche
Zahln,
so dass 0 < ^ < e.
Beweis. Nach dem archimedischen Prinzip existiert ein n £ Z , so dass 1 < e-n. Da 0 < 1 und 0 < e, gilt 0 < n. Somit ist n e N und 0 < ^ < e. D 8°. Gilt fiir die Zahl x £ M., dass 0 < x und x < -^ fiir alle n G N, dann ist x = 0. Beweis.
Die Ungleichung 0 < a; ist nach 7*^ unmoglich.
D
9°. Zu beliebigem a,b GM. mit a < b gibt es eine rationale Zahl r € Q, so dass a < r
a
"
10°. Zu jeder Zahl a; £ M existiert k <x < k+1. Beweis.
eine eindeutige
"
n
ganze Zahl k G IJ, so dass
Dies folgt sofort aus dem archimedischen Prinzip.
D
Die eben genannte Zahl k wird [x] bezeichnet und ganzzahliger Teil von X genannt. Die GroBe {x} := x — [x] wird gebrochener Teil von x genannt. Somit gilt a; = [x] + {a;} und {a;} > 0. 2.2.4 Die geometrische Interpretation der M e n g e der reellen Zahlen und Gesichtspunkte b e i m Rechnen mit reellen Zahlen a. D i e r e e l l e G e r a d e Im Zusammenhang mit den reellen Zahlen benutzen wir oft eine anschauliche geometrische Darstellung, so wie Sie sie im Grofien und Ganzen aus der Schule kennen. Nach den Axiomen der Geometrie existiert ein eins-zu-eins Zusammenhang / : L —>• ffi zwischen den P u n k t e n einer Geraden L und der
58
2 Die reellen Zahlen
Menge der reellen Zahlen M. AuBerdeni bestelit ein Zusanimenhang mit starren Bewegungen der Geraden. Um genauer zu sein, so existiert, falls T eine parallele Verscliiebung der Geraden L auf sicli ist, eine Zahl t £ K (die nur von T abliangt), so dass f(T{x)) = f{x) +1 fiir jeden Punkt x Gh. Die Zahl f{x), die einem Punkt a; £ L entspricht, wird Koordinate von x genannt. Im Hinblick auf die bijektive Eigenschaft der Abbildung / : L —>• M wird die Koordinate eines Punktes oft auch einfach Punkt genannt. So sagen wir beispielsweise anstelle von „wir nehmen den Punkt mit der Koordinate 1" „wir nehmen den Punkt 1". Mit Kenntnis der Beziehung / : L —^ffinennen wir die Gerade L die Koordinatenachse, die Zahlengerade oder die reelle Gerade. Da / bijektiv ist, wird die Menge ffi selbst oft als reelle Gerade und ihre Elemente als Punkte der reellen Gerade bezeichnet. Wie wir oben angemerkt haben, besitzt die bijektive Abbildung / : L ^ K, durch die die Koordinaten auf L definiert werden, die Eigenschaft, dass sich die Koordinaten der Bildpunkte der Geraden L nach einer parallelen Verschiebung T von den urspriinglichen Koordinaten der Punkte um die Zahl t e M unterscheiden. Dies ist fiir alle Punkte gleich. Aus diesem Grund wird / voUstandig durch Angabe des Punktes mit Koordinate 0 und des Punktes mit Koordinate 1 bestimmt oder, kiirzer formuliert, durch den Punkt 0, der Ursprung genannt wird und den Punkt 1. Das abgeschlossene Intervall, das durch diese Punkte festgelegt wird, wird Einheitsintervall genannt. Die Richtung des Strahls mit Ursprung in 0 zum Punkt 1 wird positive Richtung genannt, und eine Bewegung in diese Richtung (von 0 nach 1) wird Bewegung von links nach rechts genannt. In Ubereinstimmung mit dieser Konvention liegt 1 rechts von 0 und 0 liegt links von 1. Nach einer parallelen Verschiebung T, bei der der Ursprung XQ in den Punkt xi = T{xo) mit der Koordinate 1 bewegt wird, sind die Koordinaten der Bilder aller Punkte um eine Einheit grofier als die ihrer Urbilder. Und deshalb erhalten wir den Punkt X2 = T{xi) mit Koordinate 2, den Punkt X'j, = T{x2) mit Koordinate 3, ...und den Punkt Xn+i = T{xn) mit der Koordinate n + 1 genauso wie die Punkte X-i = T~^{xo) mit der Koordinate — 1, .. .und den Punkt X-„-i = T~^(a;_„) mit der Koordinate —n — 1. Auf diese Weise erhalten wir alle Punkte mit ganzzahligen Koordinaten m £ Z. Wir wissen, wie dieses Einheitsintervall zu verdoppeln, zu verdreifachen, . . . ist, und konnen analog dazu mit Hilfe des Satzes von Thales dieses Intervall in n gleich grofie Teilintervalle teilen. Wenn wir das Teilintervall so wahlen, dass der eine Endpunkt im Ursprung liegt, finden wir, dass das andere Ende, das wir mit x bezeichnen, die Gleichung n-x = 1 erfiillt, d.h. x = -. Auf diese Weise konnen wir alle Punkt mit rationalen Koordinaten — £ Q finden. Aber es verbleiben noch Punkte auf L, da wir wissen, dass es IntervaUe gibt, die zum Einheitsintervall inkommensurabel sind. Jeder derartige Punkt wie jeder andere Punkt der Geraden unterteilt die Gerade in zwei Strahlen. Auf jedem dieser Strahlen gibt es Punkte mit ganzzahligen und rationalen Koordinaten. (Dies ist eine Konsequenz aus dem urspriinglich geometrischen archimedischen Prinzip.) Somit erzeugt ein Punkt eine Unterteilung, oder wie
2.2 Klassen reeller Zahleii und Berechnungen
59
es genannt wird, einen Schnitt von Q in zwei nicht leere Mengen X und Y entsprechend zu den rationalen Punkten (den Punkten niit rationalen Koordinaten) auf deni linken oder deni rechten Strahl. Nach dem VoUstandigkeitsaxiom gibt es eine Zahl c, die X und Y trennt, d.h., x < c < y fiir alle x G X und alle y £Y. Da XUY = Q, folgt, dass supX = s = i = iniY. Denn ansonsten ware s < i und es gabe eine rationale Zahl zwischen s und i, die weder in X nocli in Y liegen wiirde. Somit ist s = i = c. Diese eindeutig definierte Zahl c wird dem entsprechenden Punkt auf der Geraden zugeordnet. Die gerade beschriebene Zuordnung von Koordinaten zu Punkten auf der Geraden eroffnet ein anschauliches Modell sowohl fiir die Anordnungsrelation in M (daher der Ausdruck „lineare Anordnung") als auch das VoUstandigkeitsaxiom in K. Letzteres bedeutet geometrisch, dass es keine „L6cher" auf der Geraden L gibt, die die Gerade in zwei Stiicke, die keinen Punkt gemeinsam haben, unterteilen wiirden. (Eine derartige Trennung konnte nur mit Hilfe eines Punktes auf der Geraden L zustande kommen.) Wir woUen die Konstruktion der Abbildung / : L —^ffinicht naher untersuchen, da wir die geometrische Interpretation der Menge der reellen Zahlen nur der Anschaulichkeit halber ins Spiel bringen. Vielleicht hilft eine geometrische Intuition dem Leser. Die formalen Beweise werden, wie bisher, entweder aus Tatsachen, die wir aus Axiomen fiir die reellen Zahlen erhalten haben, oder direkt aus den Axiomen selbst aufgebaut. Geometrische Ausdriicke werden wir jedoch standig benutzen. Wir fiihren nun die folgende Schreibweise und Terminologie fiir die unten angefiihrten Zahlenmengen ein: ]a, b[:= {x £M.\a < X < b} ist das offene IntervaU ah, [a, b] := {x GM.\a < X
]-oo,b[:: = {x eR\x ]-oo,b]: := {XGR\X
< b}. < b}
und ] — oo,-|-oo[:= M werden iiblicherweise unbeschrdnkte Intervalle oder unendliche Intervalle genannt. In Ubereinstimmung mit dieser Nutzung der Symbole -l-oo (sprich: „positiv unendlich") und —oo (sprich „minus unendlich") ist es iiblich, die nicht von oben (bzw. von unten) beschrankte numerische Menge X mit der Schreibweise sup AT = -l-oo (bzw. inf AT = —oo) zu bezeichnen.
60
2 Die reellen Zahlen
Definition 7. Ein offenes Intervall, das den Punkt a; € M enthalt, wird eine Umgebung dieses Punktes genannt. Insbesondere wird fiir 6 > 0 das ofFene Intervall ]x—d, x+d[ die 6- Umgebung von X genannt. Seine Lange betragt 26. Der Abstand zwisclien zwei Punkten x,y G W wird durcli die Lange des Intervalls bestimmt, das diese beiden Punkte als Endpunkte besitzt. Um uns dabei niclit darum kiinimern zu niiissen, welcher der Punkte „links" und welcher „reclits" liegt, d.li., ob nun x < y oder y < x und die Lange y — x oder x — y betragt, benutzen wir die folgende hilfreiclie Funktion: X falls a; > 0 , 0 falls a; = 0 , —X falls a; < 0 , die der Betrag oder der Absolutwert der Zalil x genannt wird. Definition 8. Der Abstand zwisclien x,y GM. entspricht |a; — 2/|. Der Abstand ist nicht negativ und genau dann gleich Null, wenn die Punkte X und y identisch sind. Der Abstand zwischen x und y ist mit dem Abstand zwischen y und x identisch, da |a; — 2/| = ly — a;|. Ist schlieBlich 2; £ M, dann gilt |a; — 2/| < |a; — z| + |z — yj. Dies ist die sogenannte Dreiecksungleichung. Die Dreiecksungleichung ergibt sich aus einer Eigenschaft des Betrags, der auch Dreiecksungleichung genannt wird (da sie aus der obigen Dreiecksungleichung durch Setzen von z = 0 und Ersetzen von y durch —y erhalten werden kann). Auf den Punkt gebracht, so gilt die Ungleichung \x + y\< \x\ + \y\ fiir alle Zahlen x und y, und Gleichheit herrscht nur dann, wenn die Zahlen X und y beide das gleiche Vorzeichen besitzen. Beweis. Seien 0 < a; und 0 < y, dann gilt 0 < x -\- y, \x -\- y\ = x + y, \x\ = x und \y\ = y, so dass in diesem Fall Gleichheit herrscht. Seien a; < 0 und y < 0, dann gilt x + y < 0, \x + y\ = —{x + y) = —x — y, \x\ = —X und \y\ = —y, so dass wiederum Gleichheit herrscht. Sei nun eine der Zahlen negativ und die andere positiv, etwa x < 0 < y. Dann gilt entweder a; < a; + y < 0 oder 0 < x + y < y. Ira ersten Fall ist |a; + 2/| < \x\ und im zweiten |a; + 2/| < \y\, so dass in beiden Fallen |a; + 2/| < |a;| + |2/| gih. D Mit Hilfe des Induktionsprinzips konnen wir zeigen, dass \xi
-\
\-Xn\
< \xi\
H
h \Xn\ ,
wobei wiederum genau dann Gleichheit herrscht, wenn die Zahlen a;i,...• ,a; ; '*^n alle das gleiche Vorzeichen besitzen.
2.2 Klassen reeller Zahleii und Berechnungen
61
Die Zahl ^-^ wird oft der Mittelpunkt oder das Zentrum des Intervalls mit den E n d p u n k t e n a und b genannt, da sie zu beiden E n d p u n k t e n des Intervalls den gleiclien Abstand besitzt. Insbesondere ist ein P u n k t x G W das Zentrum seiner (5-Umgebung ]x — d,x + d[ und alle P u n k t e der (5-Umgebung besitzen von x einen Abstand kleiner als 6.
b . S c h r i t t w e i s e N a h e r u n g zur D e f i n i t i o n e i n e r Zahl Bei Messungen realer physikalischer Grofien erhalten wir eine Zahl, die im Allgemeinen bei einer Wiederholung der Messung etwas anders ausfallt, vor allem dann, wenn entweder die Messmetliode oder das Messinstrument ausgetausclit wird. Dalier ist ein Messergebnis iiblicherweise ein Naherungswert der gesucliten Grofie. Die Qualitat oder die Genauigkeit einer Messung wird beispielsweise durcli die GroBe einer moglichen Abweichung zwischen dem tatsachliclien Wert der GroBe und den bei der Messung erhaltenen Werten cliarakterisiert. Dabei kann es vorkommen, dass wir niemals den exakten Wert einer GroBe (falls er theoretisch existiert) bestimmen konnen. Von einem elier konstruktiven Gesichtspunkt aus konnten (oder soUten) wir jedoch sagen, dass wir die gewiinschte GroBe voUstandig kennen, falls wir sie mit jeder vorgegebenen Genauigkeit messen konnen. Dieser Gesichtspunkt lauft darauf hinaus, eine Zahl als eine Folge^ immer genauerer Naherungsergebnisse aus Messungen zu betrachten. Dabei ist jede Messung eine endliche Anzahl von Vergleichen mit einem Standard oder mit einem Teil eines Standards in vergleichbarer GroBenordnung. Somit wird das Messergebnis notwendigerweise mit Hilfe natiirlicher, ganzer oder, allgemeiner formuliert, rationaler Zahlen ausgedriickt. Daher kann theoretisch die ganze Menge der reellen Zahlen mit Hilfe von Folgen rationaler Zahlen beschrieben werden, indem nach reiflicher Analyse eine mathematische Kopie oder, besser formuliert, ein Modell konstruiert wird, das dem alltaglichen Umgang mit Zahlen ohne eine Vorstellung ihrer axiomatischen Beschreibung entspricht. Taglich addieren und multiplizieren wir Naherungswerte anstelle von Messwerten, die unbekannt sind. (Dabei ist sicher, dass i.A. nicht immer gewusst wird, in welcher Beziehung das Ergebnis dieser Operationen zu dem Ergebnis steht, das durch Berechnung mit den exakten Werten erhalten wiirde. Wir werden diesen Gesichtspunkt unten naher untersuchen.) Nachdem wir eine Zahl mit einer Folge von Naherungen identifiziert haben, sollten wir dann auch Folgen von Naherungen beispielsweise addieren, wenn wir zwei Zahlen addieren woUen. Die so erhaltene neue Folge muss als eine neue Zahl betrachtet werden, die Summe der ersten beiden genannt wird. ^ Ist n die Nummer der Messung und x„ das Messergebnis, dann ist die Zuordnung n 1-^ x„ einfach eine Funktion / : N —> R mit einer natiirlichen Zahl als Argument und somit per definitionem eine Folge (in diesem Fall eine Zahlenfolge). In Abschnitt 3.1 werden numerische Folgen ausfiihrlich behandelt.
62
2 Die reellen Zahlen
Aber ist diese Folge eine Zahl? Die Subtilitat dieser Frage entspringt der Tatsache, dass nicht jede zufallig erzeugte Folge eine Folge von beliebig genauen Naherungen an eine Grofie ist. Somit miissen wir erst noch untersuclien, wie aus der Folge direkt zu erkennen ist, ob sie eine Zahl darstellt oder nicht. Ein anderes Problem, das sich bei dem Versuch ergibt, eine mathematische Kopie von Operationen mit Naherungszahlen zu erstellen, ist, dass verschiedene Folgen Naherungsfolgen fiir dieselbe Grofie sein konnen. Die Beziehung zwischen Naherungsfolgen, die eine Zahl definieren, und den Zahlen selbst ist in etwa dieselbe wie die zwischen einem Punkt auf einer Karte und eineni Pfeil auf der Karte, der auf den Punkt verweist. Der Pfeil bestimmt den Punkt, aber der Punkt bestimmt nur die Spitze des Pfeils und die Pfeilform ist voUstandig behebig. Eine genaue Beschreibung dieser Probleme wurde durch Cauchy^ gegeben, der einen voUstandigen Entwurf zur Konstruktion eines Modells der reellen Zahlen erstellte, den wir nur kurz andeuteten. Wir hoffen, dass Sie nach der Untersuchung der Theorie von Grenzwerten diese Konstruktionen unabhangig von Cauchy wiederholen konnen. Das bisher Ausgefiihrte erhebt natiirlich keinen Anspruch auf mathematische Strenge. Der Zweck dieser nicht formalen Ausfiihrungen war es, den Leser auf die theoretischen Moglichkeiten hinzuweisen, dass mehr als ein natiirliches Modell fiir die reellen Zahlen existieren kann. Daneben habe ich versucht, ein Bild von der Beziehung zwischen Zahlen und der uns umgebenden Welt zu zeichnen und die zentrale RoUe, die dabei die natiirlichen und rationalen Zahlen spielen, zu verdeutlichen. Schliefilich woUte ich auch zeigen, dass Naherungsrechnungen sowohl natiirlich als auch notwendig sind. Der folgende Teil dieses Abschnitts ist einfachen, aber wichtigen Fehlerabschatzungen gewidmet, die bei arithmetischen Operationen mit Naherungswerten auftreten. Diese Abschatzungen werden unten benutzt und sind von allgemeinem Interesse. Wir machen nun genaue Aussagen. Definition 9. Sei x der genaue Wert einer Grofie und x eine bekannte Naherung an diese Grofie. Dann werden die Zahlen A{x) := \x — x\ und
der absolute und der relative Naherungsfehler von x genannt. Der relative Fehler ist fiir x = 0 nicht definiert. ^ A. Cauchy (1789-1857) - franzosischer Mathematiker. Einer der aktivsten Begriinder der mathematischen Sprache und der Maschinerie der klassischen Analysis.
2.2 Klassen reeller Zahleii und Berechnungen
63
Da der Wert x unbekannt ist, sind die Werte A{x) und d{x) ebenfalls unbekannt. Normalerweise sind aber fiir diese GroBen gewisse obere Schranken A{x) < A und d{x) < S bekannt. Fiir diesen Fall sagen wir, dass der absolute oder der relative Fehler A oder 6 nicht iibersteigt. Praktiscli miissen wir uns nur um Abschatzungen fiir die Fehler kiimmern, so dass die Gr6i3en A und 6 auch oft selbst absoluter und relativer Fehler genannt werden. Dies werden wir jedoch nicht t u n . Die Schreibweise x = x ± A bedeutet, dass x — A<x<x + A. Einige Beispiele: Gravitationskonstante Lichtgeschwindigkeit Plancksche Konstante Ladung eines Elektrons Ruhemasse eines Elektrons
G c h e nip
(6,672598 ± 0, 00085) • 1 0 - " N • m V k g ^ 299792458 m / s (exakt im V a k u u m ) , (6,6260755 ± 0,0000040) • l O ' ^ " J • s, (1,60217733 ± 0,00000049) • I Q - i ^ C o u l , (9,1093897 ± 0,0000054) • l O ' ^ i k g .
Der wichtigste Indikator fiir die Genauigkeit einer Messung ist der relative Fehler der Naherung, der iiblicherweise in Prozenten angegeben wird. Somit sind bei den Beispielen die relativen Fehler hochstens (in der Reihenfolge): 13-IQ-
0 ,
6-10-
31 • 10"
6-10-
oder als Prozentangabe der gemessenen Werte: 13 • 10"^% ,
0% ,
6 • 10"^% ,
6-10-
31 • IQ-
Wir wollen nun die Fehler abschatzen, die bei arithmetischen Operationen mit Naherungswerten auftreten. S a t z . Sei \x -x\
= A{x) ,
\y -y\=
A(y)
dann gilt: A{x + y) :=\{x A{x-y) Gilt
+ y)-(x
+ y)\<
:=\x-y-x-y\<
\x\A{y)
+ \y\A{x)
+ A{x) • A{y) .
(2.2)
ferner y ¥"0,
y ¥"0 und
5{y)
My) \y\
dann
(2.1)
A(x) + A{y) ,
< 1,
auch
y
y
<
\x\A{y)
+ y2
\y\A(x)
1
1- m
(2.3)
64
2 Die reellen Zahlen
a und y = y + p. Dann gilt:
Beweis. Seien x A{x + y) A{x-y)
\{x + y)-{x
+ \(]\ = A{x)+A(y)
+ y)\ = \a + l3\<\a\
\xy - X • y\ = \{x + a){y + (]) - X • y\ = = \xP + ya + aP\ < \x\ \P\ + \y\ \a\ + \ap\ = = \x\A{y) + \y\A{x) + A{x) • A{y)
A{-
X
X
xy — yx
y
y
yy
(x + a)y — {y + P)x
1
I
1 + Ply
W \x\A{y)^\y\A{x)
<
+ \y\H
1
a
1 - S{y)
y
1 - S{y)
Diese Abschatzungen des absoluten Fehlers fiihren uns zu den folgenden Abschatzungen fiir die relativen Fehler: d{x + y)<
A(x) + A(y)
(2.1')
\x + y\ 6(x • y) < 6{x) + 6(y) + 5{y) • 6(y) , x\
<
d{x)
+6{y)
1 - Siy)
(2.2') (2.3')
Bei der Arbeit mit geniigend guten Naherungen A{x)-A{y) « 0, d{x)-d{y) « 0 und l—d{y) « 1 konnen wir in der Praxis die folgenden hilfreiclien, aber formal geselien niclit richtigen Varianten der Formeln (2.2), (2.3), (2.2') und (2.3') benutzen: A{x-y)
< \x\A{y) + \y\A{x) , \x\A{y)+yA{x) <
.y J 5{x-y)
(^d)
y < d{x)+d{y)
,
<S{x)+6{y).
Die Formeln (2.3) und (2.3') zeigen an, dass Division durch eine Zahl, die fast Null ist, vermieden werden soUte, genauso wie die Verwendung selir ungenauer Naherungen, bei denen y oder 1 — 6(y) einen kleinen Betrag besitzen. Die Formel (2.1') warnt uns vor der Addition genaherter GroBen, falls diese fast den gleichen Betrag, aber unterschiedliches Vorzeichen besitzen, da dann |a; + 2/| nahezu Null ist. In alien diesen Fallen konnen die Fehler betrachtlich anwachsen. Wurde beispielsweise Ihre GroBe zweimal durch ein Gerat mit einer Genauigkeit von ±0, 5 cm gemessen, wobei die Messungen Hi = (200 ± 0, 5) cm
2.2 Klassen reeller Zahleii und Berechnungen
65
und H2 = (199, 8 ± 0, 5) cm ergaben. Angenommen, dass Sie sich bei der zweiten Messung auf ein Blatt Papier gestellt haben. Nun macht es offensichtlich iiberhaupt keinen Sinn, die Starke des Papiers aus der DifFerenz H2 — Hi zu bestimmen. Diese Rechnung wiirde nur ergeben, dass die Papierstarke nicht iiber 0,8 cm liegt, was natiirlich zu einer sehr groben Wiedergabe (falls m a n es iiberhaupt eine „Wiedergabe" nennen kann) der Realitat fiilirt. Es lolint sich jedoch, einen anderen vielversprechenderen Effekt bei Berechnungen zu betrachten, bei dem vergleichsweise genaue Messungen mit einem ungenauen Gerat erzielt werden konnen. Wird beispielsweise das Gerat, das eben zur Messung Ihrer GroBe benutzt wurde, eingesetzt, um die Dicke von 1000 Seiten Papier zu messen und das Ergebnis ware (20 ± 0, 5) cm, dann ergabe sich nach Formel (2.1) fiir die Starke einer Seite Papier (0,02 ± 0,0005) cm, das sind (0, 2 ± 0, 005) mm. Somit ist mit einem absoluten Fehler von hochstens 0,005 m m die Starke einer Seite auf 0,2 m m bestimmt. Der relative Fehler bei dieser Messung ist hochstens 0, 025 oder 2,5%. Diese Idee kann weiter entwickelt werden und sie wurde beispielsweise zur Erkennung eines schwachen periodischen Signals inmitten starkerer zufalliger Storungen, dem sogenannten weiBen Rauschen, vorgeschlagen. c. S t e l l e n w e r t s y s t e m e Oben wurde behauptet, dass jede reelle Zahl als eine Folge rationaler Naherungen dargestellt werden kann. Wir woUen nun eine Methode vorstellen, die fiir Berechnungen wichtig ist. Dabei wird fiir jede reelle Zahl in eindeutiger Weise eine Folge derartiger rationaler Naherungen konstruiert. Dadurch erhalten wir Stellenwertsysteme oder auch Positionssysteme. L e m m a . Sei q> 1 eine feste natiirliche Zahl. Dann existiert fur jede Zahl a; € M eine eindeutige Zahl k G li, so dass q''~^
positive
<x
Beweis. Wir zeigen zunachst, dass die Menge der Zahlen der Gestalt q'', k GN nicht nach oben beschrankt ist. W a r e sie beschrankt, dann gabe es eine kleinste obere Schranke s und nach der Definition der kleinsten oberen Schranke eine natiirliche Zahl m £ N, so dass ^ < q"^ < s. Aber dann ist s < (7™+^, so dass s keine obere Schranke dieser Menge sein kann. Da 1 < q, gilt (7™ < g" fiir m < n fiir alle m,n £ Z . Damit haben wir bereits gezeigt, dass fiir jede reelle Zahl c £ ffi eine natiirhche Zahl TV £ N existiert, so dass c < g" fiir alle n > N. Nun folgt, dass fiir jedes e > 0 ein M £ N existiert, so dass -^^ < e fiir aUe natiirhchen Zahlen m > M. Tatsachlich geniigt es, dafiir c = ^ und N = M zu setzen. Dann ist ^ < g™ fiir m > M.
66
2 Die reellen Zahlen
Somit ist die Zahlenmenge m £ Z , die die Ungleichung x < q"^ fiir a; > 0 erfiillt, von unten beschrankt und besitzt daher ein kleinstes Element k, das oflFensichtlich das Gesuchte ist, da fiir diese ganze Zahl q'^~^ < x < q'' gilt. Die Eindeutigkeit dieser Zahl k folgt aus der Tatsaclie, dass fiir m,n G Z und etwa m < n gilt: m < n — 1. Daher gilt fiir g > 1, dass g™ < g"~^. Tatsachlich kann an dieser Anmerkung ersehen werden, dass die Ungleichungen (7™~^ <x 1 fest vorgegeben und a; £ M eine beliebige positive Zahl. Nach dem Lemma konnen wir eine eindeutige Zahl p G 1, finden, so dass qP <x<
qP+^ .
(2.4)
D e f i n i t i o n 10. Die Zahl p, die (2.4) erfiillt, wird der Grad von x in der Basis q oder (falls q feststeht) nur der Grad von x genannt. Nach dem archimedischen Prinzip konnen wir eine eindeutige natiirliche Zahl ccp £ N finden, so dass apqP <x<
apqP + q" .
(2.5)
Mit (2.4) konnen wir sicher sein, dass ccp £ { 1 , . . . , g — 1}. AUe bei unserer Konstruktion nachfolgenden Schritte werden den folgenden mit Ungleichung (2.5) beginnenden Schritt wiederholen. Aus Ungleichung (2.5) und dem archimedischen Prinzip folgt, dass eindeutige Zahlen ap-i £ { 0 , 1 , . . . , g — 1} existieren, so dass apq^ + a.p-iqP~^
<x < a^q^ + ccp-ig^"^ + qP~^ .
(2.6)
Nach n derartigen Schritten erhalten wir die Ungleichung: apqP + ap-iqP-^
+ •• • + ap-„gP-" <
< a; < apqP + Up-iqP-^ + ••• + ttp-ng^"" + g^"". Nun existiert nach dem archimedischen Prinzip eine eindeutige Zahl a p _ „ _ i £ { 0 , 1 , . . . ,g — 1}, so dass apqP + • • • + a p - „ g J ' - " + a p _ „ _ i g J ' - " - i < X < apqP + ••• + ap-nqP-"
+ ap-n-ig^"""! +
qP-"-\
Somit haben wir einen Algorithmus gefunden, mit dem eine Folge von Zahlen ccp, c c p - i , . . . , ap-n, • • • aus der Menge { 0 , 1 , . . . , g—1} in eine Beziehung zur positiven Zahl x gebracht wird. Weniger formal formuliert, so haben wir eine Folge rationaler Zahlen der Form r „ = apqP + ••• + ap-nq^-"" konstruiert, so dass rn<x
-. + - ^
•
(2.7)
(2.8)
2.2 Klassen reeller Zahleii und Berechnungen
67
Anders forniuliert, so erhalten wir niit Hilfe der speziellen Folge (2.7) von unten und von oben immer bessere Naherungen. Das Symbol ap ... ap-n • • • ist eine Darstellung fiir die komplette Folge { r „ } . Um die Folge { r „ } aus ilirer symbolischen Darstellung zu erzeugen, miissen wir den Wert p, den Grad von X, angeben. Fiir p > 0 wird iiblicherweise ein K o m m a nacli CCQ gesetzt. Ist p < 0, so gilt die Vereinbarung, \p\ Nullen links von ap zu schreiben und die links steliende Null mit einem K o m m a abzutrennen (wir erinnern daran, dass Up ^ 0). So ist beispielsweise fiir q = 10: 123,45 := 1 • 10^ + 2 • 10^ + 3 • 10° + 4 • IQ-^ + 5 • 10"^ , 0,00123 := 1 • 10"^ + 2 • 10"^ + 3 • 10"'^ . Fiir q = 2: 1000,001 := l - 2 ^ + l - 2 - ^ . Somit hangt der Wert einer Stelle im Symbol ap ... ap-n • • • von seiner relativen Position zum K o m m a ab. Mit dieser Konvention konnen wir aus der symbolischen Darstellung die gesamte Naherungsfolge aufstellen. ap .. .ao-... Aus den Ungleichungen (2.8) (zeigen Sie dies!) konnen wir sehen, dass verschiedene Folgen {r„} und {r'„} und daher auch verschiedene Darstellungen und a'p .. .aQ.... zu verschiedenen Zahlen x und x' gehoren. ap .. .ao-... Wir wollen nun die Frage beantworten, ob jede Darstellung ccp . . . CCQ- • • • einer reellen Zahl a; £ M entspricht. Die Antwort darauf wird „Nein" lauten. Wir halten fest, dass aufgrund des beschriebenen Algorithmus zur Bestimmung der Zahlen ap-n G { 0 , 1 , . . . , g — 1} nicht alle diese Zahlen von einem gewissen P u n k t an gleich g — 1 sein konnen. Ist namlich r „ = apqP + ••• ap-kq^-'^
+ (q - l ) g P - * - i + • • • + {q -
fiir alle n > k, d.h. -P
n^-P
< X
1
dann gilt nach (2.. 1
1
ru H—; qk-p
q"-P
~
qk-
Nun gilt fiir alle n > k: 1 qh p
was nach 8° oben unmoglich ist.
1 qn
l)qP-"
68
2 Die reellen Zahlen
Auch die Feststellung, dass, falls eine der Zahlen cxp—j^—i,..., cxp—'a kleiner a\s q — 1 ist, wir anstelle von (2.9) 1 qk-p
1 qn-v
schreiben konnen oder, was identisch ist ^n + ^p
+^ ,
(2.10)
ist hilfreicli. Nun konnen wir beweisen, dass jede Darstellung «„ . . . a o - . . . , die aus den Zahlen ccfc € {0,1,...,(/ — 1} zusammengesetzt ist und in der es von q — 1 verschiedene Zahlen mit beliebig groBen Indizes gibt, zu einer Zahl a; > 0 gehoren. Tatsachlich konnen wir aus der Darstellung ocp ... cxp—n • • • die Folge {r„} der Form (2.7) konstruieren. Aufgrund der Beziehungen ro < ri < r„ < • • • und unter Beriicksichtigung von (2.9) und (2.10) erhalten wir: r o < r i < • • • < • • • < • • • < r„ + ^ < - - - < r i + ^ < r o + 4 r qn p
qi- p
(2-11)
q p
Die strengen Ungleichungen in dieser letzten Beziehung soUten folgendermaBen verstanden werden: Jedes Element der Folge auf der linken Seite ist kleiner als jedes Element auf der rechten Seite. Dies folgt aus (2.10). Wenn wir nun x = sup r„ ( = inf (r„+g~("~P-')) bilden, wird die Folge {r„} die Bedingungen (2.7) und (2.8) erfiiUen, d.h., die Darstellung ap ... ap-n • • • entspricht der Zahl a; € ffi. Somit haben wir eine eindeutige Beziehung zwischen den positiven Zahlen X GW und den Symbolen der Form ap .. .ao,... fiir p > 0 oder 0,0 . . . 0 ccp . . . IPI Nullen
fiir p < 0 hergestellt. Die x zugewiesene symbolische Darstellung wird auch q-adische Darstellung von x genannt. Die in der Darstellung auftretenden Zahlen werden Ziffern und die Position einer Ziffer relativ zum Komma wird Stelle genannt. Wir vereinbaren, einer Zahl a; < 0 die Darstellung der positiven Zahl —x mit vorangestelltem Minuszeichen zu geben. SchlieBlich weisen wir die Darstellung 0, 0 . . . 0 . . . der Zahl 0 zu. Auf diese Weise haben wir das Stellenwertsystem (auch Positionssystem) zur Basis q zum Schreiben reeller Zahlen konstruiert. Das gebrauchlichste System ist dabei das Dezimalsystem (im normalen Gebrauch) und aus technischen Griinden das binare System (in elektronischen Computern). Weniger verbreitet, aber in einigen Teilen der Informatik iiblich, sind das ternare, oktale und hexadezimale System.
2.2 Klassen reeller Zahleii und Berechnungen
69
Die Formeln (2.7) und (2.8) verdeutlichen, dass der absolute Fehler der Naherung (2.7) fiir x nicht grofier ist als eine Einheit in der letzten vorhandenen Stelle, wenn in der symbolischen Darstellung von x nach einer endlichen Zalil von Ziffern alle folgenden Stellen gestriclien werden (oder, falls gewiinsclit, konnen wir diese Stellen gedanklich mit NuUen fiillen). Diese Beobachtung ermoglicht den Gebraucli der Formeln aus Paragraph b, um die Fehler, die bei arithmetischen Operationen mit Zahlen auftreten, abzuschatzen, wenn wir die exakten Zahlen durch die entsprechenden Werte der Formel (2.7) ersetzen. Diese letzte Anmerkung besitzt auch einen gewissen theoretischen Wert. Genauer gesagt, werden wir ein neues Modell der reellen Zahlen erstellt haben, wenn wir eine reelle Zahl x mit ihrer g-adischen Darstellung identifizieren und entsprechend Paragraph b gelernt haben, arithmetische Operationen direkt mit g-adischen DarsteUungen auszufiihren. Offensichtlich besitzt dieses Modell fiir Berechnungen einen besonderen Stellenwert. Dabei stellen sich im Wesentlichen die folgenden Probleme: Bei zwei g-adischen DarsteUungen ist es notwendig, fiir deren Summe ein neues Symbol einzufiihren. Dieses wird natiirlich schrittweise konstruiert. Genauer gesagt, werden wir rationale Naherungen fiir die Summe erhalten, wenn wir immer genauere rationale Naherungen der Ausgangszahlen addieren. Mit Hilfe der obigen Anmerkung konnen wir zeigen, dass wir mit steigender Genauigkeit der Naherungsausdriicke immer mehr Ziffern der g-adischen Darstellung der Summe erhalten, die sich dann nicht mehr bei den folgenden Verbesserungen in den Naherungen verandern. Dasselbe Problem stellt sich bei der Multiphkation. Ein anderer, weniger konstruktiver Weg zu den reellen Zahlen geht auf Dedekind zuriick. Dedekind identifiziert eine reelle Zahl mit einem Schnitt der Menge Q der rationalen Zahlen, d.h. einer Zerlegung von Q in zwei disjunkte Mengen A und B, so dass a < 6 fiir aUe a £ A und b G B. Mit dieser Annaherung an reelle Zahlen wird unser VoUstandigkeitsaxiom zu einem wohl bekannten Satz von Dedekind. Aus diesem Grund wird das VoUstandigkeitsaxiom in der Art, wie wir es formuliert haben, manchmal auch das Dedekind-Axiom genannt. Zusammenzufassend lasst sich sagen, dass wir in diesem Abschnitt die wichtigste Klasse von Zahlen vorgestellt haben. Wir haben die zentrale Rolle, die die natiirlichen und die rationalen Zahlen dabei spielen, verdeutlicht. Wir konnten zeigen, dass sich die zentralen Eigenschaften dieser Zahlen aus dem Axiomensystem*, das wir gewahlt haben, ergeben. Wir haben verschiedene Modelle der Menge der reellen Zahlen skizziert. Wir haben dabei die Gesichtspunkte bei Berechnungen mit reellen Zahlen untersucht: Fehlerabschatzungen, In fast der hier vorgestellten Form wurde es von Hilbert zu Beginn des 20. Jahrhunderts aufgestellt, vgl. etwa Hilbert, D.: "Uber den ZahlbegrifF" in Jahreshericht der deutschen Mathematikervereinigung 8 (1900).
70
2 Die reellen Zahlen
die bei arithmetischen Operationen mit Naherungswerten auftreten und die symbolische g-adische Darstellung. 2.2.5 U b u n g e n u n d A u f g a b e n 1. Zeigeii Sie mit dem Induktionsprinzip, dass a) die Summe xi + • • • + Xn reeller Zahlen unabhangig ist von der Klamnierung der Summanden, d.h. der Festschreibung der Reihenfolge, b) das Gleiche auch fiir das Produkt Kilt, c) \xi -\ h a;„| < |xi| H h |x„|, d ) \xi
• • -Xnl
e) ({m, neK)
=
\xi\
•••
\Xn\,
A{m
^
({n - m) G
NV
f) (1 + x)" > 1 + nx fiir a; > —1 und n G N, wobei Gleichheit nur fiir n = 1 oder X = 0 gilt {Bernoullische Ungleichung) und g) (a + 6)" = a" + f^o"-i6 + i i ^ ^ o " - " 6 " + • • • + "'"„"_V),""a6"-^ + 6" (Newtons binomische Formel). 2. a) Zeigen Sie, dass Z und Q induktive Mengen sind. b) Geben Sie Beispiele fiir von N, Z, Q und R verschiedene induktive Mengen. 3. Zeigen Sie, dass eine induktive Menge nicht von oben beschrankt ist. 4.
a) Eine induktive Menge ist unendlich (d.h. aquipotent zu einer ihrer Teilmengen, die von ihr verschieden ist). b) Die Menge -B„ = {x £ N | a; < n} ist endlich. (Wir bezeichnen \E„\ mit n.)
5.
a) (Der euklidische Algorithmus) Seien TTI, n £ N und m > n. Ihr groflter gemeinsamer Teller (ggT (m, n) = d GN) kann in einer endlichen Schrittzahl mit dem folgenden Algorithmus von Euklid bestimmt werden, der aufeinanderfolgende Divisionen mit Rest beinhaltet. m = qin + ri n = q2ri + r2 ri = q3r2 + rs Tk-i
(ri < n) , (r2 < ri) , (rs < r2) ,
= qk+iTk + 0 .
Dann ist d = Vk. b) Ist d = ggT (m, n), konnen wir Zahlen p,q G "Z wahlen, so dass pm + qn = d. Insbesondere gilt, wenn m und n teilerfremd sind, dass pm + qn = 1. 6. Versuchen Sie einen eigenen Beweis fiir den Fundamentalsatz der Arithmetik (Paragraph a in Absatz 2.2.2) zu formuberen. 7. Ist das Produkt m-n natiirlicher Zahlen durch eine Primzahl teilbar, d.h., m-n = p • k, mit fc £ N, dann ist entweder m oder n durch p teilbar. 8. Aus dem Fundamentalsatz der Arithmetik folgt, dass die Menge der Primzahlen unendlich ist.
2.2 Klassen reeller Zahleii und Berechnungen
71
9. Zeigeii Sie, dass die Gleichung x"^ = n keine rationale Losung besitzt, wenn sich die natiirliche Zahl n nicht als fc"* mit k,m, GN schreiben lasst. 10. Zeigeii Sie, dass die Formulierung einer rationalen Zahl in einer beliebigen qadisclien Darstellung periodiscli ist, d.li., ab einer Stelle besteht sie aus periodiscli wiederkelirenden ZifFerngruppen. 11. Wir woUen eine irrationale Zahl a £ R durch rationale Zahlen wohl genahert nennen, falls fiir beliebige natiirliche Zahlen n,N£'N eine rationale Zahl ^ existiert, so dass a — f <
j ^ -
a) Konstruieren Sie ein Beispiel einer wohl genaherten irrationalen Zahl. b) Beweisen Sie, dass eine wohl genaherte irrationale Zahl nicht algebraisch sein kann, d.h., sie ist transzendent (Satz von Liouville^). 12. Leiten Sie die „Regeln" fiir die Addition, Multiplikation und Division von Briichen her, wobei Sie von — := m • n~^ (per definitionem), mit m £ Z und n G N, ausgehen, und ebenso fiir die Bedingung, damit zwei Briiche gleich sind. 13. Beweisen Sie, dass die rationalen Zahlen Q alle Axiome der reellen Zahlen erfiillen, mit Ausnahme des Vollstandigkeitsaxioms. 14. Zeigen Sie im geometrischen Modell fiir die Menge der reellen Zahlen (die reelle Gerade), wie die Zahlen a + b, a — b, ab und |- in diesem Modell konstruiert werden. 15. a) Veranschaulichen Sie auf der reellen Gerade das VoUstandigkeitsaxiom. b) Zeigen Sie, dass das Prinzip der kleinsten oberen Schranke zum VoUstandigkeitsaxiom aquivalent ist. 16. a) Gilt Ac B C^, dann auch sup A < sup B und inf A > inf B. b) Sei R D A 7^ 0 und R D F ^ 0 . Ist a; < y fiir alle x G X und alle y GY, dann ist A von oben beschrankt, Y von unten beschrankt und sup A < inf F . c) Gilt fiir die Mengen X,Y in b) auch XUY = R, dann gilt sup A = inf F . d) Seien A und Y die in c) definierten Mengen. Dann besitzt entweder A ein grofites Element oder Y ein kleinstes Element {Satz von Dedekind). e) (Fortsetzung.) Zeigen Sie, dass der Satz von Dedekind zum VoUstandigkeitsaxiom aquivalent ist. 17. Sei A + B die Menge von Zahlen der Form a + b und A-B die Menge der Zahlen der Form a • b, mit a G A und 6 G _B C R. Entscheiden Sie, ob es immer wahr ist, dass a) sup(^ + B) = sup A + sup B, b) sup(^ • B) = sup A • sup B. 18. Sei —A die Menge der Zahlen der Form —a mit a G A C R. Zeigen Sie, dass s u p ( - A ) = - i n f A. ® J. Liouville (1809-1882) - franzosischer Mathematiker, der sich mit komplexer Analysis, Geometric, Differentialgleichungen, Zahlentheorie und Mechanik beschaftigte.
72
2 Die reellen Zahlen
19.
a) Zeigen Sie, dass die Gleichung x" = o fiir n G N und o > 0 eine positive Losung (mit \/a oder a"^'"' bezeichnet) besitzt. Beweisen Sie, dass fiir o > 0, 6 > 0 und n^m ^'i^ gilt: b) yah = \fa • yh und \j^Ja = " "^/o. c) (on )"" = (o"") n =: o""/" und o'^" • a}'"^ = a^/^+^/^. d) ( o " " / " ) - ' = ( o " ' ) ' " / " =: o-""/". e) Zeigen Sie, dass fiir alle r i , r 2 G Q gilt: a"-! . a'^ = a'^+'^
und
{a'^f^ = a'^'^ .
20.
a) Zeigen Sie, dass die Inklusion eine teilweise Anordnung fiir die Menge (aber keine lineare Anordnung!) induziert. b) Seien A, B und C Mengen mii A d C, B
21.
a) Zeigen Sie, dass die Menge Q ( y n ) von Zahlen der Form a + 6^/n, mit o, 6 G Q , wobei n eine feste natiirliclie Zahl ist, die keine Quadratzalil einer anderen ganzen Zalil ist, genau wie die Menge Q ein geordneter Korper ist, der das arcliimedische Prinzip erfiillt, aber niclit das VoUstandigkeitsaxiom. b) Bestimmen Sie, welches der Axiome fiir die reellen Zahlen nicht fiir Q_{^/n) gilt, wobei die normalen arithmetischen Operationen in Q ( ^ n ) beibehalten werden, aber die Anordnung durch die Regel (a + 6^/n < a' + b'^/n) := ((fe < 6')^ ((6 = b') A (a < a')]] definiert wird. Erfiillt Q{^n) so das archimedische Prinzip? c) Ordnen Sie die Menge P[a;] der Polynome mit rationalen oder reellen KoefRzienten mit Hilfe von Pm{x) = oo + aix + • • • + ttmx"^ >~ 0,
fiir
am > 0 .
d) Zeigen Sie, dass die Menge Q{x) rationaler Briiche R„
ao + aix + • • • + UmX^ bo + bix + • • • + 6„x"
mit KoefRzienten in Q oder R ein geordneter Korper ist, aber nicht ein archimedisch geordneter Korper. Dabei wird die Anordnungsrelation Rm,n >~ 0 dadurch definiert, dass Umbn > 0. Ansonsten gelten die iiblichen arithmetischen Operationen. Daraus folgt, dass das archimedische Prinzip nicht ohne Verwendung des VoUstandigkeitsaxioms aus den anderen Axiomen fiir R abgeleitet werden kann. 22. Sei n G N und n > 1. In der Menge En = { 0 , 1 , . . . , n — 1} definieren wir die Summe und das Produkt zweier Elemente als die Reste, die sich durch Division der iiblichen Summen und Produkte in R mit n ergeben. Mit den so definierten Operationen wird die Menge En als Z„ bezeichnet. a) Zeigen Sie, dass Zahlen m,,k in Z„ ungleich Null existieren, so dass m • k = 0, falls n keine Primzahl ist. (Derartige Zahlen werden Nullteiler genannt.) Dies bedeutet, dass in Z„ die Gleichung a • b = c • b nicht impliziert, dass a = c gilt, selbst wenn b ^ 0.
2.2 Klassen reeller Zahleii und Berechnungen
73
b) Zeigen Sie, dass fiir die Primzahl p keine NuUteiler in Zp existieren und Zp ein Korper ist. c) Zeigen Sie, dass unabhangig von der Primzahl p Zp nicht so angeordnet werden kann, dass dies niit arithmetischen Operationen konsistent ist. 23. Zeigen Sie, dass fiir zwei Modelle R und R' der reellen Zahlen und einer Abbildung / : R ^ R mit f{x + y) = f{x) + f{y) und f{x • y) = f{x) • f{y) fiir alle a;,2/GR, gilt: a) /(O) = 0', b) / ( I ) = 1' fiir f{x) ^ 0'. Dies setzen wir im Folgenden voraus. c) f{m) = m mit m € Z und m' G Z'. Ferner ist die Abbildung / : Z —>• Z' injektiv und erhalt die Anordnung. d) / ( f ) = f r mit m , n G Z, n ^ 0, m',n' G Z', n' 7^ 0', / ( m ) = m', / ( n ) = n'. Somit ist / : Q —>• Q' eine bijektive Abbildung, die die Anordnung erhalt. e) / : R —> R' ist eine bijektive Abbildung, die die Anordnung erhalt. 24. Zeigen Sie, ausgehend von der vorherigen Aufgabe und dem Vollstandigkeitsaxiom, dass das Axiomensystem fiir die Menge der reellen Zahlen diese Menge bis auf einen Isomorphismus (eine Realisierungsmethode) bestimmt, d.h., sind R und R' zwei Mengen, die diese Axiome erfiillen, so existiert eine eins-zu-eins Abbildung / : R —> R', die die arithmetischen Operationen und die Anordnung erhalt: fix + y) = fix) + fiy),
fix • y) = fix) • fiy) und ix
[fix)
<
fiy)).
25. Eine Zahl x wird auf dem Computer als ^ ^ ^ py
On
k
dargestellt, wobei p die Ordnung von x ist und M = X) fS" ^^^ die Mantisse der n=l
Zahl X ( i < M < 1). Nun arbeitet ein Computer nur mit einem gewissen Zahlenbereich: fiir g = 2 ist iiblicherweise |p| < 64, und k = 35. Bestimmen Sie diesen Bereich im Dezimalsystem. 26. a) Formulieren Sie die (6 x 6) Multiplikationstabelle zur Basis 6. b) Multiplizieren Sie „spaltenweise" mit Hilfe der Ergebnisse aus a) zur Basis 6: (532)6 "" (145)6 Kontrollieren Sie ihr Ergebnis mit einer Vergleichsrechnung im Dezimalsystem. c) Benutzen Sie die „Schuldivision" fiir (1301)6 1(25)6 und iiberpriifen Sie ihr Ergebnis mit einer Vergleichsrechnung im Dezimalsystem.
74
2 Die reellen Zahlen
d) Addieren Sie „spaltenweise":
+
(4052)e (3125)e
27. Schreiben Sie (100)lo im binaren und im ternaren System. 28.
a) Zeigen Sie, dass eine ganze Zahl neben ihrer eindeutigen Darstellung als ( a „ Q „ - l . . .Qo)3
mit ai G {0,1, 2} auch als (jSuPn-l-.-Ms mit /3 G { — 1, 0,1} geschrieben werden kann. b) Sie wollen in drei Wiegevorgangen mit einer Waage eine falsche Miinze, die sich im Gewicht von einer echten unterscheidet, identifizieren. Nennen Sie die groflte Anzahl von Miinzen, aus der Sie die falsche Miinze linden konnen. 29. Wie viele Fragen, die nur mir „Ja" oder „Nein" beantwortet werden, miissen Sie mindestens stellen, um eine 7-stellige Telefonnummer siclier zu bestimmen? 30.
a) Wie viele verschiedene Zahlen konnen mit 20 dezimalen Ziffern (etwa 2 Reihen mit jeweils 10 moglichen ZifFern) definiert werden? Beantworten Sie dieselbe Frage fiir das binare System. In welchem System ist ein Vergleich zweier Zahlen efFektiver durchzufiihren? b) Bestimmen Sie die Anzahl verschiedener Zahlen, die mit n ZifFern eines Systems zur Basis q geschrieben werden konnen. ( A n t w o r t : g"^*.) c) Zeichnen Sie den Graphen der Punktion f{x) = x"'^''' mit Argumenten aus der Menge der natiirlichen Zahlen und vergleichen Sie die Effektivitat der verschiedenen Berechnungsmethoden.
2.3 Wichtige Satze im Zusammenhang mit der Vollstandigkeit der reellen Zahlen In diesem Abschnitt werden wir einige einfache niitzliche Hauptsatze einfiihren, von denen jeder als VoUstandigkeitsaxiom bei unserer Konstruktion der reellen Zahlen h a t t e benutzt werden konnen^". Wir nennen diese Hauptsatze wichtige Satze im Hinblick auf ihren verbreiteten Gebrauch beim Beweisen einer Vielzahl von Satzen der Analysis. 2.3.1 D e r S a t z zur I n t e r v a l l s c h a c h t e l u n g (Cauchy—Cantor Hauptsatz) D e f i n i t i o n 1 . Eine Funktion / : N —>• X mit natiirlichen Zahlen als Argument wird eine Folge oder voUstandiger eine Folge von Elementen von X genannt. Vgl. Aufgabe 4 am Ende dieses Abschnitts.
2.3 Wichtige Satze zur VoUstandigkeit
75
Der zur Zahl n € N zugehorige Wert f{n) der Funktion / wird oft x„ geschrieben und das n-te Element der Folge genannt. D e f i n i t i o n 2. Sei Xi,X2, • • •, X „ , . . . eine Folge von Mengen. Gilt Xi D X2 D • • • D Xn 3 • • •, d.h. Xn D Xn+i fur alle n £ N, so sprechen wir von einer gescliachtelten Folge. S a t z . (Caucliy-Cantor). Zu jeder geschachtelten • • • abgeschlossener Intervalle existiert ein Punkt len enthalten ist. 1st zusatzlich bekannt, dass fiir jedes e > 0 ein Ldnge \Ik\ kleiner als e ist, dann ist c der einzige Intervallen.
Folge h D h ^ • • • ^ In ^ c £ ffi, der in alien IntervalIntervall Ik existiert, dessen gemeinsame Punkt in alien
Beweis. Wir beginnen mit der Feststellung, dass fiir je zwei abgesclilossene Intervalle / „ = [um, bm] und / „ = [a„, b„] der Folge gilt, dass a™ < &„. Denn ansonsten wiirde Un < bn < am < bm gelten und die Intervalle / „ und / „ waren zueinander disjunkt und gleichzeitig ware eines (das mit dem groBeren Index) in dem anderen enthalten. Somit erfiillen die numerischen Mengen A = { a m | m € N} und B = {bn\n e N} die Annalime des VoUstandigkeitsaxioms, nacli dem eine Zahl c e ffi existiert, so dass am < c < bn fiir aUe am & A und bn & B. Insbesondere gilt dabei an < c < bn fiir aUe n € N. Das bedeutet aber, dass der P u n k t c in alien Intervallen / „ enthalten ist. Nun seien ci und C2 zwei P u n k t e mit dieser Eigenschaft. Sind sie verschieden, etwa ci < C2, dann gilt fiir jedes n £ N, dass a„ < ci < C2 < bn und daher 0 < C2 — ci < bn — an- Somit kann die Lange jedes Intervalls in der Folge nicht kleiner als C2 — ci sein. Existieren daher Intervalle beliebig kleiner Lange in der Folge, so ist der gemeinsame P u n k t eindeutig. D 2.3.2 D e r S a t z zur e n d l i c h e n U b e r d e c k u n g (Borel—Lebesgue H a u p t s a t z o d e r S a t z v o n Heine—Borel) D e f i n i t i o n 3 . Eine Familie S = {X} von Mengen X wird Uberdeckung einer Menge Y genannt, wenn Y C [J X, (d.h., wenn jedes Element y G Y in xes mindestens einer der Mengen X in der Familie S enthalten ist). Eine Teilmenge einer Menge S = {X}, die eine Familie von Mengen ist, wird Teilfamilie von S genannt. Daher ist eine Teilfamilie einer Familie von Mengen selbst wieder eine gleichartige Familie. S a t z . (Borel-Lebesgue).^^ Jede Familie offener Intervalle, senes Intervall iiberdeckt, enthdlt eine endliche Teilfamilie, sene Intervall iiberdeckt.
die ein abgeschlosdie das abgeschlos-
^^ E. Borel (1871-1956) und H. Lebesgue (1875-1941) - wohl bekannte franzosische Mathematiker, die sich mit Punktionentheorie beschaftigten.
76
2 Die reellen Zahlen
Beweis. Sei S = {U} eine Familie oflFener Intervalle U, die das abgeschlossene Intervall [a, b] = / i iiberdeckt. Kann das Intervall / i nicht von einer endlichen Menge von Intervallen der Familie S iiberdeckt warden, dann teilen wir / i in zwei Halften. Mindestens einer der Halften, die wir mit I2 bezeichnen, erlaubt keine endliche Uberdeckung. Wir wiederholen nun dieses Verfahren mit dem Intervall I2 und so welter. Auf diese Weise erzeugen wir eine geschaclitelte Folge Ii D /2 D • • • D I„ D • • • abgeschlossener Intervalle, von denen keines eine Uberdeckung durch eine endliche Teilfamilie von S zulasst. Da die Lange des Intervalls / „ gleich \In\ = \h\ • 2 ~ " ist, enthalt die Folge {/„} Intervalle beliebig kleiner Lange (vgl. das Lemma in P a r a g r a p h c in Absatz 2.2.4). Nach dem Satz zur Intervallschachtelung existiert jedoch ein P u n k t c, der in alien diesen Intervallen / „ n £ N enthalten ist. Da c £ / i = [a,b], existiert ein oflFenes Intervall ]«,/?[= U G S, das c enthalt, d.h., a < c < p. Sei e = min{c —cc,/? —c}. In der eben konstruierten Folge finden wir ein Intervall / „ mit | / „ | < e. Da c G I„ und | / „ | < e, konnen wir folgern, dass In C U =]a,/3[. Dies widerspricht jedoch der Tatsache, dass das Intervall / „ nicht durch eine endliche Menge von Intervallen der Familie iiberdeckt werden kann. D 2.3.3 Der Satz v o m Haufungspunkt (Hauptsatz von Bolzano—Weierstrafi) Wir erinnern daran, dass wir eine Umgebung eines P u n k t e s a; € M als ein offenes Intervall definiert haben, das den P u n k t x enthalt, und eine d-Umgebung um X als das offene Intervall ]x — d,x + d[. D e f i n i t i o n 4. Ein P u n k t p € M ist ein Haufungspunkt der Menge X C ffi, wenn jede Umgebung des P u n k t e s eine unendliche Teilmenge von X enthalt. Diese Bedingung ist offensichtlich aquivalent zu der Annahme, dass jede Umgebung von p mindestens einen P u n k t von X enthalt, der von p verschieden ist. (Beweisen Sie dies!) Wir geben nun einige Beispiele. Sei X = { i e M| n e N } . Dann ist der P u n k t 0 e K der einzige Haufungspunkt von X. In einem oflFenen Intervall ]a, b[ ist jeder P u n k t im abgeschlossenen Intervall [a, b] ein Haufungspunkt und es gibt keine weiteren. In der Menge Q rationaler Zahlen ist jeder P u n k t in ffi ein Haufungspunkt, da, wie wir wissen, jedes offene Intervall um reelle Zahlen rationale Zahlen enthalt. S a t z . (Bolzano-Weierstrafi)^^. Jede beschrankte Zahlen besitzt mindestens einen Haufungspunkt.
unendliche
Menge
reeller
^"^ B. Bolzano (1781-1848) - tschechischer Mathematiker und Philosoph. K. Weierstrafi (1815-1897) - deutscher Mathematiker, der einen Grofiteil seiner Aufmerksamkeit den logischen Grundlagen der mathematischen Analysis widniete.
2.3 Wichtige Satze zur VoUstandigkeit
77
Beweis. Sei X die vorgegebene Teilnienge von ffi. Aus der Definition der Beschranktheit folgt, dass X in einem abgeschlossenen Intervall / C ffi enthalten ist. Wir werden zeigen, dass zumindest ein P u n k t von / ein Haufungspunkt von X ist. Wenn dem nicht so ware, dann h a t t e jeder P u n k t x G I eine Umgebung U{x), in der entweder kein P u n k t von X enthalten ist oder hochstens eine endliche Zahl. Die Gesamtheit dieser Umgebungen {U{x)}, die fiir die P u n k t e X £ I konstruiert werden, bilden eine Uberdeckung von / mit ofFenen Intervallen U{x). Nach dem Satz zur endlichen Uberdeckung konnen wir eine Familie U{xi),... ,U{xn) offener Intervalle herausgreifen, die / iiberdeckt. Da aber X C I, iiberdeckt dieselbe Familie ebenso X. Es gibt jedoch nur endlich viele P u n k t von X in U{xi) und dalier aucli nur endlich viele in der Vereinigung der Umgebungen. Damit ist X eine endliche Menge. Dieser Widerspruch beendet den Beweis. D
2.3.4 Ubungen und Aufgaben 1. Zeigen Sie, dass a) fiir eine beliebige Familie geschachtelter abgeschlossener Intervalle / gilt: sup | o G R| [o, 6] G / } = Q < /3 = inf Ih G R| [o, 6] G / } und
[a,/3]=
n
[o,6];
[o,i)]e/
b) fiir eine Familie / geschachtelter offener Intervalle ]o, h[ die Schnittmenge PI ]a, 6[ leer sein kann. ]o,i)[e/ H i n w e i s : ]o„,6„[= lo, ^ I. 2. Zeigen Sie, dass a) aus einer Familie abgeschlossener Intervalle, die ein abgeschlossenes Intervall iiberdeckt, nicht immer eine endliche Teilfamilie gewahlt werden kann, die das Intervall uberdeckt; b) aus einer Familie offener Intervalle, die ein offenes Intervall iiberdeckt, nicht immer eine endliche Teilfamilie gewahlt werden kann, die das Intervall iiberdeckt; c) aus einer Familie abgeschlossener Intervalle, die ein ofFenes Intervall iiberdeckt, nicht immer eine endliche Teilfamilie gewahlt werden kann, die das Intervall iiberdeckt. 3. Zeigen Sie, dass keiner der drei oben bewiesenen Satze wahr ist, wenn wir die Menge Q der rationalen Zahlen anstelle der voUstandigen Menge R der reellen Zahlen nehmen und ein abgeschlossenes Intervall, ein offenes Intervall und eine Umgebung eines Punktes r G Q jeweils entsprechende Teilmengen von Q bedeuten. 4. Zeigen Sie, dass wir ein zu dem bereits Vorgestellten aquivalentes Axiomensystem erhalten, wenn wir das Vollstandigkeitsaxiom ersetzen durch
78
2 Die reellen Zahlen
a) den Hauptsatz von Bolzano-Weierstrafi, b) den Satz von Heine-Borel (den Hauptsatz von Borel-Lebesgue). H i n w e i s : Das archimedische Prinzip und das Vollstandigkeitsaxiom in seiner friiheren Form folgen beide aus a). c) Der Ersatz des VoUstandigkeitsaxioms durch den Hauptsatz von Cauchy-Cantor fiihrt auf ein Axiomensystem, das zum urspriinglichen System aquivalent wird, wenn wir auch das archimedische Prinzip postuheren. (Vgl. Aufgabe 21 in Absatz 2.2.2.)
2.4 Abzahlbare und iiberabzahlbare Mengen Wir woUen nun die Inforniationen iiber Mengen, die wir in Kapitel 1 gegeben haben, erganzen. Diese Erganzung wird unten hilfreich sein. 2.4.1 A b z a h l b a r e M e n g e n D e f i n i t i o n 1. Eine Menge X heii3t ahzahlhar, wenn sie zur Menge N der natiirlichen Zahlen aquipotent ist, d.h., \X\ = |N|. S a t z . a) Eine unendliche Teilmenge einer abzahlbaren Menge ist ahzahlhar. b) Die Vereinigung der Mengen einer endlichen oder ahzdhlharen Familie ahzdhlharer Mengen ist eine ahzdhlhare Menge. Beweis. a) Es geniigt zu zeigen, dass jede unendliche Teilmenge E von N zu N aquipotent ist. Wir konstruieren die notwendige bijektive Abbildung f :N ^ E folgendermaBen: Es gibt ein kleinstes Element von Ei := E, das wir der Zahl 1 £ N zuweisen und mit ei £ E bezeichnen. Die Menge E ist unendhch und daher ist E^ := Ei \ ei nicht leer. Wir weisen das kleinste Element von E2 der Zahl 2 zu und bezeichnen es als 62 € -B2- Dann betrachten wir E3 := E \ {61,62} u.s.w.. Da E eine unendliche Menge ist, kann diese Konstruktionen nicht nach einer endlichen Anzahl von Schritten mit dem Index n £ N abbrechen. Wie aus dem Induktionsprinzip folgt, weisen wir auf diese Weise eine gewisse Zahl 6„ £ -E jedem n £ N zu. Offensichtlich ist die Abbildung f :N ^ E injektiv. Es bleibt zu zeigen, dass sie surjektiv ist, d.h., / ( N ) = E. Sei e G E. Die Menge {n £ N| n < e} ist endhch und daher ist die Teilmenge {n £ E\n < e} ebenso endlich. Sei k die Anzahl der Elemente in der letztgenannten Menge. Dann ist nach der Konstruktion e = e^. b ) S e i A i , . . . , A m •. • eine abzahlbare Familie von Mengen und jede Menge ^m = {a^m, • • • ,a;5^,...} sei ebenfalls abzahlbar. Dann ist die Machtigkeit der Menge X = [J A „ , die aus den Elementen x^ mit m,n £ N besteht, nSN
nicht geringer als die Machtigkeit jeder der Mengen X^. Daraus folgt, dass X eine unendliche Menge ist. Das Element x^ £ X^ kann mit dem P a a r (m, n) natiirlicher Zahlen, die es kennzeichnen, identifiziert werden. Somit
2.4 Abzahlbare und iiberabzahlbare Mengeii
79
kann die Machtigkeit von X nicht groBer sein als die Machtigkeit der Menge aller derartigen geordneten Paare. Aber die Abbildung / : N x N ^ N, die durch die Formel (m, n) ^ (m+»)(m+n+i) ^ ^ gegeben wird, ist, wie einfach zu zeigen ist, bijektiv. (Sie besitzt eine anschauliche Bedeutung: Wir zahlen die Punkte einer Ebene mit den Koordinaten {m,n), wobei wir nach und nach von Punkten einer Diagonalen, auf der m + n konstant ist, zu den Punkten der nachsten derartigen Diagonalen wechseln, auf der die Summe um 1 groi^er ist.) Daher ist die Menge der geordneten Paare {m,n) der natiirlichen Zahlen abzalilbar. Aber dann ist \X\ < |N|, und da X eine unendliche Menge ist, folgern wir auf der Basis von a), dass |X| = |N|. D Aus dem eben bewiesenen Satz folgt, dass eine Teilmenge einer abzahlbaren Menge entweder endlicli oder abzalilbar ist. Wenn bekannt ist, dass eine Menge entweder endlich oder abzahlbar ist, sagen wir, sie ist hochstens abzdhlbar. (Eine aquivalente Formulierung ist \X\ < |N|.) Wir konnen nun insbesondere behaupten, dass die Vereinigung einer hochstens abzahlbaren Familie von hochstens abzdhlbaren Mengen hochstens abzdhlbar ist. KoroUare 1) | Z | = | N | . 2) |N2| = |N|. (Dieses Ergebnis bedeutet, dass das direkte Produkt abzahlbarer Mengen wieder abzahlbar ist.) 3) |Q| = |N|, d.h., die Menge der rationalen Zahlen ist abzdhlbar. Beweis. Eine rationale Zahl ^ wird durch ein geordnetes Paar {m,n) von ganzen Zahlen definiert. Zwei Paare (m, n) und (m',n') definieren genau dann dieselbe rationale Zahl, wenn sie proportional sind. Wenn wir daher als eindeutiges Paar das Paar {m,n) mit der kleinsten positiven ganzen Zahl n € N als Nenner zur eindeutigen Charakterisierung einer rationalen Zahl wahlen, so stellen wir fest, dass die Menge Q zu einer unendlichen Teilmenge der Menge Z X Z aquipotent ist. Aber jZ^I = |N| und daher ist |Q| = |N|. D 4) Die Menge der algebraischen Zahlen ist abzdhlbar. Beweis. Wir stellen zunachst fest, dass aus der Gleichheit |Q x Q| = |N| mit Induktion folgt, dass |Q^ | = |N| fiir alle fc e N. Ein Element r £ Q* ist eine geordnete Menge ( n , . . . , r j ) aus k rationalen Zahlen. Eine algebraische Gleichung vom Grad k mit rationalen KoefRzienten lasst sich in der reduzierten Form a;* + ria;*~^ + • • • + ?•& = 0 schreiben, wobei der fiihrende Koeffizient 1 ist. Daher gibt es so viele verschiedene algebraische
80
2 Die reellen Zahlen
Gleichungen vom Grade k wie verschiedene geordnete Paare ( r i , . . . ,rfc) rationaler Zahlen, d.h. eine abzahlbare Menge. Die algebraischen Gleichungen niit rationalen Koeffizienten (niit beliebigem Grad) bilden ebenfalls eine abzahlbare Menge, da sie eine abzahlbare Vereinigung (iiber die Grade) abzahlbarer Mengen ist. Jede derartige Gleichung besitzt nur eine endliche Anzahl von NuUstellen. Daher ist die Menge der algebraischen Zahlen hochstens abzahlbar. Aber sie ist unendlich und daher abzahlbar. D 2.4.2 D i e M a c h t i g k e i t d e s K o n t i n u u m s D e f i n i t i o n 2. Die Menge ffi der reellen Zahlen wird auch Zahlenkontinuum^^ genannt und ihre Machtigkeit ist die Machtigkeit des Kontinuums. T h e o r e m . (Cantor). |N| < |K|. Dieses Theorem stellt sicher, dass die unendliche Menge M eine groBere Machtigkeit besitzt als die unendliche Menge N. Beweis. Wir werden zeigen, dass selbst das abgeschlossene Intervall [0,1] eine iiberabzahlbare Menge ist. Angenommen es sei abzahlbar, d.h., es konnte als Folge xi,X2, • • • ,x„,... geschrieben werden. Wir greifen den P u n k t e xi heraus und halten auf dem IntervaU [0,1] = IQ ein abgeschlossenes Intervall mit positiver Lange h fest, das den P u n k t xi nicht enthalt. Auf dem Intervall / i konstruieren wir ein Intervall L2, das X2 nicht enthalt. Nach der Konstruktion des Intervalls / „ konstruieren wir, da \I„\ > 0 ein Intervall In+i, so dass Xn+i ^ In+i und | / „ + i | > 0. Nach dem Satz zur Intervallschachtelung existiert ein P u n k t c, der in alien Intervallen I Q , / i , . . . , / „ , . . . enthalten ist. Aber dieser P u n k t ini abgeschlossenen Intervall IQ = [0,1] kann nach dieser Konstruktion kein P u n k t d e r F o l g e xi,X2,
• • • ,Xn, • • • sein.
D
KoroUare 1) Q 7^ ffi und somit existieren
irrationale
Zahlen.
2) Es existieren transzendente Zahlen, da die Menge der algebraischen Zahlen abzahlbar ist. (Nach der Losung von Aufgabe 3 unten wird der Leser diese letzte Behauptung ohne Zweifel folgendermafien interpretieren wollen: Algebraische Zahlen sind gelegentlich zwischen den reellen Zahlen zu finden.) Zu Beginn der Mengentheorie tauchte die Frage auf, ob Mengen existieren, deren Machtigkeit zwischen der abzahlbarer Mengen und der Machtigkeit ^^ Aus dem Lateinischen continuus, das zusammenhiingend bedeutet.
oder
ununterbrochen
2.4 Abzahlbare und iiberabzahlbare Mengeii
81
des Kontinuums liegen. Es wurde vermutet, dass keine dazwischen liegenden Machtigkeiten existieren. Dies ist als Kontinuumshypothese bekannt. Die Frage betraf die tiefsten Fundamente der Mathematik. Sie wurde 1963 durch den zeitgenossischen anierikanischen Mathematiker P. Cohen endgiiltig beantwortet. Cohen bewies, dass die Kontinuumshypothese nicht entscheidbar ist, indem er zeigte, dass weder die Hypothese noch ihre Negation den iibhchen Axioniensystemen der Mengentheorie widerspricht, so dass sie im Axiomensystem weder bewiesen noch falsifiziert werden kann. Diese Situation ist ahnhch wie bei Eukhds fiinftem Postulat zu parallelen Geraden, das von den anderen Axiomen der Geometrie unabhangig ist. 2.4.3 U b u n g e n u n d A u f g a b e n 1. Zeigeii Sie, dass die Menge der reellen Zahlen dieselbe Machtigkeit besitzt, wie die Punkte im Intervall ] — 1,1[. 2. Formulieren Sie einen expliziten eins-zu-eins Zusammenhang zwischen a) den Punkten zweier ofFener Intervalle, b) den Punkten zweier geschlossener Intervalle, c) den Punkten eines geschlossenen Intervalls und den Punkten eines ofFenen Intervalls, d) den Punkten des geschlossenen Intervalls [0,1] und der Menge R. 3. Zeigen Sie, dass a) jede unendliche Menge eine abzahlbare Teilmenge enthalt, b) die Menge gerader ganzer Zahlen dieselbe Machtigkeit besitzt, wie die Menge der natiirlichen Zahlen, c) die Vereinigung einer unendlichen Menge und einer hochstens abzahlbaren Menge dieselbe Machtigkeit besitzt wie die urspriingliche unendhche Menge, d) die Menge der irrationalen Zahlen die Machtigkeit des Kontinuums besitzt, e) die Menge der transzendenten Zahlen die Machtigkeit des Kontinuums besitzt. 4. Zeigen Sie, dass a) die Menge der ansteigenden Folgen natiirhcher Zahlen {m < n-z < • • •} dieselbe Machtigkeit besitzt wie die Menge der Zahlen der Form 0,aia2 • •., b) die Menge aller Teilmengen einer abzahlbaren Menge die Machtigkeit des Kontinuums besitzt. 5. Zeigen Sie, dass a) die Menge V{X) der Teilmengen einer Menge X dieselbe Machtigkeit besitzt wie die Menge aller Funktionen auf X mit den Werten 0 oder 1, d.h. die Menge der Abbildungen / : X -> {0,1}, b) fiir eine endliche Menge X mit n Elementen gilt: |'P(X)| = 2", c) \V{X)\ = 2l^l und insbesondere |-p(N)| = 21^1 = |R| gilt (nutzen Sie die Ergebnisse der Aufgaben 4b) und 5a)),
82
2 Die reellen Zahlen
d) fiir jede Menge X gilt: |X| < 2'^', insbesondere n < 2" fiir alle n G N . H i n w e i s : Der Satz von Cantor in Absatz 1.4.1. 6. Sei X i , . . . ,X„ eine endliche Familie endlicher Mengen. Zeigen Sie, dass
J1<J2
il
_... + (_!)—i|(Xin---nx^)|, wobei die Summationen iiber alle Mengen von Indizes von 1 bis m lauft, die die Ungleichungen unter dem Summenzeichen erfiillen. 7. Beschreiben Sie auf dem abgeschlossenen Intervall [0,1] C R die Zahlenmengen X G [0,1], deren ternare Darstellung x = 0 , a i a 2 a 3 .. ., ai G {0,1, 2} die folgenden Eigenschaften besitzt: a) Qi ^ 1, b) ( Q I ^ l ) A ( Q 2 f ^ l ) ,
c) Vi G N(Qi ^ 1) (die Cantor Menge). 8. (Fortsetzung von Aufgabe 7.) Zeigen Sie, dass a) die Zahlenmenge x G [0,1], deren ternare Darstellung 1 nicht enthalt, dieselbe Machtigkeit besitzt wie die Menge aller Zahlen, deren binare Darstellung die Form 0, /3i/32 . . . besitzt, b) die Cantor-Menge dieselbe Machtigkeit besitzt wie das abgeschlossene Intervall
[0,1].
Grenzwerte
Bei der Diskussion der verschiedenen konzeptionellen Gesichtspunkte der reellen Zahlen bemerkten wir insbesondere, dass wir bei Messungen realer physikalischer GroBen auf Folgen von Naherungswerten treffen, mit denen dann gearbeitet werden muss. Bei diesem Stand der Dinge drangen sich sofort zumindest die folgenden drei Fragen auf: 1) Welche Beziehung besteht zwischen der so erhaltenen Folge von Naherungen und der zu messenden GroBe? Dabei denken wir an den mathematischen Aspekt dieser Frage, d.h., wir suchen eine exakte Formulierung fiir die Bedeutung des Ausdrucks „ Folge von Naherungswerten" im Allgemeinen und inwieweit eine derartige Folge den Wert der GroBe besclireibt. 1st die Beschreibung unzweideutig oder kann dieselbe Folge zu verschiedenen Werten der MessgroBe fiihren? 2) Welcher Zusammenhang besteht zwischen Operationen mit den Naherungswerten und denselben Operationen mit den exakten Werten? Wie konnen wir Operationen charakterisieren, die berechtigterweise so ausgefiihrt werden konnen, dass die exakten Werte durch die genaherten ersetzt werden konnen? 3) Wie konnen wir an einer Zahlenfolge erkennen, ob sie eine Folge beliebig genauer Naherungen fiir die Werte einer GroBe sein kann? Die Antwort zu diesen und ahnlichen Fragen wird durch das Konzept des Grenzwertes einer Funktion, eines der zentralen Konzepte der Analysis, gegeben. Wir beginnen unsere Diskussion der Theorie von Grenzwerten mit der Betrachtung von Grenzwerten von Funktionen, deren Argumente natiirliche Zahlen sind (eine Folge), im Hinblick auf die zentrale Rolle, die diese Funktionen spielen. Dies haben wir bereits ausgefiihrt. Ferner konnen alle wichtigen Tatsachen der Theorie von Grenzwerten an diesen einfachsten Beispielen deutlich erkannt werden.
84
3 Grenzwerte
3.1 Der Grenzwert einer Folge 3.1.1 Definitionen und Beispiele Wir wiederholen die folgende Definition. D e f i n i t i o n 1. Eine Funktion f :N ^ X, deren Definitionsbereich die Menge der natiirlichen Zahlen ist, wird Folge genannt. Die Werte f{n) der Funktion / werden Terme oder Glieder der Folge genannt. Sie werden iiblicherweise durch ein Symbol fiir ein Element der Menge, die den Wertebereich enthalt, besclirieben, das um den zugeliorigen Index des Arguments erweitert wird. Somit ist a;„ := / ( n ) . In diesem Zusammenhang wird die Folge selbst {a;„} oder auch xi,X2, • • •, x„,... geschrieben. Sie wird Folge in X oder eine Folge von Elementen in X genannt. Das Element a;„ wird als n-tes Glied der Folge bezeiclmet. In den naclisten Absclmitten werden wir nur Folgen / : N —>• ffi reeller Zahlen betracliten. D e f i n i t i o n 2. Eine Zahl A £ M wird Grenzwert der numerischen Folge {a;„} genannt, falls fiir jede Umgebung V{A) von A ein (von V{A) abhangiger) Index N existiert, so dass alle Terme der Folge mit einem Index grofier als N in der Umgebung V{A) liegen. Wir werden diese Definition unten in formaler Logik ausdriicken, aber zunachst auf eine andere gebraucliliche Formulierung der Definition des Grenzwertes einer Folge hinweisen. Eine Zahl A £ ffi wird Grenzwert der Folge {a;„} genannt, falls fiir jedes e > 0 ein Index N existiert, so dass |a;„ — A\ < e fiir aUe n > N. Die Aquivalenz dieser beiden Aussagen lasst sich leicht zeigen (zeigen Sie sie!), wenn wir beriicksichtigen, dass jede Umgebung V{A) von A eine eUmgebung des P u n k t e s A enthalt. Die zweite Formulierung der Definition eines Grenzwertes bedeutet, dass es unabhangig davon, mit welcher Genauigkeit wir e > 0 vorgeben, einen Index N gibt, so dass der absolute Fehler bei der Annaherung der Terme der Folge {xn} an A kleiner als s ist, sobald n > A^ ist. Wir schreiben nun diese Formulierungen der Definition eines Grenzwertes in der Sprache der symbohschen Logik. Dabei bedeutet der Ausdruck „ hm Xn = A^\ dass A der Grenzwert der Folge {a;„} ist. Somit lim x„ = A) := yV{A)
3N G fi ^n > N (x„ G V{A))
bzw. ( lim Xn = A) •=ye>03N
Gf^yn>
N (|a;„ - A\ < e)
3.1 Der Grenzwert einer Folge
85
D e f i n i t i o n 3 . Gilt lim a;„ = A, so sagen wir, dass die Folge {a;„} gegen A n—)-oo
konvergiert oder gegen A strebt und schreiben x„ ^ A fiir n —>• oo. Eine Folge, die einen Grenzwert besitzt, wird konvergent genannt. Fine Folge, die keinen Grenzwert besitzt, wird divergent genannt. Wir woUen einige Beispiele betracliten. Beispiel
1. lim i = 0, da I ^ - Ol = ^ < e fiir n > TV = [ i ] .^
Beispiel 2. lim ^^^^^^ = 1, da 1^^^ - ll = - < s f i i r n > [-1. ^-i™« (l + ^
)
= 1'da I ( l + i ^ )
- l| = i < e fiirn > [ i ] .
^_ lij^ Sinn. = 0, da | 5 i i i i i - 0 | < i < e m r n >
[i].
5. lim -IT = 0 fiir |g| > 1. n—)-oo y
Wir wollen diese letzte Behauptung mit Hilfe der Definition des Grenzwertes beweisen. Wie in P a r a g r a p h c Absatz 2.2.4 gezeigt wurde, so existiert fiir jedes e > 0 ein TV £ N, so dass j-pv < £• E)a |g| > 1, erhalten wir
4r-0
< -TTTT < YW ^ ^ '^^'" ^ > ^7 wodurch die Bedingung in der Definiti-
on des Grenzwertes erfiillt ist Beispiel 6. Die Folge 1, 2, | , 4 , | , 6 , y , . . . , deren n-tes Glied a;„ = (n e N) ist, divergiert.
n*^ ^)"
Beweis. Nacli der Definition des Grenzwertes wiirde jede Umgebung von A alle Ternie der Folge, mit Ausnalime einer endliclien Anzalil, enthalten, wenn A der Grenzwert dieser Folge ware. Eine Zahl A ^ 0 kann nicht der Grenzwert dieser Folge sein. Ist namlich s = - y > 0, dann liegen alle Terme der Folge der Form JE+T^ ^^'" '^^^ JE+T ^ '-^^ gilt, aufierhalb der e-Umgebung von A. Die Zahl 0 kann aber auch nicht der Grenzwert sein, da es beispielsweise unendlich viele Glieder der Folge gibt, die auBerhalb der 1-Umgebung von 0 liegen. D Beispiel 7. Auf ahnhche Weise kann gezeigt werden, dass die Folge 1 , - 1 , + 1 , — 1 , . . . mit Xn = (—1)" keinen Grenzwert besitzt. ^ Wir wiederholen, dass [x] der ganzzalilige Teil der Zalil x ist. (Vgl. Korollare 7° und 10° in Absclmitt 2.2.)
86
3 Grenzwerte
3.1.2 Eigenschaften des Grenzwertes einer Folge a. AUgemeine Eigenschaften Wir behandeln in diesem Paragraphen nicht nur die Eigenschaften, die numerische Folgen besitzen, sondern, wie wir unten sehen warden, auch andere Arten von Folgen. Aber im Augenblick werden wir diese Eigenschaften nur fiir nunierische Folgen untersuchen. Fine Folge, die nur einen Wert annimnit, wird konstante Folge genannt. Definition 4. Falls eine Zahl A und ein Index N existieren, so dass Xn = A fiir alle n > A^, so wird die Folge {a;„} schliefiUch konstant genannt. Definition 5. Eine Folge {a;„} heifit beschrankt, faUs es ein M gibt, so dass \x„\ < M fiir alle n £ N. Satz 1. a) Eine schliefiUch konstante Folge konvergiert. b) Jede Umgebung des Grenzwertes einer Folge enthalt, bis auf eine endliche Anzahl von Termen der Folge, alle Terme. c) Eine konvergente Folge kann keine zwei verschiedenen Grenzwerte besitzen. d) Eine konvergente Folge ist beschrankt. Beweis. a) Gilt Xn = A fiir n > N, dann gilt fiir jede Umgebung V{A) von A, dass Xn £ V{A) fiir n > N, d.h., lim a;„ = A. n—>oo
b) Diese Behauptung folgt unmittelbar aus der Definition einer konvergenten Folge. c) Dies ist der wichtigste Teil des Satzes. Sei lim x„ = Ai und lim x„ = n—)-oo
n—)-oo
A^. Gilt Ai ^ A2, so konnen wir Umgebungen V{Ai) und V{A2) definieren, die sich nicht schneiden. Diese Umgebungen konnen beispielsweise (5-Umgebungen von Ai und A2 mit S < ^|Ai — A2I sein. Nach der Definition des Grenzwertes gibt es Indizes A^i und N2, so dass a;„ £ V{Ai) fiir alle n > Ni und a;„ £ U(^2) fiir alle n > N2. Aber dann miisste fiir A^ = max{A^i,A^2} gelten, dass a;„ £ U ( ^ i ) n V{A2). Dies ist jedoch unmoglich, da V{Ai) n ^ ( ^ 2 ) = 0 . d) Sei lim a;„ = A. Wenn wir in der Definition des Grenzwertes e = 1 n—>oo
setzen, gibt es ein A^, so dass |a;„ — A\ < 1 fiir aUe n > N, denn es gilt \x„\ < |A| + 1 fiir n > N. Nun wahlen wir M > max{|a;i|,..., |a;„|, |A| + 1} und stellen fest, dass \x„\ < M fiir alle n £ N. D b. Grenzwerte und arithmetische Operationen Definition 6. Seien {a;„} und {yn} zwei numerische Folgen. Ihre Summe, Produkt und Quotient (in Ubereinstimmung mit der allgemeinen Definition von Summe, Produkt und Quotient von Funktionen) sind die Folgen
3.1 Der Grenzwert einer Folge {{Xn + Vn)},
{{x„-yn)},
87
{( ~ ) }"
Der Quotient ist natiirlich nur definiert, falls yn ¥" (^ fur alle n € N. Satz 2. Seien {a;„} und {yn} numerische Folgen. Gilt lim Xn = A und n—>oo
lim y„ = B, dann ist n—)-oo
a) lim {xn +yn) = A + B, n—)-oo
b) lim (xn • yn) = A • B und n—>oo
c) lim 7^ = 4 , vorausgesetzt, dass yn ¥^ ^ (^T- = Ij 2 , . . . , ) und B ^ 0. n—>oo « "
Beweis. Wir benutzen zur Ubung die bereits bekannten Abschatzungen (vgl. Absatz 2.2.4) fiir die absoluten Feliler, die bei aritlimetischen Operationen mit Naherungswerten auftreten. Sei |A — a;„| = A{xn), \B — 2/„| = A{yn). Dann gilt im Fall a), dass \{A + B)-
{Xn +yn)\<
A{Xn)
+ ^(^/n) .
Sei e > 0 gegeben. Da lim a;„ = A, existiert N', so dass Z\(a;„) < e/2 fiir n—)-oo
alle n > N'. Da lim yn = B, existiert analog ein N", so dass A{yn) < e/2 n—)-oo
fiir alle n > N". Dann gilt fiir n > maxjiV', N"}: \{A + B) - {Xn + yn)\ <£, womit nach Definition des Grenzwertes die Beliauptung a) bewiesen ist. b) Wir wissen, dass \{A-B)-
{Xn •yn)\<
\Xn\A{yn)
+ \yn\A{Xn)
+ A{Xn)
Zu vorgegebenem e > 0 gibt es Zahlen N' und N", so dass Vn>iV'
(^(-«)<-in{l,^p^}),
yn>N"
(^(2/«)<-in{l,^p^}
Dann erhalten wir fiir n > N = max{A^', N"}: \Xn\ < \A\ + A(Xn)< \yn\<\B\
|A| + 1 ,
+ A{y„)<\B\
+ l,
A{xn) • A(yn) < m i n | l , - | • m i n | l , - | < Somit erhalten wir fiir n > N:
• ^(^/n) .
3 Grenzwerte
\Xn\A{Vn)< (|A| + 1) \Vn\A{Xn)< [\B\ + l)
£
e
3(|A| + 1) < 3 <
3(|i?| + l,
Z\(x„) • zi(2/„) < und somit \AB — Xntlnl < e fur n > N. c) Wir nutzen die Abschatzung A Vn
mit S{yn) =
<
\Xn\^{yn)
+
\Vn\^{Xn)\
1 - KVn)
A (j/n)
TAX vorgegebenem e > 0 gibt es Zahlen N' und N", so dass Vn>iV'
rz\(x„) < m i n { l , ^ } ' )
,
Dann erhalten wir fiir n > N = max{A^', N"}:
\Xn\ <\A\+A(Xn)
<\A\ + 1,
\y„\>\B\-A{y„)>\B\-\^>\^, 1
2
bnl l-'5(2/„) >
|S|/2 1
2
und daher -^zl(y„) < i\A\ + !)• 1 Vn
A{Xn)
0<
<
—
B2
2 IS 1
1 - '^(yn)
e-B^ 16(|A| + 1)
e|S| _ £ " 4 ' <2
und folglich A
Xn
B
Vn
< e fm n> N.
4
3.1 Der Grenzwert einer Folge
89
Anmerkung. Die Formulierung des Satzes erlaubt eine andere, weniger konstruktive Beweismethode, die wahrscheinlich dem Leser aus der hoheren Schule von den Grundlagen der Analysis bekannt ist. Wir werden diese Methode erwahnen, wenn wir den Grenzwert einer beliebigen Funktion untersuchen. Aber hier, bei der Betrachtung des Grenzwertes einer Folge, wollen wir auf die Art aufmerksam niachen, wie Felilergrenzen fiir das Ergebnis matliematischer Operationen eingesetzt werden konnen, urn zulassige Fehlergrenzen bei den Werten von Grofien, auf denen eine Operation ausgefiihrt wird, zu setzen. c. Grenzwerte und Ungleichungen Satz 3. a) Seien {a;„} und {yn} zwei konvergente Folgen mit lim Xn = A und n—>oo
lim tjn = B. Gilt A < B, dann existiert ein N G'N, so dass a;„ < 2/„ fiir alle n—)-oo
n>
N. b) Angenommen, die drei Folgen {a;„}, {yn} und {z„} sind derart, dass Xn ^y-n ^ Zn fur alle n > A^ € N. Konvergieren beide Folgen {a;„} und {z„} zu demselben Grenzwert, dann konvergiert auch die Folge {yn} gegen diesen Grenzwert. Beweis. a) Wir walilen eine Zalil C, so dass A < C < B. Nach der Definition des Grenzwertes konnen wir Zahlen N' und A^" finden, so dass |a;„—A| < C—A fiir alle n > N' und \yn — B\ < B — C fiir alle n > N". Dann erhalten wir fiir n> N = max{Ar', A^"}: x-a < A +C - A = C = B - {B - C) < ynb) Sei lim x„ = lim z„ = A. Zu vorgegebenem e > 0 wahlen wir A^' und n—)-oo
n—)-oo
A^", so dass A — e < a;„ fiir alle n > N' und 2;„ < A + e fiir alle n > A^". Dann erhalten wir fiir n > A^ = maxjA^', A^"}: A — e < Xn < yn < Zn < A + s. Somit ist \yn — A\ < s, d.li., A = lim 2/„. D KoroUar. Seien lim x„ = A und lim yn = B. Falls ein N existiert, so dass n—>oo
n—>oo
fiir alle n > N gilt: a) Xn > yn, dann ist A > B ; b) x„ > yn, dann ist A> B ; c) x„ > B, dann ist A> B ; d) x„ > B, dann ist A > B . Beweis. Wir arbeiten mit Widerspriiclien und erhalten die ersten beiden Behauptungen sofort aus Teil a) des Satzes. Die dritte und vierte Behauptung sind Spezialfalle der ersten beiden, die wir fiir y„ = B erhalten. D Wir wollen darauf hinweisen, dass strenge Ungleichheit zu Gleichheit im Grenzwert werden kann. Beispielsweise gilt ^ > 0 fiir alle n € N und doch ist lim i = 0.
90
3 Grenzwerte
3 . 1 . 3 F r a g e n zur E x i s t e n z d e s G r e n z w e r t e s e i n e r F o l g e a. D a s C a u c h y s c h e K o n v e r g e n z k r i t e r i u m D e f i n i t i o n 7. Eine Folge {a;„} wird fundamental oder Cauchy-Folge^ genannt, falls ftlr jedes e > 0 ein Index N £ N existiert, so dass \xjn — x„\ < e fiir alle n > N und m > N. S a t z 4 . (Caucliysclies Konvergenzkriterium). Eine numerische giert genau dann, wenn sie eine Cauchy-Folge ist. Beweis.
Folge
konver-
Sei lim a;„ = A. Zu vorgegebenen e > 0 existiert ein N, so dass n—>oo
|a;„ —A| < I fiir n > N. Dann erhalten wir fiir m > N und n > N: \xm — x„\ < \xm — A\ + \xn — A\ < l + l = e , womit bewiesen ist, dass die Folge eine Cauchy-Folge ist. Nun sei {xk} eine Cauchy-Folge. Zu gegebenen e > 0 existiert ein N, so dass \xm — Xk\ < I fiir m > N und k > N. Wenn wir m = N setzen, finden wir fiir jedes k > N: £ £ XN - - < Xk < XN + - •
(3.1)
Da aber nur eine endliche Anzahl von Ternien der Folge Indizes besitzen, die nicht groi^er als N sind, haben wir gezeigt, dass eine Cauchy-Folge beschrankt ist. Fiir n £ N setzen wir nun a„ := inf Xk und &„ := supxfc. *>"
k>n
Aus diesen Definitionen ist klar, dass a„ < a „ + i < 6„+i < 6„ (da die groBte untere Schranke nicht abninimt und die kleinste obere Schranke nicht anwachst, wenn wir zu einer kleineren Menge iibergehen). Nach deni Prinzip der Intervallschachtelung gibt es einen P u n k t A, der alien abgeschlossenen Intervallen [a„,b„] gemeinsam ist. Da a„ < A
sup xu = b„ k>n
fiir fc > n, folgt, dass \A-Xk\
(3.2)
^ Bolzano fiihrte Cauchy-Folgen beim Beweisversuch, dass fundamentale Folgen konvergieren, ein, ohne dass er ein genaues Konzept einer reellen Zahl zur Verfiigung hatte. Cauchy gab den Beweis, indeni er das Prinzip der Intervallschachtelung, das spater von Cantor gerechtfertigt wurde, als ofFensichtlich annahm.
3.1 Der Grenzwert einer Folge
91
Aber aus Ungleichung (3.1) folgt, dass £
XN -
£
T < inf Xk = an
fiir n > N und daher
= s u p Xk <XN k>n
+ T 'J
2e K - an < — < £
(3.3)
fiir n > m. Ein Vergleich der Relationen (3.2) und (3.3) fiihrt zu \A-Xk\
<£
fiir alle k > N und somit haben wir bewiesen, dass lim Xk = A .
D
fe—)-oo
Beispiel 8. Die Folge (—1)" (n = 1, 2 , . . . ) besitzt keinen Grenzwert, da sie keine Cauchy-Folge ist. Obwohl diese Tatsache offensichtlich ist, geben wir doch einen formalen Beweis. Die Negierung der Aussage, dass {a;„} eine CauchyFolge ist, lautet: 3£ > 0 \/N £ N 3n > N 3m > N {\xm - a;„| > e) , d.h., es gibt ein e > 0, so dass fiir jedes N £ N zwei Zahlen n, m grofier als N existieren, so dass \xm — Xn\ > £• Fiir unseren Fall geniigt es, e = 1 zu setzen. D a n n gilt fiir jedes N £ N, dass \XN+I — XN+2\ = | 1 - (-1)1 = 2 > 1 = e. Beispiel
9. Sei
a;i = 0 ;
a;2 = 0, a i ;
xs = 0, aia^
; . . . ; a;„ = 0, aia2 •. • ccn ;. •.
eine Folge endlicher binarer Darstellungen, bei der jede folgende Darstellung durch Hinzufiigen einer 0 oder einer 1 an den Vorganger erhalten wird. Wir werden zeigen, dass eine derartige Folge stets konvergiert. Sei m > n. Wir wollen den Unterschied Xm — a;„ abschatzen: «n+l
^ _ ^
2n+l
On
2"
<
— 2"+i
2™
1——
2"
Somit konnen wir zu vorgegebenem e > 0 ein N so wahlen, dass -^ < £ und erhalten die Abschatzung, dass \xm — Xn\ < -^ < jiv < £ fiir alle m > n > N. Damit ist bewiesen, dass die Folge {a;„} eine Cauchy-Folge ist. Beispiel
10. Wir betrachten die Folge {a;„}, mit 2
Da
1 \X2n
Xn
n 1
- + ••• +
1 >n-
1
— --" 2
1 n Konvergenzkriterium +n in fiir alle n £ N, folgt aus demn +Cauchyschen sofort, dass diese Folge keinen Grenzwert besitzt.
92
3 Grenzwerte
b. Ein Existenzkriterium fiir den Grenzwert einer monotonen Folge Definition 8. Eine Folge {x„} ist anwachsend, wenn a;„ < Xn+i fiir alle n € N, nicht absteigend, wenn x„ < Xn+i fiir alle n £ N, nicht anwachsend, wenn a;„ > Xn+i fiir alle n € N und absteigend, wenn a;„ > a;„+i fiir alle n € N. Derartige Folgen heifien monotone Folgen. Definition 9. Eine Folge {a;„} ist von ohen beschrdnkt, falls eine Zahl M existiert, so dass a;„ < M fiir alle n £ N. Satz 5. (Weierstrafi). Damit eine nicht absteigende Folge einen Grenzwert besitzt, ist es notwendig und hinreichend, dass sic von oben beschrdnkt ist. Beweis. Dass jede konvergente Folge besclirankt ist, wurde oben unter allgemeinen Eigenscliaften des Grenzwertes einer Folge bewiesen. Aus diesem Grund ist nur die Beliauptung, dass dies hinreichend sei, zu zeigen. Angenommen wird, dass die Menge der Werte der Folge {a;„} von oben beschrankt ist, weswegen sie eine kleinste obere Schranke s = supa;„ besitzt. nGN
Nach der Definition der kleinsten oberen Schranke existiert fiir jedes e > 0 ein Element XN £ {xn}, so dass s — e < XN < s. Da die Folge {a;„} nicht absteigend ist, gilt, dass s — e < XN < Xn < S fiir alle n > N, d.h. \s — a;„| = s — Xn < £• Somit haben wir bewiesen, dass lim x„ = s. D n—)-oo
Natiirlich lasst sich ein analoger Satz fiir eine nicht anwachsende Folge, die von unten beschrankt ist, aufstellen und beweisen. In diesem Fall ist lim x„ = n—)-oo
inf XnnGN
Anmerkung. Die Beschranktheit von oben (bzw. unten) einer nicht absteigenden (bzw. nicht anwachsenden) Folge ist offensichtlich zur Beschranktheit dieser Folge aquivalent. Wir woUen einige niitzliche Beispiele betrachten. Beispiel 11. lim ^ = 0 fiir g > 1. n—)-oo ^
Beweis. Ist a;„ = ^ , dann ist in der Tat Xn+i = ^^^^n fiir n G N. Da lim 2i±i = lim (1 + i ) i = lim (l + i ) • lim i = 1 • i = i < 1, existiert ein Index N, so dass ^ ^ < 1 fiir n > A^. Somit gilt Xn+i < a;„ fiir n > N, so dass die Folge ab dem Index N monoton absteigend ist. Nach der Definition eines Grenzwertes besitzt eine endliche Anzahl von Termen einer Folge keinen Einfluss auf die Konvergenz der Folge oder ihren Grenzwert, so dass es ausreicht, den Grenzwert der Folge x^+i > XN+2 > . . . ZU bestimmen. Die Terme dieser Folge sind positiv, d.h., die Folge ist von unten beschrankt und besitzt daher einen Grenzwert.
3.1 Der Grenzwert einer Folge
93
Sei X = lim a;„. Aus Xn+i = ^ ^ a ^ n folgt, dass nq
X = lim {xn+i) = lim (
n + l
Wir erkennen daraus, dass ( l — -)x
\ ,. n + 1 , . a;„) = lim • lim a;„
1
= 0 und folglich x = 0.
D
KoroUar 1. lim \/n = 1. n—>oo
Beweis. Mit dem eben Bewiesenen gibt es zu gegebenem e > 0 ein N G N, so dass 1 < n < (1 + e ) " fiir alle n > N. Dann gilt fiir n > iV: 1 < y/n < 1 + e und daher lim i^n = 1. D n—>oo
KoroUar 2. lim A/C = 1 fiir jedes a > 0. n—)-oo
Beweis. Wir nehmen zunaclist an, dass a > 1. Zu jedem e > 0 existiert ein N GN, so dass 1 < a < (1 + e ) " fiir alle n > N, so dass 1 < -v/a < 1 + e fiir alle n > N gilt, wonach lim ^ = 1. n—)-oo
Fiir 0 < a < 1 gilt 1 < ^ und somit: lim
n—)-oo
A/C
= lim —j= = n—>oo „ / i ?/ V "
r= = 1.
i„ /i lim ?/ n—>oo V '^
D
Beispiel 12. Sei g £ ffi beliebig, n € N und n\ := 1 • 2 • ... • n. Dann gilt: lim ^ = 0. n—)-oo ^"
Beweis. Fiir g = 0 ist die Behauptung offensiclitlich. Da ferner 1^1 = i", geniigt es, die B e h a u p t u n g fiir g > 0 zu beweisen. Mit denselben Uberlegungen wie in Beispiel 11 erhalten wir, dass Xn+i = —^a;„. Da die Menge der natiirlichen Zalilen niclit von oben besclirankt ist, existiert ein Index N, so dass 0 < ^ ^ < 1 fiir alle n > N. Damit erhalten wir fiir n > N, dass Xn+i < Xn- Da die Terme der Folge positiv sind, konnen wir nun sicher sein, dass der Grenzwert lim existiert. Aber dann gilt: n—>oo
X = lim Xn+i = lim n—)-oo
q
-a;„ = lim
n—)-oo Tl -\- V
q
n—)-oo Ji -\- \
• lim a;„ = 0 • a; = 0. n—)-oo
D
94
3 Grenzwerte
c. D i e Zahl e Beispiel
13. Wir woUen beweisen, dass der Grenzwert lim
IH— I
n—>oo \
existiert.
nJ
Trifft dies zu, dann ist der Grenzwert eine Zahl, die wir nach Euler niit deni Buchstaben e bezeichnen. Diese Zahl ist so wichtig fiir die Analysis, wie die Zahl 1 fiir die Arithmetik oder TT fiir die Geometrie. Wir werden in vielfaltigen Zusammenhangen auf sie zuriickkommen. Wir beginnen damit, die folgende Ungleichung, die manchmal die Bernoullische^ Ungleichung genannt wird, zu beweisen: (1 + a ) " > 1 + na
fiir n £ N und a > -I
.
Beweis. Die B e h a u p t u n g ist fiir n = 1 wahr. Gilt sie fiir n € N, dann muss sie auch fiir n + 1 gelten, da dann gilt: (1 + a ) " + i = (1 + a ) ( l + a)" > (1 + a ) ( l + na) = = 1 + (n + l)a + na^ > 1 + (n + l ) a . Nach dem Induktionsprinzip ist die B e h a u p t u n g fiir alle n € N wahr. Im Ubrigen ergibt die Berechnung, dass strenge Ungleichheit gilt fiir a ^ 0 und n > 1. D Wir zeigen nun, dass die Folge 2/n = ( l + - )
abnehmend ist.
Beweis. Sei n > 2. Mit Hilfe der Bernoullischen Ungleichung erhalten wir: Vn-i Vn
^ (1 + ^ ) " ^ n^" n (l + i ) " + i (n2-l)»'n +
T~V
n^-l/
n+1 >
> {^ + —, 7 7 > 1+ 7 = 1n+1 V n/ V vZ — l/n+l V n / nn ++ 1 ixn+l
Da die Terme der Folge positiv sind, existiert der Grenzwert lim ( l + ^ ) Somit gilt: / l\n lim ( 1 + - ) = lim n->oo V nJ n->oo = lim
/ (1 + V / 1+
n—>oo V
l\n+i/ l\-i -) (1 + - ) = n/ \ nl I1N\ n+1 iNn+l 1 / • hm ^ = hm 1 + n/
n—)-oo 1 -I- — n
n—)-oo V
Jl'
Nun konnen wir die folgende Definition aufstellen: D e f i n i t i o n 10. e := lim ( 1 H— ) n—>oo \
7J/
^ Jakob (James) Bernoulli (1654-1705) - schweizerischer Mathematiker, Mitglied der angesehenen Gelehrtenfamilie Bernoulli. Er war einer der Begriinder der Variationsrechnung und der Wahrscheinlichkeitstheorie.
3.1 Der Grenzwert einer Folge
95
d. T e i l f o l g e n u n d T e i l g r e n z w e r t e e i n e r F o l g e D e f i n i t i o n 1 1 . Sei
Folge und rii < 77-2 < • • • < n^ < • • •
eine anwachsende Folge natiirliclier Zalilen. Dann wird die Folge Xm, a;„2, . . . , a;„j,,... eine Teilfolge der Folge {x„} genannt. So ist z.B. die Folge 1 , 3 , 5 , . . . der positiven ungeraden Zahlen in ihrer natiirlichen Anordnung eine Teilfolge der Folge 1 , 2 , 3 , . . . , aber die Folge 3 , 1 , 5 , 7 , 9 , . . . ist keine Teilfolge dieser Folge. L e m m a 1. (Bolzano-WeierstraB). sitzt eine konvergente Teilfolge.
Jede beschrankte
Folge reeller Zahlen be-
Beweis. Sei E die Menge der Werte der beschrankten Folge {a;„}. Ist E endlich, dann existiert ein P u n k t x G E und eine Folge n i < 77.2 < • • • von Indizes, so dass a;„j = a;„2 = • • • = x. Die Teilfolge {x„^,} ist konstant und konvergiert folglich. Ist E unendlich, dann besitzt sie nach dem Satz von Bolzano-WeierstraB in Absatz 2.3.3 einen Haufungspunkt x. Da x ein Haufungspunkt von E ist, konnen wir 771 € N wahlen, so dass \xni — x\ < 1. Wurde 77^ £ N so gewahlt, dass |a;„j, — x\ < ^, dann existiert ein Uk+i £ N, so dass rifc < 77j;+i und la^wfe+i — x\ < ^ ^ , da X ein Haufungspunkt von E ist. Da lim r = 0, konvergiert die so konstruierte Folge Xm, a;„2, • • •, Xn^, • • • fc—>oo
gegen x.
D
D e f i n i t i o n 1 2 . Wir schreiben a;„ -^ + 0 0 und sagen, dass die Folge {a;„} gegen positiv Unendlich strebt, falls fiir jede Zahl c ein TV £ N existiert, so dass Xn > c fiir alle n > N. Wir woUen diese und zwei analoge Definitionen in logischer Schreibweise forniulieren:
{x„ -)• +00) = Vce {x„ -)• - 0 0 ) = Vce {x„ -)• 00) = Vce
3N GN^ny
N {c<Xn)
,
3N GN^ny
N {x.a
,
3N GN^ny
N {c< |a;„|) .
Bei den letzten beiden Fallen sagen wir, dass die Folge {a;„} gegen negativ Unendlich bzw. gegen Unendlich strebt. Wir nierken an, dass eine Folge unbeschrankt sein kann und dennoch nicht gegen positiv Unendlich, negativ Unendlich oder Unendhch strebt. Ein Beispiel dafiir ist a;„ = n^~^' . Folgen, die gegen Unendlich streben, werden nicht als konvergent betrachtet. Mit diesen Definitionen werden wir in die Lage gesetzt. Lemma 1 zu erweitern und etwas anders zu formulieren.
96
3 Grenzwerte
Lemma 2. Jede Folge reeller Zahlen besitzt entweder eine konvergente Teilfolge oder eine Teilfolge, die gegen Unendlich strebt. Beweis. Der neue Fall tritt auf, wenn die Folge {x„} nicht besclirankt ist. Dann konnen wir fiir jedes fc £ N ein rifc £ N wahlen, so dass \x„^, \ > k und rifc < Uk+i- So erhalten wir eine Teilfolge {x„^}, die gegen Unendlich strebt.D Sei {xk} eine beliebige Folge reeller Zahlen. Ist sie von unten beschrankt, dann konnen wir die Folge «„ = inf Xk (die wir bereits aus dem Beweis des k>n
Cauchyschen Konvergenzkriteriums kennen) betrachten. Da i„ < in+i fiir alle n € N, besitzt die Folge {«„} entweder einen endlichen Grenzwert lim i„ = I n—>oo
oder i„ -^ +oo. Definition 13. Die Zahl I = lim inf Xk wird Limes inferior der Folge {xk} n—)-oo k>n
genannt und lim Xk oder liminf a;j; geschrieben. Gilt i„ -^ +oo, so sagt man, dass der Limes inferior der Folge positiv Unendlich ist und wir schreiben lim Xk = +00 oder liminf Xfc = +oo. Ist die urspriingliche Folge {xk} nicht A;—>oo
A;—>oo
von unten beschrankt, dann erhalten wir «„ = inf Xfc = — oo fiir alle n. In k>n
diesem Fall sagen wir, dass der Limes inferior der Folge negativ Unendhch ist und schreiben lim a;j; = — oo oder liminf Xfc = — oo. Wenn wir alle gerade aufgezahlten Moglichkeiten beriicksichtigen, konnen wir nun kurz die Definition des Limes inferior einer Folge {xk} schreiben: lim Xk := lim inf Xk k->-oo
n^ook>n
Ganz ahnlich gelangen wir bei Betrachtung der Folge s„ = sup Xk zur k>n
Definition des Limes superior der Folge {xk}'Definition 14. lim Xk •= lim sup Xfc fe—)-oo
n—)-oo
k>n
Wir geben nun einige Beispiele: Beispiel U. Xk = (-1)^, fc £ N: lim Xk = lim inf Xk = lim inf (—1) = lim (—1) = —1 , k—^oo
n—>oo k>n
n—>oo k>n
lim Xk = lim sup a;j; = lim sup(—1) = lim 1 = 1 fe—)-oo
n—>oo k>n
n—>oo k>n
n—)-oo
3.1 Der Grenzwert einer Folge id 15. Xk = f c ( - i ) ' ,
fceN:
lim fc(-i)' = j,_^^
lim inf k'--^^' = lim 0 = 0 , n->oo k>n
lim k^~^'
97
n—>oo
= lim supfc'""'^-'
fc->oo
= lim (+oo) = + o o .
n->oo j , > „
n->oo
ie? iff. a;*; = fc, fc e N: lim k = lim inf k = lim n = +CXD , fc_>oo n->c>o fc>n n->oo
lim fc = fc—>oo
lim sup k = lim (+oo) = +oo . n—>oo j , > „
n—>oo
ie? i 7 . a;fc = ^ ^ , fc £ N: fiir n = 2m + 1 lim ^ ! ^ fc_j.oo
=
fc
lim inf ^ ^ ^ = lim <( n->oo
fc>n
k
>= 0,
n—>oo I
i
n+l -^- ( - 1 ) ^ lim — ; — = fc—>oo
k
. (-1)* lim sup — - — = n->oo j , > „
k
fiir n = 2m
- , fiir n = 2m lim n—>oo
- ^
, fiir n = 2m + 1
18. Xk = -k'\ fc G N: lim (—fc ) = lim inf (—fc ) = —oo . i p . Xk = (-l)^fc, fc e N: lim (-l)*^fc = j,_!.OQ
lim (-l)*^fc = fc—>oo
lim i n f ( - l ) * f c = n—>oo k>n
lim ( - o o ) = - o o , n->oo
lim s u p ( - l ) * f c = lim (+oo) = +oo . n—>oo k>n
n—>oo
Zur Erklarung des Ursprungs der Ausdriicke Limes „superior" und „inferior" einer Folge, geben wir die folgende Definition. D e f i n i t i o n 15. Eine Zahl (oder das Symbol —oo oder +oo) wird Teilgrenzwert einer Folge genannt, wenn die Folge eine Teilfolge entlialt, die gegen diese Zahl konvergiert. S a t z 6. Der Limes inferior und der Limes superior einer heschrankten sind jeweils die kleinsten und grofiten Teilgrenzwerte der Folge^.
Folge
* Hierbei gelien wir von der natiirlichen Beziehung — oo < a; < +oo zwischen den Symbolen —oo, +oo und den Zahlen a; £ R aus.
98
3 Grenzwerte
Beweis. Wir woUen dies beispielsweise fiir den Limes inferior i = lim Xk A;—>oo
beweisen. Wir wissen, dass die Folge «„ = inf Xk nicht absteigend ist und dass k>n
lim in = i G M. Fiir die Zahlen n £ N wahlen wir mit Hilfe der Definition n—)-oo
der grofiten unteren Schranke durch Induktion Zahlen fc„ £ N, so dass «„ < Xkn < *n + - und fc„ < kn+i- Da lim i„ = lim (i„ + -) = i, konnen wir mit Eigenschaften des Grenzwertes feststellen, dass lim Xk„ = i- Somit haben n—>oo
wir bewiesen, dass i ein Teilgrenzwert der Folge {xu} ist. Es ist der kleinste Teilgrenzwert, da fiir jedes e > 0 ein n £ N existiert, so dass i — s < in, d.h., i — e < in = inf Xk < Xk fiir alle k > n. k>n
Die Ungleichung i — e < Xk fiir k > n bedeutet, dass kein Teilgrenzwert der Folge kleiner als i — e sein kann. Aber e > 0 ist beliebig und daher kann kein Teilgrenzwert kleiner als i sein. Der Beweis fiir den Limes superior verlauft natiirlicli analog. D Wir merken an, dass eine von unten nicht beschrankte Folge eine Teilfolge besitzt, die gegen — oo strebt. Aber in diesem Fall gilt auch lim Xk = — oo, A;—>oo
SO dass wir vereinbaren konnen, dass der Limes inferior wiederum der kleinste Teilgrenzwert ist. Der Limes superior kann endlich sein und falls dem so ist, muss er der groBte Teilgrenzwert sein. Aber er kann ebenfalls unendlich sein. Gilt lim Xk = +0O, dann ist die Folge auch oben unbeschrankt und wir A—>oo
konnen eine Teilfolge finden, die gegen +oo strebt. Ist schliefilich lim Xk = A—>oo
—00, was ebenfalls moglich ist, so bedeutet dies, dass sup Xk = s„ ^ —oo, d.h., k>n
die Folge {a;„} strebt gegen — oo, da s„ > a;„. Ganz ahnlich gilt Xk -^ +oo, falls lim Xk = +oo. fe—)-oo
Wenn wir das eben Gesagte beriicksichtigen, konnen wir den folgenden Satz herleiten: Satz 6'. Fiirjede Folge ist der Limes inferior der kleinste ihrer Teilgrenzwerte und der Limes superior der grofite ihrer Teilgrenzwerte. KoroUar 3. Eine Folge besitzt genau dann einen Grenzwert oder strebt gegen negativ oder positiv Unendlich, wenn der Limes inferior und der Limes superior identisch sind. Beweis. Die Falle lim Xk = lim Xk = +oo und lim Xk = lim Xk = —oo wurden bereits oben untersucht und wir konnen daher annehmen, dass lim Xk = lim Xk = A G W. Da «„ = inf Xfc < a;„ < sup Xk = Sn und A—>oo
fe—)-oo
k>n
k>n
angenommen wird, dass lim i„ = lim s„ = A, gilt nach den Eigenschaften n—)-oo
n—)-oo
von Grenzwerten, dass lim Xn = A.
D
KoroUar 4. Eine Folge konvergiert genau dann, wenn jede ihrer Teilfolgen konvergiert.
3.1 Der Grenzwert einer Folge
99
Beweis. Der Limes inferior und der Limes superior einer Teilfolge liegen zwischen denen der Folge. Wenn die Folge konvergiert, dann stinimen der Limes inferior und superior iiberein und daher miissen auch die der Teilfolge gleich sein. Damit ist bewiesen, dass die Teilfolge konvergiert. Aufierdem muss der Grenzwert der Teilfolge niit dem der Folge iibereinstimnien. Die umgekelirte Beliauptung ist offensiclitlich, da die gewahlte Teilfolge die Folge selbst sein kann. D KoroUar 5. Das Lemma von Bolzano-Weierstrafi in seiner eingeschrankten und umfassenderen Form folgt jeweils aus den Sdtzen 6 und 6'. Beweis. Ist in der Tat die Folge {xk} beschrankt, dann sind die P u n k t e i = lim Xk und s = lim Xk endlich und nacli dem eben Bewiesenen Teilgrenzwerte der Folge. Nur fiir i = s besitzt die Folge einen eindeutigen Grenzwert. Fiir i < s existieren mindestens zwei. Ist die Folge auf der einen oder anderen Seite unbesclirankt, dann existiert eine Teilfolge, die gegen die entsprecliende Unendlichkeit strebt. D Zusammenfassende Anmerkungen Wir haben alle drei zu Beginn des Absclinitts angefiihrten P r o g r a m m p u n k te durcligefiilirt (und sind in gewisser Weise dariiber liinaus gegangen). Wir haben eine prazise Definition des Grenzwertes einer Folge gegeben, bewiesen, dass der Grenzwert eindeutig ist, den Zusammenhang zwisclien Grenzwert und Operationen und der Struktur der Menge der reellen Zalilen erlautert und ein Kriterium fiir die Konvergenz einer Folge erhalten. Wir untersuchen nun einen speziellen T y p von Folge, der oft auftritt und sehr niitzlich ist - eine Reilie. 3.1.4 Elementares zu R e i h e n a. D i e S u m m e e i n e r R e i h e u n d d a s C a u c h y s c h e K o n v e r g e n z k r i t e r i u m fur R e i h e n Sei {a„} eine Folge reeller Zahlen. Wir erinnern daran, dass die Summe Op + 9
ap+i + • • • + Og, {p < q) mit dem Symbol X] a„ bezeichnet wird. Wir woUen n=p
nun dem Ausdruck ai + a2 + • • • + a„ + • • • eine klare Bedeutung verleihen, die die Summe aller Glieder der Folge {a„} zum Ausdruck bringt. D e f i n i t i o n 16. Der Ausdruck ai + a2 + • • • + a„ + • • • wird durch das Symbol oo
^
a „ bezeichnet und iiblicherweise eine Reihe oder eine unendliche
Reihe
n=l
(um den Unterschied zu einer Summe mit endlicher Anzahl von Summanden zu betonen) genannt.
100
3 Grenzwerte
Definition 17. Die Elemente der Folge {a„} werden als Bestandteile einer Reihe die Glieder der Reihe genannt. Das Element a„ wird als n-tes Glied bezeiclinet. n
Definition 18. Die Summe s„ = X] Ofc wird Teilsumme der Reihe oder, falls fc=i
der Index hervorgelioben werden soil, die n-te Teilsumme der Reihe^ genannt. Definition 19. Falls die Folge {sn} der Teilsummen einer Reihe konvergiert, dann sagen wir, dass die Reihe konvergiert. Besitzt die Folge {sn} keinen Grenzwert, so sagen wir, dass die Reihe divergiert. Definition 20. Der Grenzwert lim Sn = s der Folge von Teilsummen der n—)-oo
Reihe wird, falls er existiert, die Summe der Reihe genannt. In diesem Sinne werden wir zukiinftig den Ausdruck oo
n=l
verstehen. Da die Konvergenz einer Reihe zur Konvergenz ihrer Folge von Teilsummen {s„} aquivalent ist, erhalten wir durch das Cauchysche Konvergenzkriterium fiir die Folge {sn} den folgenden Satz: Satz 7. (Cauchysches Konvergenzkriterium fiir Reihen). Die Reihe oi + • • • + a„ + • • • konvergiert genau dann, wenn fiir jedes e > 0 ein N G'N existiert, so dass aus den Ungleichungen m > n > N folgt: |a„ + • • • + am\ < £• KoroUar 6. Wird nur eine endliche Anzahl von Gliedern einer Reihe verandert, dann konvergiert die neue Reihe, falls die urspriingliche Reihe konvergiert und sie divergiert, wenn die urspriingliche divergiert. Beweis. Fiir den Beweis geniigt die Annahme, dass die Zahl N im Cauchyschen Konvergenzkriterium groBer ist als der groBte Index der veranderten Gheder. D KoroUar 7. Es ist eine notwendige Bedingung fiir die Konvergenz der Reihe ai -\- • • • -\- On + • • •, dass ihre Glieder fiir n ^ oo gegen Null streben, d.h., es ist notwendig, dass lim a„ = 0. Beweis. Es geniigt, im Cauchyschen Konvergenzkriterium m = n zu setzen und die Definition des Grenzwertes einer Folge zu benutzen. D 6
Somit definieren wir eine Reihe als geordnetes Paar ( {on}, {s„} 1 von Folgen, die durch die Gleichung [s„ = '^ Ukj fiir alle n £ N verkniipft sind. k= l
'
3.1 Der Grenzwert einer Folge
101
Hier noch ein weiterer Beweis: a„ = s„ —s„_i und es gilt unter der Voraussetzung, dass lim s„ = s: lim a„ = lim (s„ —s„_i) = lim s„— lim s„_i = n—>oo
n—)-oo
n—>oo
n—>oo
n—)-oo
s - s = 0. Beispiel 20. Die Reihe l + ( 7 + g^+ ••• + ?" + ••• wird oft auch geometrische Reihe genannt. Wir wollen ihr Konvergenzverhalten untersuchen. Da \q"\ = \q\"-, gilt |g"| > 1 fiir \q\ > 1, weswegen in diesem Fall die notwendige Konvergenzbedingung niclit eingehalten wird. Sei nun \q\ < 1. Dann erhalten wir n-i
1 - 9" 1-q
und lim s„ = -r^-, da lim (/" = 0 fiir \q\ < 1. n—)-oo
y
n—)-oo oo
Somit konvergiert die Reihe ^ (/""^ genau dann, wenn \q\ < 1, und dann n=l
betragt die Summe -r—. °
1 —g
Beispiel 21. Die Reihe l + ^ + --- + - + --- wird harmonische Reihe genannt, da voni zweiten Term an jeder Term dem harmonischen Mittel der beiden Terme links und rechts davon entspricht (vgl. Aufgabe 6 am Ende des Abschnitts). Die Gheder der Reihe streben gegen Null, aber die Folge der Teilsummen , 1 1 2 n divergiert, wie wir in Beispiel 10 gezeigt haben. Dies bedeutet, dass in diesem Fall s„ -^ +00 fiir n ^ oo. Somit divergiert die harmonische Reihe. Beispiel 22. Die Reihe 1 — 1 + 1 h (—1)"+^ H divergiert, wie wir an der Folge der Teilsummen 1,0,1,0,... sehen konnen und daran, dass ihre Glieder nicht gegen Null streben. Wenn wir Klammern einfiihren und die neue Reihe (1_1) + (1_1) + ... betrachten, deren Glieder die geklammerten Differenzen sind, sehen wir, dass diese neue Reihe konvergiert und ihre Summe ist offensichtlich Null. Wenn wir die Klammern anders setzen und die Reihe 1 + ( - 1 + 1 ) + ( - 1 + !) + ••• betrachten, dann konvergiert diese Reihe zur Summe 1. Wenn wir alle Terme, die gleich —1 sind, in der urspriinglichen Reihe um zwei Positionen nach rechts verschieben, erhalten wir die Reihe 1 + 1-1 + 1-1 + 1
.
102
3 Grenzwerte
Durch Klanimerung gelangen wir zur Reihe (l + l) + ( - l + l) + ( - l + !) + ••• , deren Summe gleich 2 ist. Diese Beobachtungen zeigen, dass die iiblichen Gesetze zur Behandlung endlicher Sumnien im AUgenieinen nicht auf Reihen erweitert werden konnen. Es gibt nichtsdestotrotz einen wichtigen Typ von Reihen, der, wie wir unten sehen werden, genauso wie endliche Summen behandelt werden kann. Dies sind sogenannte absolut konvergente Reihen. Mit diesen werden wir hauptsachlich arbeiten. b. Absolute Konvergenz. Der Vergleichssatz und seine Konsequenzen oo
Definition 21. Die Reihe J2 ^n ist absolut konvergent, faUs die Reihe n=l oo
^
|a„| konvergiert.
n=l
Da \a„ + • • • + Oml < |a„| + • • • + \am\, folgt nach dem Cauchyschen Konvergenzkriterium, dass eine absolut konvergente Reihe konvergiert. Die Unikehrung dieser Aussage ist im AUgenieinen nicht wahr, d.h., absolute Konvergenz ist eine starkere Anforderung als blofie Konvergenz, wie sich leicht an einem Beispiel zeigen lasst. Beispiel 23. Die Reihe 1 — I + 5 — 5 + | — | H , deren Teilsummen entweder - oder 0 sind, konvergiert gegen 0. Auf der anderen Seite divergiert die Reihe der Absolutwerte der Glieder 1+ 1
1
1
1
1
—+ —+ —+ —+ 2
2
3
3
wie schon im Fall der harmonischen Reihe. Dies folgt aus dem Cauchyschen Konvergenzkriterium, da 1
1
—7 H
1 7H
+
1
+
n+n n+n ( \ I N 2 - + ••• + >2n Vn + 1 n^ nl
1 = 1 n+n
Zur Untersuchung der absoluten Konvergenz einer Reihe geniigt es, die Konvergenz von Reihen mit nicht negativen Gliedern zu untersuchen. Es gilt der folgende Satz: Satz 8. (Konvergenzkriterium fiir Reihen mit nicht negativen Gliedern). Eine Reihe ai + • • • + a„ + • • •, deren Glieder nicht negativ sind, konvergiert genau dann, wenn die Folge der Teilsummen von oben beschrdnkt ist.
3.1 Der Grenzwert einer Folge
103
Beweis. Dies folgt aus der Definition der Konvergenz einer Reihe und dem Konvergenzkriterium einer nicht absteigenden Folge, wobei die Folge der Teilsummen in diesem Fall si < S2 < • • • < s„ < • • • ist. D Aus diesem Kriterium folgt der folgende einfache Satz, der fiir die Praxis sehr niitzlich ist. oo
oo
Satz 9. (Vergleiclissatz). Seien ^ a„ und ^ b„ zwei Reihen mit nicht nen=l
n=l
gativen GUedern. Falls ein Index N G 'N existiert, so dass a„ < b„ fiir alle oo
n > N, dann folgt aus der Konvergenz der Reihe ^ &„ die Konvergenz von oo
oo
oo
^ a„ und aus der Divergenz von ^ a„ folgt die Divergenz von ^ b„. n=l
n=l
n=l
Beweis. Da eine endliche Anzahl von Gliedern keine Auswirkung auf die Konvergenz einer Reihe besitzt, konnen wir oline Verlust der Allgemeinheit ann
nelimen, dass a„ < &„ fiir jeden Index n € N. Dann gilt An = X] Ofc < fc=i n
oo
J2 bk = Bn- Konvergiert die Reihe ^ &„, dann strebt die Folge {Bn}, die fc=l
n=l
nicht absteigend ist, gegen einen Grenzwert B. Aber dann gilt An < Bn < B oo
fiir alle n GN und folglich ist die Folge A„ der Teilsummen der Reihe ^
a„
n=l
beschrankt. Nach dem Konvergenzkriterium einer Reihe mit nicht negativen oo
Gliedern (Satz 8) konvergiert die Reihe "^2 inn=\
Die zweite Behauptung des Satzes folgt aus dem eben Bewiesenen durch einen Widerspruchsbeweis. D ^- D^ n(n+i) < ; ? < (n--V)n f^*" " > 2, folgcrn wir, dass die Reihen oo
oo
X] -^ und X] n{n+'\:) beide konvergieren oder divergieren. n=l
n=l
Aber die zweite Reihe kann direkt aufgrund von n
^I^J^-Y\
— \ ~ i+T ^^^" oo
gewertet werden, da folglich Yu k(k+\) = ^ ~ ^ - Daher ist Yu n(n+\) = ^• fc=l
n=l oo
Folgerichtig konvergiert die Reihe ^ n=l
oo
^ . Interessanterweise gilt Y W
2
~\^
n=l
wie wir unten zeigen werden. Beispiel 25. Wichtig ist, dass der Vergleichssatz nur fiir Reihen mit nicht negativen Gliedern gilt. Setzen wir namlich beispielsweise a„ = —n und &„ = 0, oo
oo
dann gilt a„ < 6„ und die Reihe ^ 6„ konvergiert, wohingegen ^ a„ divern=l
giert.
n=l
104
3 Grenzwerte oo
KoroUar 8. (WeierstraBscher M-Test auf absolute Konvergenz). Seien ^
a„
n=l oo
und ^ b„ Reihen. Angenommen,
es existiere ein Index N G 'N, so dass
n=\
I On I < ^n fur alle n > N. Dann ist es eine hinreichende Bedingung fiir die oo
oo
absolute Konvergenz der Reihe ^ a„, dass die Reihe ^ &„ konvergiert. n=l
n=l
Beweis. Nach dem Vergleichssatz konvergiert in der Tat die Reihe X] \ar, n=l
und genau das entspricht der absoluten Konvergenz von X] a„.
D
n=l
Dieser wichtige hinreichende Test auf absolute Konvergenz wird oft in Kurzform wie folgt formuliert: Werden die (Absolutwerte der) Glieder einer Reihe durch die Glieder einer konvergenten numerischen Reihe majorisiert, dann konvergiert die betrachtete Reihe absolut. Daher wird dieser Test auch oft als Majorantenkriterium bezeichnet. oo
Beispiel 26. Die Reihe YJ ^ ^ konvergiert absolut, da | ^ ^ | < ^ , und die n=l oo
Reihe ^
-^ konvergiert, wie wir in Beispiel 24 gezeigt haben.
n=l oo
KoroUar 9. (Cauchyscher Test). Sei ^ a„ eine gegebene Reihe und a = n=i
lim A/|a„|. Dann gilt:
n—)-oo
oo
a) fiir a < 1 konvergiert die Reihe ^ a„ absolut, n=\ oo
b) fur cc > 1 divergiert die Reihe X] ^n; n=l
c) fiir a = 1 existieren sowohl absolut konvergente wie divergente Reihen. Beweis. a) Fiir a < 1 konnen wir g £ ffi so wahlen, dass cc < g < 1. Bei festem q existiert nach der Definition des Limes superior ein A^ £ N, so dass A/|a„| < q fiir alle n > N. Somit erhalten wir |a„| < g" fiir n > N und, da die oo
Reihe ^ g" fiir \q\ < 1 konvergiert, folgt nach dem Vergleichssatz oder nach n=l oo
dem Weierstrafischen Kriterium, dass die Reihe ^ a„ absolut konvergiert. n=l
b) Da a ein Teilgrenzwert der Folge { \/l'^»l} ^^^ (Satz 6), existiert eine Folge {onfc}, so dass hm " v K » J = ct- Daher existiert fiir cc > 1 ein K £N, n—)-oo
SO dass |a„j, | > 1 fiir alle k > K. Somit wird die notwendige Konvergenzbeoo
dingung (a„ -^ 0) nicht von der Reihe ^ a„ erfiillt, weswegen sie divergiert. n=l
3.1 Der Grenzwert einer Folge oo
105
oo
c) Wir wissen bereits, dass die Reihe J2 ~ divergiert und ^
-^ konver-
n=l
jiert (absolut, da 1^1 = -^). Aufierdem gilt lim \ - = lim -4i= = 1 und In
lim
I
n
n->-oo V "
lim - ^ = lim {4r)
n->-oo
V"
= 1-
n—)-oo
Beispiel 27. Wir woUen die Werte x £ M finden, fiir die die Reihe oo
konvergiert. Dazu bereclmen wir cc = lim A / | ( 2 + (—l)")"a;"| = \x\ lim |2+(—1)"| = n—>oo
n—)-oo
3|x|. Somit konvergiert die Reihe fiir |a;| < | sogar absolut, wohingegen sie fiir \x\ > I divergiert. Der Fall \x\ = | erfordert eine Spezialbehandlung. Dies ist fiir diesen Fall einfach, da fiir |a;| = | und gerades n {n = 2k) gilt: (2 + (-1)^*^) x^* = 3^*^(1) = 1. Daher divergiert die Reihe, da sie die notwendige Konvergenzbedingung nicht erfiillt. KoroUar 10. (D'Alembert-Kriterium®, Quotientenkriterium). der Grenzwert
lim
an + i
existiere fiir die Reihe
^
Angenommen,
a „ . Dann
gilt:
n—>oo
a) Fiir a < 1 konvergiert
die Reihe
^
a„
absolut.
n=l oo
b) Fiir a > 1 divergiert
die Reihe
^
a„.
n=\
c) Es gibt fiir a = 1 sowohl absolut konvergente
wie divergente
Reihen.
Beweis. Fiir a < 1 existiert eine Zahl q, so dass a < q < 1. Wenn wir q festhalten und die Eigenschaften von Grenzwerten ausnutzen, konnen wir einen Index N £ N finden, so dass |^iii±i| < o fiir n > A^. Da eine endliche "
\ an
\
Anzahl von Gliedern keinen Einfluss auf die Konvergenz von Reihen besitzt, konnen wir ohne Verlust der AUgemeinheit annehmen, dass ""^^ < q fiir alle n e N. 02 On+l an Da = ai an an-1 erhalten wir | a „ + i | < | a i | • g". Aber die Reihe ^ Summe ist offensichthch gleich 'f^),
| a i | g " konvergiert (ihre
so dass die Reihe ^
a „ absolut kon-
n=l
vergiert. ^ J. L. d'Alembert (1717-1783) - franzosischer Gelehrter mit Mechanik als Spezialgebiet. Er war Mitglied der Gruppe von Philosophen, die die Encydopedie schrieben.
106
3 Grenzwerte
b) Fiir a > 1 gilt ab einem Index A^ £ N die Ungleichung |^^f^^| > 1, d.h., |a„| < |an+i|- Somit ist die zur Konvergenz notwendige Bedingung, dass oo
a„ ^ 0, fiir die Reihe ^ a„ nicht erfiillt. n=l oo
oo
c) Wie beim Cauchyschen Test dienen die Reihen J2 ~ und J2 ^ ^1^ n=l
n=l
Beispiele.
D
Beispiel 28. Wir woUen die Werte x £ M bestimmen, fiir die die Reihe oo
-.
V-a;" ^ ^ n! n=l
konvergiert. Fiir X = 0 konvergiert sie offensichtlich absolut. Fiir X ^ 0 erhalten wir lini ""^^ = lim ^ ^ = 0. n—>oo ' ^'^ '
n—)-oo ^+-'-
Somit konvergiert die Reihe absolut fiir jeden Wert x £ M. Zuni Abschluss woUen wir eine besondere, aber oft vorkonimende Klasse von Reihen, deren Glieder eine monotone Folge bilden, betrachten. Fiir derartige Reihen gilt die folgende notwendige und hinreichende Bedingung: oo
Satz 10. (Cauchy). Fiir ai > a2 > • • • > 0 konvergiert die Reihe ^ a„ genau n=l oo
dann, wenn die Reihe ^ 2*a2'« = oi + 2a2 + 4a4 + Sag + • • • konvergiert. fc=o
Beweis. Da 0 2 < 0 2 < Ol ,
2a4 < as + a4 < 2a2 , 4a8 < 05 + ag + a? + og < 4a4 , 2"a2"+i < a2»+i H
h a2»+i < 2"a2» ,
erhalten wir nach Addition dieser Ungleichungen: ^(-Sn+l - Oi) < ^2" + ! - ai < 5„ , wobei Ak = ai + • • • + Uk und 5„ = ai + 2a2 + • • • + 2"a2" die Teilsummen der beiden betrachteten Reihen sind. Die Folgen {Aj-} und {5„} sind nicht abnehmend und daher konnen wir aus diesen Ungleichungen folgern, dass sie entweder beide von oben beschrankt sind oder beide von oben unbeschrankt sind. Dann folgt aus deni Konvergenzkriterium von Reihen niit nicht negativen Gliedern, dass die beiden Reihen tatsachlich beide konvergieren oder divergieren. D
3.1 Der Grenzwert einer Folge
107
Aus diesem Ergebnis folgt ein niitzliches Korollar. KoroUar. Die Reihe
^
^
konvergiert
fiir p > 1 und divergiert fiir p < 1.^
n=l
Beweis.
Fiir p>0 folgt aus Satz 10, dass die Reihe gleichzeitig mit der Reihe
k=0
^
'
fc=0
konvergiert oder divergiert und eine notwendige und hinreichende Bedingung fiir die Konvergenz dieser Reihe ist (/ = 2 ^ ~ P < 1, d.h., p> \. OO
Fiir p < 0 divergiert die Reihe ^
^
offensichthch, da alle Gheder der
n=l
Reihe groBer als 1 sind.
D OO
Die Bedeutung dieses Korohars hegt darin, dass die Reihe ^
-^ oft als
n=l
Vergleichsreihe benutzt wird, urn die Konvergenz anderer Reihen zu untersuchen. c. D i e Zahl e als S u m m e e i n e r R e i h e Zum Abschluss unserer Untersuchungen iiber Reihen kehren wir wiederum zur Zahl e zuriick und erhalten eine Reihe, die einen sehr bequenien Weg zu ihrer Berechnung eroffnet. Wir werden Newtons binoniische Forniel benutzen, um den Ausdruck (1 + -i;)" zu entwickeln. Diejenigen, die mit dieser Formel aus der Schulzeit nicht vertraut sind und nicht die Teilaufgabe Ig) in Abschnitt 2.2 gelost haben, konnen diesen Anhang zur Zahl e ohne Verlust des Zusammenhangs auslassen. Dieser Anhang kann nach der Untersuchung der Taylorschen Fornieln, die als Verallgenieinerungen von Newtons binomischer Formel betrachtet werden konnen, nachgeholt werden. Wir wissen, dass e = hm ( l + - ) . n—>oo ^
"'
Nach Newtons binomischer Formel gilt: n 1
(' + - ) "
n(n — 1) 1
"^Tln "^
2!
'^^'"^
n(n-l)---(n-fc+l)
+
1
1
k\
n'• •
\
n
/
ni \
n/
\
X
n
/
^ Bis jetzt haben wir in diesem Buch die Zahl n'' formal nur fiir rationale Werte p definiert, so dass es dem Leser fiir den Augenblick freisteht, dieses Korollar nur fiir Werte p, fiir die n*" bisher definiert ist, anzuwenden.
108
3 Grenzwerte
Wir setzen (l + :^) = e„ und l + l + ---^ + --- + -k = Sn und erhalten e„ < s„, (n = 1,2,...)Auf der anderen Seite gilt fiir jedes feste k und n > k, wie wir aus derselben Entwicklung sehen, dass 1 /
1/
IN
1\
/
k-l\
Mit n ^ CO strebt die linke Seite dieser Ungleichungen gegen Sk und die rechte gegen e. Damit konnen wir folgern, dass Sfc < e fiir alle fc £ N. Nun erhalten wir aber aus den Relationen
dass lim s„ = e. n—>oo
In Ubereinstimmung mit der Definition der Summe einer Reihe, konnen wir nun schreiben: e == 1
1
+ 1!
1
+ 2! +
• • +
1 n!
+ •••
Diese Darstellung der Zahl e ist sehr wohl fiir Berechnungen geeignet. Wir woUen den Unterschied e — s„ abschatzen: 1 1 0 < e — Sr, (n + iy. (n + 2)! 1 r 1 1 -I < ' (n + 1)! r ^ n + 2 ^ (n + 2)(n + 3) ^"'\ 1 r 1 1 -1 _ '^ (n + iyA ^ n + 2 ^ (n + 2)2 + ' " J ~ 1 1 n+2 1 (n+l)!l-^ n ! ( n + l ) 2 < n\n ' Um den absoluten Fehler in der Naherung von e durch s„ etwa kleiner als 10~^ zu machen, geniigt es, dass ^ < j ^ und diese Bedingung ist bereits fiir sg erfiillt. Die fiihrenden Dezimalstellen von e lauten: e = 2,7182818284590... . Diese Abschatzung fiir die Differenz e — s„ kann als Gleichung e = Sn -\
;—, rnit 0 < ^„ < 1 n\n geschrieben werden. Aus dieser Darstellung folgt unmittelbar, dass e irrational ist. Wenn wir annehmen, dass e = ^ mit p,q G fi, dann muss die Zahl qle eine ganze Zahl sein, wohingegen g!e
^, \ _
, , «!
«!
, 9!
^«
i!
Z\
q\
q
4.-2)-'4-1— q\q/
3.1 Der Grenzwert einer Folge
109
Folglich soUte die Zahl -f- eine ganze Zahl sein, was unmoglich ist. Zur Information des Lesers bemerken wir, dass e nicht nur irrational, sondern auch transzendent ist. 3.1.5 U b u n g e n u n d A u f g a b e n 1. Zeigeii Sie, dass eine Zahl x e R genau danii rational ist, wenn ihre g-adische Darstellung in jeder Basis q periodisch ist, d.h., sie besteht ab einer Stelle aus ZifFern, die sich periodisch wiederholen. 2. Ein aus der Hohe h fallender Ball springt auf die Hohe qh zuriick, wobei q ein konstanter Koeffizient 0 < g < 1 ist. Bestimmen Sie die Zeit, die vergeht, bis der Ball zur Ruhe konimt und den Weg, den er in der Zeit in der Luft zuriickgelegt hat. 3. Beginnend bei einem festen Punkt markieren wir alle Punkte auf eineni Kreis, die durch Drehung des Kreises um einen Winkel von n Radianten entstehen. Dabei lauft n G Z uber alle ganzen Zahlen. Beschreiben Sie alle Haufungspunkte der so konstruierten Menge. 4. Der Bruch
1
ni H n2 +
i
113 +
1
1 nk mit Wfc £ N wird endlicher Kettenbruch genannt und der Bruch Uk-i H
1
ni + n-z +
n3 +
ein unendlicher Kettenbruch. Die Briiche, die aus einem Kettenbruch erhalten werden, wenn man von einem Punkt an alle folgenden Elemente weglasst, werden Konvergenten genannt. Der einem unendlichen Kettenbruch zugewiesene Wert ist der Grenzwert der Konvergenten. Zeigen Sie, dass: a) Jede rationale Zahl ^ , mit m, n £ N eindeutig als Kettenbruch entwickelt werden kann: m 1 1 - = gi + g2 + g3+
1
1 q-n-i H
Dabei ist q-n i= ^ fiir n > 1.
qn
110
3 Grenzwerte H i n w e i s : Die Elemente genannten Zahlen g i , . . . ,g„ konnen mit dem euklidischeii Algorithmus m
= n • qi+ri , ri • q2 +r2 ,
n = ri
= r2 • qs +r3
berechnet werden, indem wir — -^[Q folet schreiben: m l — =qi + —r- = gi +
n
1 —
32 +
nn
b) Die Konvergenten -Ri = gi, -R2 = gi H
, • • • erfiillen die Ungleichungen
i?l < i?3 < • • • < ^ 2 * - ! < —
< R2k-2
<•••
n c) Die Zahler P^ und Nenner Qk der Konvergenten werden nach der folgenden Vorschrift gebildet: Pk = Pk-iqk + Pk-2 , Qk = Qk-iqk
+ Qk-2
P2 = qiq2 , Pi = qi ,
,
Q2 = q2 ,
Qi = 1 .
d) Die Differenz zwischen aufeinander folgenden Konvergenten kann nach der Vorschrift berechnet werden: Rk-Rk-i=
J,
'
(fc>l).
I^kl^k-l
e) Jeder unendliche Kettenbruch besitzt einen bestimmten Wert. f) Der Wert eines unendhchen Kettenbruchs ist irrational. g)
1 +
h) Die Fibonacci Zahlen 1,1, 2, 3, 5, 8 , . . . (d.h., u„ = Un-i + Un-2 und MI = M2 = 1), die als Zahler der Konvergenten in g) erhalten werden, ergeben sich nach der Forniel:
1 r/i + y s v
fi-Vh
i) Fiir die Konvergenten Rf^ = ^ in g) gilt: ^^^ ~ o^ ^ Qfc " ' >i> f5"^- I 2 Q, I Qi^Vergleichen Sie dieses Ergebnis mit den Annahmen in Aufgabe 11 in Abschnitt 2.2.
3.1 Der Grenzwert einer Folge
111
5. Zeigeii Sie: a) Die Gleichung 1 1 1 + TT :^H 1! + 2!
1 1 \--r n! + n\n
1 • 2 • 2!
(n - 1) • n • n!
gilt fiir n > 2. oo
°) ^ = "^ ~ Z^ (n+l)(n+2)(n+2)! • n=0
c) Die Formel e w l + Y! + 5T + ' ' ' + ';n~'" TTF^ ^^^ ^^'' naherungsweisen Berechnung der Zahl e viel besser geeignet als die urspriingliche Formel e w 1 + YT + 5T + ' ' ' + ^ (Schatzen Sie die Fehler ab und vergleichen Sie das Ergebnis mit dem Wert von e, der auf Seite 108 aufgefiihrt ist). 6. Wenn o und b positive Zahlen sind und p eine beliebige von Null verschiedene reelle Zahl, dann ist der Mittelwert voni Grad p der Zahlen o und 6 die Grofie Sp[a,b) Fiir p = 1 erhalten wir insbesondere das arithmetische Mittel von a und b, fiir p = 2 das quadratische Mittel und fiir p = —1 das harmonische Mittel. a) Zeigen Sie, dass der Mittelwert Sp{a,b) fiir jeden Grad zwischen den Zahlen a und 6 liegt. b) Bestimmen Sie die Grenzwerte der Folgen {Snia,b)},
{S-nia,b)}
7. Zeigen Sie: a) So (n) = 1 + • • • + n = n , Si(n)
= 1 +--- + n =
= -n
+ ^n ,
o f ^ i2, 82(71) = 1 H bs(n)
=
, 2 n(n + l)(2n + l) 1 3 1 2,1 \-n = = -n + -n + -n 6 3 2 6 n'jn + iy 1 4,1 3,1 2 4
= T W + T:n + -rn 4 2 4
und Sk{n) = Ok+in ^"^ + • • • + ain + oo ist ini AUgemeinen ein Polynom vom Grade fc + 1. ")
}
n'i + l ~ fc + 1 •
112
3 Grenzwerte
3.2 Der Grenzwert einer Funktion 3.2.1 Definitionen und Beispiele Sei E eine Teilmenge von K und a ein Haufungspunkt von E. Sei f : E ^ R eine auf E definierte reellwertige Funktion. Wir wollen die Bedeutung der Aussage, dass der Wert f{x) der Funktion / gegen eine Zahl A strebt, wenn x G E sich an a annahert, ausarbeiten. Es ist natiirlich, eine derartige Zahl A als Grenzwert der Funktionswerte zu bezeichnen oder als der Grenzwert von / , wenn x gegen a strebt. Definition 1. Wir werden (nacli Cauchy) sagen, dass eine Funktion f:E^R gegen A strebt, wenn x sich a annahert, oder dass A der Grenzwert von f ist, wenn x gegen a strebt, falls fiir jedes e > 0 ein 6 > 0 existiert, so dass |/(a;) - A\ < e fiir alle a; e -E mit 0 < |a; - a| < (5. In logischen Symbolen lauten diese Bedingungen: V e > 0 3 ( 5 > O V a ; e £ ; ( 0 < | a ; - a | < ( 5 ^ |/(a;) - A\ < s) . Ist A der Grenzwert von f{x), wenn x in der Menge E gegen a strebt, dann schreiben wir f{x) -^ A fiir x ^ a, x G E oder lim f{x) = A. Anstelle von x ^ a, x G E werden wir im Allgemeinen die kiirzere Sclireibweise E ^ x ^ a benutzen und anstelle von lim f{x) werden wir lim f{x) = A schreiben. E3x—>-a
Beispiel i. Sei i? = M \ 0 und f{x) = a;sin i . Wir werden zeigen, dass lim X sin — = 0 . B9x->0
X
Dazu wahlen wir 5 = e fiir ein vorgegebenes e > 0. Dann gilt fiir 0 < |a;| < 6 = e unter Einbeziehung der Ungleichung |a;sin i | < |a;|, dass jxsin ^| < £• Wir konnen iibrigens an diesem Beispiel erkennen, dass eine Funktion / : i? —>•ffieinen Grenzwert fiir E B x ^ a besitzt, ohne im Punkt a selbst definiert zu sein. Genau dies ist meistens dann der Fall, wenn Grenzwerte berechnet werden miissen. Und Sie werden, falls Sie aufmerksam waren, bemerkt haben, dass dieser Umstand bei unserer Definition des Grenzwertes beriicksichtigt wurde, da wir die strenge Ungleichung 0 < |a; — a| benutzt haben. Wir wiederholen, dass eine Umgebung eines Punktes a € ffi jedes offene IntervaU ist, dass diesen Punkt enthalt. Definition 2. Eine punktierte Umgebung eines Punktes ist eine Umgebung des Punktes, aus der der Punkt selbst entfernt wurde.
3.2 Der Grenzwert einer Punktion
113
Wenn U{a) eine Umgebung von a bezeichnet, werden wir die zugehorige punktierte Umgebung durch tj{a) bezeichnen. Die Mengen Usia) := EnU{a)
,
tlEia) := Entlia) nennen wir eine Umgebung von a in E und eine punktierte Umgebung von a in E. Sei a ein Haufungspunkt von E, dann ist JJE{OL) 7^ 0 fiir jede Umgebung U{a). Wenn wir fiir den Augenblick die umstandlichen Symbole L^^(a) und V5[f(A) verwenden, um die punktierte (5-Umgebung von a \n E und die eUmgebung von A in M zu bezeichnen, dann kann die sogenannte Cauchysche „e-(5-Definition" des Grenzwertes einer Funktion neu geschrieben werden: lim f{x)=A\ EBx—i-a
•.= ^V^{A) 3u%{a)
[f[U^ia))
C V^{A)) .
J
Dieser Ausdruck besagt, dass A der Grenzwert der Funktion / : _E ^ M ist, wenn x in der Menge E gegen a strebt, falls fiir jede e-Umgebung V^{A) von A eine punktierte Umgebung i]^^{a) von a in _E existiert, deren Bild /(?7|;(a)) unter der Abbildung / : i? —>• K vollstandig in 1^(A) entlialten ist. Wenn wir beriicksiclitigen, dass jede Umgebung eines Punktes auf der reellen Geraden eine symmetrisclie Umgebung (eine (5-Umgebung) desselben Punktes enthalt, gelangen wir zu folgendem Ausdruck fiir die Definition eines Grenzwertes, den wir als unsere eigentliche Definition verwenden: Definition 3. lim f{x) = A\ :=VyK(A) ^UE{a)
{f{UE{a))
CVuiA)).
Somit wird die Zahl A als Grenzwert der Funktion / : _E —>•ffifiir x gegen a bezeichnet, wobei wir in der Menge E bleiben (a muss ein Haufungspunkt von E sein), wenn fiir jede Umgebung von A eine punktierte Umgebung von a in E existiert, deren Bild unter der Abbildung / : _E —>• M in der vorgegebenen Umgebung von A enthalten ist. Wir haben verschiedene Aussagen zur Definition des Grenzwertes einer Funktion eingefiihrt. Fiir numerische Funktionen, wenn a und A in M enthalten sind, sind diese Aussagen, wie wir gesehen haben, aquivalent. In diesem Zusammenhang nehmen wir zur Kenntnis, dass die eine oder die andere dieser Aussagen in verschiedenen Situationen praktischer sein kann. So ist beispielsweise die urspriingliche Formulierung bei numerischen Berechnungen zweckmafiig, da sie einen erlaubten Betrag fiir die Abweichung zwischen x
114
3 Grenzwerte
und a enthalt, um sicherzustellen, dass die Abweichung zwischen f{x) und A nicht einen bestimniten Wert iiberschreitet. Dagegen ist aber fiir die Verallgemeinerung des Konzepts eines Grenzwertes auf allgemeinere Funktionen die letzte Definition am praktischsten. Sie erlaubt es uns, den BegrifF eines Grenzwertes einer Abbildung / : X —>• F zu definieren, falls uns bekannt ist, was eine Umgebung eines P u n k t e s in X und Y bedeutet, d.h., falls, wie wir sagen, eine Topologie fiir X und Y gegeben ist. Wir wollen einige weitere Beispiele betracliten, die die eigentliche Definition verdeutliclien. Beispiel 2. Die Funktion
sgna; = ^
1 fiir X > 0 , 0 fiir x = 0 , -1 fiir X <0
(sprich „signum a;"*) ist auf der ganzen reellen Geraden definiert. Wir werden zeigen, dass sie keinen Grenzwert besitzt, wenn x gegen 0 strebt. Die NichtExistenz dieses Grenzwertes wird durch VA e M 3V{A)
VLr(O) 3x £ U{0) ( / ( x ) ^
V{A))
ausgedriickt, d.h. unabliangig davon, welches A wir herausgreifen (mit dem Anspruch der Grenzwert von sgn x fiir a; ^ 0 zu sein), gibt es eine Umgebung V{A) von A, so dass, unabhangig davon wie klein wir die punktierte Umgebung L^(0) von 0 wahlen, die punktierte Umgebung zumindest einen P u n k t x enthalt, fiir den der Wert der Funktion nicht in V{A) hegt. Da sgn a; nur die Werte — 1 , 0 und 1 annimmt, kann offensichtlich keine andere Zahl der Grenzwert der Funktion sein, da jede andere Zahl eine Umgebung besitzt, die keine dieser drei Zahlen enthalt. Fiir A £ { — 1,0,1} wahlen wir als V{A) die e-Umgebung von A mit £ = ^• Die P u n k t e —1 und 1 konnen sicherlich nicht beide in dieser Umgebung liegen. Aber egal, welche punktierte Umgebung L^(0) von 0 wir auch nehmen, diese Umgebung enthalt stets sowohl positive als auch negative Zahlen, d.h., P u n k t e X mit / ( x ) = 1 und P u n k t e mit f{x) = —1. Daher gibt es einen P u n k t x G U{0), so dass f{x) ^ V{A). Ist die Funktion f : E ^ M. auf einer voUstandigen punktierten Umgebung eines P u n k t e s a £ ffi definiert, d.h., gilt IJE{a) = Unia) = U{a), so vereinbaren wir in Kurzform a; —^ a, anstelle von E ^ x ^ a zu schreiben. Beispiel
3. Wir soUen zeigen, dass hm |sgna;| = 1.
Tatsachlich gilt |sgna;| = 1 fiir a; £ ffi \ 0, d.h., die Funktion ist in jeder punktierten Umgebung L^(0) von 0 konstant und gleich 1. Daher erhalten wir fiir jede Umgebung V{1): f{u{0)) = 1 e V(1). Lateinisch fiir Zeichen.
3.2 Der Grenzwert einer Punktion
115
Beachten Sie insbesondere, dass, obwohl die Funktion |sgna;| im Punkt 0 selbst mit |sgnO| = 0 definiert ist, dieser Wert keinen Einfluss auf den Wert des fraglichen Grenzwertes hat. Daher darf man den Wert /(a) der Funktion im Punkt a nicht mit dem Grenzwert lim /(a;), den die Funktion fiir a; —^ a annimmt, durcheinander bringen. Seien ffi_ und ffi+ die Mengen der negativen und der positiven Zahlen. Beispiel 4- Wir haben in Beispiel 2 gesehen, dass der Grenzwert
lim sgna; R9a:->0
nicht existiert. Wir bemerken jedoch, dass die Einschrankung sgn|R_ von sgn auf M_ der konstanten Funktion —1 und sgnJR^ der konstanten Funktion 1 entspricht. Nun konnen wir wie in Beispiel 3 zeigen, dass lim
sgn a; = — 1 und
R_9a:->0
lim
sgn a; = 1 ,
K + 9x->0
d.h., die Einschrankungen derselben Funktion auf verschiedene Mengen konnen zu unterschiedlichen Grenzwerten im gleichen Punkt fiihren oder sie besitzen gar keinen Grenzwert, wie in Beispiel 2 gezeigt. Beispiel 5. Wir greifen die Idee aus Beispiel 2 auf und konnen ganz ahnlich zeigen, dass sin ^ fiir x ^ 0 keinen Grenzwert besitzt. Tatsachlich gibt es in jeder punktierten Umgebung U{0) von 0 immer Punkte der Form —TTJ-T^— und ,„!"„— mit n € N. In diesen Punkten nimmt — 7r/2+27rn
7r/2+27rn
die Funktion die Werte —1 und 1 an. Aber diese zwei Zahlen konnen nicht beide fiir e < 1 in der e-Umgebung V{A) eines Punktes A € ffi liegen. Daher kann keine Zahl A € M fiir a; —>• 0 der Grenzwert dieser Funktion sein. Beispiel 6. Seien
und i . , = {a..M|a. =
- - l — , n e N } ,
7r/2 + 27rn
dann erhalten wir (vgl. Beispiel 4): lim B_9x->0
sin — = — 1 und X
lim
-B+Bs-S-O
sin — = 1 . X
Es besteht eine enge Verbindung zwischen einem Grenzwert einer Folge, den wir im vorangegangenen Abschnitt untersucht haben, und dem Grenzwert einer beliebigen numerischen Funktion, den wir in diesem Abschnitt einfiihren. Dies bringt der folgende Satz zum Ausdruck.
116
3 Grenzwerte
Satz 1. ^ Die Gleichung
lim f{x) = A gilt genau dann, wenn fiir jede Folge EBx^a
{xn\ von Punkten x„ G E\a, die gegen a konvergiert, die Folge {/(a;„)} gegen A konvergiert. Beweis. Dass ( lim f{x) = A] ^ ( lim /(a;„) = A], folgt sofort aus den Definitionen. 1st namlich
lim f(x) = A, dann existiert fiir jede Umgebung E3x—>-a
V{A) von A eine punktierte Umgebung (jE{a) des Punktes a in E, so dass fiir x e UE{a) gilt: f{x) £ V{A). Wenn die Folge {a;„} von Punkten in _E \ a gegen a konvergiert, dann existiert ein Index N, so dass x„ £ UE{a) fiir n > N und somit ist /(a;„) € V{A). Nach der Definition des Grenzwertes einer Folge konnen wir dann folgern, dass lim f{x„) = A. n—)-oo
Nun woUen wir die Umkehrung beweisen. Sei A niclit der Grenzwert von f{x), wenn E ^ x ^ a. Dann existiert eine Umgebung V{A), so dass fiir jedes n £ N ein Punkt a;„ in der punktierten ^--Umgebung von a in E existiert, so dass f{xn) ^ V{A). Dies bedeutet aber, dass die Folge {/(a;„)} nicht gegen A konvergiert, obwolil {a;„} gegen a konvergiert. D 3.2.2 Eigenschaften des Grenzwertes einer Funktion Wir woUen nun einige Eigenschaften des Grenzwertes einer Funktion ausarbeiten, die standig benutzt werden. Viele davon sind zu den Eigenschaften des Grenzwertes einer Folge, die wir bereits erarbeitet haben, analog und daher im Wesentlichen bekannt. Aufierdem folgen nach dem eben bewiesenen Satz 1 viele Eigenschaften des Grenzwertes einer Funktion direkt und unmittelbar aus den entsprechenden Eigenschaften des Grenzwertes einer Folge: Die Eindeutigkeit des Grenzwertes, die arithmetischen Eigenschaften des Grenzwertes und das Verhalten von Grenzwerten in Ungleichungen. Wir werden diese Beweise nichtsdestotrotz wiederholen. Sie werden erkennen, dass das durchaus Sinn macht. Wir wollen den Leser darauf aufmerksam machen, dass wir nur zwei Eigenschaften punktierter Umgebungen eines Haufungspunktes einer Menge benotigen, um die Eigenschaften des Grenzwertes einer Funktion einzufiihren: Bi) tlEia) i- 0 , d.h., die punktierte Umgebung des Punktes a in _E ist nicht leer; B2) -it' E{a)'itj " E{a) 3 ijE{a) [tE^O) C V ' E{a) n V " ^(a)), d.h., die Schnittmenge zweier punktierter Umgebungen enthalt eine punktierte Umgebung. Diese Beobachtung fiihrt uns zu einem allgemeinen Konzept fiir einen Grenzwert einer Funktion und zu der Moglichkeit, die Theorie von Grenzwerten ® Dieser Satz wird gelegentlich auch Aquivalenzaussage zwischen der Cauchyschen Grenzwertdefinition (mit Umgebungen) und der Heineschen Definition (niit Folgen) bezeichnet. E. Heine (1821-1881) - deutsclier Matliematiker.
3.2 Der Grenzwert einer Punktion
117
zukiinftig nicht nur fiir Funktionen, die auf Zahlenmengen definiert sind, zu benutzen. Um zu verhindern, dass die Diskussion eine reine Wiederholung des in Abschnitt 3.1 Gesagten wird, warden wir einige niitzliche neue Methoden und Konzepte verwenden, die im vorangegangenen Abschnitt nicht bewiesen wurden. a. AUgemeine Eigenschaften des Grenzwertes einer Funktion Wir beginnen mit einigen Definitionen. Definition 4. Wie zuvor nennen wir eine Funktion / : _E —>• M, die nur einen Wert annimmt, konstant. Eine Funktion f : E ^ W wird schliefiUch konstant genannt, wenn sie in einer punktierten Umgebung JJE{OL) konstant ist, wobei a ein Haufungspunkt von E ist. Definition 5. Eine Funktion / : i? —>•ffiist beschrdnkt, von oben beschrdnkt oder von unten beschrdnkt, wenn eine Zahl C £ ffi existiert, so dass \f{x)\ < C, f{x) < C Oder C < f{x) fiir alle x G E. Gilt eine dieser drei Eigenschaften nur in einer punktierten Umgebung UE{OL), dann heiBt die Funktion fiir E B x ^ a schliefiUch beschrdnkt, schliefiUch von oben beschrdnkt oder schliefiUch von unten beschrdnkt. Beispiel 7. Die durch f{x) = (sin - + a;cos -) fiir x ^ 0 definierte Funktion ist in ihrem Definitionsbereich nicht beschrankt. Sie ist jedoch fiir a; —^ 0 schlieBlich beschrankt. Beispiel 8. Dasselbe gilt fiir die Funktion f{x) = x auf M. Satz 2. a) (^f : E ^ M. ist fiir E B x ^ a schliefiUch konstant gleich A) ( &;3
lim
f(x)=A).
lim /(x)
V -BBS—>a
^
{j
• E
^
R ist fiir E
B x
^
a schliefiUch
/
beschrdnkt). c) ( lim \E3x^a
fix)
=AAA( /
lim \E3x^a
f(x)
= A^)
=> {A^ =
A^).
/
Beweis. Die Behauptung a), dass eine schliei31ich konstante Funktion einen Grenzwert besitzt, folgt unmittelbar aus den entsprechenden Definitionen, ebenso wie die Behauptung b), dass eine Funktion, die einen Grenzwert besitzt, schhefilich beschrankt ist. Wir wenden uns nun dem Beweis der Eindeutigkeit des Grenzwertes zu. Sei Ai ^ A2. Wir wahlen Umgebungen V{Ai) und V{A2), die keinen Punkt gemeinsam haben, d.h. V{Ai) n V{A2) = 0 . Nach der Definition eines Grenzwertes gilt: lim f{x)=Ai
^3U'
lim f{x)=A2
^3U"E{CJ)
E3x
EBx^.
E{a) (f{U' E{a)) CV{A^)) [f{U"E{a))
CViA^))
, .
^
118
3 Grenzwerte
Wir betrachten nun eine punktierte Umgebung UE{a) von a (einem Haufungspunkt von E), so dass IJE{a) C (j' E{a) f^U" E{a)- (Wir konnen beispielsweise tjE{a) = U' E{a) f^U " E{a) wahlen, da der Schnitt auch eine punktierte Umgebung ist.) Da UE{OL) 7^ 0 , wahlen wir x £ UE{a)- Somit erhalten wir f{x) £ V{Ai) n V{A2), was unmoglich ist, da die Umgebungen V{Ai) und V{A2) keine gemeinsamen Punkte besitzen. D b. Grenzwerte und arithmetische Operationen Definition 6. Besitzen zwei reellwertige Funktionen / : _B —>• ffi und g : E ^ W einen gemeinsamen Definitionsbereich E, so sind ihre Summe, ihr Produkt und ihr Quotient die durch folgende Formeln definierten Funktionen auf derselben Definitionsmenge: (/ + ff)(a^) : = / ( x ) + 3 ( x ) , {f •g){x)
i>
••= fix)
fix)
'.f\r ^ 9^
-gix)
'
gix)
,
mit gix) ^ 0 fiir x £ E
Satz 3. Seien f : E ^ M. und g : E ^ M. zwei Funktionen mit einem gemeinsamen Definitionsbereich. Gilt hm fix) = A und hm g{x) = B, dann auch: EBx^a
a)
EBx^a
hm {f + g){x)=A
+B ,
EBx^a
b)
hm if-g){x)=A-B E3x^>a
c)
hm
EBx^a
und
f f\ A ( — ) = —, falls B ^ 0 und gix) ^ 0 fiir x £ E. \g /
B
Wie bereits zu Beginn von Absatz 3.2.2 bemerkt, folgt dieser Satz unmittelbar aus den entsprechenden Satzen zu Grenzwerten von Folgen (vgL Satz 1). Wir konnen den Satz auch dadurch erhalten, dass wir den Beweis des Satzes iiber die algebraischen Eigenschaften des Grenzwertes einer Folge wiederholen. Die notwendigen Veranderungen im Beweis beschranken sich auf einen Hinweis auf eine punktierte Umgebung fjE{OL) von a G E,wo wir vorher auf Aussagen, die „ab einem N £ N" gelten, verwiesen haben. Wir empfehlen dem Leser, dies zu iiberpriifen. Hier werden wir den Satz aus seinem einfachsten Spezialfall A = S = 0 erhalten. Natiirlich schliefien wir dabei Behauptung c) von unserer Betrachtung aus. Eine Funktion f : E ^ M. wird fiir E B x ^ a als infinitesimal bezeichnet, fahs lim f{x) = 0. EBx^a
Satz 4. a) Seien a : E ^ W und P : E ^ W infinitesimale Funktionen fur E B X ^ a. Dann ist ihre Summe cc + /? : -E —>•ffifiir E B x ^ a ebenfalls infinitesimal.
3.2 Der Grenzwert einer Punktion
119
b) Seien cc : _E —>•ffiund (3 : i? —>•ffiinfinitesimale Funktionen fiir E B x ^ a. Dann ist ihr Produkt a • P : E ^ M. fiir E B x ^ a ebenfalls infinitesimal. c) Sei a : E ^ W infinitesimal fiir E B x ^ a und P : E ^ M. schliefilich beschrdnkt fiir E B x ^ a. Dann ist ihr Produkt a • P : E ^ M. fiir E B X ^ a infinitesimal. Beweis. a) Wir werden zeigen, dass {
lim a{x) = o) A f lim /3(x) = o) ^ f lim (a + P){x) = o) .
\EBx^a
I
\E3x^a
I
\ E3x^a
I
Sei e > 0 gegeben. Nach der Definition des Grenzwertes gilt: f
lim a(x) = 0 ) ^
f3;7'is(a) V x e ;7'is(a) (|a(a;)| < I ) ) ,
f
lim p[x) = O) ^
{^U"E[a) Va; £ U"E{a) {\P{x)\ < | ) ) .
\E^x—^a
/
\
I J
Dann erhalten wir fiir die punktierte Umgebung ijE{P) tj" E{a):
C ?7's(a) fl
Va; e tjE{a) |(a + ^)(a;)| = |a(x) ^ P{x)\ < \a{x)\ + |/3(x)| < e , d.li., wir haben gezeigt, dass
lim (a + P){x) = 0.
b) Die Beliauptung ist ein Spezialfall von Behauptung c), da jede Funktion, die einen Grenzwert besitzt, schliefilich beschrankt ist. c) Wir werden zeigen, dass (
lim a{x)=0]
A(3M
eM.3ifE{a)\/xeUE{a)
{\P{x)\ <M))
^
=^ ( lim a(x)B(x) = 0) . Sei e > 0 gegeben. Nach der Definition des Grenzwertes gilt (^lim
a{x) = 0 ) ^ (BU ' E{a) yxGU'
E{a) {\a{x)\ < ^ ) ) .
Dann erhalten wir fiir die punktierte Umgebung U " E{a) C C/' £;(a) fl JJE{OL)'V x e U"E{a) \{a-P){x)\
= \a{x)P{x)\ = \a{x)\\P{x)\ <^-M
Somit haben wir bewiesen, dass
=e.
lim a{x)P{x) = 0 .
Die folgende Anmerkung ist sehr niitzlich: Anmerkung 1. (
lim f{x) = A\ <^ (f{x) = A + a{x) A lim a(x) = oV
D
120
3 Grenzwerte
Anders formuliert, so strebt die Funktion / : _E —>• K genau dann gegen A, wenn sie als Summe A + a{x) formuliert werden kann, wobei a{x) fiir E B X ^ a infinitesimal ist. (Die Funktion a{x) ist die Abweichung von f{x)
von A.y^ Diese Anmerkung folgt unmittelbar aus der Definition des Grenzwertes, nach der gilt: lim
fix)
=A^
EBx^a
lim
(f{x)
- A) = 0 .
EBx^a
Basierend auf dieser Anmerkung und den Eigenschaften infinitesimaler Funktionen woUen wir nun den Beweis fiir den aufgestellten Satz zu den arithmetischen Eigenschaften des Grenzwertes einer Funktion liefern. Beweis.
a) Seien
lim
/(a;)=A und
EBx^ta
lim
(7(a;)=i3, dann i s t / ( a ; ) = A + a(a;)
EBx^a
und g{x) = B + P{x), wobei a{x) und P{x) fiir E B x ^ a infinitesimal sind. Dann ist ( / + g){x) = f{x) + g{x) = A + a{x) +B + (]{x) = {A + B)+ 7(3;). Dabei ist 7(2;) = a{x) + fi{x) die Summe zweier infinitesimaler Funktionen und somit selbst fiir E B x ^ a infinitesimal. Somit gilt lim {f + g){x) = A + B. EBx^ta
b) Wiederum seien f{x) und g{x) in der Form f{x) g{x) = B + P{x) gegeben. Wir erhalten: ( / • 9){x) = f{x)g{x)
= (A + a{x)) {B + p{x))
= A + a{x)
=A-B+
und
^{x) ,
wobei 7(2;) = Ap{x) + Ba{x) + a{x)fi{x) fiir E B x ^ a infinitesimal ist, was aus den eben bewiesenen Eigenschaften derartiger Funktionen folgt. Somit gilt lim {f • g){x) = A • B. EBx^ta
c) Wir gehen wiederum von f{x) = A + a{x) und ^(a;) = B + P{x) aus, mit lim a{x) = 0 und lim fi{x) = 0. E3x^a
E3x^a
Da S ^ 0, existiert eine punktierte Umgebung UE{a), fiir die in jedem P u n k t \P(x)\ < ^ gilt und daher \g(x)\ = \B + P(x)\ > \B\ - \P(x)\ > ^ . Dann gilt in (jEia) ebenso, dass ,}., < |-|T, d.h., die Funktion -J-T ist schlieBlich beschrankt fiir E B x ^ a. Somit konnen wir schreiben: f\( \ ^ _ /(a;) A_A + a{x) A_ ^gJ ' B g{x) B B + P{x) B
{>
g(x) 10
B
Hier eine merkwiirdige Einzelheit. Diese sehr ofFensiclitliche Darstellung, die nichtsdestotrotz fiir Berechnungen selir niitzlicli ist, wurde durch den franzosischen Mathematiker und Facliniann der Meclianik Lazare Carnot (1753-1823), einem Revolutionsgeneral und Akademiker, besonders hervorgehoben. Er war der Vater von Sadi Carnot (1796-1832), dem Begriinder der Thermodynamik.
3.2 Der Grenzwert einer Punktion
121
Aufgrund der Eigenschaften infinitesimaler Funktionen (unter Beriicksichtigung, dass -j-v schliefilich beschrankt ist) ergibt sich, dass die Funktion 7(2;) fiir E ^ x ^ a infinitesimal ist. Somit haben wir bewiesen, dass lim ( i ) ( x ) = 4 . D c. Grenzwerte und Ungleichungen Satz 5. a) Gilt fiir die Funktionen f : E ^ W und g : E ^ W, dass lim f{x) = A, lim g{x) = B und A < B, dann existiert eine E3x^>a
E3x^>a
punktierte Umgebung UE{a) von a in E und in jedem ihrer Punkte gilt
fix)
lim h{x) = C, dann existiert der Grenzwert von g{x) fiir E ^ x ^ a EBx^a
mit
lim g{x) = C. E3x^a
Beweis. a) Wir walilen eine Zalil C so, dass A < C < B. Nach der Definition des Grenzwertes gibt es punktierte Umgebungen (j' E{OL) und U " E{OL) von a in E, so dass \f{x) - A\ < C - A fiir a; e U' E{a) und \g{x) - B\ < B - C ini X € U " E{a)- Dann gilt in jedem Punkt einer punktierten Umgebung JJE{OL), die in (j " E{a) n U " E{a) enthalten ist: fix) < A+ [C - A) = C = B - {B - C) < g{x) . b) Sei
lim f{x) = EBx^ta
lim h{x) = C. Dann existieren fiir jedes feste e > 0 EBx^ta
punktierte Umgebungen JJ' E{a) und U " E{a) von a in E, so dass C—e < f{x) fiir X £ U' E{a) und h{x) < C + e fiir x G U " E{OL)- Dann gilt in jedem Punkt einer punktierten Umgebung UE{a), die in [ / ' ^ ( a ) n U " E{OL) enthalten ist, dass C — e < f{x) < g{x) < h{x) < C + e, d.h., \g{x) — C\ < e und folglich lim g{x) =C. U EBx^ta
KoroUar. Angenommen,
lim f{x) = A und EBx^a
eine punktierte a) Gilt f{x) b) Gilt f{x) c) Gilt f{x) d) Gilt f{x)
lim g{x) = B. Sei UE{a) EBx^a
Umgebung von a in E. > g{x) fiir alle x G UE{(I), dann A > g{x) fiir alle x £ UE{OL), dann A > B fiir alle x G UE{a), dann A> > B fiir alle x £ UE{a), dann A>
>B; >B; B; B .
Beweis. Mit einem Widerspruchsbeweis erhalten wir unmittelbar die Behauptungen a) und b) des KoroUars zu Satz 5a). Die Behauptungen c) und d) folgen aus a) und b), wenn wir ^(a;) = B setzen. D
122
3 Grenzwerte
d. Z w e i w i c h t i g e B e i s p i e l e Bevor wir weiter in die Theorie des Grenzwertes einer Funktion eintauchen, wollen wir den Gebrauch des eben bewiesenen Satzes mit zwei wichtigen Beispielen veranschaulichen.
lim x->0
smx
= 1
X
Wir greifen auf die Definition von sin a; aus der Schule zuriick, d.h., sin a; ist die Ordinate des Punktes, an dem sich der P u n k t (1, 0) nach einer Drehung um X Radianten um den Ursprung befindet. Die Vollstandigkeit einer derartigen Definition hangt alleine von der Sorgfalt ab, mit der die Verbindung zwischen Drehungen und reellen Zahlen eingefiihrt wird. Da das System der reellen Zahlen an sich nicht mit geniigend Einzelheiten in der hoheren Schule bearbeitet wurde, kann m a n auf den Gedanken kommen, dass eine genauere Definition von sin a; (und dies gilt auch fiir cosx) notwendig ist. Wir werden dies zu gegebener Zeit t u n und dann rechtfertigen, dass wir fiir den Moment auf die Intuition des Lesers vertrauen. a) Wir werden zeigen, dass 2 sin a; -,„..„ , , TT cos^ X < < 1 fur 0 < |a;| < - . Beweis. Da cos^ x und ^ ^ ^ gerade Funktionen sind, geniigt es, den FaU 0 < X < TT/2 ZU betrachten. Nach Abb. 3.1 und der Definition von cos a; und sin a; erhalten wir nach Vergleich der Flachen des Sektors
.\AB\
=
yl-X=]^X.
Wenn wir diese Ungleichungen durch -^x teilen, kommen wir zu dem Ergebnis, dass die B e h a u p t u n g zutrifft. D
Abb. 3.1.
3.2 Der Grenzwert einer Punktion
123
b) Aus a) folgt, dass I sina;| < \x\ fiir jedes a; £ M, wobei die Gleichheit nur in a; = 0 gilt. Beweis. Fiir 0 < |a;| < 7r/2 gilt, wie in a) gezeigt, dass I sinxl < |a;| . Aber |sina;| < 1, so dass diese letztere Ungleicliung aucli fiir |a;| > 7r/2 > 1 gilt. Nur fiir a; = 0 erhalten wir sin a; = a; = 0. D c) Aus b) folgt, dass lim sin a; = 0 x->0
Beweis. Da 0 < Isina;! < \x\ und lim \x\ = 0, ergibt sich aus Satz 5 in X—>0
„Grenzwerte und Ungleichungen", dass lim I sinxl = 0, so dass lim sin a; = 0. X—>0
s—>0
D
d) Wir werden nun beweisen, dass lim 2iSJ£ = x_ x->0
*
Beweis. Fiir \x\ < TT/2 erhalten wir aus der Ungleichung in a), dass . 2 sma; 1 — sm X < < 1 X
Aber lim(l — sin x) = 1 — lim sin a; • lim sin a; = 1 — 0 = 1, so dass wir aus Satz 5 im Paragraplien „Grenzwerte und Ungleichungen" folgern, dass lim siiiii = 1. D s-s-O
=^
Beispiel 10. Definition der Exponential-, der Logarithmus- und der Potenzfunktionen mit Hilfe von Grenzwerten. Wir wollen nun veranschaulichen, wie die Definitionen aus der hoheren Schule fiir die Exponential- und Logarithmusfunktionen mit Hilfe der Theorie der reellen Zahlen und der der Grenzwerte vervollstandigt werden kann. Aus Griinden der Bequemlichkeit bei Verweisen und der Vollstandigkeit halber beginnen wir am Anfang. a) Die Exponentialfunktion. Sei a > 1. 1*^. Fiir n € N definieren wir induktiv: a^ := a, a""*"^ := a" • a. Auf diese Weise erhalten wir eine auf N definierte Funktion a", die, wie aus der Definition ersichthch ist, die Eigenschaft m
a" ~ fiir m.n G'N und m > n besitzt.
m —n
124
3 Grenzwerte 2^. Die Eigenschaft fiihrt zur natiirlichen Definition a° := 1 ,
a"" := — fiir n £ N , a" mit der die Funktion a" auf die Menge Z aller ganzen Zahlen erweitert wird. Es gilt also fiir alle m,n € Z. 3°. Bei der Theorie der reellen Zahlen haben wir beobachtet, dass fiir a > 0 und n £ N eine eindeutige n-te Wurzel von a existiert, d.li. eine Zahl a; > 0, so dass a;" = a. Fiir diese Zahl verwenden wir die Schreibweise a^/". Folgendes ist zweckmafiig, da es uns ermoglicht, das Gesetz zur Addition von Exponenten zu erlautern:
Aus diesem Grund ist es natiirlich, fiir n £ N und m £ Z einzufiihren: a™/» := (ai/")™ und a " ! / " := {cj}/'^)-^. Falls sich herausstellt, dass ^(mk)/{nk) _ g^m/n f^j. ^ g ^^ konnen wir in Betracht ziehen, a** fiir r £ Q definiert zu haben. 4*^. Fiir Zahlen 0 < x und 0 < y zeigen wir durch Induktion, dass fiir n £ N {x
{x" < y")
gilt, so dass insbesondere (x = y)^ (x" = 2/") . 5*^. Dies ermoglicht uns eine Priifung der Regeln fiir den Umgang mit rationalen Exponenten, insbesondere, dass ^(mfc)/(nfc) ^ ^m/n fUj. fc £ Z
und mi/m
_ m2/n2 _ „mi/ni+m2/n2
Beweis. TatsachUch gilt a(™*)/("*^) > 0 und a™/" > 0. Da , nk
mk
= (^^l/(nk}^^^^^'^^ = n^i/(nk)y^^\'^''
= mk a
und m/n\nk / l/n\n\"^^ l^^m/nyk ^ /((^l/")")
mk
a folgt, dass die erste der Ungleichungen, die in Verbindung mit Punkt 4° gepriift werden musste, nun bewiesen ist.
3.2 Der Grenzwert einer Punktion
125
Da /• m i / m
m2/n2'\"i"2 _ / m i / n i \ " i " 2 ^ /- m 2 / n 2 \ " i " 2
_ min2+m2ni
und [a
» « i / n i + » « 2 / n ,2\\n"1i "n22
-)
^/ ( m i n 2 + m 2 n i ) / ( n i n 2 ) ' \ " i " 2
= (a
,
min2+m2ni min2+m2ni
wird auf ahnliche Weise die zweite Gleichung bewiesen.
D
Somit haben wir a** fiir r £ Q und a'" > 0 definiert und wissen, dass fiir jedes r i , r 2 G Q gilt:
6°. Aus 4° folgt, dass fiir r i , r 2 £ Q gilt: ( n < ra) ^ (a'^i < a''^) . Beweis. Da (1 < a) <^ (1 < a^/") fiir n G N, was unmittelbar aus 4° folgt, erhalten wir (a^/")™ = a™/" > 1 fiir n , m € N, wie wiederum aus 4° folgt. Somit gilt fiir 1 < a und r > 0, r £ Q, dass a'" > 1. Dann erhalten wir fiir ri < r2 mit 5*^: ^r2 ^ ^ r i . ^ r 2 - r i y a''
• I = a''' .
U
70. Wir werden zeigen, dass fiir ro G Q gilt: lim
a'' = a''" .
Q9r->ro
Beweis. Wir beweisen, dass a^ ^ 1 fiir Q 3 p ^ 0. Dies folgt aus der Tatsaclie, dass fiir \p\ < - nacli 6° gilt: a - i / "
126
3 Grenzwerte Zu gegebenem e > 0 wahlen wir 6 so, dass 1 - ea-''°
fiir \p\ < 6. Damit erhalten wir fiir |r — ro| < ^• a''" {1 - ea-''°) < a' = a'''> •a'-''" < a''°(l + ea"''°) und somit a"'" - e < (/ < a"'" + e .
U
Somit haben wir eine Funktion a** auf Q mit den folgenden Eigenschaften definiert: a} = a> 1 ] a'-^ • a'^ = a''+'-^ ; a^'^ < al"^ fiir ri < r2 ; a''^ -^ a'"^ fiir Q 9 ri -?• r2 • Im Folgenden wollen wir diese Funktion auf die gesamte reelle Gerade erweitern. 8°. Seiena; £ ffi, s =
sup a** und i = Q9r
inf
a**. Offensichtlich sind s,i £ ffi,
Q9r>a:
da wir fiir r\ < x
a''^
fiir n < X < r2. Somit ist 0 < i - s < a""^ - a""^ = a'^{ar^-''^ - 1) < s{aJ"^~^^ — 1). Aber a^ ^ 1 fiir Q 9 p —>• 0, so dass fiir jedes e > 0 ein (5 > 0 existiert, so dass aJ"^~'^^ — 1 < e/s fiir 0 < r2 — ^i < <5. Somit ergibt sicli, dass 0 < « — s < e und da e > 0 beliebig ist, folgern wir, dass i = s. D Nun definieren wir a* := s = i. gO. Wir wollen zeigen, dass a* =
lim al". Q9r->a:
Beweis. Unter Beriicksichtigung von 8° wahlen wir fiir e > 0 ein r' < a;, so dass s — e < a^ < s = a^ und ein r", so dass a'^' = i < a^ < « + e. Da aus r' < r < r" folgt, dass a** < a^ < a^ , erhalten wir fiir alle r £ Q im offenen Intervall ]r',r"[: a-" - e < a"" < a^ + e.
D
3.2 Der Grenzwert einer Punktion
127
Wir woUen nun die Eigenschaften der so definierten Funktion a^ in M untersuchen. 10°. Fiir a;i,a;2 e M und a > 1 gilt: (xi < X2) => (a^^^ < a^^). Beweis. Im ofFenen Intervall ]xi,X2[ existieren zwei rationale Zahlen ri < r2Fiir xi < ri < r2 < x^ ergibt sich nach der Definition von a* in 8*^ und den Eigenschaften der Funktion a^ auf Q:
11°. Fiir jedes a;i,X2 € M gift a^^ • a^^ = a*i+^^. Beweis. Mit den uns bekannten Abschatzungen fiir den absoluten Fehler bei der Produktbildung und nach Eigenschaft 9° konnen wir behaupten, dass fiir jedes e > 0 ein 6' > Q existiert, so dass a=^i • a=^^ - I < a'-' • a'^ < a''' • a"^' + | , faUs \xi — ri\ < 6' und \x2 — r2\ < S'. Wir konnen gegebenenfalls 6' kleiner machen und 6 < 6' wahlen, so dass ^ r i + r 2 _ £ < ^xr+X2 < ^ n + r ^ _^ £
fiir |xi — r i | < (5 und \x2 — r2\ < S, d.h., \{xi + X2) — {ri + r2)\ < 2(5. Aber a^^ • a^^ = a^^~^^^ fiir ri,r2 € Q, so dass aus diesen Ungleichungen folgt, dass Da e > 0 behebig ist, gelangen wir schlieBhch zu D
12°. lim a^ = a^°. (Wir erinnern daran, dass „x —>• XQ" eine Abkiirzung ist fiir „M 3 X ^ a;o"). Beweis. Zunachst beweisen wir, dass lim a^ = 1. Zu vorgegebenem e > 0 finden wir ein n € N, so dass 1 - e < a-^/" < a^/" < 1 + e . Dann ergibt sich nach 10° fiir \x\ < 1/n: 1 - e < a - i / " < 0=^ < a^/" < 1 + e , d.h., wir haben nachgewiesen, dass lim a* = 1. X—>0
Wenn wir nun (5 > 0 so wahlen, dass |a^~^° ~ 1| < ea~*° fiir |a; — a;o| < 6, dann ergibt sich a^"" - e < a=" = 0="° (0=""="° - 1) < 0="° + e , womit gezeigt ist, dass hm a* = a*°. X^Xo
D
128
3 Grenzwerte
13*^. Wir werden zeigen, dass der Wertebereich der Funktion a; i->- a* der Menge IR__| positiver reeller Zahlen entspricht. Beweis. Sei yo G 1$+• 1st a > 1, dann wissen wir, dass ein n € N existiert, so dass a~" < yo < a". Aufgrund dieser Tatsache sind die beiden Mengen A = {x£M.\a''
< yo} und B = {x eM.\yo < a''}
nicht leer. Da aber (xi < X2) <=> (a^^ < a^^) (fiir a > 1) fiir alle Zahlen a;i,a;2 £ K, folgt aus xi G A und X2 G B, dass xi < X2- Daraus ergibt sicli, dass das VoUstandigkeitsaxiom auf die Mengen A und B anwendbar ist, woraus folgt, dass ein XQ existiert, so dass xi < a;o < X2 fiir alle xi G A und X2 £ B. Wir werden zeigen, dass a^° = yoWare a*° kleiner als yo, dann gabe es eine Zahl n G N, so dass ^xo+i/n < yg^ da a^^o+^Z" -^ a''" fiir n ^> 00. Dann batten wir [XQ + ^) & A, wobei der Punkt XQ die Mengen A und B trennt. Somit ist die Annahme, dass a*° < yo unhaltbar. Ganz ahnlich konnen wir nachweisen, dass auch die Ungleichung a*° > yo unnioglich ist. Aus den Eigenschaften der reellen Zahlen folgern wir daraus, dass a*° = yo. D 14°. Bisher sind wir davon ausgegangen, dass a > 1. Aber alle Konstruktionen waren fiir 0 < a < 1 wiederholbar. Unter diesen Umstanden ist 0 < a'" < 1 fiir r > 0, so dass wir nun in 6° und 10° finden, dass (xi < X2) =^ (a*^ > a^^) fiir 0 < a < 1. Somit haben wir fiir a > 0, a ^ 1 eine reellwertige Funktion x ^ a^ auf der Menge M der reellen Zahlen konstruiert, die die folgenden Eigenschaften besitzt: 1. a^ = a, 3. a^ -^ a*° fiir x ^ xo, 4. (a^i < a^2) <^ (2;^ < 2-2) fiir a > 1 und (a^^ > a*^) <^ {xi < X2) fiir 0 < a < 1, 5. Der Wertebereich der Abbildung x i->- a* ist M-i- = {y € M| 0 < y}, die Menge der positiven Zahlen. Definition 7. Die Abbildung x ^ a"^ wird Exponentialfunktion genannt.
zur Basis a
Auf die Abbildung x i->- e*, das entspricht dem Fall a = e, werden wir besonders haufig treffen. Sie wird oft als expx bezeichnet. In diesem Zusamnienhang schreiben wir fiir die Abbildung x i->- a* nianchnial auch b) Der Logarithmus. Die Eigenschaften der Exponentialfunktion zeigen, dass exp„ : M ^ ffi+ eine bijektive Abbildung ist. Somit besitzt sie eine Inverse.
3.2 Der Grenzwert einer Punktion D e f i n i t i o n 8. Die zu exp^j : M -^ ffi+ inverse Abbildung wird zur Basis a (0 < a, a ^ 1) genannt und wie folgt geschrieben:
129
Logarithmus
log„ : ffi+ ^ M . D e f i n i t i o n 9. 1st die Basis a = e, so wird der Logarithmus natiirlicher rithmus genannt und In : ffi+ -^ M. geschrieben.
Loga-
Bei einer anderen Annaherung an den Logarithmus, die in vieler Hinsicht natiirhcher und durchschaubarer ist, wird der Grund fiir diese Namensgebung verstandhch. Wir werden diesen Weg nach der Konstruktion der Grundlagen der Differential- und Integralrechnung erlautern. Nach der Definition des Logarithmus als die zur Exponentialfunktion inverse Funktion erhalten wir: V x e K (logJa=") =x) , Vy e ffi+ (a'°S" y = y) . Aus dieser Definition und den Eigenschaften der Exponentialfunktion folgt insbesondere, dass der Logarithmus in seinem Definitionsbereich ]R_|_ die folgenden Eigenschaften besitzt: 1') 2') 3') 4')
l o g a a = 1, loga(2/i • 2/2) = log„ yi + log„ 2/2, loga y -^ log„ 2/0 fiir ffi+ 9 2/ ^ 2/o £ « + , (log„2/i < loga2/2) <^ (2/1 < 2/2) fiir a > 1 und (log„ 2/1 > loga2/2) <^ (2/1 < 2/2) fiir 0 < a < 1, 5') der Wertebereich der Funktion log^ : IR_|_ —>•ffiist die Menge ffi aller reellen Zahlen.
Beweis. Wir erhalten 1') aus Eigenschaft 1) der Exponentialfunktion und der Definition des Logarithmus. Wir erhalten Eigenschaft 2') aus Eigenschaft 2) der Exponentialfunktion. Denn fiir xi = log^ 2/1 und X2 = log„ 2/2 ist 2/1 = o^^ und 2/2 = a*^ und somit gilt mit 2), dass 2/1 • 2/2 = a*^ • a*^ = a^^"*"*^, woraus folgt, dass log„(2/i • 2/2) = a;i -I- a;2. Aus Eigenschaft 4) der Exponentialfunktion folgt ahnlich die Eigenschaft 4') des Logarithmus. Offensichtlich gilt: 5) ^ 5'). Es verbleibt der Beweis von Eigenschaft 3'). Mit Eigenschaft 2') des Logarithmus ergibt sich log„ y - log„ 2/0 = log„
(^)
und daher sind die Ungleichungen - e < log„ 2/ - loga 2/0 < e
130
3 Grenzwerte
zur Relation log„(a-") = - e < log„ ( ^ ) < e = log„(a^) aquivalent. Diese ist nach Eigenschaft 4') des Logarithmus aquivalent zu -a^ < — < a" fiir a > 1 , 2/0 a^ < — < a~^ fiir 0 < a < 1 . 2/0 In jedem Fall ergibt sich aus yoa~'^ < y < yoo^ falls a > 1 oder 2/0^^ < y < yoa ^ falls 0 < a < 1 , dass -e < log„ 2/ - log„ yo<e . Somit haben wir bewiesen, dass V. J^j^ ^« ^°s« y = ^°s« 2/0 •
•
Abb. 3.2 zeigt die Graplien der Funktionen e*, 10*, Ina; und logj^Q x =: logx. In Abb. 3.3 sind die Graplien von ( i ) , 0,1*, logj^/gX und loggia; wiedergegeben.
logio X
Abb. 3.2.
3.2 Der Grenzwert einer Punktion
131
(1/e)
logo 1 3:
A b b . 3.3. Wir woUen nun eine Eigenschaft des Logarithmus, die wir haufig benutzen werden, ausfiihrlicher untersuchen. Wir werden zeigen, dass die Gleichung 6')
log„(6")=alog„&
fiir jedes & > 0 und jedes cc € M gilt. Beweis. 1°. Die Gleichung gilt fiir cc = n £ N, da sich mit Eigenschaft 2') des Logarithmus und Induktion ergibt, dass log|j(2/i • • • 2/„) = log^ 2/i + - • "+loga t/n, so dass loga(&") = loga b + --- + log„ b = n log„ b . 2°- log„(&"^) = - log„ b, da fiir /3 = log„ b gilt: b = a^,
b-'^ =a-^
nnd \og^{b-^)
= -(] .
3°. Aus 1° und 2° konnen wir folgern, dass die Gleichung log„(6") a log„ b fiir a £ Z gilt. 4°. log„(&V») = i log^ 6 fiir n e Z . Tatsachlich ist
=
l o g > = log„ (&!/")" = n l o g „ ( & V » ) . 5*^. Nun konnen wir nachweisen, dass die Behauptung fiir jede rationale Zahl a = fGQ gilt. In der Tat ist m log„ b = m l o g „ (&!/") = log„ ( 6 1 / " ) " = log„ (&™/») n
132
3 Grenzwerte
6°. Gilt aber die Gleichung log^ b^ = r log^ b fiir alle r € Q, dann erhalten wir mit Eigenschaft 3) der Exponentialfunktion und 3') des Logarithmus, wenn wir r in Q gegen a streben lassen, dass fiir r geniigend nahe bei a auch b^ nahe bei b" ist, ebenso wie log^ b^ nahe bei log„ b" ist. Dies bedeutet, dass lim log„ b' = log„ 6" . Q9)—ya
Aber log^ b^ = r log^ b und daher gilt: loga b" =
hm log„ b'' = Q9)—ha
hm r log„ b = a log„ 6 .
D
Q9)—ya
Aus der eben bewiesen Eigenschaft des Logarithmus konnen wir folgern, dass die folgende Gleichung fiir aUe a, /3 £ ffi und a > 0 gilt:
7') {a"f = a"^. Beweis. Fiir a = 1 gilt 1" = 1 per definitionem fiir alle a £ ffi. Somit ist fiir den Fall die Gleichung trivial. Ist a ^ 1, dann gilt nach dem eben Bewiesenen, dass logjia^f)
= /?log„(a") = p -alog, a = p-a = \og,{a"^) ,
was nach Eigenschaft 4') des Logarithmus zur Gleichung aquivalent ist.
D
c) Die Potenzfunktion Wenn wir 1" = 1 annehmen, dann haben wir fiir alle X > 0 und a £ ffi die Gr6i3e x" (sprich: „x hoch a") definiert. Definition 10. Die auf der Menge IR__| der positiven Zahlen definierte Funktion a; !->• x" wird Potenzfunktion genannt und die Zahl a wird dabei als Exponent bezeichnet. Eine Potenzfunktion ist offensichtlich eine Verkettung einer Exponentialfunktion mit dem Logarithmus; genauer: J," — Qlog„(x°) _
^alog^x
Abb. 3.4 zeigt die Graphen der Funktion y = x" fiir verschiedene Exponenten. 3.2.3 Die allgemeine Definition des Grenzwertes einer Funktion (Grenzwert auf einer Basis) Beim Beweis der Eigenschaften des Grenzwertes einer Funktion haben wir bestatigt, dass die einzigen Erfordernisse, die an die punktierten Umgebungen gestellt werden, auf der unsere Funktionen definiert waren und die im Verlauf der Beweise auftraten, die Eigenschaften Bi) und B2) waren, die in der Einleitung des vorangegangenen Absatzes erwahnt wurden. Dies rechtfertigt die Definition des folgenden mathematischen Objekts.
3.2 Der Grenzwert einer Punktion
133
Abb. 3.4. a. Basen: Definition und elementare Eigenschaften Definition 11. Eine Menge B von Teilmengen B C X einer Menge X wird Basis in X genannt, wenn die folgenden Bedingungen erfiillt sind: Bi) VBGB
{B^
0),
B2) VSi e B yB2 G B 3B e B (B c Bi n B2). Anders formuliert, so sind die Elemente des Mengensystems B nicht leere Teilmengen von X und der Schnitt je zweier Elemente entlialt immer ein Element desselben Mengensystems. Wir fiihren nun einige der in der Analysis niitzliclieren Basen an. Fiir E = E+ = {x GM.\X > a} (bzw. E = E' = {x GM.\X < a}) schreiben wir a; —>• a + 0 (bzw. x ^ a — 0) anstelle von x ^ a, x G E und wir sagen, dass X von rechts gegen a strebt (bzw. x strebt von links gegen a). 1st a = 0, schreibt man iibliclierweise a; —>• +0 (bzw. x —>• —0) anstelle von a; —>• 0 + 0 (bzw. X ^0-0). Die Schreibweise E ^ x ^ a + 0 (bzw. E B x ^ a — 0) wird anstelle von X ^ a, X G E Ci E^ (bzw. x ^ a, x G E Ci E~) eingesetzt. Es bedeutet, dass X \n E gegen a strebt, wobei es groBer (bzw. kleiner) als a bleibt. Fiir E = E^ = {xG^c<x}
(bzw. E = E:;^ = {x G^x
< c})
schreiben wir x -^ +00 (bzw. x —>• —00) anstelle von x ^ GO, x G E und sagen, dass x gegen positiv Unendlich strebt (bzw. x gegen negativ Unendlich strebt). Die Schreibweise E B x ^ +00 (bzw. E B x ^ —00) ersetzt a; ^ 00, X G EnE+, (bzw. X ^ 00, X G En E;^). 1st E = N, schreiben wir (wenn keine Unklarheiten auftreten konnen), wie in der Theorie der Grenzwerte von Folgen iiblich, n —^ 00 anstelle von a; —>• 00, a; € N.
134
3 Grenzwerte Schreibweise fiir die Basis
Sprich
Mengen (Eleniente) der Basis
Definition u n d Schreibweise von E l e m e n t e n
X —> a
X strebt gegen a
Punktierte Umgebungen a G R
U{a):={x G R|a-<5i< <x 0, S2 > 0
X —> OO
X strebt gegen Unendlich
Umgebungen von Unendlich
a, X £ E oder S 9 X —>• a oder X —> a
X strebt gegen a in E
Punktierte Umgebungen* von a in _B
X —>• oo, X G E oder E B X ^ oo oder X —> oo
X strebt gegen Unendlich in E
Umgebungen** von Unendlich in E
X^
[/(oo) : =
= {x GR|(5< |a;|}, m i t <5 G R ife(o) •.=
UE (oo) :=
Enu{a)
EnU{oo)
Mit der Annahme, dass a ein Haufungspunkt von E ist. * Mit der Annahme, dass E nicht beschrankt ist.
Wir merken an, dass alle angefiihrten Basen die Eigenschaft besitzen, dass der Schnitt zweier Elemente der Basis selbst wieder ein Element der Basis ist und nicht einfach nur eine Menge, die ein Element der Basis enthalt. Wir werden bei der Untersuchung von Funktionen auf andere Basen treffen, die auf anderen Mengen als der reellen Geraden^^ definiert sind. Wir halten aucli fest, dass der hier benutzte Ausdruck „Basis" eine Abkiirzung fiir etwas ist, das eigentlich „Filterbasis" genannt wird. Der Grenzwert auf einer Basis, den wir unten einfiihren, ist, soweit es die Analysis betrifft, der wiclitigste Teil des Konzepts eines Grenzwertes auf einem Filter^^, wie er von dem modernen franzosisclien Mathematiker H. C a r t a n begriindet wurde. b. D e r Grenzwert einer Funktion auf einer Basis D e f i n i t i o n 1 2 . Sei / : AT —>•ffieine Funktion, die auf einer Menge X definiert ist und B eine Basis in X. Eine Zalil A £ ffi wird Grenzwert der Funktion f ^^ Beispielsweise bildet die Menge der offenen Kreisscheiben (die nicht ihren Kreisrand enthalten), die einen vorgegebenen Punkt der Ebene enthalten, eine Basis. Der Schnitt zweier Elemente der Basis ist nicht immer eine Kreisscheibe, enthalt aber immer eine Kreisscheibe des Mengensystems. ^'^ Fiir weitere Details, vgl. N. Bourbaki: General topology, Addison-Wesley, 1966.
3.2 Der Grenzwert einer Punktion
135
auf der Basis B genannt, wenn fiir jede Umgebung V{A) von A ein Element B £ B existiert, dessen Bild f{B) in V{A) enthalten ist. 1st A der Grenzwert von / : X —>• K auf der Basis B, schreiben wir lim f(x) = A . Wir wiederholen nun die Definition des Grenzwertes auf einer Basis in logischen Symbolen: ;iim/(a;) = A) := Vy(A) 3B G B {f{B) C ViA)) . Da wir gegenwartig numerische Funktionen betrachten, kann es hilfreich sein, die folgende Form dieser wichtigen Definition im Hinterkopf zu behalten: (lim/(a;) = A) :=\/e > 0 3B G B \/x G B {\f{x)-A\
< e) .
In dieser Form verwenden wir eine (im Hinblick auf A symmetrische) eUmgebung anstelle einer beliebigen Umgebung V{A). Die Aquivalenz dieser Definitionen fiir reellwertige Funktionen folgt aus der bereits oben erwahnten Tatsache, dass jede Umgebung eines Punktes eine symmetrische Umgebung dieses Punktes enthalt. (Fiihren Sie diesen Beweis vollstandig aus.) Wir haben nun die allgemeine Definition des Grenzwertes einer Funktion auf einer Basis vorgestellt. Oben betrachteten wir Beispiele der in der Analysis gebrauchlichsten Basen. Fiir ein bestimmtes Problem, in der die eine oder andere dieser Basen vorkommt, miissen wir die allgemeine Definition in die fiir diese Basis bestimmte Form iibersetzen. Somit also: ( lim f(x) = A) := Ve > 0 3(5 > 0 Va; G]a - 6, a[ (\f(x) - A\ < e) , s—>a—0
( lim fix) = A) := Ve > 0 3(5 e K Vx < (5 (|/(a;) - A\ < e) . s—> —oo
Bei unserer Untersuchung von Beispielen fiir Basen haben wir insbesondere das Konzept einer Umgebung von Unendlich eingefiihrt. Wenn wir dieses Konzept einsetzen, dann ist es sinnvoU, in Ubereinstimmung mit der allgemeinen Definition eines Grenzwertes, die folgenden Vereinbarungen zu iibernehmen: (lim fix) = oo) := VF (oo) 3B G B (/(S) C V (oo)) oder, was dasselbe ist: (lim/(a;) = oo) := Ve > 0 3 S e B Vx e S (e < |/(a;)|) , (lim/(a;) = +oo) := Ve £ M 3 S £ B Va; £ S (e < fix)) , (lim/(a;) = -oo) := Ve GR3B
G B ^x G B (/(x) < e) .
136
3 Grenzwerte
Der Buchstabe e steht iiblicherweise fiir eine kleine Zahl. Dies trifft in den eben vorgestellten Definitionen natiirlich nicht zu. In Ubereinstinimung mit den iiblichen Vereinbarungen konnten wir beispielsweise schreiben: ( lim fix) = -oo) := Ve e K 3(5 e M Vx > (5 (f(x) < s) . s—> + oo
Wir geben deni Laser den Rat, die voile Definition eines Grenzwertes fiir verschiedene Basen selbstandig auszuformulieren und zwar sowolil fiir endliclie (numerische) als auch unendliclie Grenzwerte. Um die Satze zu Grenzwerten, die wir fiir die spezielle Basis E B x ^ ain Absatz 3.2.2 bewiesen haben, fiir den allgemeinen Fall eines Grenzwertes auf einer beliebigen Basis als bewiesen anselien zu konnen, miissen wir geeignet definieren, wann eine Funktion auf einer Basis schliefiUch konstant, schliefiUch beschrankt und infinitesimal ist. Definition 13. Eine Funktion / : X —^ ffi ist auf der Basis B schliefiUch konstant, falls eine Zahl A e M und ein Element B £ B existiert, so dass f{x) = A fiir alle x G B. Definition 14. Eine Funktion / : X —^ ffi ist auf der Basis B schliefiUch beschrankt, falls eine Zahl c > 0 und ein Element B £ B existiert, so dass |/(a;)| < c fiir alle x £ B. Definition 15. Eine Funktion / : X ^ ffi ist auf der Basis B infinitesimal, faUs hm f(x) = 0. Nach diesen Definitionen und der entscheidenden Anmerkung, dass alle Beweise der Satze zu Grenzwerten nur auf den Eigenschaften Bi) und B2) basieren, konnen wir alle in Absatz 3.2.2 aufgestellten Eigenschaften von Grenzwerten fiir auf beliebigen Basen giiltig erachten. Insbesondere konnen wir nun von dem Grenzwert einer Funktion fiir a; —>• 00, a; —>• — 00 oder x -^ +00 sprechen. AuBerdem haben wir uns nun davon iiberzeugt, dass wir die Theorie von Grenzwerten auch dann anwenden konnen, wenn die Funktionen auf Mengen definiert sind, die nicht notwendigerweise Zahlenmengen sind. Dies wird sich spater als besonders niitzhch erweisen. So ist beispielsweise die Lange einer Kurve eine numerische Funktion, die auf einer Klasse von Kurven definiert ist. Wenn wir diese Funktion auf unterbrochenen Geraden kennen, dann konnen wir sie auf komplizierteren Kurven definieren, wie etwa einem Kreis, indem wir zum Grenzwert iibergehen. Den hauptsachlichen Nutzen, den wir fiir den Moment aus dieser Beobachtung und dem in diesem Zusammenhang eingefiihrten Konzept einer Basis haben, ist, dass sie uns von der Notwendigkeit befreit, Nachweise und formale Beweise von Satzen zu Grenzwerten fiir jeden besonderen Typus von Grenzwertiibergangen auszufiihren oder, in unserer gegenwartigen Terminologie, fiir jeden besonderen Basistyp.
3.2 Der Grenzwert einer Punktion
137
Um das Konzept eines Grenzwertes auf einer beliebigen Basis voUstandig zu beherrschen, warden wir die Beweise der folgenden Eigenschaften des Grenzwertes einer Funktion in allgemeiner Form ausfiihren. 3.2.4 Existenz des Grenzwertes einer Funktion a. D a s C a u c h y s c h e K r i t e r i u m Bevor wir das Cauchysche Kriterium darlegen, treffen wir die folgende niitzhche Definition. D e f i n i t i o n 16. Die Oszillation £; C X ist io(f,E):=
einer Funktion / : X —^ M auf einer Menge sup
|/(a;i)-/(a;2)|,
d.h. die kleinste obere Schranke des Betrags des Unterschieds der Funktionswerte in zwei behebigen P u n k t e n a;i,a;2 £ E. nel 11. uj{x\[-l,2]) 12. uj{x,[-1,2]) 13.uj{x,]-l,2[)
=4. =3. = 3.
nel 14. w(sgna;, [—1, 2]) = 2. Beispiel
15. w(sgna;, [0,2]) = 1.
nel 16. w(sgna;,]0,2]) = 0. S a t z 6. (Das Cauchysche Kriterium fiir die Existenz eines Grenzwertes einer Funktion). Sei X eine Menge und B eine Basis in X. Fine Funktion f : X ^ W besitzt auf der Basis B genau dann einen Grenzwert, wenn fiir jedes e > 0 ein B G B existiert, so dass die Oszillation von f auf B kleiner als e ist. Somit: 3 lim f{x) ^ye>03B Beweis.
GB {uj{f, B) < e)
N o t w e n d i g . Sei h m / ( a ; ) = A £ K. Dann existiert fiir alle e > 0
ein Element B £ B, so dass \f{x) — A\ < e / 3 fiir alle x G B. Aber dann gilt fiir alle a;i,a;2 € B, dass 1/(^1) - .fix2)\ und daher uj{f; B) < e.
< Ifixi)
-A\
+ \f{x2)
- A \ < j
138
3 Grenzwerte
H i n r e i c h e n d . Wir beweisen nun den Hauptteil des Kriteriunis, der sicherstellt, dass dann, wenn fiir jedes e > 0 ein B £ B existiert, fiir das w(/; B) < s, die Funktion einen Grenzwert auf B besitzt. Indem wir e nach und nach gleich 1,1/2,..., 1/n,... setzen, konstruieren wir eine Folge Bi,B2, • • • ,Bn • • • von Elementen in der Basis B, so dass uj{f,B„) < 1/n fiir n £ N. Da i3„ 7^ 0 , konnen wir einen Punkt x„ in jedem Bn wahlen. Die Folge f{xi),f{x2), • • •, f{xn), • • • ist eine Cauchy-Folge. Tatsachlich ist i3„ fl B^ i^ 0 und mit eineni Hilfspunkt x G B^i V\ Bra ^^~ halten wir |/(a;„) - /(a;™)| < |/(a;„) - /(a;)| + |/(a;) - /(a;™)| < 1/n + 1/m. Nach dem Cauchyschen Konvergenzkriteriuni fiir eine Folge besitzt die Folge {/(a^n), n £ N} einen Grenzwert A. Aus der oben aufgestellten Ungleichung folgt, dass fiir m —>• 00 gilt: |/(a;„) — A\ < Xjn. Wenn wir die Ungleichung io[j\ Bn) < 1/n beriicksichtigen, konnen wir nun abschliei3end festhalten, dass |/(a;) - A| < e in jedem Punkt x G B„, falls n> N = [2/e] + 1. D Anmerkung. Dieser Beweis bleibt auch, wie wir unten sehen werden, fiir Funktionen mit Werten in jedem sogenannten vollstandigen Raum Y giiltig. Fiir y = ffi, dem Fall, an dem wir gerade jetzt am meisten interessiert sind, konnen wir, wenn wir wollen, dieselben Ideen benutzen wie im „hinreichend-Zweig" des Beweises des Cauchyschen Kriteriums fiir Folgen. Beweis. Sei m s = inf f{x) und MB = sup/(a;). Wir merken an, dass m^j < iTiBinB2 < MBinB2 < MB2 fiir aUe Elemente Bi und B2 der Basis B. Damit erhalten wir mit dem VoUstandigkeitsaxiom, dass fiir i? e B eine Zahl A e M existiert, die die numerischen Mengen {ms} und {MB} trennt. Da uj{f; B) = MB — fUB, konnen wir nun folgern, dass, da uj{f;B) < e, in jedem Punkt X G B gilt: |/(a;) - A\ < e. D Beispiel 17. Wir werden zeigen, dass fiir X = N und fiir n —>• 00 als Basis B, n € N, das eben bewiesene allgemeine Cauchysche Kriterium fiir die Existenz des Grenzwertes einer Funktion mit dem bereits untersuchten Cauchyschen Kriterium zur Existenz eines Grenzwertes einer Folge iibereinstimmt. Tatsachlich ist ein Element der Basis n ^ 00, n G N eine Menge B = N n U{oo) = {n G N\N < n}, die aus den natiirlichen Zahlen n £ N besteht, die groi^er als eine Zahl TV £ M sind. Ohne Verlust der Allgemeinheit konnen wir annehmen, dass N GN. Die Ungleichung w(/; B) < e bedeutet nun, dass |/(»^i) - /("-2)| < e fiir alle ni,n2 > N. Somit ist fiir eine Funktion / : N ^ M die Bedingung, dass fiir jedes e > 0 ein B G B existiert, so dass uj{f;B) < e, aquivalent zur Bedingung, dass die Folge {/(n)} eine Cauchy-Folge ist. b. Der Grenzwert einer verketteten Funktion Satz 7. (Der Grenzwert einer verketteten Funktion). Sei Y eine Menge, By eine Basis in Y und 5 : F —>• ffi eine Abbildung mit einem Grenzwert auf
3.2 Der Grenzwert einer Punktion
139
der Basis By- Sei X eine Menge, Bx eine Basis in X und f : X ^ Y eine Abbildung von X auf Y, so dass fur jedes Element By £ By ein Bx £ Bx existiert, dessen Bild f{Bx) in By enthalten ist. Mit diesen Annahmen ist die Verkettung g o f : X ^ M. der Abbildungen f und g definiert und besitzt einen Grenzwert auf der Basis Bx rnit lim(5°/)(a;) = lim^C?/)lix
HY
Beweis. Die verkettete Funktion g o f : X ^ M. ist definiert, da f{X) C Y. Sei limg{y) = A. Wir werden zeigen, dass lmi{go f)(x) = A. Zu vorgegebener BY
BX
Umgebung V{A) von A finden wir ein By £ By, so dass g{By) C V{A). Nach der Annahme existiert ein Bx £ Bx, so dass f{Bx) C By. Dann ist aber (g o f)(Bx) = g{f{Bx)) C g{By) C V{A). Damit haben wir bewiesen, dass A der Grenzwert der Funktion {g o f) : X ^W auf der Basis Bx ist. D Beispiel 18. Wir woUen den folgenden Grenzwert bestimnien: lini
s-s-o
sin 7x =! 7x
Wenn wir g{y) = ^i^Ji u^d f{x) = 7x setzen, dann ist {g° f){x) = ^™l^ • In diesem Fall ist y = K \ 0 und X = K. Da lim g{y) = lim ^^^^ = 1, konnen wir den Satz anwenden, wenn wir sicherstellen, dass es fiir jedes Element der Basis 2/ —>• 0 ein Element der Basis a; —>• 0 gibt, dessen Bild unter der Abbildung f{x) = 7x in dem vorgegebenen Element der Basis y —>• 0 enthalten ist. Die Elemente der Basis y —>• 0 sind die punktierten Umgebungen f7y(0) des Punktes 0 £ K. Die Elemente der Basis a; —>• 0 sind ebenfalls punktierte Umgebungen ilxiO) des Punktes 0 £ K. Sei Uy{0) = {y G R\a < y < P, y ^ 0} (mit a, /3 £ ffi und cc < 0, /3 > 0) eine beliebige punktierte Umgebung von 0 in wahlen, dann besitzt Y. Wenn wir f7x(0) = {a; £ ffi| y < a; < f,x^O} diese punktierte Umgebung von 0 in X die Eigenschaft, dass f(Ux{0)) = ilyiO) C Uy{0). Die Annahmen des Satzes sind daher erfiillt, und wir konnen nun behaupten, dass sin 7a; siny lim = lim = 1 . s-s-O 7x y^O y Beispiel 19. Die Funktion g{y) = \sgxiy\ besitzt, wie wir wissen (vgl. Beispiel 3), den Grenzwert lim Isgnyl = 1. J/-S-0
Die Funktion y = f{x) = x s i n ^ , die fiir x ^ 0 definiert ist, besitzt den Grenzwert hm xsin ^ = 0 (vgl. Beispiel 1). X—>0
Dagegen besitzt die Funktion {g o f){x) Grenzwert.
sgn(a;sini] fiir a; —>• 0 keinen
140
3 Grenzwerte
In der Tat gibt es in jeder punktierten Umgebung von x = 0 Nullstellen der Funktion sin i , so dass die Funktion |sgn(a; sin ^) | in jeder derartigen Umgebung sowohl den Wert 1 und den Wert 0 annimmt. Nach dem Cauchyschen Kriterium kann diese Funktion fiir a; —>• 0 keinen Grenzwert besitzen. Aber widerspricht dieses Beispiel nicht Satz 7? Uberpriifen Sie, ahnlich wie im vorigen Beispiel, ob die Annahmen des Satzes erfiillt sind. Beispiel 20. Wir woUen nun zeigen, dass
lim (l + -Y s-s-oo \
x/
Beweis. Wir wollen die folgenden Annahmen treffen: y = N , By ist die Basis n -)• oo , n e N , X = M+ = {x GM\X > 0} , Bx ist die Basis x -)• +00 , / : X —>• F ist die Abbildung x 1—> [x] , wobei [x] der ganzzahlige Teil von x ist (d.h. die groi^te ganze Zahl, die nicht groBer als x ist). Dann existiert oflFensichthch fiir jedes By = {n £ N| n > N} in der Basis n —>• 00, n £ N ein Element Bx = {x G M.\x > A^ + 1} der Basis x —>• +00, dessen Bild unter der Abbildung x i->- [x] in By enthalten ist. DieFunktionen5(n)=(l + i ) " , 5 i ( n ) = ( l + ;iTT)"™d32(n) = (l + i ) " + ' besitzen, wie wir wissen, die Zahl e als Grenzwert in der Basis n —>• 00, n £ N. Nach Satz 6 zum Grenzwert einer verketteten Funktion konnen wir nun behaupten, dass die Funktionen
ebenso e als Grenzwert auf der Basis x —>• +00 besitzen. Nun bleibt uns nur noch anzumerken, dass V
[x] + lJ
\
xJ
\
1 xH+1 [x]J
fiir X > 1. Da die aufien stehenden Terme fiir x —>• +00 gegen e streben, folgt aus Satz 5 zu den Eigenschaften eines Grenzwertes, dass lim (l + - ) = e. D Mit Hilfe von Satz 7 zum Grenzwert einer verketteten Funktion zeigen wir nun, dass hm (l + ^) = e.
3.2 Der Grenzwert einer Punktion
141
Beweis. Wir schreiben lim a;—> —oo
/ 1\=^ / 1 \(-t) / 1+ = lim 1 + -—= lim 1 V xJ (-t)->--oo\ (-t)y t^+oo V
lim (l H ^ + oo V
") =
lim (l -\
t - 1 /
t^+oo V
=
lim (1 H
]
lim (l H
t-lJ
)
1\-* = tJ
t ^ + oo V
=
lim
") t - 1 /
(1 + - )
=e
Mit Hilfe der Substitutionen u = t — 1 und t = —x konnen wir diese Gleicliungen in umgekehrter Reihenfolge (!) mit Hilfe von Satz 7 rechtfertigen. In der Tat erlaubt uns der Satz erst dann, wenn wir beim Grenzwert lim (l + - ) , dessen Existenz bereits gezeigt ist, angekommen sind, die Behauptung, dass der vorige Grenzwert ebenfalls existiert und denselben Wert annimmt. Somit existiert auch der Grenzwert davor und wir gelangen mit einer endlichen Anzahl derartiger Ubergange scliliefilicli zum urspriinglichen Grenzwert. Dies ist ein sehr typisclies Beispiel fiir den Einsatz des Satzes zum Grenzwert einer verketteten Funktion zur Berechnung von Grenzwerten. Somit erhalten wir: lim :->-oo \
1+ -
= e=
xl
lim
1+ -
x->+oo \
1 + -)
= e. Da
lim
xl
(1 + 7)
= e, existiert
tatsachlicli zu vorgegebenem e > 0 ein ci £ ffi, so dass |(l + ^) — e| < e fiir X < c\. Da auch lim (l + - ) = e, existiert ein 02 G K, so dass 1(1 + ^) — e| < e fiir C2 < x. Dann erhalten wir fiir |a;| > c = max{|ci|, |c2|}, dass |(l + j ) womit bewiesen ist, dass hm (l + i ) = e.
— e| < e, D
Beispiel 21. Wir werden zeigen, dass lim(l + t)i/* = e .
t->o
Beweis. Nach der Substitution x = 1/t gelangen wir zu dem im vorigen Beispiel betrachteten Grenzwert. D
X
lim — = 0, fiir q> 1 .
a;—)-+oo q^
Beweis. Wir wissen (vgl. Beispiel 11 in Abschnitt 3.1), dass lim -^ = 0 fiir n—)-oo y
g>l.
142
3 Grenzwerte
Nun konnen wir, wie in Beispiel 3 in Abschnitt 3.1, / : IR__| -^ N mit der Funktion [x] (der ganzzahlige Teil von x) als Hilfsabbildung betrachten. Mit Hilfe der Ungleichungen 1 q
[x] gl^l
X q^
[x] + 1 q[x]+'i-
und unter Beriicksichtigung des Satzes zum Grenzwert einer verketteten Funktion ergibt sich, dass die aui3en stehenden Terme fiir x —>• +00 gegen 0 streben. Wir folgern, dass lim ^ = 0. D a;—)--t-oo ^
Beispiel 23.
lim i^i-£ = 0. a:-> + oo
X
Beweis. Sei a > 1 und t = log^jX, so dass x = a*. Aus den Eigenschaften der Exponentialfunktion und des Logarithmus (unter Beriicksichtigung der Unbeschranktheit von a" fiir n £ N) erhalten wir (x —>• +00) <^ (t —>• +00). Mit dem Satz zum Grenzwert einer verketteten Funktion und dem Ergebnis in Beispiel 11 in Abschnitt 3.1 erhalten wir: x->-|-oo
x
t-> + oo
a*
Fiir 0 < a < 1 setzen wir —t = log^ x, x = a~*. Dann (x —>• +00) <=> (t ^ +00) und da 1/a > 1, erhalten wir wiederum: hm x->-i-oo
log. a; ,. —t ,. t ^ " = hm — - = - lim ,_, , ,, = 0 . X t->+oo a * t->-i-oo (l/aj*
D
c. Der Grenzwert einer monotonen Funktion Wir betrachten nun einen speziellen Typ einer numerischen Funktion, der aber sehr niitzlich ist, und zwar monotone Funktionen. Definition 17. Eine auf einer Menge E C R definierte Funktion f : E ^ R wird genannt: auf E anwachsend, wenn Va;i,a;2 G E {xi < x^ ^ lixi)
< fix^)) ,
auf E nicht ahsteigend, wenn Va;i,a;2 G E {xi < X2 ^ fi^i)
< fix^)) ,
auf E nicht anwachsend, wenn Va;i,a;2 G E {xi < x^ ^ fi^i)
> fix^)) ,
auf E ahsteigend, wenn Va;i,a;2 G E {xi < X2 ^ f{xi) > fix^)) •
3.2 Der Grenzwert einer Punktion
143
Derartige Funktionen werden monotone Funktionen auf der Menge E genannt. Angenonimen, die Zahlen (oder Synibole —oo oder +CXD) i = mi E und s = supi? seien Haufungspunkte der Menge E und sei / : -E ^ M eine monotone Funktion auf E. Dann gilt der folgende Satz: Satz 8. (Kriterium zur Existenz eines Grenzwertes einer monotonen Funktion). Eine notwendige und hinreichende Bedingung dafiir, dass eine nicht absteigende Funktion f : E ^ W auf der Menge E einen Grenzwert fur a; —>• s, X G E besitzt, ist, dass sie von oben beschrankt ist. Damit diese Funktion einen Grenzwert fiir x ^ i, x G E besitzt, ist es notwendig und hinreichend, dass sie von unten beschrankt ist. Beweis. Wir werden diesen Satz fiir den Grenzwert
lim f{x) beweisen.
Falls dieser Grenzwert existiert, dann ist die Funktion / , wie jede andere Funktion, die einen Grenzwert besitzt, auf der Basis -E 9 a; —>• s scliliefilicli beschrankt. Da / auf E nicht absteigend ist, folgt, dass / von oben beschrankt ist. Ja, wir konnen sogar behaupten, dass/(x) < lim / ( x ) . Dies wird im Folgenden EBx^ts
klar werden. Wir wollen die Existenz des Grenzwertes
lim f{x) zeigen, wenn / von EBx^ts
oben beschrankt ist. Angenonimen / sei von oben beschrankt, dann gibt es eine kleinste obere Schranke fiir die Werte, die / auf E annimmt. Sei A = sup/(a;). Wir xeE werden zeigen, dass lim f{x) = A. Sei e > 0 gegeben, so linden wir nach EBX^S
der Definition der kleinsten oberen Schranke einen Punkt XQ £ E, fiir den A — e < f{xo) < A. Da / nicht absteigend auf E ist, ergibt sich somit, dass A — s < f{x) < A iiiT XQ < X £ E. Aber die Menge {x G E\xo < x} ist offensichtlich ein Element der Basis x ^ s, x G E (da s = sup-E). Somit haben wir bewiesen, dass lim f{x) = A. EBX^S
Der Gedankengang ist fiir den Grenzwert
lim f{x) analog. In diesem EBx^i
Fall erhalten wir
lim f{x) = inf f{x). EBx^i
D
x€E
d. Vergleich des asymptotischen Verhaltens von Funktionen Zur Klarung eroffnen wir die Untersuchung mit einigen Beispielen. Sei 7r(a;) die Anzahl der Primzahlen, die nicht grofier als eine vorgegebene Zahl a; € M sind. Obwohl wir fiir jedes feste x (und wenn nur durch Abzahlen) den Wert 7r(a;) finden konnen, sind wir dennoch nicht in der Lage etwa zu sagen, wie sich die Funktion TT{X) fiir x —>• +00 verhalt oder, was dasselbe ist, wie das asymptotische Gesetz fiir die Verteilung von Primzahlen lautet. Wir
144
3 Grenzwerte
wissen seit Euklid, dass 7r(a;) -^ +00 fiir x —>• +00, aber der Beweis, dass 7r(a;) ungefahr wie j ^ anwachst, wurde erst im neunzehnten Jahrhundert durch P. L. Tschebyscheff^^ erbracht. Wenn es notwendig wird, das Verhalten einer Funktion in der Nahe eines Punktes (oder nahe Unendlich) zu beschreiben, in deni in der Regel die Funktion selbst nicht definiert ist, so sagen wir, dass wir an dem asymptotischen Verhalten der Funktion in einer Umgebung des Punktes interessiert sind. Das asyniptotische Verhalten einer Funktion wird iibhcherweise niit Hilfe einer zweiten Funktion charakterisiert, die einfacher oder besser untersucht ist und die die Werte der untersuchten Funktion in einer Umgebung des fraghchen Punktes niit kleineni relativen Fehler reproduziert. Somit verhah sich die Funktion Trfx) fiir x —>• +00 wie 7 ^ . Fiir a; —>• 0 verhalt sich die Funktion ^iSJS. ^^[Q (jjg konstante Funktion 1. Wenn wir von dem Verhalten der Funktion x + x + sin - fiir a; —>• 00 sprechen, sagen wir offensichtlich, dass sie sich im Grunde wie x verhalt. Wenn wir von ihrem Verhalten fiir a; —>• 0 sprechen, sagen wir dagegen, dass sie sich wie sin ^ verhalt. Wir geben nun exakte Definitionen einiger elementarer Konzepte im Zusammenhang mit dem asymptotischen Verhalten von Funktionen. Wir werden diese Konzepte im ersten Stadium unseres Analysisstudiums systematisch einsetzen. Definition 18. Wir sagen, dass eine gewisse Eigenschaft von Funktionen oder eine gewisse Relation zwischen Funktionen schliefiUch auf einer gegebenen Basis B gilt, falls B £ B existiert, worin sie gilt. Wir haben bereits die Bezeichnung einer Funktion als schliei31ich konstant oder als schlieBlich beschrankt auf einer gegebenen Basis in diesem Sinne interpretiert. In demselben Sinne werden wir von nun an sagen, dass die Relation f{x) = g{x)h{x) zwischen Funktionen / , g und h schliei31ich gilt. Diese Funktionen mogen zunachst unterschiedliche Definitionsbereiche haben, aber wenn wir an ihrem asymptotischen Verhalten auf der Basis B interessiert sind, dann ist fiir uns nur wichtig, dass sie alle auf einem Element von B definiert sind. Definition 19. Die Funktion / wird infinitesimal im Vergleich zur Funktion g auf der Basis B genannt und wir schreiben / = o{g) oder / = o{g) auf B, wenn die Relation f{x) = a{x)g{x) auf B schliefilich gilt, wobei a{x) eine Funktion ist, die auf B infinitesimal ist. Beispiel 24- a;2 = o{x) fiir a; ^ 0, da x^ = a; • a;. Beispiel 25. X
o{x'^) fiir a; —>• 00, da schlieBhch (so lange wie a; ^ 0) a; =
^•x\ X
^^ P. L. Tscliebyscheff (1821-1894) (aucli Tscliebyschow oder Cliebyshev) - hervorragender russischer Mathematiker und Fachmann fiir theoretische Mechanik, der Begriinder einer grolien Mathematikschule in Russland.
3.2 Der Grenzwert einer Punktion
145
Aus diesen Beispiel muss gefolgert werden, dass es absolut notwendig ist, die Basis, auf der / = o{g) gilt, anzugeben. Die Schreibweise / = o{g) wird „ / ist klein o von g" ausgesprochen. Aus der Definition folgt insbesondere, dass die Schreibweise / = o(l), wenn wir g{x) = 1 setzen, einfach bedeutet, dass / auf B infinitesimal ist. Definition 20. Sind / = o{g) und g selbst auf B infinitesimal, dann sagen wir, dass / auf B von hoherer Ordnung infinitesimal ist als g. Beispiel 26. x~'^ = -^ ist von hoherer Ordnung infinitesimal als x~^ = - fiir a; —>• 0 0 .
Definition 21. Eine Funktion, die auf einer vorgegebenen Basis gegen Unendlich strebt, wird infinite Funktion oder einfach Unendlichkeit auf der vorgegebenen Basis genannt. Definition 22. Sind / und g auf B infinite Funktionen und / = o{g), so sagen wir, dass g von hoherer Ordnung infinit auf B ist als f. Beispiel ^7. ^ —>• oo fiir a; ^ 0, p- —>• oo fiir a; ^ 0 und ^ = 0(^2-). Daher ist T- von hoherer Ordnung infinit als - fiir a; —>• 0. Gleichzeitig ist fiir a; —^ CXD die Funktion a;^ von hoherer Ordnung infinit als X. Die Vorstellung, dass wir die Ordnung jeder infiniten oder infinitesimalen Funktion durch Wahl einer Potenz x" charakterisieren konnen und damit sagen konnen, dass sie vom Grade n sei, trifft nicht zu. Beispiel 28. Wir werden zeigen, dass fiir a > 1 und jedes n £ Z gilt: hm — = 0 , s—>+oo a* d.h., x" = o{a^) fiir x —>• +00. Beweis. Fiir n < 0 gilt die Behauptung offensichtlich. Ist n € N, konnen wir q = \fa setzen und erhalten g > 1 und ^ = (-%) und daher: hm — = a;—> + oo O'^
hm
I —
a;—> + oo \q^
= J
hm — • . . . • hm — = 0 . a;—> + oo q^
a;—)--t-oo q^
n Faktoren
Wir haben dabei (mit Induktion) den Satz 2 in Absatz 3.1.2 und das Ergebnis in Beispiel 22 benutzt. D Somit erhalten wir fiir jedes n £ Z, dass a;" = o{a'') fiir x —>• +00 mit a > 1.
146
3 Grenzwerte
Beispiel 29. Wir woUen das vorige Beispiel erweitern und zeigen, dass lim — = 0 fiir a > 1 und jedes cc £ M, d.h., x" = o{a'') fiir x -^ +oo. Beweis. Wir wahlen n € N so, dass n > a. Dann erhalten wir fiir x > 1: 0< — < — . Mit Hilfe der Eigenschaften des Grenzwertes und dem Ergebnis aus vorigem Beispiel gelangen wir zu lim ^ == 0. D a;—> + oo '^
Beispiel 30. Wir woUen zeigen, dass ^-1/x
lim R + 9a:->0
X"
fiir a > 1 und jedes cc £ M, d.h., a~^/^ = o{x") fiir a; —>• 0, x £ ffi+. Beweis. Hier setzen wir x = — 1/t und benutzen den Satz fiir den Grenzwert einer verketteten Funktion und das Ergebnis des vorigen Beispiels und erhalten: ^-l/x lim R + 9a:->0
= x"
^a l i m —7 = 0 . t->+oo a*
D
Beispiel 31. Wir woUen zeigen, dass lim ! ^ I - £ = 0 x->+oo
x"
fiir a > 0, d.h., dass fiir jeden positiven Exponenten a gilt, dass log^ x = o{x") fiir X -^ +00. Beweis. Fiir a > 1 setzen wir x = a*'". Dann gelangen wir nach den Eigenschaften der Potenzfunktion und des Logarithmus, dem Satz zum Grenzwert einer verketteten Funktion und dem Ergebnis in Beispiel 29 zu: hm
"
a:-> + oo
=
x"
hm
'
t^+QO
a}
= — lim — = 0 . a t^+oo
a*
1st 0 < a < 1, dann ist 1/a > 1 und nach Substitution von x = a~*/" erhalten wir: hm
a:-> + oo
"
x"
=
hm -^—'-—^ =
t^+(x
a *
hm
a t-> + oo ( l / o ) *
3.2 Der Grenzwert einer Punktion
147
Beispiel 32. Wir woUen ferner zeigen, dass x" log„ X = o(l) fiir a; ^ 0, a; e IR+ fiir jedes a > 0. Beweis. Wir miissen zeigen, dass
lim
x" log. x = 0 fiir a > 0. Wir setzen
X = 1/t und wenden den Satz zum Grenzwert einer verketteten Funktion und das Ergebnis des vorigen Beispiels an und erhalten: lim
x" log„ X = lim ^°^"^^^^^ = -
lim i ^ ^ = 0 .
D
Definition 23. Wir woUen vereinbaren, dass die Schreibweise f = 0{g) oder / = 0{g) auf der Basis B (spricli: „ / ist groB O von g auf B") bedeutet, dass die Relation f{x) = (]{x)g{x) auf B schlieBlich gilt, wobei (]{x) auf B schlieBlich beschrankt ist. Insbesondere bedeutet f = 0(1), dass die Funktion f auf B schlieBlich beschrankt ist. Beispiel 33. (^ + sina;)a; = 0{x) fiir a; —>• oo. Definition 24. Die Funktionen / und g sind auf B von gleicher Ordnung und wir schreiben f ^ g auf B, wenn / = 0(g) und g = 0(f) gleichzeitig gelten. Beispiel 34. Die Funktionen (2 + sina;)a; und x sind fiir a; —>• oo von gleicher Ordnung, aber (l + sina;)a; und x sind fiir a; —>• oo nicht von gleicher Ordnung. Die Bedingung, dass / und g auf der Basis B von gleicher Ordnung sind, ist offensichtlich zu der Bedingung aquivalent, dass ci > 0 und C2 > 0 und ein Element B £ B existieren, so dass die Relationen ci|5(a;)|<|/(a;)|
-\fix)\ < W)] < -1/(^)1 • C2
Ci
Definition 25. Gilt schlieBhch die Gleichung f(x) = ^(x)g(x) auf B mit lim7(a;) = 1, so sagen wir, dass die Funktion f sich auf B asymptotisch wie g verhdlt, oder in Kurzform, dass / auf B zu g aquivalent ist. Fiir diesen Fall schreiben wir / ~ 5 oder f ^ g auf B. Die Benutzung des Wortes aquivalent wird durch folgende Relationen gerechtfertigt:
148
3 Grenzwerte
(/~5)^(ff~/) , (/~ff)A(5~/i)^(/~/i) . Die Relation / ~ / ist in der Tat offensichtlich, da in diesem Falle 7(x) = 1. 1st als Nachstes lim7(a;) = 1, dann ist l i m - r ^ = 1 und g{x) = :zh)f{x)Somit miissen wir nur noch erklaren, weswegen die Annahme zulassig ist, dass 7(a;) ^ 0. Gilt die Relation f{x) = '-f{x)g{x) auf Bi £ B und ^ < |7(a;)| < | auf B2 £ B, dann konnen wir B £ B mit B C Bi Ci B2 walilen, so dass beide Relationen gelten. AuBerhalb von B konnen wir, falls gewiinsclit, annelimen, dass 7(3;) = 0. Somit erhalten wir tatsachlicli, dass (/ ~ 3) ^ (3 ~ / ) • Ist schlieBlich f{x) = ji{x)g{x) auf Bi G B und g{x) = j2{x)h{x) auf B2 e B, dann sind auf jedem Element B £ B mit B C Bi Ci B2 diese beiden Relationen gleiclizeitig erfiillt und somit ist f{x) = ji{x)^2{x)h{x) auf B. Aber lim7i(a;)72(a;) = lim7i(a;) dim 72(3;) = 1 und daher liaben wir bewiesen, dass f ~ /i. Beachten Sie, dass die Relation / ~ 5 auf B zu f{x) = g{x) + a{x)g{x) = g{x) + 0(3(3;)) aquivalent ist, da die Relation lim7(3;) = 1 zu 7(2;) = 1 + a{x) aquivalent ist mit lima(3;) = 0. Wir erkennen, dass der relative Fehler \a{x)\ = | ifa) I ^"61 der Approximation von f{x) durch eine Funktion g{x), die zu f{x) auf B aquivalent ist, infinitesimal auf B ist. Wir woUen einige Beispiele betracliten. Beispiel 35. x"^ + x = (l + ^)x'^ ~ x^ fiir 3; —>• 00. Der Betrag der Differenz dieser Funktionen |(a;^ + x) — x"^] = \x\ strebt gegen Unendlicli. Der relative Fehler -p- = jir, der sicli durch Ersatz von 3;^ +3; durch die aquivalente Funktion x'^ ergibt, strebt jedoch fiir a; ^ 00 gegen NuU. Beispiel 36. Zu Beginn dieser Untersuchung sprachen wir iiber den beriihmten Primzahlensatz, d.h. die asymptotische Verteilung der Primzahlen. Wir konnen nun fiir dieses Gesetz eine exakte Aussage machen: r X —>• ^ '^^^ = il^ + Kl^)f i i ^ "
Beispiel 31. Da lim ^is^ = 1 erhalten wir sin 3; ~ x fiir 3; ^ 0. Dies kann auch als sin 3; = 3; + o(x) fiir a; ^ 0 geschrieben werden.
3.2 Der Grenzwert einer Punktion
149
Beispiel 38. Wir woUen zeigen, dass ln(l + a;) ~ a; fiir a; ^ 0. Beweis. lini ^"^^"^^^ = lim ln(l + xf''
x->0
X
x-s-O
= In ( lim {I + xf/-") =\ne = I . ^ s-s-0
'
Hierbei haben wir in der ersten Gleichung die Beziehung \og^{b") = alog^b und in der zweiten die Beziehung lim log^ t = log^ h = log^ (lim t) genutzt. D Somit ist ln(l -\- x) = x + o{x) fiir x ^ 0. Beispiel 39. Wir woUen zeigen. dass e^ = 1 + a; + o{x) fiir x —>• 0. Beweis. lim s-s-o
e* - 1 . t = lim —; = 1. X t->o ln(l + t)
Hierbei haben wir die Substitution x = ln(l + t), e* — 1 = t vorgenommen und die Relationen e* ^ e*^ = 1 fiir a; ^ 0 und e^ ^ 1 fiir a; 7^ 0 verwendet. Somit ist mit Hilfe des Satzes zum Grenzwert einer verketteten Funktion und dem Ergebnis des vorigen Beispiels die Behauptung bewiesen. D Somit gilt e* — 1 ~ a; fiir X —>• 0. Beispiel 4O. Wir woUen zeigen, dass (1 + x)" = 1 + ax + o{x) fiir x ^ 0. Beweis. ( 1 + X ) " - 1 lim
s-s-o
=
X
, Qain(l+x)_i lim -—
ctln(l+x) — •
=
x->o a l n ( l + x)
x ,. e* - 1 ,. ln(l + x) = a lim • lim = a . t->0
t
s-s-O
X
Bei dieser Berechnung haben wir mit der Annahme, dass a ^ 0, die Substitution a l n ( l + x) = t vorgenommen und die Ergebnisse der beiden vorigen Beispiele verwendet. Fiir cc = 0 ist die Behauptung offensichtlich. D Somit ist (1 + x)" — 1 ~ ax fiir x —>• 0. Die folgende einfache Tatsache ist manchmal bei der Berechnung von Grenzwerten hilfreich. Satz 9. Sei f ^f,
dann ist lira f{x)g{x)
= lira f{x)g{x),
unter der Voraus-
setzung, dass einer dieser Grenzwerte existiert. Beweis. Sei /(x) = 7(x)/(x) und lim7(x) = 1, dann erhalten wir: lim/(a;)g(x) = lim7(x)/(x)g(x) = lim7(x) • lim/(x)g(x) = lim/(x)g(x) . D
1
3 Grenzwerte
ispiel 41,. In cos a; 1 ,. Incos^a; 1 ,. ln(l—sin^a;) lim —^r- = — lim = — lini s-s-o sin(x"^) 2 s-s-o x-^ 2 s-s-o x-^
=
1 1 ,. — sin^ X 1 ,. a;^ — = — lini —r- = 2 x->o x-' 2 x->o a;^ ~2
= — lini
Hierbei haben wir die Relationen ln(l + a) ^ a fiir a —>• 0, sinx ~ x fiir a; —>• 0, ^ji-j ~ i fiir /? ^ 0 und sin x ^ x"^ fiir a; —>• 0 verwendet. Wir haben bewiesen, dass wir in einer vorgegebenen Basis bei der Berechnung von Grenzwerten von Monomen Funktionen durch dazu aquivalente Funktionen ersetzen konnen. Diese Regel soUte nicht auf Summen und Differenzen von Funktionen iibertragen werden. 42. \/x'^ + X ~ X fiir X —>• +00, aber lim
(yx'^ + X — x) ^
a;—)-+oo
lim {x — x) = 0 . a;—> + oo
Tatsachlicli ist lim X ^ + 00
(yx'^ + X — x) = lim
=
S ^ + OO ^ a ; 2 _|_ 2; _|_ 2;
lim
—^^=^=—
X ^ + OO
A _|_ i _|_ -|^
1 2
Wir wollen einige weitere, haufig eingesetzte Regeln fiir den Umgang mit den Symbolen o(-) und O(-) in der Analysis anfiihren. Satz 10. Zu einer vorgegebenen Basis gilt: a)o{f)+o{f)=o(f), b) o{f) bedeutet auch 0(f), c) o(f) + 0{f) = 0(f), d) 0(f) + 0(f) = 0(f), e) Ist g(x) + 0, dann 2ilg)l = o ( f i ) und ^
i
= o(£M).
Beachten Sie die Besonderheiten bei Operationen mit den Symbolen o(-) und O(-), die sich aus der Bedeutung dieser Symbole ergeben. Beispielsweise ist 2o(f) = o(f) und o(f) + 0(f) = 0(f) (obwohl i.A. o(f) ^ 0); ebenso, dass o(f) = 0(f), aber 0(f) ^ o(f). Hierbei ist das Gleichheitszeiclien im Sinne von „ist" gemeint. Die Symbole o(-) und O(-) stehen nicht wirklich fiir Funktionen, sondern deuten asymptotisches Verhalten an, ein Verhalten, das viele Funktionen gemeinsam haben konnen, wie etwa / und 2 / u.s.w.. Beweis. a) Nach der eben gegebenen Klarstellung erscheint diese Behauptung nicht mehr merkwiirdig. Das erste Symbol o(f) bezeichnet eine Funktion der Form Q;i(a;)/(a;), mit limQ;i(a;) = 0. Das zweite Symbol o(f), das man mit
3.2 Der Grenzwert einer Punktion
151
einem Zeichen versehen konnte (oder sollte), urn es vom ersten zu unterscheiden, bezeichnet eine Funktion der Form a2{x)f{x) mit lima2(a;) = 0. Dabei ist ai{x)f{x) + a2{x)f{x) = [ai{x) + a2{x))f{x) = a3{x)f{x), mit lim 0:3(2;) = 0. B Behauptung b) folgt aus der Tatsache, dass jede Funktion, die einen Grenzwert besitzt, schlieBlich beschrankt ist. Behauptung c) folgt aus b) und d). Behauptung d) folgt aus der Tatsache, dass die Summe von schhefilich beschrankten Funktionen wieder schlieBlich beschrankt ist. Bei e) ergibt sich "-^ = ^^^fgM = «(^)ZM = ^ ( f g } ) . Der zweite Teil der Behauptung e) wird auf ahnhche Weise bewiesen. D Mit Hilfe dieser Regeln und den in Beispiel 40 formulierten Aquivalenzen konnen wir den Grenzwert in Beispiel 42 durch die folgende direkte Methode bestimmen: lim (Va;^ + x — x) = lim x{\ a;— ->> ++ oooo
=
'
x->-|-oo
1 -\
VV
lim x f l - h - • - + 0 ^ - ) - 1) = a:-> + oo
\
2
X
\X I
1) = X
>
I
lim
f - + a; • o f - ) ) =
x->-|-oo \ 2
\X > I
= hin (1+0(1)) = i . Wir werden in Kiirze die folgenden wichtigen Relationen beweisen. Sie soUten sie sich jetzt wie das Einmaleins merken: (f = 1 + —a; + —x^ ^ 1! 2!
h —a;" H n\
COSx = 1 - —X + —X ^ h \ ^ , , , x^ ^ 2! 4! (2fc)! 1 1 (-1)*^ sin a; = -7a; - —a;^ H h --^——T-,X^^^^ H 1! 3! (2fc + l)! 1 1 (—1)""-'x" H ln(l + x) =x x^ + -x^ ^ h ^^ 2 3 n
fiir a; £ M , fiir a; e M , fiir a; £ M , fiir |a;| < 1 ,
(1 + a;)" = 1 + - X + - ! — — - x ^ + • • • + aia - 1) • • • (a - n + 1) „ „.. , , H—^ r -x^ + • • • fiir X < 1 . n\ Auf der einen Seite konnen diese Gleichungen bereits als Berechnungsformeln benutzt werden. Auf der anderen Seite enthalten sie die folgenden asymptotischen Formeln, die die in den Beispielen 37-40 enthaltenen Formeln verallgemeinern:
152
3 Grenzwerte 3=" =1 + —x+ —x^ ^ 1! 2! 1 1 cosx = 1 - —x^ + —x^ ^ 2! 4! 0 /I
h —,x^ + 0{x^"^^\ fiir X -!• 0 n\ (-1) h (2fc)! , ^ , , , x^^ + Ofaj^^^+^l fiir X -!• 0 /0^> *> '
_ 1 3 (-1)' s i n x = - ^ x - ;^x3 + • • • + - i r - ^ a ; 2 ^ + ' + 0{x''^^^\ !!•" 3!"" ^ ' " ^ (2fc + l ) ! ' l n ( l + x) = X - - x ^ + - x ^ + • • • + ^^ 2
3
'-
x" + 0(x"+M
fiir x ^ 0 fiir X ^ 0 ,
n
(1 + a;)" = 1 + - X + - ! — — ^ x ^ + • • • + ccfa — 1) • • • (cc — n + 1) „ ^ . „,,< ... H—^ ^ ^ x " + 0 ( x " + ^ ) fiir X -!• 0 . n\ ^ ' Diese Formeln sind iiblicherweise die effektivste Methode, urn die Grenzwerte der Elementarfunktionen zu bestimmen. Dabei soUten wir im Hinterkopf behalten, dass 0 ( x ™ + i ) = x™+i • 0 ( 1 ) = x™ • x O ( l ) = x™o(l) = o(x™) fiir X -)• 0. Wir wollen zum Abschluss einige Beispiele betrachten, in denen diese Formeln zur Anwendung gelangen. Beispiel 43x-sinx ,. X - (x - 4 x ^ - I - 0 ( x ^ ) ) ,. / 1 ^ , 9^\ 1 hm = hm ^ = hm — -|- 0 ( x ) = — . x^o x^ x^o x^ x^o V3! / 3! Beispiel 44- Wir wollen ,/T/X^ lim X ' a;—>oo
+X
1\
AVTT^-'^^'xJ
bestimmen. Fiir x —^ oo gilt: x^ - h x
l + x~'^
1 + x'-^
1 + x-
r
1 \ /^
1 \-i
(l + if)(l-Ja+0(ir))=l + ^+0(Ja) 'J I Jb
X" JL
l-hx3
woraus wir - = — • ^ + 0 f — ) fiir X -^ X 14 x^ Vx-^/ erhalten. Somit ist der gesuchte Grenzwert: x^cx,
Vl4x2
Vx3//
14
3.2 Der Grenzwert einer Punktion
153
Beispiel 45lim [ - f l + - ) 1 = lim e x p | a ; f In ('l + - ) = =
- l) | =
lim exp • ^ a ; ^ l n ( l H — ) — x> = lim exp ix"^ { s-s-oo
L
-—r + Oi^T]]
\x
= lim exp\-l + s—>oo L 2
2x^
- x> =
\X'^ / /
J
0(-)]=e-'/\ \x/ i
3.2.5 U b u n g e n u n d A u f g a b e n 1.
a) Beweisen Sie, dass es eine auf R definierte eindeutige Funktion gibt, die die folgenden Bedingungen erfiillt: /(l)=o f(xi)
{a>Q,a^l),
• f{x2) = f{xi +X2) ,
f(x) —> f(xo) fiir X ^ xo • b) Beweisen Sie, dass es eine auf R+ definierte eindeutige Punktion gibt, die die folgenden Bedingungen erfiillt: /(a) = l
(o> 0 , 0 ^ 1 ) ,
f{xi) + fix-z) = f{xi • X2) , f{x) —>• f{xo) fiir xo £ R+ und R+ 9 a; —>• xo • H i n w e i s : Wiederholen Sie die Konstruktion der Exponentialfunktion und des Logarithmus in Beispiel 10. 2.
a) Stellen Sie eine Eins-zu-Eins Beziehung 93 : R —>• R+ her, so dass {p{x + y) = (p{x) • (p{y) fiir jedes x,y GM, d.h., so dass die Operation der Multiplikation im Bild (R+) der Operation der Addition im Urbild (R) entspricht. Die Existenz einer derartigen Abbildung bedeutet, dass die Gruppen (R,+) und (R+,-) als algebraische Objekte identisch sind, oder, wie wir sagen, dass sie isomorph sind. b) Zeigen Sie, dass die Gruppen (R, +) und (R \ 0, •) nicht isomorph sind.
3. Bestimmen Sie die folgenden Grenzwerte: a) lim x^, a:->+0
b)
lim a:->0
d) lim •
x'/^
154
3 Grenzwerte
4. Zeigeii Sie, dass 1 -\
I----H = Inn + c + o(l) fiir n —>• oo , 2 n wobei c eine Konstante ist. (Die Zahl c = 0, 57721 . . . wird Eulersche genannt.) H i n w e i s : Benutzen Sie die Relation
Konstante
In ^ i ^ = In f l + i ^ = i + o f J _ ^ f i i r n ^ o o . n \ nj n \n J 5. Zeigen Sie: oo
oo
a) Gilt fiir zwei Reihen ^ an und ^ hn niit positiven Gliedern, dass Un ~ 6n fiir n=l
n=l
n —>• oo, dann konvergieren entweder beide Reihen oder beide divergieren. oo
b) Die Reihe Yl ^^^ '^ konvergiert nur fiir p > 1. n= l
6. Zeigen Sie: oo
a) Sei an > fln+i > 0 fiir alle n £ N und konvergiere die Reihe ^
Un- Dann gilt
n= l
On = o f ^ j fiir n ->• oo. b) Fiir h„ = ol^j ^
kann man inimer eine konvergente Reihe ^ -^
a„ konstruieren,
n= l
SO dass bn = o(on) fiir n —> oo. oo
c) Wenn eine Reihe ^ an niit positiven Gliedern konvergiert, dann konvergiert n=l oo
/ oo
auch die Reihe ^
An, niit An = \ jY
n=l
y
/
ik — A fc=n
U
oo
1^
a* und es gilt On = o{A„)
fc=n+l
fiir n —>• oo. oo
d) Wenn eine Reihe ^
On rnit positiven Gliedern divergiert, dann divergiert auch
n= l oo
/ n
m —1
die Reihe ^ An, mit An = * Y. ak — \ Y. ak und es gilt An = o(on) fiir n=2 y *=1 y *=1 n —>• oo. Aus c) und d) folgt, dass keine konvergente (bzw. divergente) Reihe als universeller Vergleichsstandard dienen kann, urn die Konvergenz (bzw. Divergenz) anderer Reihen abzuleiten. 7. Zeigen Sie: oo
a) Die Reihe Y, ^'^dn mit an > 0, n G N konvergiert genau dann, wenn die Folge n= l
{i7n = ai • • • an} einen endlichen Grenzwert ungleich Null besitzt. oo
b) Die Reihe Y ln(l +
CXn) n i i t IcXn
I < 1 konvergiert absolut genau dann, wenn die
n=l oo
Reihe Y Oin absolut konvergiert. n=l
H i n w e i s : Vgl. Beispiel 5 a).
3.2 Der Grenzwert einer Punktion
155
oo
8. Ein unendliches Produkt Y[ Sn wird konvergent genannt, wenn die Folge von n= l n
Zahlen i7„ = 1 1 6 * eineii endlichen Grenzwert 77 ungleich Null besitzt. Wir setzen *=i oo
dann 77 = H s*Zeigen Sie:
*=i oo
a) Konvergiert ein unendliches Produkt Y[ Sn, dann gilt e^ —>• 1 fiir n —>• oo. n=l oo
b) Wenn Vn £ N (e„ > 0), dann konvergiert das unendliche Produkt Y[ Cn genau n= l oo
dann, wenn die Reihe ^
In e^ konvergiert.
n= l
c) Wenn en = 1 + Qn und alle an das gleiche Vorzeiclien besitzen, dann konveroo
oo
giert das unendliches Produkt 11(1 + Q „ ) genau dann, wenn die Reihe ^
an
konvergiert. oo
9. a) Bestimmen Sie das Produkt JJ (1 +a;^""^). n= l oo
b) Bestimmen Sie Yl cos ^ und beweisen Sie das folgende Theorem von Viete'^'': n=l TT _
hyi + iy^'yi
2 ~
1
+ iy^ + ^y^'''
c) Bestimmen Sie die Punktion f(x) mit /(O) = 1 , f{2x) = cos X • f{x) , fix) -^ /(O) fiir x ^ 0 . Hinweis: x = 2 • | . 10. Zeigen Sie: oo
a) Sei j p ' ^ = 1+ /3n, n = 1,2,...,
und konvergiere die Reihe Yl Pn absolut, dann
"+^
n=l
existiert der Grenzwert lim 6„ = 6 G R. n—>oo oo
b) Sei ^°" = 1 + •^ + Cin, n = 1, 2 , . . . und konvergiere die Reihe ^ a „ absolut, dann gilt an '^ -^ fiir n —>• oo. oo
c) Bei der Reihe ^ n = l
oo
an gelte ^°" = 1 + J + an und die Reihe ^ a „ konvergiere ""'"•'
n = l
oo
absolut. Dann konvergiert ^ an absolut fiir p > 1 und divergiert fiir p < 1 n=l
(Gauss'scher Test auf absolute Konvergenz einer Reihe). ^"^ P. Viete (1540-1603) - franzosischer Mathematiker, einer der Begriinder der modernen symbolischen Algebra.
156
3 Grenzwerte
11. Zeigeii Sie, dass
lim ( l±^Ii±± 1 > e n—^oo
fiir jede Folge {a„} mit positiven Gliedern. Zeigeii Sie ferner, dass diese Abschatzung iiicht verbessert werdeii kanii.
Stetige Funktionen
4.1 Wichtige Definitionen und Beispiele 4.1.1 Stetigkeit einer Funktion in einem Punkt Sei / eine Funktion niit reellen Werten, die in einer Unigebung eines Punktes a € ffi definiert ist. Rein intuitiv gesprochen, ist die Funktion / in a stetig, wenn ihr Wert f{x) sich an den Wert / ( a ) , den sie im Punkt a selbst annimmt, annahert, wenn x naher an a komnit. Wir werden nun diese Beschreibung des StetigkeitsbegrifFes einer Funktion in einem Punkt prazisieren. Definition 0. Eine Funktion / ist im Punkt a stetig, wenn fiir jede Unigebung V[f{a)) ihres Wertes / ( a ) in a eine Unigebung U{a) von a existiert, deren Bild unter der Abbildung / in V(^f{a)) enthalten ist. Wir wiederholen nun die Forniulierung dieses Konzepts in logischen Synibolen zusammen niit zwei weiteren Versionen, die in der Analysis haufig eingesetzt werden. (/ ist stetig in a) := {W{f{a))3U{a)
{f{U{a)) C V{f{a))))
,
Ve>03C/(a)Va;e U(a) {\f{x) - f{a)\ < s) , V e > 0 3 ( 5 > O V a ; e K ( | a ; - a |
\f{x)-f(a)\
< s) .
Die Aquivalenz dieser Aussagen fiir Funktionen niit reellen Werten folgt aus der Tatsaclie (auf die bereits mehrfacli liingewiesen wurde), dass jede Unigebung eines Punktes eine symmetrische Unigebung dieses Punktes entlialt. Wenn man etwa zu jeder e-Umgebung y ^ ( / ( a ) ) von /(a) eine Umgebung U{a) von a wahlen kann, so dass \/x G U{a) (^\f{x) — f{a)\ < s), d.li., f(U{a)) C ^ ^ ( / ( a ) ) , dann kann man auch fiir jede Umgebung V(^f{a)) eine entsprecliende Umgebung von a wahlen. Dazu geniigt es namlich, zunachst eine e-Umgebung von /(a) mit ^ ^ ( / ( a ) ) C ^ ( / ( a ) ) zu
158
4 Stetige Funktionen
wahlen und dann das zu V^ (/(a)) entsprechende U{a) zu finden. Dann ist f{U{a))cV^_{fia))cV{fia)).
Ist daher eine Funktion ini Sinne der zweiten dieser Definitionen in a stetig, dann ist sie auch in a im Sinne der urspriinglichen Definition stetig. Das Gegenteil ist offensichtlich, so dass damit die Aquivalenz der beiden Aussagen sichergestellt ist. Wir iiberlassen dem Leser den Rest des Beweises. Um nicht von dem eigentlichen Konzept, das wir definieren wollten, nanilich der Stetigkeit in einem Punkt, abzulenken, haben wir der Einfachheit halber zu Beginn angenonimen, dass die Funktion / in einer vollstandigen Unigebung von a definiert ist. Wir betrachten nun den AUgenieinfall. Sei f : E ^ R eine Funktion mit reellen Werten, die auf einer Menge -B C ffi definiert ist und sei a ein Punkt im Definitionsbereich der Funktion. Definition 1. Eine Funktion / : _B —^ffiist im Punkt a £ E stetig, wenn es zu jeder Umgebung V[f{a)) des Wertes / ( a ) , den die Funktion in a annimmt, eine Umgebung UE{a) von a in E^ gibt, deren Bild f{UE{a)) in V{^f{a)) enthalten ist. Somit ergibt sich also: (/ :£;-!• M ist stetig in a e -B) := = {^V{f{a))3UE{a)
{f{UE{a)) C
V{f{a))))
Natiirlich kann Definition 1 auch in der oben diskutierten e-(5-Formulierung geschrieben werden. Wo numerische Abschatzungen gebraucht werden, ist dies niitzlich und sogar notwendig. Wir schreiben nun diese Versionen von Definition 1: {f : E ^Rist
stetig in a £ E) := = {ye > 03UEia)yx
e UEia) {\fix) - f{a)\ < e))
oder {f : E ^Rist stetig in a £ E) := = (Ve > 03(5 > OVa; e B (Ix - a| < (5 ^ \f(x) - f{a)\ < e)) . Wir untersuchen nun das Konzept der Stetigkeit einer Funktion in einem Punkt detailliert. 1*^. Ist a ein isolierter Punkt, d.h. kein Haufungspunkt von E, dann gibt es eine Umgebung U{a) von a, die auBer a keine Punkte von E enthalt. In diesem Fall ist UE{a) = a und daher f{UE{a)) = / ( a ) C V{f{a)) fiir jede Umgebung Vif{a)\. Daher ist eine Funktion offensichtlich in jedem isolierten Punkt ihres Definitionsbereichs stetig. Dies ist jedoch ein entarteter Fall. ^ Wir erinnern daran, dass Usia) = E Cl U{a)
4.1 Wichtige Definitionen und Beispiele
159
2°. Der Hauptteil des Konzepts der Stetigkeit beschaftigt sich daher mit dem Fall, dass a £ E ein Haufungspunkt von E ist. Aus Definition 1 ist klar, dass (/ : -E ^ M ist stetig in a G E , wobei a ein Haufungspunkt von E ist) <=> ^ (
lim
f{x)=f{a)).
E3x^a
Beweis. Ist a ein Haufungspunkt von E, dann ist die Basis E ^ x ^ a aus punktierten Umgebungen tfe(a) = UE{a) \ a von a definiert. Ist / in a stetig, dann lasst sich eine Umgebung UE{a) fiir die Umgebung V[f{a)) finden, so dass f{UE{a)) C ^ ( / ( a ) ) und gleichzeitig erhalten wir, dass f{UE{a.)) C y ( / ( a ) ) . Nach der Definition des Grenzwertes ist daher lim f{x) = f{a). EBx^a
Wissen wir andererseits, dass
lim f{x)
= / ( a ) , dann konnen wir zu
EBx^a
gegebener Umgebung V[f{a)) eine punktierte Umgebung tfe(a) finden, so dass f{tjE{a)) C V{f{a)). Da aber / ( a ) e U ( / ( a ) ) , gilt ebenso /([/^(a)) C V{^f{a)). Nach Definition 1 bedeutet dies, dass f in a £ E stetig ist. D 3*^. Da die Gleichung
lim f{x) = f{a) auch in der Form lim E3x^a
f(x) = f( ^ '
lim
•' ^E3x^a
x) '
geschrieben werden kann, gelangen wir zu der niitzlichen Folgerung, dass die stetigen und nur die stetigen Funktionen (Operationen) mit der Operation der Grenzwertbildung in einem Punkt kommutieren. Dies bedeutet, dass die Zahl / ( a ) , die wir durch Ausfiihren der Operation / auf die Zahl a erhalten, so genau wie gewiinscht durch die Werte angenahert werden kann, die wir durch Anwendung der Operation / auf Werte x erhalten, die a mit geeigneter Genauigkeit annahern. 4°. Da fiir a e -B die Umgebungen UE{a) von a eine Basis Ba bilden (ob a ein Haufungspunkt oder ein isolierter Punkt in E ist), ist Definition 1 zur Stetigkeit einer Funktion im Punkt a aquivalent zur Aussage, dass die Zahl / ( a ) - der Wert der Funktion in a - der Grenzwert der Funktion auf dieser Basis ist, d.h., (/ : £; ^ M ist stetig in a £ £;) <^ (lim/(a;) = /(a)) . 5*^. Existiert lim/(a;), dann merken wir an, dass dieser Grenzwert notwendigerweise /(a) sein muss, da a € UE{a) fiir jede Umgebung UE{a)Somit ist die Stetigkeit einer Funktion / : _E ^ M in einem Punkt a G E aquivalent zur Existenz des Grenzwertes dieser Funktion auf der Basis Ba von Umgebungen (nicht punktierten Umgebungen) UE{a) von a G E.
160
4 Stetige Funktionen Somit: (/ : £; ^ M ist stetig in a e -B) <^ (31im/(a;)) .
6*^. Nach dem Cauchyschen Kriterium fiir die Existenz eines Grenzwertes konnen wir nun sagen, das eine Funktion in einem Punkt a G E genau dann stetig ist, wenn fiir jedes e > 0 eine Umgebung UE{a) von a in E existiert, auf der die Oszillation a;(/; UE{a)) der Funktion kleiner als e ist. Definition 2. Die Gr6i3e uj{f;a) = lim uj(^f;U^{a))
(wobei U^{a) die 6-
5—)-+0
Umgebung von a in _E ist) wird die Oszillation von f : E ^ W in a genannt. Formal gesehen ist das Symbol uj{f;X) bereits in Gebraucli; es bezeichnet die Oszillation der Funktion auf der Menge X. Wir werden jedoch niemals die Oszillation einer Funktion auf einer Menge betracliten, die nur aus einem einzigen Punkt besteht (sie ware offensiclitlich gleicli Null); daher bezeichnet das Symbol uj{,f; a), wobei a ein Punkt ist, die eben in Definition 2 definierte Oszillation in einem Punkt. Die Oszillation einer Funktion auf einer Teilmenge einer Menge iibersteigt nicht die Oszillation auf dieser Menge selbst, so dass uj[f;U^{a)) eine nicht anwaclisende Funktion von d ist, wenn wir d verkleinern. Da sie nicht negativ ist, besitzt sie entweder einen endlichen Grenzwert fiir 6 -^ +0 oder es gilt w(/; U^{a)) = +0O fiir jedes S > 0.1m letzten Fall setzen wir natiirhcherweise uj{,f; a) = +00. 7*^. Mit Hilfe von Definition 2 konnen wir das in 6° Ausgefiihrte wie folgt zusammenfassen: Eine Funktion ist genau dann in einem Punkt stetig, wenn ihre Oszillation in diesem Punkt Null ist. Wir wollen das nochmals deutlich machen: (/ : £; ^ M ist stetig in a £ £;) <^ (w(/; a) = O) . Definition 3. Eine Funktion / : _E —>• M ist auf der Menge E stetig, wenn sie in jedem Punkt von E stetig ist. Die Menge aller stetigen Funktionen mit reellen Werten, die auf einer Menge E definiert sind, wird mit C{E; M) oder in Kurzform mit C{E) bezeichnet. Wir haben nun das Konzept der Stetigkeit einer Funktion untersucht und wollen nun einige Beispiele betrachten. Beispiel 1. Sei f : E ^ R eine konstante Funktion. Dann ist / £ G{E). Dies ist offensichtlich, da f{E) = c C V{c) fiir jede Umgebung V{c) von c £ M. Beispiel 2. Die Funktion f{x) = x ist auf M stetig. Denn wir erhalten fiir jeden Punkt XQ £ ffi, dass |/(a;) — /(a;o)| = |a; — XQ] < e, wenn |a; — XQ] < 5 = e.
4.1 Wichtige Definitionen und Beispiele
161
Beispiel 3. Die Funktion f{x) = sin a; ist auf ffi stetig. Tatsachlich erhalten wir fiir jeden P u n k t XQ £ ffi: X +
sm X — sm XQ
.
XQ
X —
2 cos — - — sm
XQ
<
2
X —
< 2 sm •
XQ
< 2
X —
XQ
\x — XQ\ < e
vorausgesetzt, dass |a; — XQ] < 5 = e. Hierbei haben wir die Ungleichung |sina;| < \x\ eingesetzt, die wir in Beispiel 9 in P a r a g r a p h d Absatz 3.2.2 gezeigt haben. Beispiel 4- Die Funktion f{x) = cos a; ist auf M stetig, denn wir erhalten wie im vorigen Beispiel fiir jeden P u n k t XQ £ ffi: „ c o s X — COS
XQ
.
X +
XQ
.
X —
XQ
2 sm — - — sm — - — < X —
< 2 sm •
XQ
< Ix — a;o| < e
vorausgesetzt, dass |a; — XQ] < S = S. Beispiel 5. Die Funktion f{x) = a^ ist auf M stetig, denn nach Eigenschaft 3) der Exponentialfunktion (vgl. Beispiel 10a in P a r a g r a p h d in 3.2.2) gilt in jedem P u n k t XQ £ ffi: lim a* = a'"" , was, wie wir wissen, zur Stetigkeit der Funktion a* im P u n k t x aquivalent ist. Beispiel 6. Die Funktion f{x) = log„ x ist in jedem P u n k t XQ ihres Definitionsbereichs M-i- = {a; £ M| x > 0} stetig, denn nach Eigenschaft 3) des Logarithmus (vgl. Beispiel 10b in P a r a g r a p h d in 3.2.2) gilt in jedem P u n k t xo £ ffi+: hm log„ X = log„ XQ , was zur Stetigkeit der Funktion log„ x im P u n k t XQ aquivalent ist. Sei nun e > 0 gegeben. Wir wollen versuchen, eine Umgebung C/K_,.(XO) des P u n k t e s XQ ZU finden, so dass |log„x-log„xo| < e in jedem P u n k t x £ C/K_,.(XO). Diese Ungleichung ist zur Ungleichung - e < loga — < e XQ
aquivalent. Zur Klarheit nehmen wir a > 1 an. Dann ist diese Ungleichung aquivalent zu
162
4 Stetige Funktionen XQU
< X < Xoa
Das oflFene Intervall ]xoa~'^,xoa'^[ ist die gesuchte Umgebung des Punktes XQ- Wir wollen festhalten, dass diese Umgebung sowohl von e als auch vom Punkt XQ abhangig ist, ein Phanomen, das in den Beispielen 1-4 nicht auftrat. Beispiel 7. Jede Folge / : N ^ ffi ist eine Funktion, die auf der Menge N der natiirlichen Zahlen stetig ist, da jeder Punkt von N isoliert ist.
4.1.2 Unstetigkeitsstellen Urn uns in der Beherrschung des Konzepts der Stetigkeit sicherer zu niachen, werden wir erklaren, was mit einer Funktion in einer Umgebung eines Punktes geschieht, an dem sie nicht stetig ist. Definition 4. Ist die Funktion / : _E —>•ffiin einem Punkt in E nicht stetig, dann wird dieser Punkt eine Unstetigkeitsstelle oder einfach eine Unstetigkeit von / genannt. Wenn wir die Negation der Aussage „die Funktion / : _E ^ M ist im Punkt a G E stetig" konstruieren, erhahen wir den folgenden Ausdruck fiir die Definition der Aussage, dass a eine UnstetigkeitssteUe von / ist: (a G E ist eine UnstetigkeitssteUe von / ) := = {3V{f{a)) yUsia) 3x £ [/^(a) (/(x) ^ V{f{a))))
.
Anders formuhert, so ist a £ E eine UnstetigkeitssteUe der Funktion f : E ^ R, wenn es eine Umgebung U(/(a)) des Wertes / ( a ) , den die Funktion in a annimmt, gibt, so dass es in jeder Umgebung UE{a) von a in E einen Punkt X gibt, dessen Bild nicht in V(^f{a)) Uegt. In e-(5-Notation nimmt diese Definition die folgende Form an: 3 e > 0 V ( 5 > 0 3 a ; e E {\x - a\
- f(a)\ > e) .
Wir woUen einige Beispiele betrachten. Beispiel 8. Die Funktion f{x) = sgnx ist konstant und daher in der Umgebung jedes Punktes a € M, der von 0 verschieden ist, stetig. In jeder Umgebung von 0 ist ihre OsziUation aber gleich 2. Daher ist 0 eine UnstetigkeitssteUe fiir sgna;. Wir bemerken, dass diese Funktion einen linksseitigen Grenzwert lim sgnx = — 1 und einen rechtsseitigen Grenzwert lim sgna; = 1 besitzt. a:->-0
a:->+0
Diese Grenzwerte sind jedoch erstens verschieden und zweitens ist keiner von ihnen gleich dem Wert von sgnx im Punkt 0, namlich sgnO = 0. Dies ist ein direkter Beweis dafiir, dass 0 fiir diese Funktion eine Unstetigkeitsstelle ist.
4.1 Wichtige Definitionen und Beispiele
163
Beispiel 9. Die Funktion f{x) = |sgna;| besitzt fiir a; —>• 0 den Grenzwert lim Isgna;! = 1, aber /(O) = IsgnOl = 0, so dass lim f{x) ^ /(O) und 0 daher eine Unstetigkeitsstelle Wir merken jedoch der Funktion ini P u n k t ware, d.li., wir wiirden
der Funktion ist. an, dass in diesem Fall eine Veranderung des Wertes 0 auf 1 zu einer Funktion fiihren wiirde, die in 0 stetig die Unstetigkeit heben.
D e f i n i t i o n 5. Existiert in einer Unstetigkeitsstelle a G E der Funktion f : E ^ R eine stetige Funktion / : _E ^ K, so dass /1 E\a f L,, , dann wird a eine hebbare Unstetigkeit
der Funktion / genannt.
Somit ist eine hebbare Unstetigkeit dadurcli charakterisiert, dass der Grenzwert lim f{x) = A existiert, aber A ^ f{a). Somit geniigt es, -BBS—>a
f{x)
fiir X G E , X y^ a
/(a;) A
fiir X = a
zu setzen, um eine Funktion / : i? —>• ffi zu erhalten, die in a stetig ist. Beispiel
10. Die Funktion sin - , fiir a; 7^ 0 ,
fi^) 0 ,
fiir X = 0
ist in 0 unstetig. Sie hat noch nicht einmal einen Grenzwert fiir a; —>• 0, da, wie in Beispiel 5 in Absatz 3.2.1 gezeigt, lim sin i nicht existent ist. Der G r a p h x-^0
der Funktion ist in Abb. 4.1 angedeutet.
Abb. 4.1. Die Beispiele 8, 9 und 10 erklaren die folgende Terminologie.
164
4 Stetige Funktionen
D e f i n i t i o n 6. Der P u n k t a £ E wird eine Unstetigkeit erster Art der Funktion f : E ^ W genannt, wenn die folgenden Grenzwerte^ lim
f{x)=:f{a
— 0)
und
EBx^a—O
lim
f (x) =: f (a + 0)
EBx^a+0
existieren und zuniindest einer von ihnen ungleich dem Wert / ( a ) , den die Funktion in a annimnit, ist. D e f i n i t i o n 7. 1st a £ E eine Unstetigkeitsstelle der Funktion / : i? —>• ffi und existiert zuniindest einer der beiden Grenzwerte in Definition 6 nicht, dann wird a eine Unstetigkeit der zweiten Art genannt. Damit ist gemeint, dass jede Unstetigkeitsstelle, die nicht eine Unstetigkeit erster Art ist, automatiscli eine Unstetigkeit zweiter Art ist. Wir woUen zwei weitere klassisclie Beispiele vorstellen. Beispiel
11. Die Funktion
{
1 , fiir a; e Q , 0 , fiir a; e K \ Q
wird Dirichlet-Funktion^ genannt. Diese Funktion ist in jedem P u n k t unstetig und offensiclitlich sind alle diese Unstetigkeiten zweiter Art, da jedes Intervall sowohl rationale wie irrationale Zalilen entlialt. Beispiel
12. Wir betrachten die
{
Riemann-Funktion*
- , fiir X = — G Q , wobei m, n teilerfremd sind. 0 , fiir a; e K \ Q .
Wir merken an, dass in jedem P u n k t a € M, jeder Zahl N £ N und jeder besclirankten Umgebung U{a) von a diese nur eine endliclie Anzahl rationaler Zalilen ^ , m £ Z, n e N niit n < N enthalt. Durch Einschrankung der Umgebung lasst sich somit erreichen, dass die Nenner aller rationalen Zahlen in der Umgebung (aufier moglicherweise fiir Ist a eine Unstetigkeit, dann muss a ein Haufungspunkt in E sein. Es kann jedocli vorkomnien, dass alle Punkte von E in einer Umgebung von a auf einer Seite von a liegen. In diesem Fall wird in dieser Definition nur einer der Grenzwerte beriicksiclitigt. P. G. Dirichlet (1805-1859) - groflartiger deutscher Mathematiker, ein Analyst, der nach dem Tod von Gauss im Jahre 1855 den Lehrstuhl an der Universitat in Gottingen iibernahm. B. F. Riemann (1826-1866) - hervorragender deutscher Mathematiker, dessen bahnbrechende Arbeiten die Grundlagen fiir ganze Gebiete moderner Geometrie und Analysis legten.
4.2 Eigenschaften stetiger Funktionen
165
den Punkt a selbst, falls a £ Q) grofier als N sind. Somit gilt in jedem Punkt X e ij{a), dass |7^(a;)| < l/N. Damit haben wir gezeigt, dass lim n{x) = 0 in jedem Punkt a £ M \ Q. Daher ist die Rieniann-Funktion in jedem irrationalen Punkt stetig. In den verbleibenden Punkten, d.li. in den Punkten a; e Q, ist die Funktion unstetig, mit Ausnahme vom Punkt a; = 0. Alle diese Unstetigkeiten sind Unstetigkeiten erster Art.
4.2 Eigenschaften stetiger Funktionen 4.2.1 Lokale Eigenschaften Lokale Eigenschaften von Funktionen sind die, die durch das Verhalten der Funktion in einer beliebig kleinen Umgebung eines Punktes in seinem Definitionsbereicli bestimmt werden. Somit cliarakterisieren lokale Eigenschaften das Verhalten einer Funktion in jeder Grenzwertbetrachtung, wenn das Argument der Funktion gegen den fraglichen Punkt strebt. Beispielsweise ist die Stetigkeit einer Funktion in einem Punkt ihres Definitionsbereichs offensichtlich eine lokale Eigenschaft. Wir werden nun die wichtigsten lokalen Eigenschaften stetiger Funktionen vorsteUen. Satz 1. Sei f : E ^ W eine Funktion, die im Punkt a G E stetig ist. Dann gelten die folgenden Aussagen: f. Die Funktion f : E ^ R ist in einer Umgebung Usia) von a beschrdnkt. ^. 1st f{a) 7^ 0, dann besitzen in einer Umgebung Usia) alle Werte der Funktion dasselbe Vorzeichen wie f{a). ^. Ist die Funktion g : UE{a) ^ K m einer Umgebung von a definiert und ist sie wie f stetig in a, dann sind die folgenden Funktionen in einer Umgebung von a definiert und in a stetig: a) if + 9){x) ••= f{x)+g{x), b) {f •9){x) —fix)
-gix),
c) (f )(2;) •= JM (vorausgesetzt, dass g{a) ^ 0 / 4^. Ist die Funktion g :¥ ^M. in einem, Punkt b G Y stetig, ist f stetig in a und gilt, dass f : E ^ Y mit f{a) = b, dann ist die verkettete Funktion (g o / ) auf E definiert und in a stetig. Beweis. Zum Beweis dieses Satzes geniigt es, zu wiederholen (vgl. Abschnitt 4.1), dass die Stetigkeit der Funktionen / oder g in einem Punkt a
166
4 Stetige Funktionen
ihres Definitionsbereichs dazu aquivalent ist, dass der Grenzwert dieser Funktionen auf der Basis Ba von Umgebungen von a existiert und mit den Werten der Funktionen in a iibereinstimmt: lim/(a;) = / ( a ) , lmig{x) = g{a). Somit folgen die Behauptungen 1*^, 2^ und 3° in Satz 1 unmittelbar aus der Definition der Stetigkeit einer Funktion in eineni Punkt und den entsprechenden Eigenschaften des Grenzwertes einer Funktion. Die einzige notwendige Erklarung bedarf der Beweis, dass der Bruch Aff in einer Umgebung UE{a) von a definiert ist. Laut Annahme ist g{a) ^^ 0 und nach Behauptung 2° des Satzes existiert in jedem Punkt, in dem g{x) ^ 0, eine Umgebung UE{a), d.h., A ^ ist in UE{a) definiert. Die Behauptung 4° in Satz 1 ist eine Konsequenz des Satzes zum Grenzwert einer verketteten Funktion, auf Grund dessen 1™(5 ° /)(a;) = limff(2/) = 9{b) = 5(/(a)) = (ff ° f){a) , was zur Stetigkeit von (g o / ) in a aquivalent ist. Um den Satz jedoch auf den Grenzwert einer verketteten Funktion anwenden zu konnen, miissen wir sicherstellen, dass fiir jedes Element Uyib) der Basis Bf) ein Element UE{a) der Basis Ba existiert, so dass f{UE{a)) C Uyib). Bei vorgegebener Umgebung U{b) = U[f{a)) gibt es nach der Definition der Stetigkeit von f : E ^ Y ira Punkt a eine Umgebung UE{a) von a in E, so dass f{UE{a)) C U{f{a)). Sei Uyih) =Y r^ U{h). Da der Wertebereich von / in y enthalten ist, erhalten wir f{UE{a)) C F fl C/(/(a)) = Uyib) und wir haben damit die Anwendung des Satzes auf den Grenzwert einer verketteten Funktion gerechtfertigt. D 1. Ein algebraisches Polynom P{x) = aox" + aix"~ + • • • + an ist eine stetige Funktion in ffi. Tatsachlich folgt durch Induktion aus 3*^ in Satz 1, dass die Summe und das Produkt jeder endlichen Anzahl von Funktionen, die in einem Punkt stetig sind, selbst wieder in diesem Punkt stetig ist. Wir haben in den Beispielen 1 und 2 in Abschnitt 4.1 nachgewiesen, dass die konstante Funktion und die Funktion f{x) = a; in K stetig sind. Daraus folgt, dass die Funktion ax"^ = a • a; - . . . • a; stetig ist und folghch ebenso das Polynom P{x). m Faktoren
Beispiel 2. Eine rationale Funktion R{x) = TJQ- - ein Quotient aus Polynomen - ist iiberall da, wo es definiert ist, stetig, d.h., wo Q{x) ^ 0 ist. Dies folgt aus Beispiel 1 und Behauptung 3° in Satz 1. Beispiel 3. Die Verkettung einer endlichen Anzahl stetiger Funktionen ist in jedem Punkt ihres Definitionsbereichs stetig. Dies folgt durch Induktion aus Behauptung 4° in Satz 1. Daher ist beispielsweise die Funktion e**'" (in|cosa:|) in ganz M stetig, mit Ausnahme der Punkte f (2fc -1-1), k £ Z, in denen sie nicht definiert ist.
4.2 Eigenschaften stetiger Funktionen
167
4.2.2 Globale Eigenschaften stetiger Funktionen Eine globale Eigenschaft einer Funktion ist intuitiv eine Eigenschaft, die den ganzen Definitionsbereich der Funktion betrifft. S a t z 2. (Der Zwischenwertsatz von Bolzano-Cauchy). Nimmt eine auf einem abgeschlossenen Intervall stetige Funktion in den Endpunkten des Intervalls Werte mit unterschiedlichem Vorzeichen an, dann existiert ein Punkt im Intervall, in dem sie den Wert 0 annimmt. Dieser Satz nimmt mit logischen Symbolen die folgende Form an:^ ( / e C[a, b] A / ( a ) • f{b) < 0) ^ 3c e [a, b] (/(c) = O) . Beweis. Wir wollen das Intervall [a, b] halbieren. Nimmt die Funktion im P u n k t der Halbierung niclit den Wert 0 an, dann muss sie in einem der beiden Teilintervalle in den E n d p u n k t e n unterscliiedliche Vorzeichen besitzen. In diesem Intervall wiederholen wir den Vorgang, d.h., wir wiederholen die Halbierung. So treffen wir entweder auf einen P u n k t c € [a, b] mit / ( c ) = 0 oder wir erhalten eine Folge {/„} gescliachtelter, abgeschlossener Intervalle, deren Lange gegen Null gelit und in deren E n d p u n k t e n / Werte mit unterscliiedliclien Vorzeichen annimmt. Fiir diesen Fall existiert nach dem Satz zur Intervallschachtelung ein eindeutiger P u n k t c € [a, b], den alle Intervalle gemeinsam haben. Nach unserer Konstruktion erhalten wir zwei Folgen von E n d p u n k t e n der Intervalle {x'„} und { x " } , so dass f{x'^) < 0 und /(a;") > 0, wahrend gleichzeitig lim x'^ = lim a;" = c. Nach den Eigenschaften eines Grenzwern—)-oo
n—>oo
tes und der Definition der Stetigkeit erhalten wir, dass lim f{x')
= /(c) < 0
n—>oo
und lim f{x'^) = f{c) > 0. Somit ist / ( c ) = 0 .
D
n—)-oo
A n m e r k u n g e n zu Satz 2 1°. Der Beweis des Satzes liefert einen sehr einfachen Algorithmus zum Auffinden einer Losung der Gleichung f{x) = 0 auf einem Intervall, in dessen E n d p u n k t e n eine stetige Funktion f{x) Werte mit unterschiedlichen Vorzeichen annimmt. 2°. Satz 2 stellt somit sicher, dass ein stetiger Ubergang von positiven zu negativen Werten, ohne unterwegs den Wert Null anzunehmen, unmoglich ist. 3°. Man sollte mit intuitiven Anmerkungen wie in Anmerkung 2*^ vorsichtig sein, da sie normalerweise mehr annehmen, als sie aussagen. Betrachten Sie ^ Wir erinnern daran, dass C{E) die Menge aller stetigen Funktionen auf der Menge E bezeichnet. Fiir E = [a,b] schreiben wir oft in Kurzform C[o, 6] anstelle von C([a,b]).
168
4 Stetige Funktionen
beispielsweise die Funktion, die auf dem abgeschlossenen Intervall [0,1] gleich — 1 ist und gleich 1 auf dem abgeschlossenen IntervaU [2,3]. Es ist klar, dass diese Funktion auf ihrem Definitionsbereich stetig ist und Werte mit unterschiedlicheni Vorzeichen annimnit, jedoch nienials den Wert 0. Diese Anmerkung zeigt, dass die in Satz 2 formulierte Eigenschaft einer stetigen Funktion tatsachlich das Ergebnis einer gewissen Eigenschaft des Definitionsbereichs ist (namlich, wie unten klar wird, die Eigenschaft zusammenhdngend zu sein). KoroUar zu Satz 2. Ist die Funktion cp auf einem offenen IntervaU stetig und nimmt sie in den Punkten a und b die Werte (p{a) = A und (p{b) = B an, dann gibt es zu jeder Zahl C zwischen A und B einen Punkt c zwischen a und b in dem (p{c) = C. Beweis. Das abgeschlossene Intervall / mit den Endpunkten a und b liegt innerhalb des offenen Intervalls, auf dem ip definiert ist. Daher ist die Funktion f{x) = ip{x)-C definiert und auf / stetig. Da /(a) • f{b) = {A-C){B-C) < 0, folgt aus Satz 2, dass es einen Punkt c zwischen a und b gibt, in dem /(c) = (^(c) - C = 0. D Satz 3. (Der WeierstraBsche Extremwertsatz). Eine auf einem abgeschlossenen Intervall stetige Funktion ist auf diesem Intervall beschrankt. Aufierdem gibt es einen Punkt im Intervall, in dem die Funktion ihr Maximum und einen Punkt, in dem sie ihr Minimum annimmt. Beweis. Sei / : -E ^ M eine stetige Funktion auf dem abgeschlossenen Intervall E = [a,b]. Nach den lokalen Eigenschaften einer stetigen Funktion (vgl. Satz 1) existiert zu jedem Punkt x G E eine Umgebung U{x), so dass die Funktion auf der Menge UE{X) = E r\U{x) beschrankt ist. Die Menge derartiger Umgebungen, die so fiir alle x G E konstruiert werden, bilden eine Uberdeckung des abgeschlossenen Intervalls [a, b] durch offene Intervalle. Nach dem Satz zur endlichen Uberdeckung lasst sich ein endliches Mengensystem U{xi),..., U{xn) offener Intervalle herausgreifen, das das abgeschlossene IntervaU [a, b] iiberdeckt. Da die Funktion auf jeder Menge EfMJ{xk) = Usixk) beschrankt ist, d.h., rrik < f{x) < Mf. mit reellen Zahlen rrik und M^ und X € Usixk), erhalten wir: m i n j m i , . . . ,m„} < f{x) < m a x { M i , . . . , Mjv} in jedem Punkt x G E = [a,b]. Somit ist nachgewiesen, dass f{x) auf [a,b] beschrankt ist. Nun sei M = sup f{x). Angenommen, f{x) < M in jedem Punkt x G E. xeE Dann ist die stetige Funktion M — f{x) auf E nirgendwo NuU, obwohl (nach der Definition von M) sie Werte annimmt, die beliebig nahe an 0 kommen. Daraus folgt, dass die Funktion M-fix) ^^^ '^^'" einen Seite aufgrund der lokalen Eigenschaften stetiger Funktionen auf E stetig ist und auf der anderen
4.2 Eigenschaften stetiger Funktionen
169
Seite nicht auf E beschrankt ist, was im Widerspruch zu der eben bewiesenen Eigenschaft einer stetigen Funktion auf einem abgeschlossenen Intervall steht. Somit muss es einen Punkt XM G [a, b] geben, in dem f{xM) = M gilt. Ganz ahnlich beweisen wir, indeni wir m = inf f{x) und die Hilfsfunktion f{J)-m betrachten, dass es einen Punkt Xm G [a, &] gibt, in dem f{xm) = "in. U Wir merken an, dass beispielsweise die Funktionen fi{x) = x und f2{x) = ^ auf dem offenen Intervall E = (0,1) stetig sind. Aber / i besitzt weder ein Maximum nocli ein Minimum auf E und f^ ist auf E unbesclirankt. Dalier beinhalten die in Satz 3 formulierten Eigenschaften einer stetigen Funktion eine Eigenschaft des Definitionsbereichs, namlich die Eigenschaft, dass bei jeder Uberdeckung von E durch offene Intervalle eine endliche Anzahl von Mengen zur Uberdeckung ausreicht. Von nun an werden wir solche Mengen als kompakt bezeichnen. Bevor wir zum nachsten Satz iibergehen, woUen wir eine Definition treffen. Definition 1. Eine Funktion / : _E —>•ffiist auf einer Menge i? C ffi gleichmdfiig stetig, wenn zu jedem e > 0 ein 6 > 0 existiert, so dass \f{xi) — ,f{x2)\ < s fiir alle Punkte a;i,a;2 € E mit \xi — X2\ < S. In Kurzform: (/ : -E ^ M ist gleichmaBig stetig ) := = (Ve>03(5>OVa;i G Eyx2 G E {\xi - X2\ < 6 ^ ^\f{x^)-fix2)\<e)). Wir woUen nun das Konzept der gleichmaBigen Stetigkeit untersuchen. 1°. Ist eine Funktion auf einer Menge gleichmaBig stetig, dann ist sie in jedem Punkt der Menge stetig. Tatsachlich geniigt es, in der eben vorgenommenen Definition xi = x und a;2 = a zu setzen und wir erkennen, dass die Definition der Stetigkeit einer Funktion / : i? —>• M im Punkt a G E erfiillt ist. 2*^. Im Allgemeinen folgt aus der Stetigkeit einer Funktion nicht ihre gleichmaBige Stetigkeit. Beispiel 4- Die Funktion f{x) = sin^, auf die wir bereits oft trafen, ist auf dem offenen Intervall ]0,1[= E stetig. Die Funktion nimmt jedoch in jeder Umgebung von 0 in der Menge E beide Werte —1 und 1 an. Daher ist die Bedingung |/(a;i) — f{x2)\ < e fiir e > 2 nicht erfiillt. In diesem Zusammenhang ist es hilfreich, die Negierung der Eigenschaft der gleichmaBigen Stetigkeit einer Funktion explizit zu formulieren: (/ : -E ^ M ist nicht gleichmaBig stetig) := = (3e > 0V(5> 0 3x1 £ E3x2 G E {\xi - X2\ < S A A\fix^)-f{x2)\>e))
.
170
4 Stetige Funktionen
Dieses Beispiel bringt den Unterschied zwischen Stetigkeit und gleichmafiiger Stetigkeit einer Funktion auf einer Menge intuitiv zuni Ausdruck. Urn auf die Stelle in der Definition der gleichmaBigen Stetigkeit aufmerksam zu machen, die fiir diesen Unterschied verantwortlich ist, formulieren wir ausfiihrlich, was es fiir eine Funktion / : i? —>• K bedeutet, auf E stetig zu sein: (/ : £; ^ M ist stetig auf £; := = (Vae £ ; V e > 0 3 ( 5 > O V a ; e £ ; ( | a ; - a |
\f{x) - f{a)\ < s)) .
Dabei wird die Zahl S mit Kenntnis des Punktes a G E und der Zahl e gewahlt, so dass sich also fiir ein festes e die Zahl S von einem Punkt zum anderen andern kann. Dies ist der Fall bei der Funktion sin^, die wir in Beispiel 1 betrachtet haben oder bei den Funktionen log^ x und a*, die wir auf ihrem ganzen Definitionsbereich untersucht haben. Bei der gleichmaBigen Stetigkeit wird bei alleiniger Kenntnis von e > 0 die Moglichkeit garantiert, ein 6 zu finden, so dass aus \x — a\ < 6 folgt, dass |/(a;) - /(a)I < s fiir alle x G E und a G E. Beispiel 5. Ist die Funktion / : i? —>•ffiin jeder Umgebung eines festen Punktes XQ G E unbeschrankt, dann ist sie nicht gleichmafiig stetig. Tatsachlich gibt es in diesem FaU fiir jedes (5 > 0 Punkte xi und x^ in jeder |-Umgebung von XQ, SO dass \f{xi) — f{x2)\ > 1, obwohl \xi — X2\ < S. Dies ist der Fall bei der Funktion f{x) = ^ auf der Menge M\0 fiir XQ = 0. Dasselbe gilt fiir die Funktion log^ x, die auf der Menge der positiven Zahlen definiert ist und in einer Umgebung von a;o = 0 unbeschrankt ist. Beispiel 6. Die Funktion f{x) = x'^, die auf ffi stetig ist, ist auf ffi nicht gleichmafiig stetig. Tatsachlich erhalten wir in den Punkten x'^ = \/n + 1 und a;" in. n e N, dass j[x[^ = n + 1 und /(x") = n, so dass /(a;^) — /(a;") = 1. Aber lim ( v n + l — ^Jn) = lim n->oo
n->oo ^n
,
—= 0, + 1+
^/n
SO dass es fiir jedes (5 > 0 Punkte x',^ und a;" gibt, so dass \x',^ — a;"| < 6, aber dennoch f{x'^) - f{x'^) = 1. Beispiel 7. Die Funktion f{x) = sin(a;^), die auf M stetig und beschrankt ist, ist auf ffi nicht gleichmafiig stetig, denn wir erhalten in den Punkten x'^ = ^\{n + 1) und a;" = \f\n, n £ N, dass |/(a;^) — /(a;")| = 1, wahrend lim \x'^ ~ x'n\ = 0 . n—)-oo
Nach dieser Diskussion des Konzepts der gleichmafiigen Stetigkeit einer Funktion und dem Vergleich von Stetigkeit und gleichmafiiger Stetigkeit wissen wir nun den folgenden Satz zu schatzen.
4.2 Eigenschaften stetiger Funktionen
171
Satz 4. (Der Satz von Heine zur gleichmafiigen Stetigkeit). Eine auf einem abgeschlossenen Intervall stetige Funktion ist auf diesem Intervall auch gleichmdfiig stetig. Wir bemerken, dass dieser Satz in der Literatur auch als Cantors Satz bezeichnet wird. Um ungebrauchliche Terniinologie zu vernieiden, warden wir die iiblichere Bezeichnung Satz von Heine bei spateren Verweisen benutzen. Beweis. Sei f : E ^ R eine gegebene Funktion, E = [a,b] und / e C(E). Da / in jedem Punkt x G E stetig ist, folgt (vgl. 6° in Absatz 4.1.1), dass wir zu vorgegebenem e > 0 eine (5-Umgebung U^{x) von x linden konnen, so dass die Oszillation uj{f;U^{x)) von / aul der Menge U^{x) = E Ci U^{x), die aus den Punkten im Delinitionsbereich E besteht, die in U^{x) liegen, kleiner als s ist. Zu jedem Punkt x £ E konstruieren wir eine Unigebung U^{x) mit dieser Eigenschaft. Die Gr6i3e 6 kann sich dabei von einem Punkt zum anderen andern, so dass es genauer ware, wenn auch umstandhcher, die Unigebung durch das Symbol U^^ ''{x) zu bezeichnen. Da aber das Symbol an sich durch den Punkt x bestimmt wird, konnen wir die folgende kiirzere Schreibweise einfiihren: U{x) = U^^''\x) und V{x) = C/*(*)/^(a;). Die oflFenen Intervalle V{x), x G E iiberdecken zusammen das abgeschlossene Intervall [a,b], so dass wir nach dem Satz zur endhchen Uberdeckung eine endliche Uberdeckung V{xi),..., V{xn) herausgreifen konnen. Sei S = min {^S{xi),..., ^(5(a;„)}. Wir werden zeigen, dass \f{x') — f{x")\ < e fiir aUe Punkte x', x" £ E mit \x' — x"\ < 6. Da das System der offenen IntervaUe V{xi),... ,V{xn) die Menge E iiberdeckt, existiert ein Intervall V{xi) in diesem System, das x' enthalt, d.h., \x' — Xi\ < ^6{xi). Dann ist aber \x" - Xi\ < \x' -x"\ Folglich ist x',x"
+ \x' -Xi\<6+
-6{xi) < -6{xi) + -d{xi) = d{xi) .
e U§''"''{xi) = E DU^^^'-Hxi) und somit \f{x') - f{x")\
<
Die oben gegebenen Beispiele zeigen, dass der Satz von Heine eine bestimmte Eigenschaft des Definitionsbereichs der Funktion entscheidend ausnutzt. Aus dem Beweis wird wie in Satz 3 deutlich, dass diese Eigenschaft die ist, dass wir aus jeder Uberdeckung von E aus den Umgebungen ihrer Punkte eine endliche Uberdeckung herausgreifen konnen. Nun, da Satz 4 bewiesen ist, woUen wir nochmals zu den friiher untersuchten Beispielen von Funktionen, die stetig sind, aber nicht gleichmaBig stetig, zuriickkommen. Wir wollen verdeutlichen, woran es liegt, dass etwa die Funktion sin(a;^), die nach dem Satz von Heine auf jedem abgeschlossenen IntervaU auf der reellen Gerade gleichmaBig stetig ist, nichtsdestotrotz auf M nicht gleichmaBig stetig ist. Der Grund dafiir ist voUstandig analog zu dem Grund, weswegen eine stetige Funktion im AUgemeinen nicht gleichmaBig stetig ist. Diesmal laden wir unsere Leser dazu ein, diese Frage selbstandig zu untersuchen.
172
4 Stetige Funktionen
Wir wenden uns nun dem letzten wichtigen Satz in diesem Abschnitt zu, dem Satz zur inversen Funktion. Wir miissen die Bedingungen bestimnien, unter denen eine Funktion mit reellen Werten auf einem abgeschlossenen Interval! eine Inverse besitzt, und die Bedingungen, unter denen diese Inverse stetig ist. Lemma 1. Eine stetige Abbildung f : E ^ M. eines abgeschlossenen Intervalls E = [a, b] auf M ist genau dann injektiv, wenn die Funktion auf [a, b] streng monoton ist. Beweis. Ist / anwachsend oder absteigend auf jeder Menge E C M., dann ist die Abbildung f : E ^ R offensichtlicli injektiv: Die Funktion nimmt in verschiedenen Punkten von E verschiedene Werte an. Daher ist die Beliauptung, dass jede stetige injektive Abbildung f:[a, &] —>-ffi einer streng monotonen Funktion entspriclit, der entscheidende Teil von Lemma 1. Wir nehmen an, dass dies falsch ist und finden daher drei Punkte a;i < a;2 < xz in [a,b], so dass f{x2) nicht zwischen f{xi) und f{xz) liegt. Dann liegt entweder f{xs) zwischen f{xi) und f{x2) oder f{xi) liegt zwischen f{x2) und f{xz). Der Deutlichkeit halber nehmen wir an, dass das Letzte der FaU ist. Nach Annahme ist / auf [a;2,xs] stetig. Daher gibt es nach dem Korollar zum Zwischenwertsatz (Satz 2) einen Punkt x[ in diesem Interval!, so dass f{x[) = f{xi). Fiir diesen Punkt in [a;2,a;3] gilt xi < x'l und gleichzeitig f{xi) = f{x[), was sich nicht mit der Injektivitat der Abbildung in Einklang bringen lasst. Der FaU, dass fixs) zwischen / ( x i ) und fix^) liegt, wird ahnlich behandelt. D Lemma 2. Jede streng monotone Funktion / : AT —>• ffi, die auf einer numerischen Menge AT C ffi definiert ist, besitzt eine Inverse f~^ : Y ^ W, die auf der Menge Y = f{X) von Werten von f definiert ist und die gleiche Art Monotonie aufY besitzt wie f auf X. Beweis. Die Abbildung f : X ^ Y = f{Y) ist surjektiv, d.h., sie ist eine Abbildung von X auf Y. Der Deutlichkeit halber gehen wir davon aus, dass / : AT —>• F auf X anwachsend ist. Dann ist Vxi e XVa;2 e A: [xi <X2^
f{xi) < f{x2)) .
(4.1)
Somit nimmt die Abbildung / : AT —>• y in unterschiedlichen Punkten unterschiedliche Werte an und ist daher injektiv. Folghch \st f : X ^ Y bijektiv, d.h., sie ist eine eins-zu-eins Abbildung zwischen X und Y. Daher ist die inverse Abbildung f~^ : Y ^ X durch die Formel x = f~^{y) mit y = f{x) definiert. Wenn wir die Definition der Abbildung /~^ : Y ^ X mit der Relation (4.1) vergleichen, gelangen wir zur Relation Vyi e rV2/2 e r {f-\vi)
< f-\v2)
^Vi<
2/2) ,
(4.2)
4.2 Eigenschaften stetiger Funktionen
173
die besagt, dass die Funktion f~^ in ihrem Definitionsbereich ebenso anwachsend ist. Der Fall, dass f : X ^ Y auf ihrem Definitionsbereich absteigend ist, wird offensichtlich ahnlich behandelt. D Wenn wir an der Stetigkeit einer zu einer Funktion niit reellen Werten inversen Funktion interessiert sind, dann ist es nach dem eben bewiesenen Lemma 2 hilfreich, die Stetigkeit monotoner Funktionen zu untersuchen. Lemma 3. Unstetigkeiten einer Funktion f : E ^ W, die auf der Menge E cM monoton ist, konnen nur Unstetigkeiten erster Art sein. Beweis. Der Deutlichkeit halber sei / nicht absteigend. Angenommen, a £ E sei eine UnstetigkeitssteUe von / . Da a kein isolierter Punkt von E sein kann, muss a ein Haufungspunkt zumindest einer der beiden Mengen E~ = {x £ E\x < a] oder i?+ = {x £ E\x > a} sein. Da / nicht absteigend ist, gilt fiir alle Punkte x G E~ , dass f{x) < f{a). Daher ist die Einschrankung f\^von f auf E~ eine nicht abnehmende Funktion, die von oben beschrankt ist. Daraus folgt dann, dass der Grenzwert hm
{f\
){x)=
hm
existiert. Der Beweis dafiir, dass der Grenzwert
f{x) =
lim
f{a-0)
f{x) = f{a + 0) existiert,
EBx^ta+O
wenn a ein Haufungspunkt von _E+ ist, ist analog. Der Fall, dass / eine nicht anwachsende Funktion ist, kann entweder durch Wiederholung der eben durchgefiihrten Argumentation oder durch Ubergang zur Funktion —/ behandelt werden, wodurch er sich auf den eben behandelten Fall reduziert. D KoroUar 1. Sei a eine Unstetigkeit einer monotonen Funktion f : E ^ W. Dann existiert zumindest einer der Grenzwerte lim -E9x->a-0
fix) = / ( a - 0),
lim
f{x) = f{a + 0)
-E9x->a+0
und es gilt in mindestens einer der Ungleichungen / ( a — 0) < / ( a ) < / ( a + 0) bzw. / ( a —0) > f{a) > / ( a + 0) fiir nicht absteigendes bzw. fiir nicht anwachsendes f strenge Ungleichheit. Die Funktion nimmt in dem ojfenen Intervall, das durch die strenge Ungleichheit definiert ist, keinen Wert an. Offene Intervalle dieser Art, die durch unterschiedliche Unstetigkeitsstellen bestimmt werden, besitzen keine gemeinsamen Punkte, d.h., sie sind disjunkt. Beweis. Ist a eine UnstetigkeitssteUe, dann muss a ein Haufungspunkt der Menge E sein und die Unstetigkeit ist, nach Lemma 3, eine Unstetigkeit erster Art. Somit ist zumindest eine der Basen _E 9 a; —>• a — 0 bzw. E B x ^ a + 0 definiert und der Grenzwert der Funktion existiert auf dieser Basis. (Sind
174
4 Stetige Funktionen
beide Basen definiert, existieren beide Grenzwerte auf beiden Basen.) Der Deutlichkeit halber nehmen wir an, dass / nicht absteigend ist. Da a eine Unstetigkeitsstelle ist, muss zumindest in einer der Ungleichungen / ( a — 0) < /(o^) < / ( o + 0) strenge Ungleichheit gelten. Da f{x) < lim f{x) = EBx^ta — O
f{a — 0) fiir x G E und x < a, nimmt die Funktion auf dem durch die strenge Ungleichheit / ( a — 0) < / ( a ) definierten offenen Intervah tatsachlich keine Werte an. Analog enthalt das durch die strenge Ungleichheit /(a) < / ( a + 0) definierte offene Intervall (/(a), / ( a + 0 ) ) keine Werte von / , da / ( a + 0 ) < f{x) fiir x G E und a < x. Seien oi und a2 zwei verschiedene Unstetigkeitsstellen von / und wir nehmen an, dass oi < 02- Da die Funktion nicht absteigend ist, gilt: / ( a i - 0) < / ( a i ) < / ( a i + 0) < /(aa - 0) < /(aa) < /(a2 + 0) . Daraus folgt, dass die Intervalle, die keine Werte von / enthalten und zu unterschiedlichen UnstetigkeitssteUen gehoren, disjunkt sind. D KoroUar 2. Die Menge der Unstetigkeitsstellen einer monotonen ist hochstens abzdhlbar.
Funktion
Beweis. Mit jeder Unstetigkeitsstelle einer monotonen Funktion verbinden wir das zugehorige offene Intervall aus KoroUar 1, das keine Werte von / enthalt. Diese Intervalle sind paarweise disjunkt. Aber auf der reellen Geraden konnen nicht mehr als eine abzahlbare Anzahl paarweise disjunkter offener Intervalle sein. Denn wir konnen in jedem dieser Intervalle eine rationale Zahl wahlen, so dass die Ansammlung von Intervallen mit einer Teilmenge der Menge der rationalen Zahlen Q aquipotent ist. Daher ist sie hochstens abzahlbar. Daher ist die Menge der UnstetigkeitssteUen, die in einer eins-zu-eins Beziehung zu der Menge derartiger IntervaUe steht, ebenfaUs hochstens abzahlbar. D Satz 5. (Ein Kriterium fiir die Stetigkeit einer monotonen Funktion). Eine auf einem abgeschlossenen Intervall E = [a, b] definierte monotone Funktion f : E ^ W ist genau dann stetig, wenn die Wertemenge f{E) dem abgeschlossenen Intervall mit den Endpunkten f{a) und f{b) entspricht.^ Beweis. Ist / eine stetige monotone Funktion, so folgt aus der Monotonie, dass alle Werte, die / auf dem abgeschlossenen Intervall [a, b] annimmt, zwischen den Werten / ( a ) und f{b) liegen, die in den Endpunkten angenommen werden. Aufgrund der Stetigkeit muss die Funktion alle Werte zwischen /(a) und f(b) annehmen. Daher ist die Menge der Werte, die eine monotone und auf einem abgeschlossenen Intervall [a, b] stetige Funktion annimmt, tatsachlich das abgeschlossene Intervall mit den Endpunkten / ( a ) und f{b). Wir woUen nun die Umkehrung beweisen. Sei / auf dem abgeschlossenen Intervall [a, b] monoton. Besitzt / eine Unstetigkeitsstelle in einem Punkt ^ Hierbei ist /(a) < /(6), wenn / niclit absteigend ist und f{b) < f{a), wenn / nicht ansteigend ist.
4.2 Eigenschaften stetiger Funktionen
175
c e [a, b], so ist nach Korollar 1 eines der oflFenen Intervalle ]/(c —0), /(c)[ oder ]/(c), /(c+0[ definiert, nicht leer und / ninimt darin keine Werte an. Da aber / monoton ist, ist dieses Intervall in dem Intervall mit den Endpunkten /(a) und f{b) enthalten. Besitzt daher eine monotone Funktion eine Unstetigkeitsstelle auf dem abgeschlossenen Intervall [a, b], dann kann das abgeschlossene Intervall mit den Endpunkten / ( a ) und /(&) nicht dem Wertebereich der Funktion entspreclien. D Satz 6. (Satz zur inversen Funktion). Eine auf einer Menge X C M streng monotone Funktion f : X ^ M. besitzt eine Inverse f~^ : F ^ M, die monoton ist und aufY dieselbe Monotonieeigenschaft besitzt wie f auf X. Ist X aufierdem ein abgeschlossenes Intervall [a, b] und ist f stetig auf X, dann ist die Menge Y = f{X) das abgeschlossene Intervall mit den Endpunkten f{a) und f{b) und die Funktion f~^ : Y ^ W ist auf diesem Intervall stetig. Beweis. Die Behauptung, dass fiir stetiges / die Menge Y = f{X) das abgeschlossene Intervall mit den Endpunkten f{a) und f{b) ist, folgt aus dem oben bewiesenen Satz 5. Bleibt zu zeigen, dass f~^ : F —>• K stetig ist. Aber f~^ ist monoton auf F , Y ist ein abgeschlossenes IntervaU und f~^{Y) = X = [a, &] ist ebenfalls ein abgeschlossenes Intervall. Wir schhefien aus Satz 5, dass f~^ auf dem Intervall Y mit den Endpunkten / ( a ) und f{b) stetig ist. D Beispiel 8. Die Funktion y = f{x) = sin a; ist anwachsend und stetig auf dem abgeschlossenen Intervall [— f, f ] • Daher besitzt die Einschrankung der Funktion auf das abgeschlossene IntervaU [— f, f ] eine Inverse x = f~^{y), die wir mit x = arcsiny bezeichnen. Diese Funktion ist auf dem abgeschlossenen IntervaU [sin ( — f ) , sin (|-)] = [—1,1] definiert, sie wachst von —^ auf f an und ist auf diesem abgeschlossenen Intervall stetig. Beispiel 9. Ganz ahnlich ist die Einschrankung der Funktion y = cos a; auf das abgeschlossene Intervall [0, TT] eine absteigende stetige Funktion, die nach Satz 6 eine Inverse besitzt, die mit x = arccosy bezeichnet wird und auf dem abgeschlossenen Intervall [—1,1] definiert ist. Sie ist auf diesem abgeschlossenen Intervall stetig und von TT auf 0 absteigend. Beispiel 10. Die Einschrankung der Funktion y = tana; auf das offene Intervall X = ] — I , I [ ist eine stetige Funktion, die von —oo auf -l-oo anwachst. Nach dem ersten Teil von Satz 6 besitzt sie eine Inverse, die mit x = arctany bezeichnet wird und fiir alle y € ffi definiert ist. Sie wachst im offenen Intervall ] ~ f' f [ ^^- ^™ ^^ beweisen, dass die Funktion x = arctany in jedem Punkte 2/0 ihres Definitionsbereichs stetig ist, nehmen wir den Punkt XQ = arctanyo und ein abgeschlossenes Intervall [xQ—e,XQ-\-e\, das XQ enthalt und im offenen Intervall ] — f, f [ enthalten ist. Ist XQ — e = arctan(2/o — <5i) und XQ -\- e = arctan(2/o + ^2), dann gilt fiir jedes y € ffi mit yo — Si < y < yo -\- 82, dass
176
4 Stetige Funktionen
XQ — e < a r c t a n y < XQ +e. Daher ist | a r c t a n y — arctanyol < £ fur —di < y ~ yo < <^2- Die erste Ungleichung gilt insbesondere, wenn \y — yo\ < 6 = min{(5i,(52}, womit bewiesen ist, dass die Funktion x = a r c t a n y im P u n k t 2/0 G K stetig ist. Beispiel 11. Da die Einschrankung der Funktion y = cot a; auf das ofFene Interval! ]0,7r[ eine stetige Funktion ist, die von +00 auf —00 abnimmt, beweisen wir mit analoger Argumentation wie im vorigen Beispiel, dass die Funktion eine Inverse besitzt, die wir mit x = arccoty bezeichnen. Sie ist definiert, stetig und von TT auf 0 absteigend auf der ganzen reellen Geraden ffi und nimmt Werte im Bereicli ]0,7r[ an. Anmerkung. Bei der Konstruktion der Graplien zueinander inverser Funktionen y = f{x) und x = f~^{y) kann m a n sicli merken, dass in einem gegebenen Koordinatensystem die P u n k t e mit den Koordinaten (a;,/(a;)) = {x,y) und {y, f~^iy)) = {y,x) beziiglich der Winkellialbierenden im ersten Quadranten symmetriscli liegen. Somit sind die Graplien zueinander inverser Funktionen in demselben Koordinatensystem symmetrisch beziiglich der Winkelhalbierenden. 4.2.3 U b u n g e n und Aufgaben 1. Zeigeii Sie: a) Ist / G C{A) und B C A, dann gilt: /I
G C{B).
b) Ist eine Funktion / : S i U £2 —>• R so, dass /
G C{Ei), i = 1, 2, dann gilt
nicht immer, dass / G C{Ei U E-z). c) Die Riemann-Funktion 7?, und ihre Einschrankung TZ\ auf die Menge der rationalen Zahlen sind beide in jedeni Punkt von Q, aufler in 0, unstetig und alle UnstetigkeitssteUen sind hebbar (vgl. Beispiel 12 in Abschnitt 4.1). 2. Zeigen Sie, dass mit einer Funktion / G C[a, h] auch die Funktionen m{x) = niin f(t)
und
M{x) = max
a
f(t)
a
auf dem abgeschlossenen Interval! [o, h] stetig sind. 3.
a) Zeigen Sie, dass die zu einer Funktion inverse Funktion, die auf einem offenen Interval! monoton ist, auf ihrem Definitionsbereich stetig ist. b) Konstruieren Sie eine monotone Funktion mit einer abzahlbaren Menge von Unstetigkeiten. c) Zeigen Sie, dass bei zueinander inversen Funktionen / : X —>Y und f~^:Y —>-X (hierbei sind X und Y Teilmengen von R), wobei / in einem Punkt xo & X stetig ist, die Funktion f~^ nicht notwendigerweise im Punkt yo = f{xo) in Y stetig ist.
4.2 Eigenschaften stetiger Funktionen
177
4. Zeigeii Sie: a) Seien / £ C[a,h] und g G C[a,h] und zusatzlich / ( a ) < g{a) und f{h) > g{h). Dann existiert ein Punkt c G [a, b] fiir den /(c) = g(c) gilt. b) Jede stetige Abbildung / : [0,1] —> [0,1] von einem abgeschlossenen Intervall auf sich selbst besitzt einen Fixpunkt, d.h. einen Punkt x G [0,1] mit f(x) = x. c) Konimutieren zwei stetige Abbildungen / und g von einem Intervall auf sicli selbst, d.h., / o g = p o / , dann besitzen sie einen gemeinsanien Fixpunkt. d) Eine stetige Abbildung / : R —>• R kann auch keinen Fixpunkt haben. e) Eine stetige Abbildung / : [0,1] —>• [0,1] kann auch keinen Fixpunkt haben. f) 1st eine Abbildung / : [0,1] -^ [0,1] stetig, /(O) = 0, / ( I ) = 1 und (fof){x) = x auf [0,1], dann ist f{x) = x. 5. Zeigen Sie, dass die Wertemenge jeder Funktion, die auf einem abgeschlossenen Intervall stetig ist, ein abgeschlossenes Intervall ist. 6. Beweisen Sie: a) Ist eine Abbildung / : [0,1] -> [0,1] stetig, /(O) = 0, / ( I ) = 1 und / " ( x ) := / o . . . o f[x) = X auf [0,1], dann ist f{x) = x. n Faktoren
b) Ist eine Funktion / : [0,1] —>• [0,1] stetig und nicht absteigend, dann tritt fiir jeden Punkt x G [0,1] zumindest einer der folgenden Falle ein: Entweder ist X ein Fixpunkt oder / " ( x ) strebt gegen einen Fixpunkt. (Hierbei ist / " ( x ) = / o . . . o f[x) die n-te Iteration von /.) 7. Sei / : [0,1] -> R eine stetige Funktion mit /(O) = / ( I ) . Zeigen Sie: a) Fiir jedes n e N existiert ein horizontales abgeschlossenes Intervall der Lange j^ mit Endpunkten auf dem Graphen dieser Funktion. b) Ist die Zahl / nicht der Form - , dann existiert eine Funktion dieser Form, in dessen Graphen keine horizontale Sehne der Lange / einbeschrieben werden kann. 8. Das Stetigkeitsmafi einer Funktion / : i? —>• R ist die Funktion a;(5), die fiir 5 > 0 wie folgt definiert ist: uj{5)=
sup
|/(a;i)-/(a;2)| .
\x\—X'2\<S XI, X2£E
Somit wird die kleinste obere Schranke iiber alle Paare von Punkten a;i,a;2 in E gebildet, deren Abstand kleiner als S ist. Zeigen Sie: a) Das Stetigkeitsmafi ist eine nicht absteigende nicht negative Funktion, die den Grenzwert^ ui(+0) = lim coiS) besitzt. (S->+0
b) Zu jedem e > 0 existiert ein 5 > 0, so dass fiir alle Punkte xi, 12 G E aus der Relation \xi — X2\ < 5 folgt, dass \f{xi) — /(a;2)| < cij(+0) + e. ^ Aus diesem Grund wird das Stetigkeitsmafi iiblicherweise fiir 5 > 0 betrachtet und a;(0) = a;(+0) gesetzt.
178
4 Stetige Funktionen
c) 1st E ein abgeschlossenes Intervall, ein ofFenes Intervall oder ein halb ofFenes Intervall, danii gilt die Relation 00(61+62)
fiir das Stetigkeitsmafi einer Punktion / : i? —>• R. d) Die Stetigkeitsmafle der Funktionen x und sin(a; ) sind auf der ganzen reellen Geraden uj{S) = 6, bzw. die Konstante uj{S) = 2 im Bereich S > 0. e) Eine Punktion / ist genau dann auf E gleichmafiig stetig, wenn uj(+0) = 0. 9. Seien / und g beschrankte Funktionen, die auf derselben Menge X definiert sind. Die Grofle A = sup \f(x) — g(x)\ wird der Abstand zwischen / und g genannt. xex Er zeigt, wie gut eine Funktion sich einer anderen auf der gegebenen Menge X annahert. Sei X ein abgeschlossenes Intervall [0,6]. Zeigen Sie, dass fiir f,g G C[a,h] gilt: 3x0 G [a,h] mit A = \f{xo) — g(xo)\- Zeigen Sie ferner, dass dies im Allgemeinen fiir beliebige beschrankte Funktionen nicht zutrifft. 10. Sei Pn{x) ein Polynom vom Grade n. Wir woUen eine beschrankte Funktion / : [a, 6] —>• R durch Polynome annahern. Sei A{Pn)=
sup \fix)-Pn(x)\
und
S ^ ( / ) = inf Zi(P„) ,
xe[a,b]
-P"
wobei das Infimum iiber alle Polynome vom Grade n gebildet wird. Ein Polynom Pn wird Minimalabweichung oder Proximum von / genannt, falls A(Pn) = En{f)Zeigen Sie: a) Es gibt ein Proximum Po(x) = oo vom Grade Null. b) Unter den Polynomen Q\{x) der Form \P„{x), wobei P„ ein festes Polynom ist, gibt es ein Polynom QAQI SO dass: '4(QAo) = minZi(QA). A (EM
c) Palls ein Proximum vom Grade n existiert, dann existiert auch ein Proximum vom Grade n + 1. d) Zu jeder auf einem abgeschlossenen Intervall beschrankten Funktion und jedem n = 0,1, 2 , . . . existiert ein Proximum vom Grade n. 11. Beweisen Sie die folgenden Aussagen. a) Eine Polynom mit ungeradem Grad mit reellen KoefRzienten besitzt zumindest eine reelle NuUstelle. b) Ist Pn ein Polynom vom Grade n, dann besitzt die Funktion sgnP„(a;) hochstens n Unstetigkeitsstellen. c) Gibt es im abgeschlossenen Intervall [0,6] n + 2 Punkte xo < xi < • • • < Xn+i, so dass die Groflen sgn[(/(xi)-Pn(xi))(-l)'] fiir i = 0, . . . , n + 1 stets denselben Wert annehmen, dann ist E„{f) > min \f(xi) — Pn(xi)\. (Dieses Ergebnis ist als Vallee Poussin Theorem be0
kannt. Zur Definition von E„{f) vgl. Aufgabe 10 Ch. J. de la Vallee Poussin (1866-1962) - belgischer Mathematiker und Fachmann fiir theoretische Mechanik.
4.2 Eigenschaften stetiger Funktionen
179
12.
a) Zeigen Sie, dass fiir jedes n G N die auf dem abgeschlossenen Intervall [—1,1] definierte Punktion T„{x) = cos(narccosx) eiii algebraisches Polynom vom Grade n ist. (Dies sind die Tschebyscheff Polynome). b) Findeii Sie eineii algebraischen Ausdruck fiir die Polynome Ti, T-z, T3 und T4 und zeichnen Sie ihre Graphen. c) Bestimmen Sie die Nullstellen des Polynoms T„{x) auf dem abgeschlossenen Intervall [—1,1] und die Punkte des Intervalls, in denen |T„(x)| ihr Maximum annimmt. d) Zeigen Sie, dass unter alien Polynomen Pn{x) vom Grade n, deren fiihrender Koeffizient 1 ist, das Polynom T„{x) das eindeutige Polynom ist, das Null am nachsten kommt, d.h., E„{0) = max|T„(x)|. (Vgl. Aufgabe 10 zur Definition |a;|
von
E„(f).)
13. Sei f e C[a,h]. a) Besitzt das Polynom Pn{x) vom Grade n n + 2 Punkte xo < • • • < Xn+i (die sog. Tschebyscheff AUernanten), fiir die f(xi) — Pn{xi) = ( —l)'Zi(P„) • a mit ^{Pn) = max \f{x) — Pnix)\ gilt, wobei a eine Konstante gleich 1 oder —1 ist, x£[a,b]
dann ist Pn(x) das eindeutige Proximum vom Grade n von / (vgl. Aufgabe 10). Beweisen Sie diese Aussage. b) Beweisen Sie den Satz von Tschebyscheff: Ein Polynom Pn(x) vom Grade n ist genau dann ein Proximum zur Funktion f G C[a,b], wenn zumindest n + 2 Tschebyscheff AUernanten auf dem abgeschlossenen Intervall [o, h] existieren. c) Zeigen Sie, dass fiir unstetige Funktionen die vorige Aussage im Allgemeinen nicht wahr ist. d) Bestimmen Sie das Proximum vom Grad 0 und 1 fiir die Funktion \x\ auf dem Intervall [-1,2]. 14. In Abschnitt 4.2 haben wir die lokalen Eigenschaften stetiger Funktionen untersucht. Diese Aufgabe prazisiert das Konzept einer lokalen Eigenschaft. Zwei Funktionen / und g werden als Equivalent betrachtet, wenn es eine Umgebung U{a) eines vorgegebenen Punktes a G R gibt, so dass f{x) = g{x) fiir alle X £ U{a). Diese Relation zwischen Funktionen ist offensichtlich reflexiv, symmetrisch und transitiv, d.h., sie ist wirklich eine Aquivalenzrelation. Eine Klasse von Funktionen, die alle zueinander in einem Punkt a aquivalent sind, wird Funktionskeim in o genannt. Wenn wir nur stetige Funktionen betrachten, sprechen wir von einem stetigen Funktionskeim in o. Die lokalen Eigenschaften von Funktionen sind Eigenschaften von Funktionskeimen. a) Definieren Sie die arithmetischen Operationen auf Keimen numerischer Funktionen in einem vorgegebenen Punkt. b) Zeigen Sie, dass die arithmetischen Operationen auf Keimen stetiger Funktionen nicht auflerhalb dieser Klasse von Keimen fiihren. c) Zeigen Sie unter Beriicksichtigung von a) und b), dass die Keime stetiger Funktionen einen Ring bilden - einen Ring von Keimen stetiger Funktionen. d) Ein Teilring / eines Rings K wird Ideal von K genannt, wenn das Produkt jeden Elements des Rings K mit einem Element des Teilrings / zu / gehort. Finden Sie ein Ideal im Ring der Keime stetiger Funktionen in o.
180
4 Stetige Funktionen
15. Ein Ideal in einem Ring ist maximal, wenn es nicht in eineni grofieren Ideal, aufier dem Ring selbst, enthalten ist. Die Menge C[a, 6] der auf einem abgeschlossenen Intervall stetigen Funktionen bildet einen Ring unter den iiblichen Operationen der Addition und Multiplikation numerischer Funktionen. Bestinimen Sie die niaximalen Ideale dieses Rings.
DifFerentialrechnung
5.1 Differenzierbare Funktionen 5.1.1 P r o b l e m s t e l l u n g u n d e i n l e i t e n d e B e t r a c h t u n g e n Angenomnien, wir wollen in den FuBstapfen von Newton^ das Keplersche Problem^ zweier Korper losen, d.h., das Bewegungsgesetz eines Himmelskorpers m (eines Planeten) relativ zu einem anderen Korper M (einem Stern) aufstellen. Wir beginnen niit einem kartesischen Koordinatensysteni in der Bewegungsebene mit Ursprung in M (s. Abb. 5.1). Dann kann die Position von m zur Zeit t in Zahlen durch die Koordinaten (^x{t),y{t)) seines P u n k t e s im Koordinatensysteni charakterisiert werden. Wir suchen die Funktionen x{t) und y{t). Die Bewegung von m relativ zu M wird durch die beiden beriihmten Newtonschen Gesetze bestimmt: Das allgemeine
Bewegungsgesetz ma = F ,
(5.1)
das den Kraftvektor mit Hilfe der Proportionalitatskonstante m - der tragen Masse des Korpers^ - mit dem Beschleunigungsvektor verbindet. I. Newton (1642-1727) - britischer Physiker, Astronom und Matheniatiker. Ein herausragender Gelehrter, der die grundlegenden Gesetze der klassischen Mechanik aufstellte, das allgemeine Gravitationsgesetz entdeckte und (zusammen mit Leibniz) die Grundlagen der Differential- und Integralrechnung entwickelte. Er wurde sogar von seinen Zeitgenossen geschatzt, die seinen Grabstein mit der Inschrift versahen: „Hic depositum est, quod mortale fuit Isaaci Newtoni" (Hier liegt das Sterbliche von Isaac Newton). J.Kepler (1571-1630) - beriihmter deutscher Astronom, der die Gesetze der Planetenbewegung (die Keplerschen Gesetze) entdeckte. Wir haben fiir die Masse dasselbe Symbol benutzt wie fiir den Korper selbst, aber das wird nicht zur Verwirrung fiihren. Wir merken ferner an, dass wir fiir m
182
5 Differentialrechnung
Abb. 5.1. Das allgemeine Gravitationsgesetz, das es erlaubt, die Gravitationswirkung der Korper m und M aufeinander nach der Forniel G
niM
(5.2)
zu bestimnien. Dabei ist r ein Vektor mit Anfangspunkt im Korper, auf den die Kraft einwirkt und Endpunkt in dem anderen Korper. |r| ist die Lange des Vektors r, d.h. der Abstand zwischen m und M. Kennen wir die Massen m und M, konnen wir mit Hilfe von (5.2) einfach die rechte Seite von (5.1) in Abhangigkeit von den Koordinaten x{t) und y{t) des Korpers m zur Zeit t formulieren und dabei alle Daten der vorgegebenen Bewegung beriicksichtigen. Um die in (5.1) enthaltenen Beziehungen fiir x{t) und y{t) zu erhalten, miissen wir lernen, wie die rechte Seite von (5.1) in Abhangigkeit von x{t) und y{t) formuliert werden kann. Beschleunigung charakterisiert eine Anderung der Geschwindigkeit v(t). Genauer gesagt, so ist sie einfach ein MaB fiir die Geschwindigkeitsanderung. Daher miissen wir, um unser Problem zu losen, zuallererst lernen, wie die Geschwindigkeit v(t) eines sich bewegenden Korpers zur Zeit t aus dem Umlaufvektor r(t) = (^x{t),y{t)) berechnet werden kann. Daher wollen wir definieren und erlernen, wie die momentane Geschwindigkeit eines Korpers, die implizit in der Bewegungsgleichung (5.1) enthalten ist, berechnet werden kann. Etwas zu messen bedeutet, es mit einem Standard zu vergleichen. Was kann uns in diesem Fall als Standard fiir die Bestimmung der momentanen Geschwindigkeit einer Bewegung dienen? Die einfachste Bewegungsart ist die eines freien Korpers, auf den keine Krafte einwirken. Bei dieser Bewegung legt der Korper in gleichen Zeitintervallen gleiche Entfernungen im Raum (als Vektoren) zuriick. Es ist die sogenannte gleichformige (geradlinige) Bewegung. Wenn sich ein Punkt gleichformig bewegt und r(0) und r(l) seine Abstandvektoren relativ zu einem tragen Koordinatensystem in den Zeiten t = 0 und t = 1 sind, dann wird zu jeder Zeit t gelten: r(t)-r(0) = v - t . (5.3)
5.1 Differenzierbare Funktionen
183
Dabei ist v = r(l) — r(0). Es zeigt sich also, dass die Entfernung r{t) — r(0) in diesem einfachsten Fall eine lineare Funktion der Zeit ist. Dabei iibernimmt der Vektor v die Rolle der Proportionalitatskonstanten zwisclien der Entfernung r(t) — r(0) und der Zeit t, d.h. der Entfernung in der Einheitszeit. Diesen Vektor nennen wir die Geschwindigkeit einer gleichforniigen Bewegung. Die Tatsaclie, dass die Bewegung geradlinig ist, lasst sich an der parametrischen Darstellung der Bahn (Trajektorie) erkennen: r(t) = r(0) + v • t. Dies ist die Gleicliung einer geradlinigen Strecke, wie sie uns aus der analytisclien Geonietrie bekannt ist. Wir kennen nun die in (5.3) forniulierte Geschwindigkeit v einer gleichforniigen Bewegung. Nach dem Tragheitsgesetz bewegt sich ein Korper, auf den keine auBeren Krafte einwirken, gleichforniig auf einer Geraden. Wiirde daher die Einwirkung von M auf m zur Zeit t enden, wiirde m von dem Augenblick an seine Bewegung auf einer Geraden mit der aktuellen Geschwindigkeit fortsetzen. Natiirlicherweise bezeichnet man diese Geschwindigkeit als die momentane Geschwindigkeit des Korpers zur Zeit t. Eine derartige Definition einer gleichformigen Geschwindigkeit bliebe jedoch eine reine Abstraktion, da wir keine Anleitung hatten, wie sie explizit berechnet werden kann, wenn auch nur fiir das hochst wichtige Problem, das wir gegenwartig untersuchen. Wir bleiben in dem von uns betretenen Kreis (Logiker wiirden ihn einen „Teufelskreis" nennen), den wir mit der Bewegungsgleichung (5.1) betraten, bevor wir dazu iibergingen, die Bedeutung einer momentanen Geschwindigkeit und Beschleunigung zu erkunden. Wir halten nichtsdestotrotz fest, dass wir selbst mit den aUgemeinsten VorsteUungen zu diesen Konzepten aus (5.1) die folgenden heuristischen Folgerungen ziehen konnen. Falls es keine Kraft gibt, d.h., F = 0, dann ist auch die Beschleunigung Null. Ist aber das MaB a(t) der Veranderung der Geschwindigkeit w{t) gleich Null, dann kann sich die Geschwindigkeit v(t) mit der Zeit nicht verandern. Auf diese Weise gelangen wir zum Tragheitsgesetz, nach dem sich der Korper tatsachlich im Raum mit konstant bleibender Geschwindigkeit bewegt. Aus derselben Gleichung (5.1) konnen wir erkennen, dass Krafte mit beschrankter GroBe nur Beschleunigungen beschrankter GroBe bewirken konnen. Ubersteigt die absolute GroBe der Veranderung einer GroBe P{t) aber in der Zeit [0, t] nicht einen konstanten Wert c, dann kann nach unserer Vorstellung die Anderung \P{t) — -P(0)| der GroBe P mit der Zeit t nicht c • t iibersteigen. Somit andert sich in diesem Fall die betrachtete GroBe in einem kleinen ZeitintervaU nur wenig. (In jedem Fall stellt sich die Funktion P{t) als stetig heraus.) Somit andern sich in rein mechanischen Systemen in einem kleinen ZeitintervaU die Parameter nur um kleine Betrage. Insbesondere muss zu alien Zeiten t in der Ndhe einer Zeit to die Geschwindigkeit v(t) des Korpers m nahe dem Wert v(to) liegen, den wir bestimmen woUen. Aber dann unterscheidet sich in einer kleinen Umgehung der Zeit to die Bewegung selbst nur um einen kleinen Betrag von einer gleichformi-
184
5 Differentialrechnung
gen Bewegung mit der Geschwindigkeit v(to)- Und je naher wir an to kommen, desto geringer wird der Unterschied. Wenn wir die Bahn des Korpers m durch ein Teleskop fotografieren, so wiirden wir, in Abhangigkeit von der Qualitat des Teleskops, in etwa Abb. 5.2 erhalten.
A b b . 5.2.
Der in Abb. 5.2c) gezeigte Teil der Bahn entspricht einem so kleinen Zeitintervall, dass es schwierig ist, die aktuelle Bahn von einer Geraden zu unterscheiden, da dieser Bahnteil wirkhch einer Geraden gleicht und die Bewegung einer gleichformigen geradhnigen Bewegung ahnelt. Aus dieser zufaUigen Beobachtung konnen wir folgern, dass wir mit dem Problem der Bestimmung der momentanen Geschwindigkeit (wobei die Geschwindigkeit eine VektorgroBe ist) gleichzeitig das rein geometrische Problem losen, die Tangente an eine Kurve zu definieren und zu finden (in diesem Fall ist die Bahn der Bewegung die Kurve). Wir haben also beobachtet, dass in diesem Problem v ( t ) « v(to) fiir t nahe bei to gelten muss, d.h., v ( t ) —>• v(to) fiir t ^ to oder, was dasselbe ist, v ( t ) = v{to) + o(l) fiir t —>• to- Somit muss auch r(t) - r(to) « v(to) • {t - to) fiir t nahe bei to gelten. Genauer formuliert, ist fiir t ^ Entfernung r(t) — r{to) zu 'v{to){t — to) aquivalent, oder r{t) - r(to) = v(to)(t - to) + o(v(to)(t - to))
to der Wert der
(5.4)
Dabei ist o(v(to)(t — to)) ein Korrekturvektor, dessen Grofie schneller gegen NuU strebt als der Betrag des Vektors v(to)(t — to) fiir t —>• to. Hierbei miissen wir natiirlich den FaU v(to) = 0 ausschhefien. Um diesen Fall nicht genereU aus der Betrachtung auszuschhefien, ist die Beobachtung, dass^ * Hierbei ist |t —to| der Absolutwert der Zahl t —to, wohingegen |v| der Absolutwert oder die Lange des Vektors v ist.
5.1 Differenzierbare Funktionen
185
|v(to)(^ — to)\ = |v(to)| \t — to\ hilfreich. 1st folglich |v(to)| ?^ 0, dann besitzt die Grofie |v(to)(t — to)| die gleiche Gr6i3enordnung wie |t — to|, so dass also o(v{to){t — to)) = o{t — to). Daher konnen wir anstelle von (5.4) die Gleichung r(t) - r(to) = v(to) (t - to) + o{t - to)
(5.5)
schreiben, in der der Fall v(to) = 0 nicht ausgesclilossen werden muss. Beginnend bei den allgemeinsten und vielleiclit vagen Vorstellungen iiber Geschwindigkeit sind wir zu Gleichung (5.5) gelangt, die die Gescliwindigkeit erfiillen muss. Und die Geschwindigkeit v(to) kann aus (5.5) unzweifelhaft bestimmt werden:
v(to)=liml4:i^. t—>-to
(5.6)
r — to
Daher konnen sowohl die zentrale Beziehung (5.5) als auch die dazu aquivalente Gleichung (5.6) als Definition der Grofie v(to), der momentanen Geschwindigkeit des Korpers zur Zeit to, betrachtet werden. An diesem Punkt werden wir es uns nicht erlauben, in eine detaillierte Diskussion des Problems des Grenzwertes einer vektorwertigen Funktion abzuschweifen. Stattdessen werden wir uns damit begniigen, ihn auf den Fall des Grenzwertes einer reellwertigen Funktion zu reduzieren, der bereits voUstandig untersucht wurde. Da der Vektor r(t) — r(to) die Komponenten [x{t) — x{to), y(t) - y(to)) besitzt, erhalten wir ^^^^^g^ = ( ^ ^ ^ ^ g ^ , ^'^llg*"^) und daher, wenn wir davon ausgehen, dass Vektoren nahe beieinander sind, wenn ihre Komponenten nahe beieinander sind, soUte der Grenzwert in (5.6) folgendermafien interpretiert werden: _ (f lin, ,,_ x{t) - x{to) ^.^ y{t) - y{h) ^ v(to) = hm £r(t) W -^ r(to) IM = to
V i—>-io
t — to
i—>-io
t — to
/
Der Ausdruck o(t —to) in (5.5) sollte ebenfalls als Vektor interpretiert werden der von t abhangt, so dass der Vektor °^*_ t-to *"-' (komponentenweise) fiir t ^ to gegen NuU strebt. Schliefilich merken wir an, dass fiir v(to) ^ 0 die Gleichung r(t) - r(to) = v(to) • (t - to)
(5.7)
eine Gerade definiert, die nach dem oben Gesagten als Tangente an die Bahn im Punkt {x{to),y{to)) betrachtet werden kann. Somit ist der Standard zur Definition der Geschwindigkeit einer Bewegung die Geschwindigkeit einer gleichformigen geradlinigen Bewegung, die durch die lineare Beziehung (5.7) definiert ist. Die Standardbewegung (5.7) ist mit der untersuchten Bewegung, wie gezeigt, durch Gleichung (5.5) verbunden. Der Wert v(to), fiir den (5.5) gilt, kann durch den Grenzubergang in (5.6) bestimmt werden. Er wird die Geschwindigkeit der Bewegung zur Zeit to genannt. Die in der klassischen Mechanik untersuchten Bewegungen, die durch das Gesetz (5.1) beschrieben werden, miissen den Vergleich mit diesem
186
5 Differentialrechnung
Standard zulassen, d.h., sie miissen die in (5.5) angedeutete lineare Naherung zulassen. 1st r{t) = [x{t),y{t)) der Radiusvektor eines sich bewegenden Punktes m zur Zeit t, dann ist r(t) = (^x{t),y{t)) = v(t) der Vektor, der die Veranderung von r{t) zur Zeit t beschreibt und r(t) = (x(t),i/(t)) = a(t) (die Beschleunigung) ist der Vektor, der die Veranderung von v(t) zur Zeit t wiedergibt. Damit kann (5.1) folgendermai3en geschrieben werden: m • r(t) = F{t) . Daraus erhalten wir die Koordinatenforni der Bewegung in eineni Gravitationsfeld: X{t) = - ^ ^ [ ^ 2 ( i ) + y 2 ( ^ ) ] 3 / 2 '
(5.8)
Dieses ist ein genauer mathematischer Ausdruck unseres Ausgangsproblems. Da wir wissen, wie wir r(t) aus r{t) bestimmen, wissen wir auch, wie wir r{t) linden und wir sind somit bereits in der Lage, die Frage zu beantworten, ob ein Paar von Funktionen (^x{t),y{t)) die Bewegung des Korpers m um den Korper M beschreiben kann. Um diese Frage zu beantworten, miissen wir x{t) und y{t) linden und priilen, ob (5.8) gilt. Das System (5.8) ist ein Beispiel fiir ein System sogenannter Differentialgleichungen. Gegenwartig konnen wir nur priilen, ob eine Menge von Funktionen eine Losung liir das System ist. Wie wir die Losung linden, oder besser lormuliert, wie wir die Eigenschalten von Losungen von DiflFerentialgleichungen analysieren, wird in einem besonderen und, wie man nun einschatzen kann, liir die Analysis kritischen Bereich, der Theorie der DiflFerentialgleichungen, untersucht. Die Veranderung einer vektoriellen GroBe zu bestimmen, kann, wie gezeigt wurde, aul das Bestimmen von Veranderungen in mehreren numerischen Funktionen - den Komponenten des Vektors - reduziert werden. Daher miissen wir zuallererst lernen, wie diese Operationen liir den einlachsten Fall reellwertiger Funktionen eines reellwertigen Arguments auszuliihren sind. Dies wollen wir nun in Angriff nehmen. 5.1.2 In einem Punkt difFerenzierbare Funktionen Wir beginnen mit zwei vorlauligen Delinitionen, die wir in Kiirze prazisieren werden. Definition Oi. Eine aul einer Menge i? C ffi delinierte Funktion f : E ^ R ist in einem Punkt a G E, der ein Haulungspunkt von E ist, differenzierbar, wenn eine lineare Funktion A • (x — a) des Inkrements im Argument x — a existiert, so dass f{x) — f{a) wie lolgt dargestellt werden kann: f{x) — f{a) = A • (x — a) + o{x — a) liir x ^ a, x G E .
(5.9)
5.1 Differenzierbare Funktionen
187
Anders formuliert, so ist eine Funktion in einem Punkt a difFerenzierbar, wenn die Veranderung in ihren Werten in einer Umgebung des betrachteten Punktes bis auf eine Korrektur, die im Vergleich zur Gr6i3e des Abstands x — a voni Punkt a infinitesimal ist, linear ist. Anmerkung. In der Regel liaben wir es mit Funktionen zu tun, die auf einer vollstandigen Umgebung des betrachteten Punktes definiert sind und nicht nur auf einer Teilmenge der Umgebung. Definition 02- Die lineare Funktion A- (x — a) in (5.9) wird Differential der Funktion f in a genannt. Das Differential einer Funktion in einem Punkt ist eindeutig bestimmt. Denn es folgt aus (5.9), dass lim EBx^a
fM—fiO') ^!^-^ ^ - ^ = X —a
,. lim
3x^a E32
/ , o(x — a)\ {A + — ]= A V
X —a
)
SO dass die Zalil A auf Grund der Eindeutigkeit des Grenzwertes unzweifelhaft bestimmt ist. Definition 1. Die Zalil
/'(„)=
lin, / M ^ / M EBx^a
(5.10)
X — a
wird Ahleitung der Funktion / in a genannt. Die Gleicliung (5.10) kann aquivalent geschrieben werden als: fix) - f{a) .// X , ( . = / (o^) + ct.[x) . x—a Dabei gilt a{x) -^ 0 fiir x ^ a,x G E. Diese Gleichung ist ilirerseits aquivalent zu: f{x) — / ( a ) = f'{a){x
— a) + o{x — a) fiir x ^ a, x G E .
(5.11)
Daher ist die Differenzierbarkeit einer Funktion in einem Punkt zur Existenz ilirer Ableitung in demselben Punkt aquivalent. Wenn wir diese Definition mit dem in Absatz 5.1.1 Gesagten vergleichen, konnen wir folgern, dass die Ableitung die Veranderung einer Funktion im betrachteten Punkt charakterisiert, wohingegen das Differential die beste lineare Approximation an das Inkrement der Funktion in einer Umgebung desselben Punktes liefert. Ist eine Funktion / : i? —>• M in verschiedenen Punkten der Menge E differenzierbar, so kann sich beim Ubergang von einem Punkt zu einem anderen sowohl die GroBe A als auch die Funktion o{x — a) in (5.9) andern (ein Ergebnis, das wir bereits in (5.11) explizit sehen konnten). Dieser Sachverhalt soUte bei der Definition einer differenzierbaren Funktion festgehalten werden, und wir werden nun diese fundamentale Definition voUstandig formulieren.
188
5 Differentialrechnung
Definition 2. Eine auf einer Menge _E C ffi definierte Funktion / : i? —>•ffiist im Punkt x G E, der ein Haufungspunkt von E ist, dijferenzierbar, wenn f{x + h)-f{x)=A{x)h
+ a{x;h)
(5.12)
gilt, wobei h H^ A{x)h eine lineare Funktion in h ist und a{x;h) = o{h) fiir
h^O,
x + he E.
Die Gr6i3en
Ax{h) := (x + h) — X = h und Zi/(a;;/i):=/(a; + / i ) - / ( x ) werden das Inkrement des Arguments und das Inkrement der Funktion (in Abhangigkeit voni Inkrement des Arguments) genannt. Sie werden oft (wenn auch nicht ganz korrekt) durch die Symbole Ax und Af{x) als Funktionen von h bezeichnet. Somit ist eine Funktion in einem Punkt difFerenzierbar, wenn ihr Inkrement in diesem Punkt, das eine Funktion des Inkrements h ihrer Argumente ist, bis auf eine Korrektur, die im Vergleich zu h fiir /i —>• 0 infinitesimal ist, linear ist. Definition 3. Die Funktion h i->- A{x)h in Definition 2, die linear in h ist, wird das Differential der Funktion / : i? —>• M im Punkt x G E genannt und durch d/(a;) oder Df{x) bezeichnet. Somit gih: df{x){h) = A{x)h. Aus den Definitionen 2 und 3 erhalten wir, dass Af{x; h) — df{x){h) = a{x; h) , mit a{x;h) = o{h) fiir h ^ Q, x -\- h & E. D.h., die Differenz zwischen dem Inkrement der Funktion, die durch das Inkrement h in ihrem Argument hervorgerufen wird, und dem Wert der Funktion d/(a;), der in x zum selben h linear ist, ist hoherer Ordnung infinitesimal als h. Aus diesem Grund sagen wir, dass das Differential der lineare (Haupt-) Teil des Inkrements der Funktion ist. Aus (5.12) und Definition 1 folgt A( \ tU \ A\x) = J (x) =
y lim /»->o
/(a; + /i) ; n
f{x)
x+h,xEE
und daher kann das Differential folgendermafien geschrieben werden: df{x){h) = f'{x)h.
(5.13)
Ist insbesondere f{x) = x, dann erhalten wir offensichtlich f'{x) = 1 und
5.1 Differenzierbare Funktionen
189
dx{h) = 1 • h = h , so dass, wie manchmal gesagt wird, „das Differential einer unabhangigen Variablen ihreni Inkrenient entspricht". Mit Hilfe dieser Gleichung konnen wir (5.13) neu forniulieren zu df{x){h)
= f{x)dx{h)
,
(5.14)
d.h., d/(a;) = /'(a;)da; .
(5.15)
Die Gleichung (5.15) sollte als Gleichung zweier Funktionen von h verstanden werden. Aus (5.14) erhalten wir
^W
= ^'^'^ '
^'-''^
d.h., die Funktion ^^^' (das Verhaltnis der Funktionen df{x) und dx) ist Aus diesem Grund bezeichnen wir haufig nach Leibkonstant gleich f'{x). niz die Ableitung mit dem Symbol S'" , zusammen mit der von Lagrange^ f'{x). vorgeschlagenen Schreibweise In der Mechanik wird zusatzlich zu diesen Symbolen das Symbol Lp{t) (sprich „phi-Punkt von t") benutzt, um die Ableitung der Funktion ip{t) nach der Zeit t zum Ausdruck zu bringen. 5.1.3 Die Tangente und die geometrische Interpretation der A b l e i t u n g u n d d e s Differentials Sei f : E ^ M. eine auf einer Menge E C M. definierte Funktion und XQ ein vorgegebener Haufungspunkt von E. Wir suchen die Konstante CQ, die unter den konstanten Funktionen das Verhalten der Funktion in einer Umgebung des P u n k t e s XQ am besten beschreibt. Genauer gesagt, so soU der Unterschied f{x) — CQ im Vergleich zu jeder anderen von Null verschiedenen Konstanten fiir X ^ XQ, X G E infinitesimal sein, d.h., f{x)
= Co + o(l) fiir x —>• XQ, X G E .
Diese Gleichung ist aquivalent zur Aussage, dass insbesondere die Funktion in XQ stetig, dann ist
lim
(5.17)
lim f{x)
f{x)
= CQ. Ist
= f{xo)
und
EBX^XO
natiirlich CQ = ,f{xo). Nun wollen wir versuchen, die Funktion CQ + ci{x — XQ) SO ZU wahlen, dass wir ^ J. L. Lagrange (1736-1831) - beriihmter franzosischer Mathematiker und Fachmann fiir theoretische Mechanik.
190
5 Differentialrechnung f{x)
= Co + ci{x — XQ) + o{x — XQ) fiir x ^ XQ, x G E
(5.18)
erhalten. Dies ist offensichtlich eine Verallgenieinerung des vorigen Problems, da (5.17) wie folgt neu formuliert werden kann: f{x)
= Co + o(^{x — a;o)°) fiir x -^ XQ, X £ E .
Aus (5.18) folgt unmittelbar, dass CQ =
lim
f{x) und, falls die Funktion
in diesem P u n k t stetig ist, dass CQ = f{xo). Nachdem CQ bestimmt wurde, folgt aus (5.18), dass Ci =
,.
f{x)
lim E3x^xo
- Co
.
X — XQ
Wiirden wir ganz allgemein ein Polynom P„{xo; x) = CQ + ci(a; — a;o) + • • • + c„{x — a;o)" suchen, fiir das fix)
= Co + Ci{x - XQ) -\
\-Cn{x - XQ)" + o{{x
-
XQ)")
fiir X —>• XQ, X G E (5.19) gilt, wiirden wir nach und nach oline Zweideutigkeit finden, dass Co
=
lim lim
Cl
E3x^xo
c„
,. lim E3x^xo
=
f{x)
,
i^^^ * *°
/ ( « ) - coH
7
hc„-i(x-xo) y^ {x-xo)
.
Natiirlich vorausgesetzt, dass alle diese Grenzwerte existieren. Ansonsten kann die Bedingung (5.19) nicht erfiillt werden und das Problem besitzt keine Losung. Ist die Funktion / in XQ stetig, dann folgt aus (5.18), wie wir bereits bemerkt haben, dass CQ = f{xo), und wir gelangen dann zur Gleichung f{x)
— f{xo)
= Ci{x — XQ) + o{x — XQ) fiir X -^ XQ, X G E ,
die aquivalent zu der Bedingung ist, dass f{x) fiilirt uns zu d =
,-hm
E3x^xo
fix) - fjxo)
in XQ differenzierbar ist. Dies
,, .
= / [xo) •
X — Xo
Somit haben wir den folgenden Satz bewiesen. S a t z 1. Eine in einem Hdufungspunkt XQ G E CM. stetige Funktion f -.E ^M. erlaubt genau dann eine lineare Approximation (5.18), wenn sie in diesem, Punkt differenzierbar ist.
5.1 Differenzierbare Funktionen
191
Die Funktion (p{x) = Co +ci{x mit Co = ,f{xo) und ci = f'{xo) (5.18) erfiiUt. Somit liefert die Funktion
-xo)
(5.20)
ist die einzige Funktion der Form (5.20), die
(p{x) = f{xo) + f'ixo){x
- Xo)
(5.21)
die beste lineare Approximation an die Funktion / in einer Umgebung von xo in dem Sinne, dass fiir jede andere Funktion (p{x) der Form (5.20) gilt, dass f{x) — (p{x) 7^ o{x — XQ) fiir x -^ xo, x G E. Der Graph der Funktion (5.21) ist eine Gerade
y - f{xo) =
(5.22)
f'ixo){x-xo)
die durch den P u n k t {xo,f{xo)) geht und die Steigung f'{xo) besitzt. Da die Gerade (5.22) der optimalen linearen Approximation des Graphen der Funktion y = f{x) in einer Umgebung des P u n k t e s (XQ, /(XO)) entspricht, fiihrt uns dies zu folgender Definition. D e f i n i t i o n 4. Ist eine Funktion f : E ^ R auf einer Menge i? C ffi definiert und im P u n k t xo £ E differenzierbar, dann wird die durch Gl. (5.22) definierte Gerade die Tangente an den Graphen dieser Funktion im P u n k t (a;o,/(a;o)) genannt. In Abb. 5.3 ist alles Wichtige, was wir bisher in Verbindung mit der Differenzierbarkeit einer Funktion in einem P u n k t kennen, dargestellt: Das Inkrement im Argument, das zugehorige Inkrement der Funktion und der Wert des Differentials. Die Abbildung zeigt den Graphen der Funktion, die Tangente
y
/y =-f{^) //y P
Xo + h)
X \ —r Af{xo;h)
P o /
Ax{h)
.^fV^ i—
Xo
f{xo + h) - f{xo)
X y~ ^^^°^
df{xo)ih)
df{xo){h) f{xo)
//
/(a^o)-
h
Xo + h A b b . 5.3.
{x — Xo)
192
5 Differentialrechnung
an den Graphen im P u n k t PQ = {xo,f{xo)) und zum Vergleich eine beliebige Gerade (normalerweise Sekante genannt), die durch PQ und einen P u n k t P ^ PQ des Graphen der Funktion geht. Die folgende Definition erweitert Definition 4. D e f i n i t i o n 5. Sind die Abbildungen / : _E ^ ffi und g : E ^ W m einem Haufungspunkt XQ G E stetig und gilt f{x) — g{x) = o((a; — X Q ) " ) fiir x -^ XQ, X G E, dann sagen wir, dass / und g sich in XQ in n-ter Ordnung beriihren (genauer: mindestens n-ter Ordnung). Fiir n = 1 sagen wir, dass die Abbildungen / und g in XQ zueinander Tangenten sind. Nach Definition 5 ist (5.21) in XQ eine Tangente a n eine Abbildung f : E ^ R, die in diesem P u n k t differenzierbar ist. Wir konnen nun auch sagen, dass das Polynom Pn{xo;x) = co+ci{x — xo) + " •" + c„{x — a;o)" in (5.19) die Funktion / mit mindestens n-ter Ordnung beriihrt. Die Zahl h = x — XQ, d.h. das Inkrement im Argument, kann als Vektor betrachtet werden, der im P u n k t XQ beginnt und den Ubergang von XQ ZU X = XQ + h definiert. Wir bezeichnen die Menge aller derartigen Vektoren mit TK(a;o) oder TR^^^. Ganz ahnlich bezeichnen wir mit TR{yo) oder TMj,„ die Menge aller Verschiebungsvektoren vom P u n k t yo entlang der y-Achse (vgl. Abb. 5.3). Aus der Definition des Differentials konnen wir nun folgern, dass die Abbildung d/(a;o) : TK(xo) ^ ™ ( / ( x o ) ) , (5.23) die durch das Differential h H^ f'{xo)h = df{xo){h) definiert wird, Tangente zur Abbildung h^f(xo + h)-f{xo) = Af(xo;h) (5.24) ist, die durch das Inkrement der differenzierbaren Funktion definiert wird. Wir merken an (vgl. Abb. 5.3), dass das Differential (5.23) dem Inkrement der Ordinate der Tangente an den Graphen der Funktion fiir das Inkrement h im Argument entspricht, wenn beim Ubergang des Arguments von XQ ZU xo + h das Inkrement der Ordinate des Graphen der Funktion y = f{x) durch (5.24) beschrieben wird. 5.1.4 D i e R o U e d e s K o o r d i n a t e n s y s t e m s Die analytische Definition der Tangente (Definition 4) mag der Grund fiir ein leichtes Unwohlsein sein. Wir versuchen, dieses Unwohlsein auf den P u n k t zu bringen. Zunachst werden wir aber eine mehr geometrische Konstruktion der Tangente an eine Kurve in einem ihrer P u n k t e PQ (vgl. Abb. 5.3) geben. Wir greifen einen von PQ verschiedenen beliebigen P u n k t P auf der Kurve heraus. Die Linie, die durch das P u n k t e p a a r PQ und P verlauft, wird, wie 6
Dies weicht leicht von der iiblichen Schreibweise Tx^M. oder T2;Q(R) ab.
5.1 Differenzierbare Funktionen
193
bereits benierkt, Sekante genannt. Wir zwingen nun den Punkt P entlang der Kurve imnier naher an PQ heran. Falls sich die Sekante dabei an eine bestimmte Gerade annahert, dann ist diese „Grenzwertgerade" die Tangente der Kurve in PQ. Entgegen unserer Intuition ist eine derartige Definition der Tangente fiir uns im Augenblick nicht moglicli, da wir niclit wissen, was eine Kurve ist und was es bedeutet, dass „ein Punkt entlang der Kurve einem anderen Punkt immer naher kommt" und scliliefilicli, was unter der Aussage, dass sich die „Sekante einer bestimmten Geraden annahert", zu verstehen ist. Statt diesen Begriffen eine prazise Bedeutung zu verleihen, woUen wir einen prinzipiellen Unterschied zwischen den beiden hier vorgestellten Definitionen einer Tangente deutlich niachen. Die Zweite war rein geometrisch und ohne Zusammenhang (zumindest solange, wie sie nicht prazise ist) zu einem Koordinatensystem. Bei der Ersten haben wir jedoch die Tangente an eine Kurve, die der Graph einer differenzierbaren Funktion ist, in einem Koordinatensystem definiert. Natiirlich stellt sich die Frage, ob die Kurve in einem anderen Koordinatensystem noch differenzierbar ist oder, falls sie differenzierbar ist, ob sie eine andere Gerade als Tangente besitzt, wenn die Berechnungen mit neuen Koordinaten ausgefiihrt werden. Diese Frage nach der Invarianz, d.h. der Unabhangigkeit vom Koordinatensystem, tritt immer dann auf, wenn ein Konzept mit Hilfe eines Koordinatensystems eingefiihrt wird. Diese Frage stellt sich im gleichen AusmaB beim Begriff der Geschwindigkeit, die wir in Absatz 5.1.1 diskutiert haben, und die, wie wir bereits bemerkt haben, das Konzept einer Tangente beinhaltet. Punkte, Vektoren, Geraden und so welter besitzen in verschiedenen Koordinatensystemen (Koordinaten eines Punktes, Komponenten eines Vektors, die Geradengleichung) verschiedene numerische Charakteristika. Wenn wir jedoch die Formeln kennen, die zwei Koordinatensysteme miteinander verbinden, dann konnen wir bei zwei numerischen Darstellungen immer bestimmen, ob sie Ausdriicke fiir dasselbe geometrische Objekt in unterschiedhchen Koordinatensystemen sind oder nicht. Unsere Intuition sagt uns, dass die in Absatz 5.1.1 vorgestellte Prozedur fiir die Definition der Geschwindigkeit unabhangig vom Koordinatensystem, in dem die Berechnungen ausgefiihrt werden, zum selben Vektor fiihrt. Zu geeigneter Zeit, bei der Untersuchung von Funktionen mehrerer Variabler, werden wir eine detaillierte Untersuchung auf Fragen dieser Art anfiihren. Die Invarianz der Definition der Geschwindigkeit bzgl. verschiedener Koordinatensysteme wird im nachsten Abschnitt bewiesen. Bevor wir uns der Untersuchung besonderer Beispiele zuwenden, woUen wir einige der Ergebnisse zusammenfassen. Wir trafen auf das Problem, mathematisch die momentane Geschwindigkeit eines sich bewegenden Korpers zu beschreiben. Dieses Problem fiihrte uns auf das Problem der Approximation einer gegebenen Funktion in der Umgebung eines bestimmten Punktes durch eine lineare Funktion, was uns bei der geometrischen Interpretation zur Tangente fiihrte.
194
5 Differentialrechnung
Wir gehen davon aus, dass Funktionen, die die Bewegung realer mechanischer Systeme beschreiben, eine derartige lineare Approximation erlauben. Auf diese Weise fanden wir die Klasse der dijferenzierbaren Funktionen in der Klasse aller Funktionen. Das Konzept des Differentials einer Funktion in einem Punkt wurde eingefiihrt. Das Differential ist eine lineare Abbildung, die auf Verscliiebungen des betracliteten Punktes definiert ist und die das Verhalten des Inkrements einer differenzierbaren Funktion in einer Umgebung des Punktes bis auf eine Grofie, die im Vergleicli zur Verschiebung infinitesimal ist, besclireibt. Das Differential df{xo)h = f'{xo)h wird voUstandig durcli die Zahl / ' ( X Q ) , die Ableitung der Funktion / in a;o, bestimmt. Sie kann als Grenzwert rif . f (xo) =
,hm E3x^xo
fix) -
fjxo)
X — Xo
bestimmt werden. Die pliysikalische Bedeutung der Ableitung ist das Ausmafi an Verdnderung einer Grofie f{x) zur Zeit XQ. Ilire geometrische Bedeutung ist die Steigung der Tangente an den Graphen der Funktion y = f{x) im Punkt (a;o,/(a;o)). 5.1.5 Einige Beispiele Beispiel 1. Sei f{x) = sin a;. Wir werden zeigen, dass f'{x) = cos a;. Beweis. lim h-s-o
sinfx +/i) - sina; ,. 2sin ( | ) cos (x + | ) ^ -^ = lim ^'^' ,—^^ ^^ = h /i->o h
(
h,\ ,.
sin(f)
= lim cos (x -\— • lim —,, , h^o V 2 / h^o ( I )
= cos x .
D
Hierbei liaben wir den Satz zum Grenzwert eines Produktes, die Stetigkeit der Funktion cos a;, die Aquivalenz sint ~ t fiir t —>• 0 und den Satz zum Grenzwert einer verketteten Funktion benutzt. >iel 2. Wir werden zeigen, dass cos' x = — sin a;. Beweis. hm h-s-o
cosfa; +/i) - cosa; ,. - 2 s i n ( | ) sin (x + | ) ^^ -^ = hm ^^ ^^ ^^ = h h-s-o h ,• • f h\ ,. sin ( I ) = — hm sm [x + — ) • hm —77—— = — smx . h^o V 2 / h^o ( I )
Beispiel 3. Wir werden zeigen, dass die Ableitung zu f{t) = rcosujt, —rujsmujt lautet.
f'{t)
5.1 Differenzierbare Funktionen
195
Beweis. ,. r cos Luit + h)-r lim ^ h ft->o ,.
.
cos cut
,. - 2 s i n ( ^ ) sinwft + | ) = r /i->o lim ^ ^ 'h ^ ^' — /i\
/
lim sm uj[t -\
,.
sm 1-5- ,
• lim —, , ;
= —ruj sm ujt
Beispiel 4- Sei f{t) = rsmcot, dann ist f'{t) = rujcoscot. Beweis. Der Beweis ist zu denen in den Beispielen 1 und 3 analog. 5. Die momentane Geschwindigkeit und die momentane Beschleunigung einer Punktmasse. Angenommen, eine Punktmasse bewege sich in einer Ebene und ihre Bewegung werden in einem gegebenem Koordinatensystem durch die nach der Zeit ableitbaren Funktionen X = x{t) und y = y{t) beschrieben oder, was dasselbe ist, durch den Vektor
r{t) = {x{t),yit)) . Wie wir in Absatz 5.1.1 erklart haben, entspricht die Geschwindigkeit des Punktes zur Zeit t dem Vektor v ( t ) = f ( t ) = (i(t),2/(t)) , wobei x{t) und y{t) die Ableitungen von x{t) und y{t) nach der Zeit sind. Die Beschleunigung a(t) entspricht dem AusmaB an Veranderung des Vektors v(t), so dass a ( t ) = v ( t ) = f ( t ) = (a;(t),y(t)) , wobei x{t) und y{t) die Ableitungen der Funktionen x{t) und y{t) nach der Zeit sind, die zweite Ableitungen von x{t) und y{t) genannt werden. Somit miissen, im Sinne des physikalischen Problems, die Funktionen x{t) und y{t), die die Bewegung einer Punktmasse beschreiben, sowohl eine erste als auch eine zweite Ableitung besitzen. Wir wollen insbesondere die gleichformige Bewegung eines Punktes entlang eines Kreises mit Radius r betrachten. Sei uj die Winkelgeschwindigkeit des Punktes, d.h. die GroBe des Winkels, den der Punkt in der Einheitszeit iiberstreicht. In kartesischen Koordinaten (mit den Definitionen der Funktionen cos a; und sin a;) lauten diese Funktionen: r(t) = (^r cos{ujt + a), r sm{ujt + a)) , und fiir r(0) = (r, 0) nimmt sie die folgende Form an: r(t) = i^r cos Lvt, r sin Lvt) .
196
5 Differentialrechnung
Ohne Verlust der AUgenieinheit bei unseren weiteren Herleitungen werden wir zur Abkiirzung annehmen, dass r(0) = (r, 0). Dann erhalten wir mit den Ergebnissen aus den Beispielen 3 und 4: v(t) = r{t) = {—ru) sin cut, ru) cos cot) . Die Berechnung des inneren P r o d u k t s ( v ( t ) , r ( t ) ) = —r'^uj sin Lvt cos ujt + r'^ uj cos ujt sin ujt = 0 besagt, wie wir fiir diesen Fall nicht anders erwarten konnen, dass der Geschwindigkeitsvektor v(t) zum Radiusvektor r ( t ) senkrecht ist und dalier entlang der Tangente des Kreises gericlitet ist. Als Naclistes erhalten wir fiir die Besclileunigung a(t) = v(t) = r{t) = {—ruj'^ cosujt, —rw^ sinwt) , d.li., a(t) = —uj'^r{t) und die Beschleunigung ist somit tatsachlicli zentripetal, da sie dem Radiusvektor r(t) entgegen gerichtet ist. AuBerdem gilt \a{t)\=Lo''\T(t)\=u:\=^-^^
=
-
mit V = |v(t)|. Ausgeliend von diesen Formeln wollen wir beispielsweise die Gescliwindigkeit eines Erdsatelliten in tiefer Hohe bereclinen. In diesem Fall entspricht r dem Radius der Erde, d.li. r = 6400 km, walirend |a(t)| = g mit g « l O m / s ^ die Beschleunigung fiir den freien Fall an der Erdoberflache ist. Somit ist 1-2 = |a(t)|r « l O m / s ^ x 64 • lO'^ m = 64 • lO*' (m/s)^ und daher V wS-lO^m/s. Beispiel 6. Die optischen Eigenschaften eines Parabolspiegels. Wir wollen die Parabel y = j-x"^ (p > 0, vgl. Abb. 5.4) betrachten und die Tangente im P u n k t {xo,yo) = [xo,-^xl) konstruieren. Da f{x) = -^x'^, erhalten wir 1 2
f'{xo)
^X = lim —
x^xo
1 2 -
1 .. , 1 — = -— lim (x + XQ) =, -XQ .
^XQ
X — XQ
p
2p x^xo
Folglich besitzt die gesuchte Tangente die Gleichung: 1
2
1
y- :r^o = 2p
.
^
-xo(x-xo) p
oder -xo{x P mit 2/0
2p-^o-
- xo) - {y - yo) = 0 ,
(5.25)
5.1 Differenzierbare Funktionen
197
Der Vektor n = ( — ^XQ, l ) ist, wie aus dieser letzten Gleichung abgelesen werden kann, senkrecht zur Geraden mit der Gleichung (5.25). Wir warden zeigen, dass die Vektoren e^ = (0,1) und e / = ( — a;o, f — yo) niit n dieselben Winkel einschliei3en. Der Vektor e^ ist ein Einheitsvektor, der entlang der yAchse gerichtet ist. Dagegen ist e / vom Beriihrpunkt {xo,yo) = (a;oi ^rja^o) zum P u n k t (O, | ) gerichtet, dem Fokus der Parabel. Daher ist: 1 |e/||n| (e/,n)
i„2
§ + :^ 2p-^0
2p-^0
cose/n 2p^0J
,2 + 2p^0J
Somit haben wir gezeigt, dass eine Strahlenquelle im P u n k t ( 0 , | ) , dem Fokus der Parabel, zu einem Strahl fiihrt, der parallel zur Spiegelachse (der 2/-Achse) verlauft, und dass ein parallel zur Spiegelachse auftreffender Strahl durch den Fokus verlauft (vgl. Abb. 5.4). Beispiel 7. In diesem Beispiel werden wir zeigen, dass die Tangente bloB die beste lineare Approximation an den Graphen einer Funktion in einer Umgebung des Beriihrpunktes ist und nicht notwendigerweise nur einen P u n k t mit der Kurve gemeinsam besitzt, wie es beim Kreis oder im AUgemeinen bei konvexen Kurven der Fall ist. (Fiir konvexe Kurven werden wir eine eigene Untersuchung durchfiihren.) Die Funktion sei durch x'^ sin i , fiir a; ^ 0 /(a;) 0 ,
fiir a; = 0
jegeben. Der G r a p h dieser Funktion ist als dicke Linie in Abb. 5.5 dargestellt. Wir suchen nach der Tangente an den Graphen im P u n k t (0, 0). Da /'(O) = hm^ x->0
x'^ sin i
0
lim X sin — x->0
X
0
198
5 Differentialrechnung
x^ sin — ,
fiir fiir
a; / 0, X= 0
A b b . 5.5. besitzt die Tangente die Gleichung y — 0 = 0 • (x — 0) oder einfach y = 0. Somit ist in diesem Beispiel die a;-Achse die Tangente, die vom Graphen unendlich oft in jeder Umgebung des Beriihrpunktes geschnitten wird. Laut Definition der Differenzierbarkeit einer Funktion / : _B —>• M ini P u n k t XQ G E erhalten wir f{x)
— ,f{xo) = A{xo){x
— XQ) + o{x — XQ) fiir x —>• XQ, X G E .
Da die rechte Seite dieser Gleichung iiiT x ^ XQ, x G E gegen Null strebt, folgt, dass lim f{x) = f{xo), so dass eine in einem P u n k t differenzierbare EBX^XO
Funktion notwendigerweise in diesem P u n k t stetig ist. Wir werden zeigen, dass der Unikehrschluss natiirlich nicht inimer wahr ist. Beispiel
8. Sei f{x) lim X^tXQ—O
lim
= |a;| (vgl. Abb. 5.6). Dann ergibt sich im P u n k t XQ = 0:
f{x)-f{xo) X — XQ
fix) - fjxo) X — XQ
,.
lim
kl-0 N
0 a; - 0 lim 'x\ - 0 >+0 X
0
lim «->-0
= —1 , X
lim —
1
s^+O X
Folgerichtig besitzt die Funktion in diesem P u n k t keine Ableitung und ist daher in diesem P u n k t nicht differenzierbar. Beispiel 9. Wir werden zeigen, dass e*+'' — (f = (fh + o{h) fiir h ^ Q. Damit ist die Funktion exp(a;) = e^ differenzierbar mit dexp(a;)/i = exp(a;)/i, bzw. de^ = e^dx und daher ist exp'a; = e x p x , bzw. ^ ^ = e^.
5.1 Differenzierbare Funktionen
199
A b b . 5.6. Beweis. ^x+h
e'={e'' -1)
=e''{h
+ o{h)) =e'=h + o{h)
Hierbei haben wir die Forniel e^ — 1 = h + o{h), die wir in Beispiel 39 in Absatz 3.2.4 erhalten haben, benutzt. D Beispiel 10. Sei a > 0. Dann ist ax + h gilt da* = a * ( l n a ) d x und ^ ^ = a ^ l n a .
a^{\na)h
+ o{h) fiir /i ^ 0. Somit
Beweis. ^x+h _^x
^ ^x^^h _^^^
= a^iyhhia Beispiel
a=^(e''i"« - 1) =
+ o ( / i l n a ) ) = a^{\na)h
+ o{h) fiir /i ^> 0 .
D
11. Sei x ^ Q. Dann ist In |x + /i| — In \x\ = ^/i + o{h) fiir /i —>• 0.
Somit gilt d i n |x|
Idx und
^ ^
Beweis. In |a; + /i| — In \x\ Fiir \h\ < \x\ erhalten wir | l + f Werte von h schreiben konnen:
In I
1-
ln|l + ^ '
X
:, so dass wir fiir geniigend kleine
h\ - In \x\ = In f 1 + - ) = - + o{-] \ xJ X \xJ
= -h + o{h) X
fiir /i ^ 0. Hierbei haben wir die Gleichung l n ( l + 1 ) = t + o{t) fiir t ^ 0, die wir in Beispiel 38 in Absatz 3.2.4 gezeigt haben, benutzt. D 12. Sei X ^ 0 und 0 < a ^ 1. Dann gilt fiir /i —>• 0: log^ \x -\- h\ — lo.-» ,a;| = jY^h
+ o{h). Somit ist dlog„ \x\ = -rrtr^dx und —SSaJii — xln -J—a' a; In a dx
Beweis. l0g„ \x + h\-
l0g„ \x\ = l0g„ 1 + -
In a
\
X/
= loga ( l +
InaVx
\x/
-)
/
;ln a
h + o{h)
Hierbei haben wir die Formel fiir den Ubergang von einer Logarithmenbasis zu einer anderen und die in Beispiel 11 ausgefiihrten Betrachtungen eingesetzt. D
200
5 Differentialrechnung
5.1.6 Ubungen und Aufgaben 1. Zeigeii Sie: a) Die Tangentengleichung zur Ellipse 2
X
2
y
h— = 1
lautet im Punkt {xo,yo) folgendermafien : XXQ
yyo_ ^
b) Eine Ellipse mit den Halbaclisen a > 6 > 0 besitze die Foki Fi = ( —\Ja? — 62, 0 J und F2 = (^02 - 6 2 , 0 ) . Befindet sicli in einem der Foki eine Lichtquelle, dann wird deren Licht von einem elliptischen Spiegel ini anderen Fokus eingesanimelt. 2. Schreiben Sie die Fornieln fiir die nalierungsweise Bereclinung der folgenden Werte: a) sin ( f- + Q J fiir a nalie 0, b) sin(30° + Q ° ) fiir a° nalie 0, c) cos ( -J + Q 1 fiir a nalie 0, d) cos(45° + a°) fiir a° nalie 0. 3. Ein Wasserglas drehe sicli um seine Aclise mit konstanter Winkelgeschwindigkeit cij. Sei y = f{x) die Gleicliung der Kurve, die sicli als Sclinitt der Fliissigkeitsoberflache mit einer Ebene durcli die Dreliachse ergibt. a) Zeigen Sie, dass f'{x) = ^x, wobei g die Gravitationskonstante ist (vgl. Beispiel 5). b) Walilen Sie eine Funktion f{x), die die in Teil a) gestellte Bedingung erfiillt (vgl. Beispiel 6). c) Verandert sicli die Bedingung fiir die Funktion f{x) aus Teil a), wenn die Drehachse niclit mit der Aclise des Glases iibereinstimmt? 4. Ein als Punktmasse auffassbarer Korper gleite unter dem Einfluss der Scliwerkraft einen sanften Hiigel hinunter. Der Hiigel sei der Graph der differenzierbaren Funktion y = f(x). a) Bestimmen Sie die horizontalen und die vertikalen Komponenten des Besclileunigungsvektors, den der Korper im Punkt (xo,yo) besitzt. b) Bestimmen Sie fiir den Fall f{x) = x'^, wobei der Korper aus grofler Hohe gleitet, den Punkt der Parabel y = x'^, in dem die liorizontaler Komponente der Beschleunigung maximal ist.
5. Sei
fiir 0 < X < i ,
I'oix) 1 — X , fiir I < X < 1
5.2 Wichtige Ableitungsregeln
201
Erweitern Sie diese Funktion fiir die ganze reelle Gerade so, dass sie Periode 1 besitzt. Wir bezeichnen die erweiterte Funktion mit ipo- Sei ferner
Die Funktion (pn bat die Periode 4~" und besitzt iiberall eine Ableitung gleich + 1 oder —1, aufier in den Punkten x = .2
fix) = ^Vni^:)
•
n= l
Zeigen Sie, dass die Funktion / definiert und auf R stetig ist, aber in keinem Punkt eine Ableitung besitzt. (Dieses Beispiel geht auf den wohl bekannten niederlandischen Mathematiker B. L. van der Waerden (1903-1996) zuriick. Die ersten Beispiele fiir stetige Funktionen, die keine Ableitungen besitzen, wurden von Bolzano (1830) und Weierstrafl (1860) konstruiert.)
5.2 Wichtige Ableitungsregeln Das Differential einer gegebenen Funktion zu konstruieren, oder, was aquivalent dazu ist, ihre Ableitung zu finden, wird Differentiation^ genannt. 5.2.1 D i f f e r e n t i a t i o n u n d a r i t h m e t i s c h e O p e r a t i o n e n S a t z 1. Sind die Funktionen / : AT —>• ffi und g : X ^ differenzierbar, dann a) ist ihre Summe in x differenzierbar mit:
if+9nx)
= {f' + g'){x);
b) ist ihr Produkt in x differenzierbar {f-g)'{x)
= nx)-g{x)
c) falls g{x) ^ 0, ist ihr Quotient
W im Punkt x G X
mit: +
f{x)-g'{x)-
in x differenzierbar
mit:
'f\\._f'{x)9{x)-f{x)g'{x)
( )g)' < 7
g^{x)
Obwohl es mathematisch aquivalent ist, das Differential zu bestimmen oder die Ableitung zu finden, sind das Differential und die Ableitung dennoch nicht dasselbe. Aus diesem Grund gibt es etwa im Deutschen wie im Franzosischen zwei Ausdriicke - ableiten bzw. derivation fiir das Finden der Ableitung und differenzieren bzw. differentiation fiir das Bestimmen des Differentials.
202
5 Differentialrechnung
Beweis. Wir werden den Beweis auf der Definition einer difFerenzierbaren Funktion und den Eigenschaften des Symbols o(-), die wir in Absatz 3.2.4 bewiesen haben, aufbauen. a)
(/ + g){x + h)-{f
+ g){x) = {f{x + h) + g{x + h)) -
- {fix) + g(x)) = [fix + h)- fix)) + [gix + h) - gix)) = = {f'{x)h + o{h)) + {g'{x)h + o{h)) = (fix) + g'{x))h + o{h) = = [f + g'){x)h + 0{h) .
h)
if • g){x + h)-{f- g){x) = fix + h)gix + h) - fix)gix) = = ifix) + f'ix)h + oih)) igix) + g'ix)h + o(/i)) - fix)gix) = if'ix)gix)+fix)g'ix))h
=
+ oih).
c) Da eine in eineni Punkt x G X difFerenzierbare Funktion in diesem Punkt stetig ist, konnen wir aufgrund der Eigenschaften stetiger Funktionen garantieren, dass gix + h) ^ 0 fiir geniigend kleine Werte von h, falls gix) ^ 0. Bei den folgenden Bereclinungen wird angenommen, dass h klein ist:
(^)i^+h)-a)ix)=i^-i^= \gJ
\gJ
gix + h)
gix)
= "TTT—TTT gix)gix + h)'(/(^ + M5(a;) - fix)gix = [-^+oil)')iifix) = (
+ f'ix)h ^
+ h)) =
+ oih))gix)-fix)igix)+g'ix)h
+ «(!)) {if'(^)9i^)
- fi^)9'{^))h f'ix)gix)
+ oih))) =
+ oih)) =
- fix)g'ix) -h + oih) g'^ix)
Hierbei haben wir die Stetigkeit von g im Punkt x und die Ungleichung gix) ^ 0 benutzt und dass lim h^o gix)gix + h)
g^ix) '
d.h. 1 gix)gix + h)
_
1 g^ix)
wobei o(l) fiir /i ^ 0 mit x + h G X infinitesimal ist.
D
KoroUar 1. Die Ahleitung einer Linearkombination von differenzierbaren Funktionen ist gleich der Linearkombination der Ableitungen dieser Funktionen.
5.2 Wichtige Ableitungsregeln
203
Beweis. Da eine konstante Funktion offensichtlich difFerenzierbar ist und die Ableitung in jedem Punkt gleich 0 ist, erhalten wir mit Aussage b) aus Satz 1, wenn wir / = const = c setzen, dass {cgy{x) = cg'{x). Nun konnen wir mit Aussage a) aus Satz 1 schreiben: (ci/ + C23)'(a;) = (ci/)'(a;) + (c23)'(a;) = cif'{x) + c^g {x) . Wenn wir das eben Bewiesene beriicksichtigen, konnen wir durch Induktion zeigen, dass ( C l / l + • • • + Cnfn)'{x)
= Cifiix)
+ ••• + Cnfl,{x)
.
D
KoroUar 2. Sind die Funktionen / i , . . . , /„ in x dijferenzierbar, dann gilt: {h---fn)'{x)
= f[{x)h{x)---U{x) + fl{x)!2{x)fz{x)
• • • fn{x)
+ + ••• + fi{x)---
fn-l{x)f'^{x)
.
Beweis. Fiir n = 1 ist die Aussage oflFensichtlich. Wenn die Aussage fiir ein n £ N gilt, dann gilt sie nach Aussage b) aus Satz 1 aucli fiir (n + 1) € N. Mit dem Induktionsprinzip folgern wir, dass die Formel fiir jedes n £ N Giiltigkeit besitzt. D KoroUar 3. Aus dem Zusammenhang zwischen Ableitung und Differential folgt, dass Satz 1 auch fiir Differentiale formuliert werden kann. Auf den Punkt gebracht: a) d ( / + g){x) = df{x) + dg{x) ; b) d ( / • g){x) = g{x)df{x) + f{x)dg{x) ; C) d ( i ) ( x ) = « ( - ) d / ( x ) - / ( ^ ) d a ( x ) ^ ^ ^ ^ ( ^ ) _, 0
Beweis. Wir woUen exemplariscli Aussage a) zeigen. d ( / + g){x)h = (/ + gy{x)h = (/' + g'){x)h = = (fix) + g'{x))h = f'{x)h + g'{x)h = = df{x)h + dg{x)h = (df{x) + dg{x))h . Somit haben wir gezeigt, dass d{f -\-g){x) und df{x)-\-dg{x) sind.
dieselbe Funktion D
Beispiel 1. Invarianz der Geschwindigkeitsdefinition. Wir konnen nun nacliweisen, dass der momentane Geschwindigkeitsvektor einer Punktmasse, der in Absatz 5.1.1 definiert wurde, vom verwendeten kartesischen Koordinatensystem unabhangig ist. Wir werden dies sogar fiir alle affinen Koordinatensysteme zeigen. Seien {x^ ,x'^) und (x^, x"^) die Koordinaten desselben Punktes in der Ebene in zwei unterschiedlichen Koordinatensystemen, die durch die Gleichungen x^ = alx^ + a\x'^ + b^ , 2 _ „ 2 ^ 1 , „ 2 ^ 2 , L2 x"^ = a\x^ + a^x"^ + h
(5.26)
204
5 Differentialrechnung
niiteinander verbunden sind. Da jeder Vektor (ini afRnen Rauni) durch ein P u n k t e p a a r bestinimt wird und seine Koniponenten der DifFerenz der Koordinaten des Anfangs- und Endpunktes des Vektors entsprechen, sind die Komponenten eines vorgegebenen Vektors in diesen beiden Koordinatensystemen durch die Gleichungen «! = a\v^ + a\v^^ , w^ = a\v^ + ajW^
,g 27) '
niiteinander verbunden. Wird das Bewegungsgesetz des P u n k t e s in einem der Koordinatensysteme durch die Funktionen x^{t) und x'^{t) beschrieben, dann wird es im anderen System durch die Funktionen x^{t) und Sp'{t) beschrieben, die durch die Gleichungen (5.26) mit den Ersteren verkniipft sind. Wenn wir die Gleichungen (5.26) nach der Zeit ableiten, erhalten wir mit den Ableitungsregeln: ^2 _ X
2-1
— OJ-\X
2-2
^^-2^)
~\~ CloX
Daraus folgt, dass die Komponenten {v^,v'^) = {x^,x^)
des Geschwindig•1
'2
keitsvektors im ersten System und die Komponenten (w^,^^) = (x ,x ) des Geschwindigkeitsvektors im zweiten System tatsachlich durch die Gleichungen (5.27) verkniipft. Dies zeigt uns, dass wir es mit zwei unterschiedlichen Ausdriicken fiir denselben Vektor zu t u n haben. Beispiel 2. Sei f{x) = tana;. Wir werden zeigen, dass in jedem P u n k t in dem cos a; 7^ 0 ist, f'{x) = V gilt, d.h. im gesamten Definitionsbereich der Funktion t a n x = -^^S-S.. cos X In den Beispielen 1 und 2 in Abschnitt 5.1 haben wir gezeigt, dass sin'(a;) = cos a; und cos'a; = — s i n x , so dass nach Aussage c) aus Satz 1 fiir cos a; ^ 0 gilt: , /sm\' sm X cos X — sm x cos x tan X = (x) = I (X) Vcos/ COS/ COS X COS X + sm x sm x
Beispiel 3. cot' x = —-^^s-^ iiberall da, wo sin a; ^ 0, d.h. im Definitionsbereich voncotx = fff. Tatsachlich gilt: , /cos\' , cot X = -;— (x) Vsm sm/ • '
cos X sm X — cos x sm x sin^ x sm X sm X — cos x cos x sin^ X
svo? X
5.2 Wichtige Ableitungsregeln
205
Beispiel 4- 1st P{x) = CQ + cix + • • • + c„x" ein Polynom, dann ist P'{x) = C\ + 2C2X + • • • +
nCnX'^~^.
Da gf = 1, erhalten wir mit Korollar 2, dass ^ r = nx"~^. Die Aussage folgt nun unmittelbar aus Korollar 1.
5.2.2 Differentiation einer verketteten Funktion (Kettenregel) Satz 2. (Kettenregel) Ist die Funktion f : X ^ Y C M. im Punkt x G X differenzierbar und ist die Funktion g :Y ^ W im Punkt y = f{x) G Y dijferenzierbar, dann ist die verkettete Funktion go f : X ^ W in x differenzierbar und das Differential d{g o f){x) : TW{x) —>• TW(^g(^f(x))) der verketteten Funktion ist gleich der Verkettung dg{y) o df{x) ihrer Differentiate Af{x) : TK(x) ^ TW{y = f{x))
und dg{y = f{x)) : T^y)
^ T^g{y))
.
Beweis. Die Bedingungen fiir die Differenzierbarkeit der Funktionen / und g lauten: fix + h)-
fix) = f'{x)h
+ o{h) fiir /i ^ 0, a; + /i e X ,
9{y + t)- giy) = g'{y)t + oit) fiir t ^ o, y +1 e y . Wir merken an, dass wir davon ausgelien konnen, dass o{t) in der zweiten Gleicliung fiir t = 0 definiert ist und dass wir im Ausdruck o{t) = 7(t)t, mit 7(t) —>• 0 fiir t —>• 0, 2/ + t e F , annelimen konnen, dass 7(0) = 0. Wenn wir f{x) = y und fix + h) = y + t setzen, erhalten wir aufgrund der Differenzierbarkeit (und somit Stetigkeit) von / im Punkt x, dass t —>• 0 fiir h ^ 0 und dass fiir x + h G X gilt: y +1 £ Y. Nach dem Satz zum Grenzwert einer verketteten Funktion erhalten wir nun, dass 7(/(a; + h)-
fix))
= a(/i) ^ 0 fiir /i ^ 0, a; + /i £ AT ,
und somit fiir t = fix + h) — fix), o{t) = lifix
+ h)-
dass
fix)) [fix + h)-
fix))
= aih) {f'ix)h + oih)) = aih)f'ix)h
= + a(/i)o(/i) =
= oih) + oih) = oih) fiir h ^ 0, X + h G X . Somit erhalten wir (3 o /)(x + ft) - (3 o f)ix) = g{fix + h)) -gifix))
= 9iy + t)-giy)=g'iy)t = 9'{fix)) = 9'{fix))
{fix + h)-
fix)) + o{fix + h)-
{f'ix)h + oih)) + o{fix + h)-
= 9' {fix)) {f'ix)h)
=
+ oit) =
+ g' {fix)) {oih)) +o{fix
fix)) fix))
= =
+ h)-
fix))
.
206
5 Differentialrechnung
Da wir den Ausdruck g'{f{x)) [f'{x)h)
als Wert dg{^f{x)) o df{x)h
kettung h
der Abbildungen h t ^ ^ f'{x)h
^^(^HI^-^^^^)
g'ifix))
• f{x)h
der Verund
T I—> g'{y)T in h interpretieren konnen, bleibt fiir den Abschluss des Beweises nur noch anzumerken, dass die Summe g'[f{x)){o{h))+o{f{x
+
h)-f{x))
im Vergleich zu h fiir /i—>-0, a; + / i £ X infinitesimal ist, oder, wie wir bereits festgestellt haben, dass o{f{x + h)-
fix))
= o{h) iiir h^O,x
+ hGX
.
Somit haben wir bewiesen, dass (g o f)(x
+ h) - (g o f)(x)
= a'(/(a;)) • f'ix)h
=
+ o{h) fiir /i ^ 0, a; + /i e X .
D
KoroUar 4. Die Ahleitung (g o f)'{x) der Verkettung differenzierbarer Funktionen mit reellen Werten ist gleich dem Produkt g'{f{x)) • f'{x) der Ableitungen dieser Funktionen in den entsprechenden Punkten. Es besteht die groBe Versuchung, fiir diese Aussage in der Schreibweise, die Leibniz fiir die Ableitung einfiihrte, einen kurzen Beweis zu geben: dz dx
dz dy
dy dx
fiir z = z{y) und y = y{x). Dies erscheint vollig natiirlich, wenn wir die Symbole j ^ und -^ nicht als Einheit, sondern als Verhaltnis von dz zu dy und dy zu dx betracliten. Wir konimen dabei auf die folgende Beweisidee, bei der wir die Differenzenquotienten Az _ Az Ay Ax Ay Ax betracliten und dann zum Grenzwert fiir Ax -^ 0 iibergehen. Die dabei auftretende Schwierigkeit (mit der wir teilweise schon zu tun batten) ist, dass Ay fiir Ax ^ 0 Null werden kann. KoroUar 5. Existiert die Verkettung (fn ° • • • ° fi){x) tionen yi = fi{x),...,yn = fniVn-i), dann gilt: (/n ° • • • ° fi)'{x) = /;(y„_i)/;_i(y„_2)
differenzierbarer Funk-
•••f[{x).
Beweis. Die Aussage gilt offensichtlich fiir n = 1. Gilt sie auch fiir ein n € N, dann gilt sie nach Satz 2 auch fiir n + 1, so dass sie nach dem Induktionsprinzip fiir alle n € N zutrifft. D
5.2 Wichtige Ableitungsregeln 5. Wir wollen fiir a; > 0 zeigen, dass fiir a € M gilt: ^^ d.h. da;" = ax"~^dx und {x + h)" -x"
= ax"-^h
207
= ax" ^,
+ o{h) fiir /i ^ 0 .
Beweis. Wir schreiben x" = e"'"* und wenden Satz 2 an, wobei wir die Ergebnisse aus den Beispielen 9 und 11 aus Abschnitt 5.1 und Aussage b) aus Satz 1 einbeziehen. Sei g{y) = e^ und y = f{x) = Q;ln(x). Dann ist x" = {g o f){x) und
(9 ° fYi^) = g'iy) • fix) = e^ • f = e"'"" • f = OCX"-' • Beispiel 6. Die Ableitung des Logarithmus des Betrags einer difFerenzierbaren Funktion wird oft als logarithmische Ableitung bezeichnet. Da F{x) = ln|/(a;)| = (lno| | o f){x), erhalten wir nach Beispiel 11 Abschnitt 5.1, dass F'{x) = ( l n | / | ) ' ( x ) = ^ . Somit ist: An i^i\/ ^ = ti^A d(ln|/l)(a.) - ^ d . =
d/(a;) - ^ .
Beispiel 7. Der durch fehlerhafte Daten im Argument verursachte absolute und relative Fehler im Wert einer differenzierbaren Funktion. Ist die Funktion / in x differenzierbar, dann ist f{x + h) — f{x) = f'{x)h
+ a{x; h) ,
mit a{x; h) = o{h) fiir h ^ 0. Ist daher das Argument x mit einem absoluten Fehler h behaftet, dann kann bei der Berechnung des Wertes f{x) einer Funktion, der durch diesen Fehler im Argument verursachte absolute Fehler \f{x + h) — /(a;)| im Funktionswert fiir kleines h durch den Betrag des Differentials \df{x)h\ = \f'{x)h\ ersetzt werden. Der relative Fehler kann dann aus dem Verhaltnis ' \f(J)\' = \fZ)\ berechnet werden oder als Produkt I^Tzf) | \h\ des Betrags der logarithmischen Ableitung der Funktion mit dem Betrag des absoluten Fehlers im Argument. Nebenbei merken wir an, dass fiir f{x) = Ina; das Differential d l n x = ^ lautet, und dass folglich der absolute Fehler bei der Berechnung eines Logarithmus gleich dem relativen Fehler im Argument ist. Dieser Umstand kann wundervollerweise beim Rechenschieber (und bei jedem anderen Gerat mit nicht gleichformigen Skalen) verwendet werden. Zur Prazisierung wollen wir uns vorstellen, dass wir mit jedem Punkt der reellen Gerade, der rechts von Null hegt, seine Koordinate y verbinden und diese oberhalb des Punktes notieren. Unterhalb des Punktes schreiben wir die Zahl x = e^. Dann ist y = \nx. Dieselbe reelle Halbgerade haben wir auf diese Weise mit einer gleichformigen Skala y und einer nicht gleichformigen Skala x (logarithmisch) versehen. Um In x zu bestimmen, muss der Zeiger nur auf die Zahl x gesetzt
•
208
5 Differentialrechnung
und die zugehorige Zahl y oberhalb abgelesen werden. Die Genauigkeit bei der Platzierung des Zeigers auf einen bestimmten P u n k t ist von der Zahl x oder dem entsprechenden y unabhangig. Sie wird durch Ay (die Lange des Intervalls einer moglichen Verschiebung) auf der gleichformigen Skala gegeben. Wir erhalten daher ungefahr denselben absoluten Fehler bei der Bestinimung einer Zahl x wie fiir ihren Logarithmus y. Bei der Bestinimung einer Zahl aus ihrem Logarithmus werden wir iiberall auf der Zahlengeraden ungefahr denselben relativen Fehler erhalten. Beispiel 8. Wir woUen eine Funktion ^(a;)''^^-' differenzieren, wobei u{x) und v{x) differenzierbare Funktionen sind niit u{x) > 0. Wir schreiben ^(a;)''^^-' = QV{X)\I\U(X) yj^j verwenden KoroUar 5. Dann gilt: ^ Q"W^^-^W
ax
[y' (^x)\-D.u{x) +v{x)^^
=
\ u(x) I = u(x)''(=^) • v'{x) I n u ( x ) + v{x)u{xy^''^-^
• u'{x) .
5.2.3 Differentiation einer inversen Funktion S a t z 3 . (Die f~^ :Y ^ X ander inverse ist auch f~^
Ableitung einer inversen Funktion). Seien f : X ^ Y und in den Punkten XQ G X und / ( X Q ) = yo G Y stetige und zueinFunktionen. Ist f in XQ differenzierbar und ,f'{xo) ^ 0, dann im Punkt yo differenzierbar, mit
Beweis. Da die Funktionen f : X ^ Y und f~^ -.Y^X zueinander invers sind, sind f{x) - f{xo) und ,f~^{y) - f~^{yo), rnit y = f{x), fiir x ^^ XQ ungleich Null. AuBerdem folgern wir aus der Stetigkeit von / in XQ und f~^ in yo, dass {X ^ x ^ XQ) <^ (Y B y ^ yo). Nun erhalten wir unter Benutzung des Satzes zum Grenzwert einer verketteten Funktion und den arithmetischen Eigenschaften des Grenzwertes, dass
hm LM^I:1M=
lin,
^-^0 lim
XBx^xo
_ 1
1
(/MnIiiolA \
X — Xo
f'(xo)
Somit haben wir gezeigt, dass die Funktion j ~ ^ : Y ^ Ableitung besitzt und dass
(r')'(2/o) = (/'(xo))"V
'
I
X vn yo eine
•
Anmerkung 1. Wenn wir im Voraus gewusst hatten, dass die Funktion / ~ ^ in 2/0 differenzierbar ist, wiirden wir sofort aus der Identitat (/~^ ° f){x) = x und dem Satz zur Differentiation einer verketteten Funktion folgern, dass
(/-')'M-/'(a;o) = l.
5.2 Wichtige Ableitungsregeln
209
Anmerkung 2. Die Bedingung f'{xo) ^ 0 ist oflFensichtlich zur Aussage aquivalent, dass die Abbildung h i->- f'{xo)h, die durch das Differential df{xo) • TK(a;o) —>• TR{yo) realisiert wird, die inverse Abbildung [d/(a;o)]~^ : TM.{yo) -^ TR{xo) besitzt, die durch die Formel T H^ (/'(a^o)) T gegeben wird. Daher konnen wir mit Hilfe des Differentials die zweite Aussage in Satz 3 wie folgt schreiben: Ist eine Funktion f in einem Punkt XQ dijferenzierbar und ist ihr Differential df{xo) : TM.{xo) —>• TW{yo) in diesem Punkt invertierbar, dann existiert das Differential der zu f inversen Funktion f~^ im Punkt yo = /(XQ) und ist die Abbildung dr\yo)
= [dfixo)]-'
: TR{yo) ^ TR{xo) ,
die zu df{xo) : TW{xo) —>• TM.{yo) invers ist. Beispiel 9. Wir werden zeigen, dass arcsin'y =
, ""'
fiir \y\ < 1. Die
Funktionen sin : [-7r/2,7r/2] -)• [-1,1] und arcsin : [-1,1] -?• [-7r/2,7r/2] sind zueinander invers und stetig (vgl. Beispiel 8 in Abschnitt 4.2) und sin'(a;) = cosa; ^ 0 fiir \x\ < 7r/2. Fiir |a;| < 7r/2 erhalten wir \y\ < 1 fiir die Werte y = sinx. Daher ist nach Satz 3: arcsin y
sin'a;
cosa;
^ 1 - sin^ x
v^l - 2/^
Das Vorzeichen vor der Wurzel wurde unter Beriicksichtigung der Ungleichung cosa; > 0 fiir |a;| < 7r/2 gewahlt. Beispiel 10. Mit ahnlichen Uberlegungen wie im vorigen Beispiel konnen wir zeigen (mit Hilfe von Beispiel 9 in Abschnitt 4.2), dass arccos'w =
,
fiir Iwl < 1 .
Denn wir erhalten: arccos y
1 cos'a;
1 sin a;
1 Vl - cos^ x
1 ^Jl - y'^
Das Vorzeichen vor der Wurzel wurde unter Beriicksichtigung der Ungleichung sin a; > 0 fiir 0 < a; < TT gewahlt. \spiel 11. arctan y = j ^ ^ , y £ K. Tatsachlich gilt: 1 aictan y-
1 - (Vcos^i X \/
= COS^ X
=
1 1 + tan^ x
1 1 + 2/2
210
5 Differentialrechnung 12. arccot'y = - j ^ , Tatsachlich gilt: 1 arccot y = cot'a; ;— = -.(
2/ £ K.
1 -2 -,—r- = — sm x rJ^—)
1 1 + cot^a;
1 + 2/ 2
Beispiel 13. Wir wissen bereits (vgl. die Beispiele 10 und 12 in Abschnitt 5.1), dass die Funktionen y = f{x) = a^ und x = f~^{y) = log„ y die Ableitungen f'{x) = a'^lna und {f~^)'{y) = j ^ besitzen. Wir woUen sehen, inwiefern ciies zu Satz 3 konsistent ist:
f'{x)
a^ I n a
ylna
'
^'^'^ = CFW = (5^ = '''" = "'''"• 14. Die Hyperbelfunktionen ihre Ableitungen. Die Funktionen
und die inversen Hyperbelfunktionen
und
sinha; = - ( e ^ — e~^) und cosh a; = -(e"" + e ~ ' " ) werden Sinus Hyperbolicus und Cosinus Hyperbolicus^ von x genannt. Diese Funktionen, die fiir den Moment nur rein formal eingefiihrt werden, treten in vielen Problemen genauso natiirlich auf wie die Winkelfunktionen sin a; und cos a;. Wir merken an, dass sinh(—a;) = — s i n h x und cosh(—a;) = cosh a; , d.h., der Sinus Hyperbolicus ist eine ungerade Funktion und der Cosinus Hyperbolicus ist eine gerade Funktion. AuBerdem ist die folgende wichtige Gleichung offensichtlich: cosh X — sinh x = 1 . Die Graphen der Funktionen y = sinha; und y = coshx sind in Abb. 5.7 dargestellt. Aus der Definition von sinh x und den Eigenschaften der Funktion e* folgt, dass s i n h x eine stetige und streng monoton anwachsende Funktion ist, die M bijektiv auf sich selbst abbildet. Daher existiert die inverse Funktion zu sinh x, sie ist auf ffi definiert, stetig und streng monoton anwachsend. Vom Lateinischen: Sinus hyperbolicus und cosinus hyperbolicus.
5.2 Wichtige Ableitungsregeln
211
sinh X
A b b . 5.7. Diese Inverse wird mit arsinhy (sprich: „Areasinus Hyperbolicus von y") bezeichnet^. Diese Funktion ist mit bereits bekannten Funktionen einfach formulierbar. Durch Losen der Gleichung 1
(e=^
l =y
nach X, erhalten wir nach und nach
+ yrTi (e^ > 0 und folglich e^ ^ y — \/T-\-y^)
mit
In {y + V l + 2/') • Somit ist arsinhy = In (y + y l + y"^) ,
y £
Ahnlich konnen wir mit Hilfe der Monotonie der Funktion y = coshx auf den beiden Intervallen K_ = {a; £ M| a; < 0} und ffi+ = {x £ M| a; > 0} die Funktionen arcosh_2/ und a r c o s h + y konstruieren, die fiir y > 1 definiert sind und zur Funktion cosh a; auf M_ bzw. ffi+ invers sind. Ihre Formeln lauten: arcosh_2/ = In (y — yy'^ — l ) arcosh_|_2/ = In (y + yy^
und
— l) .
® Der voile Name ist Arcus Sinus Hyperpolicus (Lat.). Der Grund fiir die Benutzung der Vorsilbe Area anstelle von Arc wird, wie auch die Winkelfunktionen, spater erklart werden.
212
5 Differentialrechnung Aus den oben vorgestellten Definitionen erhalten wir: sinh'x = - ( e * + e~^) = cosh a; und cosh' x = - (e* — e~^) = sinh x .
Nach dem Satz zur Ableitung einer inversen Funktion ergibt sich: arsinh'y
1
1
sinh'a;
1
cosh a;
1 ^ 1 + sinh^ x
V^ + v'^
arcosh' , = ^ ^ = - 4 - = , ' cosh X smhx _ Vcosh^ x-1 arcoshV, = ^ ^ = 4 - = cosh X smhx
= - ^ ^ , y > l , V2/^ - 1
, ' ^cosh^ x-1
= ^ ^ , y > l . V2/^ " 1
Diese letzten drei Gleichungen konnen bewiesen werden, wenn wir die exphziten Ausdriicke fiir die inversen Hyperbelfunktionen arsinh y und arcosh y benutzen. Beispielsweise ist arsinh'y =
^ ^ ( l + ^(1 + 2/")"'^" ' 2?/)
1 2/ + y i T y 2
VTT7 + y_ V l + y'
1 ^ 1 + 2/'
Wie tan x und cot x konnen wir die Funktionen tanha; =
sinhx coshx — und cothx = -^—— cosh x smh x
einfiihren, die als Tangens HyperboUcus und als Cotangens HyperboUcus bezeichnet werden. Ebenso auch die dazu inversen Funktionen, den Areatangens HyperboUcus artanhy = - I n , 2 1-y und den Areacotangens Hyperbohcus arcothy = - In 2 y -1
\y\ < 1
lyl > 1 .
Wir lassen die Losung der einfachen Gleichungen aus, die zu diesen Fornieln fiihren.
5.2 Wichtige Ableitungsregeln
213
Nach den Ableitungsregeln erhalten wir: sinli' X cosh x — sinh x cosh' x cosh^ x cosh X cosh X — sinh x sinh x
tanh';
2
1
~
'^^^
2—
cosh a; cosh a; cosh' X sinh a; — cosh x sinh' a; sinh X sinh a; sinh a; — cosh x cosh a; 1 sinh X sinh a;
coth'x
Nach dem Satz zur Ableitung einer inversen Funktion ergibt sich: ,/ artanh a; =
1 1 —;— = -.—^ tanh X
,2 r- = cosh x =
—^o—)
arcoth'. = ^ ^ =
\
cotn X
1
1
1 - tanh X
1-2/
, I2/I < 1 u n d
= - ^ x
• l-^ ] V
Sinn
X /
1 coth^ a; - 1
1 -, | 2 / I > l 2/^ - 1'
Die beiden letzten Fornieln konnen auch durch direkte Differentiation der expliziten Formeln fiir die Funktionen artanh y und arcothy erhalten werden.
5.2.4 Ableitungstabelle der wichtigen Elementarfunktionen Wir stellen nun (vgl. Tab. 5.1) die Ableitungen der wichtigen Elementarfunktionen, die wir in den Abschnitten 5.1 und 5.2 berechnet haben, zusanimen. 5.2.5 Differentiation einer sehr einfachen impliziten Funktion Seien y = y{t) und x = x{t) differenzierbare Funktionen, die in einer Unigebung [/(to) des Punktes to £ K definiert sind. Angenommen, die Funktion X = x{t) besitzt eine Inverse t = t(a;), die in einer Umgebung y(a;o) von a;o = a;(to) definiert ist. Dann kann die Grofie y = y{t), die von t abhangt, ebenso als implizite Funktion von x betrachtet werden, da y{t) = y(t{x)). Wir suchen die Ableitung dieser Funktion nach x im Punkt XQ unter der Annahnie, dass a;'(to) ^ 0. Mit Hilfe des Satzes zur Ableitung einer verketteten Funktion und dem Satz zur Ableitung einer inversen Funktion erhalten wir y.A
dy(t(a;)) Ax
_ Ay{t) At
At{x) Ax
dyjt) I
_ -^\t=to
(Hierbei nutzen wir die iibliche Schreibweise: /(a;)| _
dt
_
\t=to
:= f{xo).)
v'tih) *^
'
214
5 Differentialrechnung
K a n n dieselbe Grofie als eine Funktion verschiedener Arguniente betrachtet werden, dann werden wir, um Missverstandnisse bei der Ableitung zu vernieiden, die Variable, nach der wir difFerenzieren, explizit angeben. Beispiel 15. Das Gesetz zur Addition von Geschwindigkeiten. Die Bewegung eines P u n k t e s entlang einer Geraden ist vollstandig bestimmt, wenn wir zu jeder Zeit t die Koordinate x des P u n k t e s in unserem gewahlten Koordinatensystem (die reelle Gerade) und einem System, das wir zur Messung der Zeit gewahlt haben, kennen. Daher bestimmt das Zahlenpaar {x,t) die Position des P u n k t e s in R a u m und Zeit. Das Bewegungsgesetz wird in Form einer Funktion x = x{t) geschrieben. Angenommen, wir mochten die Bewegung dieses P u n k t e s mit Hilfe eines anderen Koordinatensystems {x,t) ausdriicken. Beispielsweise mag sich die reelle Gerade gleichformig mit der Geschwindigkeit —v relativ zum ersten
Tabelle 5.1. Funktion f{x)
Ableitung f'{x)
1. C (konst. 2. x"
0 ax"-^
3. o^ 4. loga kl 5. sinx 6. C O S T 7. t a n x
a'^lno X In a
Einschrankungen im Definitionsbereich fiir X G R X > 0 fiir Q G R a; e R fiir a e N a; e R (o > 0, a ^ 1) X G R \ 0 (o > 0, o 7^ 1)
COST
— sinx a; 7^ I + Trfc, fc G
8. cot X
X 7^ Trfc, fc G Z
9. arcsin x
\x\ < 1
10 . arccosx
\x\ < 1
11 . arctanx 12 . arccot X 13 . sinhx 14 . cosh a; 15 . tanha; 16. cotha;
— . ^-i
x^O
17. arsinha; = In (x + V l + a;^ 1
^
18. arcosha; = In (x ± \/x'^ — 11
=1= , ^
\x\ > 1
19. artanha; = | In f^
T ^
M <1
20. arcotha; = i l n f ^
•:3^
|x| > 1
5.2 Wichtige Ableitungsregeln
215
System bewegen. (Der Geschwindigkeitsvektor kann in diesem Fall durch die einfache Zahl, die ilin definiert, identifiziert werden.) Der Einfacliheit lialber werden wir annehmen, dass sicli die Koordinaten (0,0) in beiden Koordinatensystemen auf denselben Punkt beziehen. Genauer gesagt, stimmt zur Zeit t = 0 der Punkt x = 0 mit dem Punkt a; = 0, in dem die Ulir t = 0 anzeigt, iiberein. Die klassischen Galilei-Transformationen X = x + vt,
^g_29)
formuliert eine der moglichen Zusammenhange zwisclien den Koordinatensystemen {x,t) und {x,i), um von zwei Beobachtern die Bewegung desselben Punktes in verscliiedenen Koordinatensystemen zu beschreiben. Wir woUen eine etwas allgemeinere lineare Transformation i=-fx
+ 6t
^^-^"^
betracliten, wobei wir natiirlicli annehmen, dass diese Verbindung invertierbar ist, d.h., dass die Determinante der Matrix I
„ j ungleich Null ist.
Seien x = x{t) und x = x{t) die Bewegungsgesetze fiir den beobachteten Punkt in diesen Koordinatensystemen. Wenn wir die Beziehung x = x{t) kennen, erhalten wir aus (5.30): x{t) = ax{t) + fit , t{t) = -fx{t) + dt .
(5.31)
Da die Transformation (5.30) invertierbar ist, ergibt sicli X = ax + pt , t = ^x + dt .
(5.32)
Mit Kenntnis von x = x{i) ergibt sich scliliefilicli x{i) = ax{i) + pi, t{i) = 7x(t) + di .
(5.33)
Aus (5.31) und (5.33) wird deutlich, dass fiir den gegebenen Punkt zueinander inverse Funktionen t = t{t) und t = t{t) existieren. Als Nachstes woUen wir den Zusammenhang zwischen den Geschwindigkeiten fiir einen Punkt in den jeweiligen Koordinatensystemen {x, t) und {x, i) betrachten: V{t) = ^ ^ At
= xt{t) und V{t) = - ^ = iiit) '"• ' ^' dt
216
5 Differentialrechnung
Mit der Regel zur Ableitung einer inipliziten Funktion und niit (5.31) erhalten wir
At
g
7f+'5
oder ~ ~ aV{t) + p vit) = ^ 7 ( ^ y ^ '
(5-34)
wobei fund t die Koordinaten desselben Augenblicks in den Systemen {x,t) und {x,t) sind. Dies muss man bei der abgekiirzten Schreibweise fiir (5.34)
stets im Hinterkopf behalten. Im Falle der Galilei-Transformationen (5.29) erhalten wir aus Formel (5.35) das klassische Gesetz zur Addition von Geschwindigkeiten V = V + v.
(5.36)
Es ist mit einem hohen Genauigkeitsgrad experimentell bewiesen (und dies ist eines der Postulate der speziellen Relativitatstheorie), dass sicli Licht im Vakuum mit einer bestimmten Geschwindigkeit c fortbewegt und dies unabhangig vom Bewegungszustand des stralilenden Korpers. Dies bedeutet, dass das Licht einer Explosion, die zur Zeit t = t = 0 im Punkt x = x = 0 stattfindet, die Punkte mit den Koordinaten x mit x'^ = (ct)'^ nach der Zeit t im Koordinatensystem {x,t) erreichen wird, wahrend es im System {x,i) zur Zeit t zu den Koordinaten x mit x^ = (ct)'^ gelangt. Ist daher x'^—c^t^ = 0, dann ist auch x^—cP = 0 und umgekehrt. Aufgrund bestimmter weiterer physikalischer Betrachtungen muss davon ausgegangen werden, dass i.A. a;2 - c^p = x^ - c^t^ , (5.37) falls (a;, t) und {x, i) sich auf denselben Vorgang in den durch (5.30) verbundenen verschiedenen Koordinatensystemen beziehen. Gleichung (5.37) ergibt die folgenden Bedingung fiir die KoefRzienten a, P, 7 und 6 der Transformation (5.30): a'-
2 2 • c 7
1, aP —c^7(5 = 0 ,
P'- • c'd'' Fiir c :
=
(5.38) ,2
= —( -c
lle von (5.38) a' -1'
= 1,
P 6
P' -6''
1
a = -1
(5.39)
5.2 Wichtige Ableitungsregeln
217
Daraus ergibt sich einfach, dass die allgemeine Losung von (5.39) (bis auf einen Vorzeichenwechsel in den Paaren (a,/3) und (7,(5)), wie folgt formuliert werden kann: a = cosh (p,
7 = sinh cp, (3 = sinh ip,
5 = cosh Lp .
Dabei ist ip ein Parameter. Damit besitzt die allgemeine Losung des Systems (5.38) die Form ct P\ _ ( cosh if c sinh cp ^ 6J \ - sinh ip cosh ip und die Transformation (5.30) kann spezifiziert werden zu: X = cosh(px + csinh(pt , (5.40) i = - sinh (px + cosh (p t . Dies ist die Lorentz-Transformation. Wir wollen noch erklaren, wie der freie Parameter ip bestimmt wird. Dazu erinnern wir daran, dass die ai-Achse sich mit der Geschwindigkeit —v relativ zur a;-Achse bewegt, d.h., der Punkt x = 0 dieser Achse hat, wenn er im System {x,t) beobachtet wird, die Geschwindigkeit —v. Wenn wir in (5.40) X = 0 setzen, erhalten wir sein Bewegungsgesetz im System {x,t): X = —ctajihcpt .
Daher ist V
tanh(^ = - . (5.41) c Wenn wir das allgemeine Gesetz (5.35) zur Transformation von Geschwindigkeiten mit der Lorentz-Transformation (5.40) vergleichen, erhalten wir ~
cosh LpV + c sinh Lp i sinh ipV + cosh (p
oder unter Beriicksichtigung von (5.41):
Gleichung (5.42) ist das relativistische Gesetz zur Addition von Geschwindigkeiten, das fiir \vV\ <S c^, d.h. c ^ oo, in das klassische Gesetz (5.36) iibergeht. Die Lorentz-Transformation (5.40) kann mit Hilfe von Gleichung (5.41) neu geschrieben werden und nimmt dann die folgende natiirlichere Form an:
218
5 Differentialrechnung X + Vt
(5.43)
^J^-i^y Daran konnen wir erkennen, dass diese Gleichungen fiir Iwl <S c, d.h. c —>• oo, in die klassische Galilei-Transformation (5.29) iibergelien.
5.2.6 Ableitungen hoherer Ordnung 1st eine Funktion / : _B —^ ffi in jedem Punkt x £ E difFerenzierbar, dann entstelit eine neue Funktion f : E ^ R, deren Wert in einem Punkt x G E der Ableitung f'{x) der Funktion / in diesem Punkt entspricht. Die Funktion f : E ^ W kann nun ihrerseits selbst eine Ableitung (/')' : i? —>•ffibesitzen, die die zweite Ableitung der urspriingliclien Funktion / genannt wird und niit einem der folgenden Symbole bezeichnet wird: f"{x)
oder
dx'^
Wenn wir beini ersten Symbol die Differentiationsvariable explizit angeben wollen, dann sclireiben wir auch /"^.(a;). Definition. Durch Induktion konnen wir dann, wenn die n — 1-te Ableitung / ( " - I ) (a;) von / definiert ist, die Ableitung n-ter Ordnung durch folgende Formel definieren: /(»)(x) := (/("-i))'(x) . Die folgenden Schreibweisen sind fiir Ableitungen n-ter Ordnung iiblicli: /(")(.)
o d e r ^ .
Es ist auch iiblich, f^^\x) := f{x) zu schreiben. Die Menge der Funktionen / : i? —>• ffi, die einschlieBlich der n-ten Ordnung stetige Ableitungen besitzen, werden mit C'"' {E, K) bzw. den einfacheren Symbolen C"(£;,M), C^'^\E) oder C"(£;) bezeichnet, falls dadurch keine Unklarheiten aufkommen konnen. Insbesondere ist C^^\E) = C{E), da nach unserer Vereinbarung f^^\x) = Wir wollen nun einige Beispiele fiir die Berechnung von Ableitungen hoherer Ordnung betrachten.
5.2 Wichtige Ableitungsregeln
219
Beispiele
fix)
fix)
fix)
16)
a"
o^ Ino
o^ In^ a
a" In" a
17)
e"
e^
e"
e^
18)
sin a;
cos a;
— sin X
sin(a; + mr/2)
19)
cos a;
— sin a;
— cos X
cos(a; + n7r/2)
20)(l + a;)"
Q(l + a;)"-^
/("'(x)
a{a - l ) ( l + x ) " - ^ •
a(Q — 1) • • • (Q
21)
x"
ax"-^
22) log„ \x\ 23)
ln|a;|
X-'
• • a{a — 1) ••• ( a - n + l)x'
a(a-l)i"-"
(_1)"-1(„_1)!
^J-a;-^
In a
- n + l ) ( l + a;)"-"
„
In a
(-- l ) " - ' ( n - l ) ! a ; - "
(-l)x-^
Beispiel 24- Leibnizsche Formel. Seien ^(a;) und vix) Funktionen, die auf einer gemeinsamen Menge E Ableitungen einschlieBlich n-ter Ordnung besitzen. Die folgende Leibnizsche Formel gilt fiir die n-te Ableitung ilires Produkts: n
w("-™)f(") .
(MV)(») = J 2 ( n) m=0 ^
(5.44)
^
Die Leibnizsche Formel gleicht der Newtonschen binomischen Formel stark und tatsachlich sind die beiden direkt miteinander verbunden. Beweis. Fiir n = 1 stimmt (5.44) mit der bereits aufgestellten Regel fiir die Ableitung eines Produkts iiberein. Besitzen die Funktionen u und v Ableitungen einschlieBlich (n + 1)Ordnung, dann erhalten wir, wenn wir annehmen, dass Formel (5.44) fiir Ordnung n gilt, nach Ableitung der linken und der rechten Seiten: ^(n-m)^(m+l)
= u(n+%iO) +J2((l)
+ (k-l))
««"+''-''«<*) + u(°^V^"
fc=0 ^
Hierbei haben wir Ausdriicke, die gleiche Produkte von Ableitungen der Funktionen u und v enthalten, kombiniert und die Gleichung ( , ,
1 I=
J,
1 fur die Binomialkoeffizienten benutzt.
220
5 Differentialrechnung
Somit haben wir die Giiltigkeit der Leibnizschen Formel durch Induktion bestatifft. D iel 25. 1st Pn{x) = Co + cia; + • • • + Cnx"^, dann gilt: Pn{^)
= Co ,
P'^{x)
= ci + 2o2X H
h ncnx''~^
und P^(0) = ci ,
P"(a;) = 2c2 + 3 • 2c3X + • • • + n ( n - l ) c „ x " - 2 und P " ( 0 ) = 2!c2 P^3) (a;) = 3 . 2c3 + • • • n ( n - 1) (n - 2 ) c „ x " - 3 und P^^' (0) = 3!c3 , p W (a;) = „ ( „ _ i ) ( „ _ 2 ) . •. 2c„ und P ^ " ' (0) = n!c„ , pO^) {x) = 0 fiir fc > n . Somit kann das Polynom Pn{x) wie folgt geschrieben werden: P „ ( x ) = P W ( 0 ) + ^ P ( i ) ( 0 ) a ; + j^P^\Q)x'
+ ••• + ^ P ( " ) ( 0 ) a ; " .
Beispiel 26. Mit Hilfe der Leibnizschen Formel und der Tatsache, dass alle Ableitungen eines Polynoms holierer Ordnung als der Grad des Polynoms gleich Null sind, erhalten wir die n-te Ableitung von f{x) = x'^ sinx: / ( " ) (x) = sin(") {x)-x^+h^
sin("-i) a; • 2x + T ^ ) sin^"-^) x-2
=
x'' 'sin [x + n—] + 2 n a ; s i n i x + (n — 1) — j + i — n{n — 1) sin I x + n—j ) = = {x'^ — n{n — 1)) sin ix + n—\ — 2nxcos
f x + n— I .
27. Sei f{x) = arctana;. Wir suclien die Werte / ( " ) ( 0 ) (n = 1, 2 , . . .)• Da f'{x) = ^ , ergibt sich (1 + x'^)f{x) = 1. Wenn wir die Leibnizsclie Formel auf diese letzte Gleichung anwenden, gelangen wir zur rekursiven Gleichung (1 + a;2)/("+i)(x) + 2nxf^"\x)
+ n{n - l ) / ( " - i ) ( x ) = 0 ,
aus der m a n nach und nach alle Ableitungen von f{x) Wenn wir x = 0 setzen, dann erhalten wir
bestimmen kann.
/(»+i)(0) = - n ( n - l ) / ( " - i ) ( 0 ) Fiir n = 1 ergibt sich /(2)(0) = 0 und daher ist /(^"HO) = 0. Fiir Ableitungen ungerader Ordnung erhalten wir: /(2™+i)(0) = - 2 m ( 2 m - l)/(2™-i)(0) . Da /'(O) = 1 fiihrt dies zu /(2™+i)(0) = ( - l ) ™ ( 2 m ) ! .
5.2 Wichtige Ableitungsregeln
221
Beispiel 28. Beschleunigung. Wenn x = x{t) die Zeitabhangigkeit einer Punktmasse beschreibt, die sich entlang der reellen Geraden bewegt, dann ist ^ ^ = x{t) die Geschwindigkeit dieses Punktes und ^ ^ = ^^^ = x{t) die Beschleunigung zur Zeit t. Ist x{t) = at + P, dann ist x{t) = a und x{t) = 0, d.h. die Beschleunigung bei einer gleichformigen Bewegung ist Null. Wir werden bald nachweisen, dass die Funktion von sich aus die Form at + P besitzt, wenn die zweite Ableitung Null ist. Soniit ist bei gleichformigen Bewegungen, und nur bei gleichformigen Bewegungen, die Beschleunigung gleich Null. Wenn wir aber woUen, dass sich ein trager Korper im luftleeren Raum gleichformig auf einer Geraden bewegt, wenn wir ihn in zwei verschiedenen Koordinatensystemen beobachten, dann miissen die Transformationsformeln fiir den Ubergang aus einem Inertialsystem in das andere linear sein. Aus diesem Grund wurde in Beispiel 15 die lineare Formel (5.30) fiir die Koordinatentransformationen gewahlt. 9. Die zweite Ableitung einer einfachen impliziten Funktion. Seien y = y{t) und X = x{t) zweimal differenzierbare Funktionen und die Funktion X = x{t) habe eine differenzierbare inverse Funktion t = t(x). Dann kann y{t) als implizite Funktion von x betrachtet werden, da y = y{t) = y{t{x)). Wir suchen die zweite Ableitung y'J,^ unter der Annahme, dass x'{t) ^ 0. Nach den Regeln zur Ableitung derartiger Funktionen, die wir in Absatz 5.2.5 untersucht haben, gelangen wir zu ,./ _ y't
so dass iyxJt ^ yx'Jt ^ X
Xf
Xf
(x',r Xf
^ Xtytt - Xttyt [Xf.)
Wir merken an, dass die expliziten Ausdriicke fiir alle Funktionen, die hierbei auftreten, inklusive y'^^ von t abhangen. Sie erlauben es aber, den Wert von y'J,^ in dem bestimmten Punkt x zu erhalten, nachdem fiir t der zu diesem x entsprechende Wert t = t{x) substituiert wurde. Ist etwa 2/ = e* und a; = Int, dann ist I v'i ^f i , ,1 (v'r)i e* + te* , ^, i 2/^ = ^ = 777 = ^e* und y'^^ = ^ ^ = — - 7 — = t{t + 1 e* . "^ x[ 1/t '''' x[ 1/t Wir haben absichthch dieses einfache Beispiel gewahlt, bei dem t explizit in Abhangigkeit von x durch die Gleichung t = e^ ausgedriickt werden kann. Durch die Substitution von t = e^ in y{t) = e* kommt so die explizite Abhangigkeit von y = e'^ von x zum Vorschein. Wenn wir diese letzte Funktion ableiten, lassen sich die obigen Resultate nachvollziehen.
222
5 Differentialrechnung
OflFensichtlich konnen auf diese Weise Ableitungen beliebiger Ordnung bestinimt werden, indem nach und nach folgende Formel angewendet wird: („) _ (y;.-i^)t
5.2.7 Ubungen und Aufgaben 1. Seieii a o , a i , . . . , Q n vorgegebene reelle Zahleii. Formulieren Sie ein Polynom Pn{x) vom Grade n, das in einem vorgegebenen Punkt xo G R die Ableitungen Pn {xo) = ak, k = 0,1,... ,n besitzt. 2. Berechnen Sie f'{x) fiir exp ( - IT j fiir X ^ 0 a) f{x) 0
fiir X = 0
x'^ sin - fiir x ^ 0 ,
b) fix) 0
fiir X = 0 .
c) Zeigen Sie, dass die Funktion in Teil a) beliebig oft auf R differenzierbar ist und dass/<">(0) = 0 . d) Zeigen Sie, dass die Ableitung in Teil b) auf R definiert ist, aber keine stetige Funktion auf R ist. e) Zeigen Sie, dass die Funktion exp ( - j
^ - (YZT)?) fur - 1 < X < 1
f{x) 0
fiir 1 < |a;|
beliebig oft auf R differenzierbar ist. 3. Sei / G C<°°'(R). Zeigen Sie, dass fiir a; 7^ 0 gilt: a;"+i
\x)
^
' Ax"\
\x
4. Sei / eine auf R differenzierbare Funktion. Zeigen Sie: a) Ist / eine gerade Funktion, dann ist / ' eine ungerade Funktion. b) Ist / eine ungerade Funktion, dann ist / ' eine gerade Funktion. c) ( / ' ungerade) <^ ( / gerade). 5. Zeigen Sie: a) Eine Funktion j{x) ist genau dann in einem Punkt xo differenzierbar, wenn j{x) — f(xo) = ip(x)(x — xo), wobei fix) eine in xo stetige Funktion ist (und in dem Fall ist (p{xo) = f'{xo)).
5.3 Die zentralen Satze der DifFerentialrechnung
223
b) Die Punktion f{x) besitzt eine Ableitung /'•"'(xo) der Ordnung n in xo, wenn f{x) — fixo) = (p{x){x — Xo) mit (p £ (7*-"""'' (U{xo)], wobei U{xo) eine Umgebung von xo ist. 6. Zeigen Sie an einem Beispiel, dass die Annahme, dass f~^ im Punkt yo stetig ist, in Satz 3 nicht fallen gelassen werden kann. 7.
a) Zwei Korper mit den Massen mi und m-z bewegen sicli im Raum unter dem alleinigen Einfluss ihrer gegenseitigen Gravitation. Zeigen Sie mit Hilfe des Newtonsclien Gesetzes (die Gleicliungen (5.1) und (5.2) in Abschnitt 5.1), dass
E = Q n ^ , . ? + Imzvl^
+( - G ^ )
=:K + U,
wobei vi und V2 die Geschwindigkeiten der Korper sind. Der Abstand r zwischen den Korpern verandere sich bei der Bewegung nicht. b) Geben Sie eine physikalische Interpretation fiir die Grofie E = K + U und ihre Komponenten. c) Erweitern Sie dieses Ergebnis auf die Bewegung von n Korpern.
5.3 Die zentralen Satze der DifFerentialrechnung 5.3.1 D e r S a t z v o n F e r m a t u n d d e r S a t z v o n R o U e D e f i n i t i o n 1. Ein P u n k t XQ G E C M. wird lokales Maximum (bzw. lokales Minimum) genannt und der Wert einer Funktion / : _E —>• M in dieseni P u n k t als lokaler Maximalwert (bzw. lokaler Minimalwert) bezeichnet, falls eine Umgebung UE{XO) von XQ in E existiert, so dass in jedem P u n k t x £ UE{XO) gilt: f{x) < f(xo) (bzw. fix) > fixo)). D e f i n i t i o n 2. Gilt in jedem P u n k t x G UE{XO) \ XQ = UE{XO) die strenge Ungleichung f{x) < f{xo) (bzw. f{x) > f{xo)), dann wird der P u n k t XQ isoliertes lokales Maximum (bzw. isoliertes lokales Minimum) genannt und der Wert der Funktion / : i? —>• ffi als isolierter lokaler Maximalwert (bzw. isolierter lokaler Minimalwert) bezeichnet. D e f i n i t i o n 3 . Die lokalen Maxima und Minima werden lokale Extrema und die Werte der Funktion in diesen P u n k t e n lokale Extremwerte der Funktion genannt. Beispiel
1. Sei
{
x^ , fiir - 1 < a; < 2 , 4 , fiir
2<x
(vgl. Abb. 5.8). Bei dieser Funktion ist X = —\ ein isoliertes lokales Maximum, a; = 0 ein isoliertes lokales Minimum und X = 2 ein lokales Maximum.
224
5 Differentialrechnung
Die P u n k t e x > 2 sind alle lokale Extrenia und zwar gleichzeitig Maxima und Minima, da die Funktion in diesen P u n k t e n lokal konstant ist.
y 4
/
3
/
-
2
N^ /
-10
/
1
2
i X
Abb. 5.8.
Beispiel 2. Sei f(x)
= sin i auf der Menge E =
Die P u n k t e a; = ( | + 2fc7r) P u n k t e X = ( — f +2fc7r)
R\0.
, fc £ Z sind isolierte lokale Maxima und die
, fc £ Z sind isolierte lokale Minima (vgl. Abb. 4.1).
D e f i n i t i o n 4. Ein E x t r e m u m XQ £ E einer Funktion / : _B —^ ffi wird ein inneres E x t r e m u m genannt, wenn XQ ein Haufungspunkt der beiden Mengen E- = {x G E\x < XQ} und E^ = {x G E\ x > XQ} ist. In Beispiel 2 sind alle E x t r e m a innere Extrema, wohingegen in Beispiel 1 der P u n k t x = —1 kein inneres E x t r e m u m ist. S a t z 1. (Fermat). Ist eine Funktion f : E ^ W in einem inneren Extremum XQ G E differenzierbar, dann ist ihre Ahleitung in XQ gleich Null, d.h.,
fixo) = 0. Beweis.
Nach der Definition der Differenzierbarkeit in XQ gilt f{xo + h) - f{xo)
= f'{xo)h
+ a{xo;h)h
,
mit a{xo; /i) —>• 0 fiir h ^ 0, XQ + h G E. Wir woUen diese Beziehung wie folgt neu schreiben: f{xo + h) - f{xo)
= [f'{xo) + a{xo;
h)]h
(5.45)
Da XQ ein E x t r e m u m ist, ist die linke Seite von (5.45) fiir alle Werte h, die geniigend nahe bei 0 liegen und fiir die xo + h G E gilt, entweder nicht negativ oder nicht positiv. Ist f'{xo) i^ 0, dann h a t t e fiir geniigend kleines h nahe bei 0 die Grofie f'{xo) + a{xo; h) dasselbe Vorzeichen wie / ' ( X Q ) , da a{xo; h) ^ 0 fiir h ^ 0, xo + hG E.
5.3 Die zentralen Satze der DifFerentialrechnung
225
Aber der Wert von h kann positiv wie negativ sein, da wir davon ausgehen, dass XQ ein innerer Extremwert ist. Wenn wir daher annehmen, dass / ' ( X Q ) 7^ 0, dann erhalten wir, dass die rechte Seite von (5.45) das Vorzeichen wechselt, wenn h es wechselt (falls h geniigend nahe bei 0 ist), wohingegen die linke Seite das Vorzeichen nicht wechseln kann, wenn h geniigend nahe bei 0 ist. Mit diesem Widerspruch ist der Beweis abgeschlossen. D A n m e r k u n g e n z u m Satz von Fermat 1°. Der Satz von Fermat liefert uns eine notwendige Bedingung fiir einen inneren Extremwert einer differenzierbaren Funktion an die Hand. Fiir Extrema, die keine inneren sind (wie der P u n k t x = —1 in Beispiel 1), ist dies im Allgemeinen nicht der Fall. 2°. Anschauhch ist dieser Satz offensichtlich. Er bedeutet, dass die Tangente an den Graphen einer differenzierbaren Funktion in einem Extremwert waagerecht verlauft. (SchlieBhch ist f'{xo) der Tangens des Winkels, den die Tangente mit der x-Achse einschlieBt.) 3°. Physikalisch bedeutet dieser Satz, dass die Geschwindigkeit in dem Augenblick gleich Null sein muss, wenn sich die Bewegungsrichtung entlang einer Geraden umdreht. (Dies entspricht einem Extremum!) Dieser Satz fiihrt uns in Verbindung mit dem Satz zum Maximum (oder Minimum) einer stetigen Funktion auf einem abgeschlossenen Intervall zu folgendem Satz. S a t z 2. (Satz von Rolle^°). Ist eine Funktion / : [a, &] —>• M auf einem abgeschlossenen Intervall [a, b] stetig und auf dem offenen Intervall ]a, b[ differenzierbar und ist f{a) = f{b), dann existiert ein Punkt ^ G]a,b[, in dem / ' ( O = 0 gilt. Beweis. Da die Funktion / auf [a,b] stetig ist, existieren P u n k t e Xm,XM £ [a, b], in denen sie ihre Extremwerte annimmt. Ist f{xm) = f{xM), dann ist die Funktion auf [a, b] konstant. Da in diesem Fall f'{x) = 0, ist die Behauptung offensichtlich wahr. Ist f{xm) < f{xM), dann muss einer der P u n k t e Xm oder XM im offenen Intervall ]a, 6[ liegen, da f{a) = f{b). Wir bezeichnen ihn mit ^. Aus dem Satz von Fermat folgt nun, dass / ' ( ^ ) = 0 . D 5.3.2 D e r M i t t e l w e r t s a t z u n d d e r S a t z v o n C a u c h y Der folgende Satz liefert eine der am haufigsten benutzten und wichtigsten Methoden zur Untersuchung numerischer Funktionen. M. RoUe (1652-1719) - franzosischer Mathematiker
226
5 Differentialrechnung
S a t z 3 . (Mittelwertsatz^^). 1st eine Funktion / : [a, &] —>• M auf einem abgeschlossenen Intervall [a, b] stetig und auf dem ojfenen Intervall ]a, b[ dijferenzierbar, dann existiert ein Punkt ^ G]a, b[, so dass f{b)-f{a)=rmb-a) Beweis.
(5.46)
Wir betrachten die Hilfsfunktion
Fi.) = m - l^^Ii^i.
- a)
die offensichtlich auf dem abgeschlossenen Intervall [a, b] stetig ist und auf dem offenen Intervall ]a, b[ differenzierbar. Sie besitzt in den E n d p u n k t e n die gleichen Werte F{a) = F{b) = f{a). Somit konnen wir den Satz von Rolle auf F{x) anwenden und einen P u n k t ^G]a,b[ finden, in dem
F'io = no
fib) - f{a)
0
A b b . 5.9.
Anmerkungen zum Mittelwertsatz 1°. Anscliaulich gesprochen bedeutet der Mittelwertsatz (vgl. Abb. 5.9), dass in einem P u n k t (^, / ( ^ ) ) mit ^ £]a, b[ die Tangente an den Graplien der Funktion zur Strecke, die die P u n k t e [a,f{a)) und (b,f{b)) verbindet, parallel ist, da die Steigung der Strecke gleich -^^ IZ^ ist. 2°. Wir interpretieren x als Zeit, 6 — a als Zeitspanne und f{b) — f{a) als Betrag der Verscliiebung eines Teilcliens, das sich in dieser Zeitspanne entlang einer Geraden bewegt. Dann besagt der Mittelwertsatz, dass es eine Zeit Dieser Satz wird auch Mittelwertsatz nach Lagrange genannt.
5.3 Die zentralen Satze der DifFerentialrechnung
227
^ e]a, b[ gibt, so dass das Teilchen genau die gleiche Entfernung f{b) — f{a) in der Zeitspanne zuriicklegen wiirde, wenn es sich niit der gleichforniigen Geschwindigkeit /'{£,) bewegt. Es ist ganz natiirlich, /'{£,) die Durchschnittsgeschwindigkeit in der Zeitspanne [a, b] zu nennen. 3°. Wir halten jedoch fest, dass es fiir eine Bewegung, die nicht entlang einer Geraden verlauft, keine Durchschnittsgeschwindigkeit im Sinne von Anmerkung 2*^ geben kann. Wenn wir etwa annehmen, dass sich das Teilchen auf einer Kreisbahn niit Radius Eins mit konstanter Winkelgeschwindigkeit w = 1 bewegt, dann lautet das Bewegungsgesetz dafiir r(t) = (cost,sint) . Dabei ist r{t) = v(t) = (—sin t, cost) und |v| = V sin^ t + cos^ t = 1. Das Teilchen ist zu den Zeiten t = 0 und t = 27r im selben Punkt r(0) = r(27r) = (1,0) und die Gleichung r(2^)-r(0)=v(O(27r-0) wiirde bedeuten, dass v(^) = 0. Dies ist jedoch unmoghch. Wir werden dennoch lernen, dass es eine Beziehung zwischen der Verschiebung in einer Zeitspanne und der Geschwindigkeit gibt. Die voile Lange L des zuriickgelegten Weges kann nicht groBer sein als der Betrag der Maximalgeschwindigkeit multipliziert mit der Lange der Zeitspanne. Das eben Gesagte lasst sich wie folgt prazise schreiben: \r{b)-r{a)\<
sup |r(t)|
(5.47)
te]a,b[
Wie wir spater zeigen werden, bleibt diese Ungleichung tatsachlich immer giiltig. Sie wird auch als Schrankensatz bezeichnet und nach Lagrange benannt. Gleichung (5.46), die nur fiir numerische Funktionen gilt, wird auch als Mittelwertsatz nach Lagrange bezeichnet. (Die Rolle eines Mittelwerts kommt dabei sowohl dem Wert /'{£,) der Geschwindigkeit als auch dem Punkt ^ zwischen a und 6 zu.) 4°. Der Schrankensatz ist wichtig, da er eine Verbindung zwischen dem Inkrement einer Funktion auf einem endlichen Intervall und der Ableitung der Funktion auf dem Intervall herstellt. Bis jetzt kannten wir keinen derartigen Satz fiir endliche Inkremente, sondern charakterisierten nur das lokale (infinitesimale) Inkrement einer Funktion durch die Ableitung oder das Differential in einem gegebenen Punkt.
228
5 Differentialrechnung
KoroUare zum Mittelwertsatz KoroUar 1. (Kriterium fiir die Monotonie einer Funktion). 1st die Ableitung einer Funktion in jedem Punkte eines offenen Intervalls nicht negativ (bzw. positiv), dann ist die Funktion in diesem Intervall nicht ahsteigend (bzw. anwachsend). Beweis. Sind xi und X2 zwei Punkte im Intervall mit xi 0 . Dann gilt nacli (5.46): fix'i) - f{xi) = f {0(^:2 - xi) , mit xi < ^ < a;2 . Dalier ist das Vorzeichen der Differenz auf der linken Seite dieser Gleichung gleich dem Vorzeichen von /'(^). D Natiirlicli konnen wir analog beliaupten, dass eine Funktion nicht anwachsend (bzw. ahsteigend) ist, faUs die Ableitung nicht positiv (bzw. negativ) ist. Amnerkung. Mit dem Satz zur inversen Funktion und KoroUar 1 konnen wir folgern, dass eine numerische Funktion f{x) auf einem Intervall / stetig und monoton auf / ist, wenn sie eine Ableitung besitzt, die immer positiv oder immer negativ ist. Dann besitzt sie aber eine inverse Funktion /~^, die auf dem Intervall / ' = / ( / ) definiert und differenzierbar ist. KoroUar 2. (Kriterium fiir die Konstanz einer Funktion). Eine Funktion, die auf einem ahgeschlossenen Intervall [a, b] stetig ist, ist genau dann konstant auf dem Intervall, wenn ihre Ableitung in jedem Punkt des Intervalls [a, b] (oder nur auf dem offenen Intervall ]a, b[) gleich Null ist. Beweis. Von Interesse ist alleine die Behauptung, dass aus f'{x) = 0 auf ]a, b[ folgt, dass f{xi) = f{x2) fiir aUe a;i,a;2, £ [a,b]. Dies ergibt sich jedoch aus dem Mittelwertsatz, nach dem f{x2)-f{xi)=nO{x2-Xi)=Q
gilt, da .f zwischen xi und X2 liegt, d.h., ^ e]a, b[ und somit f'{£,) = 0 .
D
Anmerkung. Daraus konnen wir die folgende Folgerung (die, wie wir sehen werden, fiir die Integralrechnung sehr wichtig ist) ziehen: Sind die Ableitungen Fl{x) und F2{x) zweier Funktionen Fi{x) und F2{x) auf einem Intervall gleich, d.h., F[{x) = F2{x) auf dem Intervall, dann ist die Differenz Fi {x) — F2 {x) konstant. Der folgende Satz ist eine niitzhche VeraUgemeinerung des Mittelwertsatzes, der auch auf dem Satz von RoUe aufbaut.
5.3 Die zentralen Satze der DifFerentialrechnung
229
S a t z 4 . (Satz von Cauchy, verallgemeinerter Mittelwertsatz). Seien x = x{t) und y = y{t) Funktionen, die auf einem abgeschlossenen Intervall [a, P] stetig und auf dem ojfenen Intervall ]a,P[ dijferenzierbar sind. Dann existiert ein Punkt r £ [a,/3], so dass a;'(T) {yiP) - y{a)) 1st zusdtzlich Gleichung:
= y'ir) {x{/3) - x{a))
x'{t) ^ 0 fur alle t £]a,P[,
x{P) — x{a)
.
dann ist x{a) ^ x{P) und es gilt die
X'{T)
Beweis. Die Funktion F{t) = x{t)(^y{(]) —y{a)) —y{t){x{P) —x{a)) erfiillt die Voraussetzungen des Satzes von RoUe auf dem abgeschlossenen Intervall [a, /3]. Dalier existiert ein P u n k t r €]«,/?[, in dem F'{T) = 0. Dies ist aquivalent zu der zu beweisenden Gleichung. Daraus erhalten wir (5.48), da wiederum nach dem Satz von Rolle gilt, dass x{a) ^ x{(]) fiir x'{t) 7^ 0 in ]a,/3[. D Anmerkungen zum verallgemeinerten Mittelwertsatz 1°. Wenn wir das P a a r (^x{t),y{t)) als Bewegungsgesetz eines Teilchens betrachten, dann ist {x'{t),y'{t)) sein Geschwindigkeitsvektor zur Zeit t und {x{f5) — x{a),y{(]) — y{a)) ist sein Verschiebungsvektor in der Zeitspanne [a,/?]. Der Satz stellt dann sicher, dass zu einer bestimmten Zeit T £ [a,P] diese beiden Vektoren kolhnear sind. Diese Tatsache, die fiir eine Bewegung in der Ebene gilt, ist jedoch ahnhch wie die Durchschnittsgeschwindigkeit im Falle der Bewegung entlang einer Geraden eine erfreuliche Ausnahme. Wenn wir dagegen die Bewegung eines Teilchens mit gleichbleibender Geschwindigkeit entlang einer raumlichen Helix betrachten, dann schliefit seine Geschwindigkeit einen konstanten Winkel ungleich Null mit der Vertikalen ein, wohingegen der Verschiebungsvektor (nach einer kompletten Umdrehung) ausschliefilich in die Vertikale zeigt, d.h., Verschiebungsvektor und Geschwindigkeitsvektor sind nicht kolhnear. 2°. Der Mittelwertsatz kann aus dem Satz von Cauchy erhalten werden, wenn wir x = x{t) = t, y{t) = y{x) = f{x), a = a und P = b setzen. 5.3.3 Die Taylorschen Formeln Aus dem Bisherigen kann m a n den korrekten Eindruck bekommen, dass zwei Funktionen sich umso besser in einer Umgebung eines P u n k t e s approximieren, je mehr Ableitungen der beiden Funktionen (inklusive der Ableitung nullter Ordnung) in diesem P u n k t iibereinstimmen. Bisher waren wir hauptsachlich an Approximationen von Funktionen in der Umgebung eines P u n k t e s durch ein Polynom P„(a;) = P„(XQ;X) = CQ + ci{x — XQ) + • • • + C„{X — XQ)'^ interessiert und das bleibt auch unser Hauptinteresse. Wir wissen (vgl. Beispiel 25 in
230
5 Differentialrechnung
Absatz 5.2.6), dass ein algebraisches Polynom wie folgt dargestellt werden kann: P „ ( x ) = P„(a;o) + ^^^{x 1!
-xo)
+ --- + ^ " " i"""^ {x - x o ) " , n\
d.h., Cfc = " fci , (fc = 0 , 1 , . . . , n ) . Dies lasst sich einfach direkt beweisen. Wenn wir eine vorgegebene Funktion f(x) niit ihren Ableitungen bis einschlieBlich n-ter Ordnung in XQ kennen, konnen wir unniittelbar das folgende Polynom
P^(xo;x)=Pn{x)=fixo)
+ ^^{x-xo) 1!
+ --- + ^^-^ix-xor n\
(5.49)
forniulieren, dessen Ableitungen in XQ bis einscliliefilicli n-ter Ordnung mit den entsprechenden Ableitungen von f(x) in diesem P u n k t iibereinstimmen. D e f i n i t i o n 5. Das durch (5.49) gegebene Polynom ist das Ta?//or^^-Polynom n-ter Ordnung von f{x) in XQ. Wir sind an der Differenz f{x) - Pnixo;x)
=rn{xo;x)
,
(5.50)
die oft aucli Restglied oder genauer n-tes Restglied genannt wird, zwisclien dem Polynom Pn{x) und der Funktion f{x) interessiert. Mit ihm gelangen wir zur sogenannten Taylorsclien Formel:
f{x)
= f{xo) H
7r-{x 1!
-xo)-\
\
i - ^ ( a ; - a^o)" + r„(a;o; x) n! (5.51) Gleichung (5.51) ist natiirlich wertlos, wenn wir nicht mehr iiber die Funktion r„{xo;x) wissen als ihre Definition (5.50). Wir werden nun einen hochgradig kiinstlichen Weg einschlagen, um Informationen iiber das Restglied zu gewinnen. Einen natiirlicheren Zugang zu diesen Informationen werden wir durch die Integralrechnung erhalten. S a t z 5. Die Funktion f und ihre ersten n Ableitungen seien auf dem abgeschlossenen Intervall mit den Endpunkten XQ und x stetig und f besitze in den inneren Punkten dieses Intervalls eine Ableitung n + 1-ter Ordnung. Dann existiert zu jeder Funktion cp, die auf diesem abgeschlossenen Intervall stetig ist und eine Ableitung ungleich Null in ihren inneren Punkten besitzt, ein Punkt ^ zwischen XQ und x, so dass
(p'iOnl B. Taylor (1685-1731) - britisdier Mathematiker.
(5.52)
5.3 Die zentralen Satze der DifFerentialrechnung
231
Beweis. Auf dem abgeschlossenen Intervall / mit den Endpunkten XQ und x betrachten wir die Hilfsfunktion
F(t)=f(x)-P„{t;x)
(5.53)
mit t als Argument. Wir formulieren nun die Definition dieser Funktion F{t) detaillierter: Fit) = fix)
fit) + ^ { x
-t)
+ --- + ^ ^ { x
- t)"
(5.54)
An der Definition der Funktion Fit) und den Voraussetzungen des Satzes erkennen wir, dass F auf dem abgeschlossenen Intervall / stetig und in seinen inneren Punkten differenzierbar ist und dass
;.„,-£si+m,,_„_m,,,_„. 1! 1! 1!
F'(t)
+
f"'it) 2!
ix - tf
J(n+l)(i)
;(n+l)(^)
ix - ty
ix - t ) " .
Nun wenden wir den verallgemeinerten Mittelwertsatz auf die beiden Funktionen Fit) und ipit) auf dem abgeschlossenen Intervall / an (vgl. (5.48)) und wir finden einen Punkt ^ zwischen XQ und x, in dem gilt: Fix)-Fixo) fix) -(fixo)
^F'iO (f'iO
Wir ersetzen F' (^) durch obigen Ausdruck und erhalten aus dem Vergleich mit (5.50), (5.53) und (5.54), dass Fix) - F(a;o) = 0 - Fixo) = -r„ixo;x), woraus sich (5.52) ergibt. D Wenn wir in (5.52) (pit) = x — t setzen, erhalten wir das folgende Korollar: KoroUar 1. (Restglied nach Cauchy). rnixo;x) = l / ( » + i ) ( a ( a ; - 0"{x - Xo)
(5.55)
Wir erhalten eine besonders elegante Formel, wenn wir (pit) = (a; — t)""*"^ in (5.52) setzen: Korollar 2. (Restglied nach Lagrange) r„ixo;x)
(n + 1)
•/(»+i)(0(x-xo) n + l
(5.56)
Wir merken an, dass die Taylorsche Formel (5.51) fiir XQ = 0 oft auch MacLaurin^^ -Formel genannt wird. Wir woUen einige Beispiele betrachten. C. MacLaurin (1698-1746) - britischer Mathematiker.
232
5 Differentialrechnung
Beispiel 3. Fiir f{x) = e* nimmt die Taylorsche Formel in a;o = 0 die folgende Form an: e=" = 1 + —a; + —x^ H + —a;" + r„(0; x) . (5.57) 1! 2! nl Mit (5.56) konnen wir fiir |^| < \x\ berechnen: rn[\J',X)
— -,
• TTTS
-X
(n + 1)1 Somit ist
Fiir jedes feste x e M strebt SrjTT fiir n —>• oo, wie wir wissen (vgl. Beispiel 12 in Absatz 3.1.3), gegen Null. Daher folgt aus der Abschatzung (5.58) und der Definition der Sunime einer Reihe, dass e=" = 1 + —a; + —a;^ + 1! 2!
h —x" H n\
(5.59)
fiir alle x GW. Beispiel 4- Wir erhalten auf ahnliche Weise die Entwicklung der Funktion a* fiir jedes a, 0 < a, a ^ 1: In a 1!
a" = 1 + -—X
In a ., 2!
+ -^TT-x^ H
H
In" a „ —x" n\
H
.
Beispiel 5. Sei f{x) = sin a;. Wir wissen (vgl. Beispiel 18 in Absatz 5.2.6), dass /(")(x) = sin (x + f n), n e N. Somit finden wir als Restglied nach Lagrange (5.56) fiir XQ = Q und jedes a; £ ffi, dass ^"(0;x) = j ^ ^ ^ , sin (? + | ( n + l))a;"+^ ,
(5.60)
woraus sich ergibt, dass r„(0;a;) fiir jedes a; € ffi, n —>• oo gegen Null strebt. Dies fiihrt uns zur Entwicklung 1 1 sina; = a; - —a;^ + —x^
(—1)" h j ^ Tii^^"^^ "^
^^•^^-'
fiir jedes x £ M. Beispiel 6. Ganz ahnlich erhalten wir fiir die Funktion f{x) = cos(x): ^"(0;x) = ^ ^ ^ ^ cos (C + f (n + l))a;"+i
(5.62)
und cosx = 1 - - x ^ + - x ^ 2! 4! fiir jedes x £ M.
+ V4ra;2" + • • • (2n)!
(5.63)
5.3 Die zentralen Satze der DifFerentialrechnung
233
Beispiel 7. Da sinh x = cosh a; und cosh x = sinhx, erhalten wir mit (5.56) den folgenden Ausdruck fiir das Restghed der Taylor-Reihe von f{x) = sinh a;:
mit /'"^^H?) = sinh^ fiir gerades n und / ' " ^ ^ ' ( O = cosh^ fiir ungerades n. In jedem Fall ist |/("+^H6l < maxjl sinhx|, I coshx|}, da |^| < \x\. Daher ergibt sich fiir jeden gegebenen Wert a; £ ffi, dass r„(0; a;) —>• 0 fiir n ^ oo und wir erhalten die Entwicklung sinhx = x+ —x^ + —x^ + h TTra;^""^^ H , (5.64) 3!
5!
(2n + l)!
die fiir aUe a; £ ffi giiltig ist. Beispiel 8. Ahnlich erhalten wir die Entwicklung cosh x = l + —x^ + —x^ H h 7—rra;^" H 2! 4! (2n)! die fiir aUe a; £ ffi giiltig ist. Beispiel 9. Fiir die Funktion f{x) (i+a;)"~
,
(5.65)
= ln(l + x) ergibt sich / ' " ' ( x )
=
1 so dass die Taylor-Reihe dieser Funktion in a;o = 0 lautet:
ln(l + x)=x--x'^
+ -x^ + ^^ x" + r„(0; x) . 2 3 n Dieses Mai formuheren wir r„(0;a;) nach Cauchy (vgl. (5.55)):
^
(5.66)
^ n! (1 + 0"
oder r„(0;x) = ( - l ) " x ( ^ ) " ,
(5.67)
wobei ^ zwischen 0 und x liegt. Fiir \x\ < 1 folgt aus der Bedingung, dass ^ zwischen 0 und x hegt, dass x-^
1+C
' ' ' " ' ^ ' < ¥ ^ = 1 - ^ < 1 - ^ = N. |i + ?l - 1-1^1 1-ICI i-|o|
(5.68)
Somit ergibt sich fiir |x| < 1 |r„(0;a;)|<|a;r+i
(5.69)
und somit, dass die folgende Entwicklung fiir \x\ < 1 gilt: ln(l +x)=x--x^ 2
+ -x^ 3
+ ^^
'n
x" + •••
(5.70)
234
5 Differentialrechnung
Wir merken an, dass die Reihe auf der rechten Seite von (5.70) aufierhalb des abgeschlossenen Intervalls \x\ < 1 in jedem Punkt divergiert, da ihre Glieder ini AUgenieinen fiir |a;| > 1 nicht gegen Null streben. Beispiel 10. Fiir cc £ M betracliten wir die Funktion (1 + x)" mit f^"'{x) = a{a — 1) • • • (a — n + 1)(1 + a;)"~". Fiir XQ = 0 lautet die Taylorsclie Formel fiir diese Funktion /i
NA.
-,
ct
(1 + a;)" = 1 + —X+
a(a
— 1)
-——-x^
,
+ •••
a(a - 1) • • • (a - n +1) „ ,„ , ••• + -^ '-x"+ rniO;x) . n!
/^ „-,x 5.71)
Fiir das Restglied nacli Caucliy (vgl. (5.55)) erhalten wir
r„(0; x) = "^" - 1) •-•(«-") (1 ^ 0"-"-Hx - 0"^ ,
(5.72)
n! wobei ^ zwisclien 0 und x liegt. 1st \x\ < 1, dann erhalten wir mit der Abscliatzung (5.68): |r„(0;a;)| < | a ( l - ^ ) • • • ( l - ^ ) |(l + 0 " - ' ^ ! " + ' •
(5-73)
Wird n um 1 erholit, wird die reclite Seite von (5.73) mit | (l — ^#j-)^| niultipliziert. Da aber \x\ < 1, gilt | (l — ^#j-)^| < 9 < l^ und das unabliangig von a, solange \x\ < q < 1 und n geniigend groB sind. Daraus folgt, dass r„(0;a;) ^ 0 fiir n —>• oo fiir jedes a £ M und jedes x im offenen Intervall \x\ < 1. Somit ist die folgende von Newton aufgestellte Entwicklung (der Newtonsche Binomialsatz) auf dem offenen Intervall |a;| < 1 giiltig: ,_, N„ , a a(a — l) , a(a — l)---(a — n+l) „ ,^ „ , \ (l+x)" = 1 + 773; + ^ - — - x ^ + - • •+— p -x" + - • • 5.74) 1! 2! n\ Wir merken an, dass nach dem D'Alembert-Kriterium (vgl. Paragraph b in Absatz 3.1.4) folgt, dass die Reihe (5.74) im AUgemeinen fiir cc ^ N divergiert. Wir woUen nun den Fall, dass a = n GN, getrennt betrachten. In diesem Fall ist f{x) = {1 + x)" = {1 + x)" ein Polynom vom Grad n und daher sind alle Ableitungen von hoherer Ordnung als n gleich 0. Somit ermoglicht uns die Taylorsche Formel in Verbindung mit beispielsweise dem Restglied nach Lagrange das Aufstellen der folgenden Gleichung: ,, x„ -, »Tn(n - 1) o (l+x)" = l + —x + --—,—-x^+ 1! 2!
n(n - 1) • • • 1 „ ••• + — p x" . n\
/^ „^x 5.75)
Dies ist der Binomialsatz von Newton, wie er aus der hoheren Schule fiir natiirliche Exponenten bekannt ist:
5.3 Die zentralen Satze der DifFerentialrechnung
235
Wir haben also die Taylorsche Formel (5.51) definiert und die Formeln (5.52), (5.55) und (5.56) fiir die Restglieder aufgestellt. Wir haben die Beziehungen (5.58), (5.60), (5.62), (5.69) und (5.73) ausgearbeitet, die es uns ernioglichen, den Fehler bei der Berechnung wichtiger einfacher Funktionen mit Hilfe der Taylorsche Formel abzuschatzen. SchlieBlich haben wir die Potenzreihenentwicklung fiir diese Funktionen erhalten. D e f i n i t i o n 6. Besitzt die Funktion f{x) in einem P u n k t XQ Ableitungen beliebiger Ordnung n £ N, dann wird die Reihe fM
+ l^/{xo)ix
die Taylor-Reihe
-xo)
+ --- + ^/"Hxo){x
- xo)" + •••
von / im P u n k t XQ genannt.
Man soUte nicht davon ausgehen, dass die Taylor-Reihe einer unendlich oft differenzierbaren Funktion in einer Unigebung von x^ konvergiert, da fiir jede Folge CQ, c i , . . . , c „ , . . . von Zahlen eine Funktion f{x) konstruiert werden kann (obwohl das nicht leicht ist), so dass /'"'(a^o) = Cn, n €i N. Man sollte auch nicht davon ausgehen, dass die Taylor-Reihe, wenn sie konvergiert, notwendigerweise gegen die Funktion konvergiert, aus der sie entstanden ist. Eine Taylor-Reihe konvergiert nur dann gegen die Funktion, aus der sie gebildet wird, wenn die erzeugende Funktion zur Klasse der sogenannten analytischen Funktionen gehort. Es folgt ein Beispiel von Cauchy fiir eine nicht analytische Funktion:
{
e~^/^
, fiir a; 7^ 0 ,
0 ,
fiir a; = 0 .
Wenn wir mit der Definition der Ableitung beginnen und beriicksichtigen, dass a;*e~^/^ -^ 0 unabhangig vom Wert von fc fiir a; —>• 0 (vgl. Beispiel 30 in Abschnitt 3.2), konnen wir zeigen, dass / ( " ) (0) = 0 fiir n = 0 , 1 , 2 , . . . . Daher sind fiir dieses Beispiel alle Gheder der Taylor-Reihe gleich 0 und daher ist ihre Summe ebenso gleich 0, wohingegen f{x) ^ 0 fiir a; ^ 0. Zuni Abschluss untersuchen wir eine lokale Version der Taylorschen Formel. Wir kehren wieder zu dem Problem zuriick, mit dessen Diskussion wir bereits in Absatz 5.1.3 begonnen haben, namlich ein Polynom zu finden, das einer Funktion j : E ^ M. lokal entspricht. Wir wollen das Polynom Pn{xo; x) = XQ + Ci{x — XQ) -|- • • • -|- C„{X — XQ)'^ SO wShlen, dass f{x)
= Pn{x) + o[{x — a;o)") fiir x -^ a;o, x G E
gilt, bzw. detaillierter: fix)
= Co + Ci{x - Xo) -\
\-Cn{x
- XQ)" + o{{x -
XQ)")
fiir X —>• Xo, X G E . (5.76)
236
5 Differentialrechnung
Wir fiihren nun ausdriicklich einen Satz an, der bereits vollstandig in seinen wichtigen P u n k t e n bewiesen wurde. S a t z 6. Existiert ein Polynom P„{xo; x) = CQ + ci{x — XQ) + • • • + c„(a; — X Q ) " , das die Bedingung (5.76) erfiiUt, dann ist dieses Polynom eindeutig. Beweis. In der Tat liefert uns (5.76) die KoefRzienten des Polynoms schrittweise vollstandig unzweideutig: Co
=
lims9x^xo /(a;) ,
ci
=
\imE3^^^o 4 r ^
C„
_ -
,. [imEBx^xo
fix)-[co-i
'
^c„-i{x-xo)" (x-xo)"
^\
[] •
Nun beweisen wir die lokale Version des Satzes von Taylor. S a t z 7. (Die lokale Taylorsche Formel) Sei E ein ahgeschlossenes Intervall mit XQ G W als Endpunkt. Besitzt die Funktion f : E ^ M. die Ahleitungen / ' ( x o ) , . . . , / ' " ' ( x o ) his einschliefilich n-ter Ordnung im Punkt XQ, dann gilt die folgende Darstellung: f(x)
= f(xo)
+
-,, 1!
[X - xo) -\
H
j (x - xo) + n! + o ( ( x — Xo)") fiir X -^ Xo, x G E . (5.77)
Somit wird das Problem einer lokalen Naherung einer differenzierbaren Funktion durch das Taylor-Polynom der geeigneten Ordnung gelost. Da das Taylor-Polynom P„{xo;x) mit der Anforderung konstruiert wird, dass seine Ableitungen bis einschlieBlich n-ter Ordnung mit den entsprechenden Ableitungen der Funktion / in xo iibereinstimmen muss, folgt, dass / W ( x o ) - P ^ ^ ' ( x o ; x o ) = 0 {k = 0 , 1 , . . . , n ) und die Giiltigkeit von (5.77) wird durch das folgende Lemma sicliergestellt. L e m m a 1. Besitzt eine Funktion ip : E ^ W, die auf einem abgeschlossenen Intervall E mit Endpunkt XQ definiert ist, Ableitungen bis einschliefilich nter Ordnung in XQ und ist (fixo) = '^'{XQ) = ••• = (y9(")(xo) = 0, dann gilt (p{x) = o((x — Xo)") fiir X -^ Xo, x G E. Beweis. Fiir n = 1 folgt die Behauptung aus der Definition der Differenzierbarkeit der Funktion ip in XQ, aufgrund derer gilt: (p{x) = (p{xo) + (p'{xo){x — Xo) -I- o{x — Xo) fiir x -^ XQ, X G E . Da (p{xo) = (p'{xo) = 0, erhalten wir (p{x) = o{x — Xo) fiir x ^ XQ, x G E .
5.3 Die zentralen Satze der DifFerentialrechnung
237
Angenommen, die Behauptung wurde fiir die Ordnung n = k — 1 > 1 bewiesen. Wir werden zeigen, dass sie dann auch fiir die Ordnung n = k > 2 gilt. Wir merken vorlaufig an, dass die Existenz von Lp^'''{xo), die sich aus ip'- '[xo) = {^^
') (xo) = ^ lim E3x^xo
X — Xo
ergibt, vermuten lasst, dass die Funktion ip^''~^^{x) auf E definiert ist, zumindest nahe dem Punkt XQ. Wenn wir das abgeschlossene Intervall E, falls notwendig, verkleinern, konnen wir beginnend bei (p{x), ip'(x),..., (p^ ' (x) mit k > 2 annehmen, dass diese Funktionen alle auf dem gesamten abgeschlossenen Intervall E mit Endpunkt XQ definiert sind. Da fc > 2, besitzt die Funktion (p{x) auf E eine Ableitung (p'{x) und laut Annahme ist
{^'y{xo) = --- = {v')^'-'H^o) = o. Dabei gilt laut Induktionsannahme, dass (p'{x) = o((a; — XQ)
) fiir x —>• XQ, X G E .
Dann erhalten wir mit Hilfe des Mittelwertsatzes, dass (p{x) = (f{x) - (f{xo) = (^'(0(a; - Xo) = a(0(C - a;o)**"^'(a; - XQ) ,
wobei ^ zwisclien XQ und x liegt, d.li. |^ — a;o| < |a; — xo| und a(^) —>• 0 fiir ^ ^ XQ, ^ G E. Dalier haben wir fiir x ^ XQ, x G E gleichzeitig ^ ^ XQ, ^ G E und a(^) -)• 0. Da \f{x)\
< \aiO\ \x - a;o|*"^|a; - xo\ ,
haben wir gezeigt, dass (p{x) = o(^{x — Xo) ) fiir x —>• XQ, X G E . Somit haben wir die Behauptung in Lemma 1 mit Hilfe mathematischer Induktion bewiesen. D Gleichung (5.77) wird als sogenannte lokale Taylorsche Formel bezeichnet, da die Form des Restglieds (das sogenannte Peano Restglied) r„(xo;x) = o((x-a;o)")
(5.78)
nur Schlussfolgerungen iiber die asymptotische Beziehung zwischen dem Taylor-Polynom und der Funktion fiir x ^ XQ, x G E erlaubt. Gleichung (5.77) ist daher bequem zur Berechnung von Grenzwerten und zur Beschreibung des asymptotischen Verhaltens einer Funktion fiir x ^ XQ, X G E geeignet. Sie kann jedoch nicht zur naherungsweisen Berechnung des
238
5 Differentialrechnung
Wertes der Funktion eingesetzt werden, bevor eine genaue Abschatzung der Grofie r„(a;o;a;) = o[{x — XQ)") verfiigbar ist. Wir wollen unsere Ergebnisse nun zusammenfassen. Wir haben das TaylorPolynoni Pn(xo;x)
= f(xo)
H
-;—(X - xo) -\ 1!
1
i—(a; - XQ) n!
definiert, die Taylorsche Forniel f{x)
= f{xo) H
-^(x-xo) 1!
H
\
-^{x n\
- Xo)" + Vnixo; x)
aufgestellt und sie in die folgende wichtige Gestalt iiberfiihrt. Besitzt f eine Ahleitung der Ordnung n+ 1 auf dem ojfenen Intervall den Endpunkten XQ und x, dann ist fix)
= fixo)
+ ^ ^ { x 1!
-xo)
+ --- + ^^-^{x n\
- xo)" +
+ ( ^i\, (^-^o)"+\ (n + I j ! wobei ^ ein Punkt zwischen XQ und x ist. Besitzt f Ableitungen bis einschliefilich dann gilt: fix)
= f(xo) + ^^(x-xo) 1!
mit
(5.79)
der Ordnung n > 1 im Punkt XQ,
+ --- + ^^^^(x-xo)" n\
+ o{{x-xo)")
. (5.80)
Gleichung (5.79), die Taylorsche Formel mit Restglied nach Lagrange genannt wird, ist ofFensichtlich eine Verallgenieinerung der Definition der Differenzierbarkeit einer Funktion in einem P u n k t , auf die sie fiir n = 1 reduziert wird. Wir merken an, dass Gleichung (5.79) fast immer die stichhaltigere von beiden ist. Denn auf der einen Seite setzt sie uns, wie wir gesehen haben, in die Lage, den Absolutbetrag des Restgheds abzuschatzen. Auf der anderen Seite folgt aus ihr auch, wenn etwa /("+^'(a;) in einer Umgebung von XQ beschrankt ist, die asymptotische Formel fix)
= fixo)
+ ^ ^ { x 1!
-xo)
+ ---+
^ " ^^'^ (x - xo)" + Oiixnl
xo)"+i) .
(5.81) Daher enthalt fiir unendlich oft differenzierbare Funktionen, die in der klassischen Analysis die Mehrheit ausmachen, Gleichung (5.79) die lokale Formel (5.80). Insbesondere konnen wir auf der Basis von (5.81) und den gerade untersuchten Beispielen 3-10 die folgende Ubersicht asymptotischer Formeln fiir a; —>• 0 aufstellen:
5.3 Die zentralen Satze der DifFerentialrechnung e'' = 1 + —X + —x^ ^ 1! 2! cosa; = 1 - :ia;2 + i-x^ 2! 4!
h -7x" + Oix"^"^^) , n\ + fe^x^" + 0(a;2"+2) , (2n)!
cosh a; = 1 + —a;^ + —x^ H 2! 4!
h -TTT^.X^'^ + 0(x^"+^) , (2n)!
sinhx = X + —x^ + —x^ H
+ —
239
TTj^^"^^ + 0(x2"+^) ,
ln(l + x) = X - -x^ + -x^ + ^^ ^ x " + 0(x"+M , 2 3 n ,„ , cc a{a-\) 9 afcc - 1) • • • (cc - n + 1) „ (11 ++ x)" x)" == 11 ++ -TX —X ++ -—^-r: ^ - — - x^X^ ^ ++ hh-^^ -^^ rr -^ ^x" 1! 2! n 0(x"+i) Wir woUen nun einige weitere Beispiele fiir den Gebrauch der Taylorschen Forniel betrachten. Beispiel 11. Wir wollen ein Polynom finden, niit dem die Werte von sinx auf dem Intervall — 1 < x < 1 mit einem absoluten Fehler von hochstens 10~^ bestimnit werden konnen. Wir konnen fiir dieses Polynom ein Taylor-Polynom mit einem geeigneten Grad ansetzen, das wir aus der Entwicklung von sinx in einer Umgebung von xo = 0 erhalten. Da 1 1 sinX = X - - x ^ + -x^ 3!
+ ,„
5!
(—1)" I 1M^^"^^ + 0 • a;^""^^ + ^2n+2(0;x) ,
{in + Ij!
wobei wir fiir |x| < 1 das Restglied nach Lagrange ,
,
s i n ( ^ + f ( 2 n + 3)) „ ,„
durch
K+2(0;x)|<^^^ abschatzen konnen. Nun ist aber .„ ^, „,, < 10~^ fiir n > 2. Somit besitzt die Naherung ° die geforderte Genauigkeit auf dem abgeschlossenen Intervall |x| < 1. Beispiel 12. Wir werden zeigen, dass tanx = x + |x^ + o(x^) fiir x ^ 0. Es gilt: tan' X = cos~^ x , tan" X = 2 cos~^ x sin x , tan'" X = 6 cos"'* x sin^ x + 2 cos~^ x
240
5 Differentialrechnung
Somit ist tan 0 = 0, tan' 0 = 1, tan" 0 = 0 und tan'" 0 = 2 und die gesuchte Beziehung folgt nun aus der lokalen Taylor-Reihe. oo
Beispiel 13. Sei a > 0. Wir woUen die Konvergenz der Reihe ^ In cos ^ n=l
untersuchen. Fiir a > 0 gilt ^ —>• 0 fiir n —>• oo. Wir woUen den Grad eines Glieds in der Reihe abschatzen: In cos — = In ( 1 - -7 • -T,
h o ( -^— ) ) = - - • -r,
h o ( -rr- ) •
Somit haben wir eine Reihe niit Ghedern niit konstanteni Vorzeichen, deoo
ren Glieder aquivalent sind zu denen der Reihe ^
2^5^- Da diese letztgenann-
n=l
te Reihe nur fiir cc > 5 konvergiert, wenn a > 0, konvergiert die urspriinghche Reihe nur fiir a> \ ('^gl- Aufgabe 15b) unten). Beispiel 14- Wir wollen zeigen, dass Incosa; = —^a;^ — j^x^ — j^x^ + 0{x^) fiir X ^ 0. Dieses Mai werden wir, anstatt sechs aufeinander folgende Ableitungen zu berechnen, die bereits bekannten Entwicklungen von cos a; fiir x ^ 0 und ln(l + u) fiir u ^ 0 benutzen: In cos a; = In fl V
= u-\u'
-x^ + —x* 2! 4!
TX^ + 0(x^)] = ln(l + u) = 6! \ /J \ J
+ 1^3 + 0(^4) = ( - la.2 + I x ^ - la.« + 0(x«)) -
- \ [w^' - 2 • i-'+^(-^)) 4 (- w^'+^^''^) = Beispiel 15. Wir suchen die Werte der ersten sechs Ableitungen der Funktion Incosa; in a; = 0. Es gilt (Incos)'x = \^™,^ und daher ist klar, dass die Funktion in 0 Ableitungen beliebiger Ordnung besitzt, da cosO 7^ 0. Wir werden nicht versuchen, fiir diese Ableitungen Funktionen zu formulieren, sondern stattdessen die Eindeutigkeit des Taylor-Polynoms ausnutzen sowie das Ergebnis aus dem vorigen Beispiel anwenden.
5.3 Die zentralen Satze der DifFerentialrechnung
241
1st f{x) = Co + cix + • • • + c„x" + o{x") fiir a; —>• 0 , dann gilt
Daher erhalten wir fiir diesen Fall: (Incos)(0) = 0,
(Incos)'(0) = 0,
(Incos)"(0) = - i • 2! ,
(In cos) (3) (0) = 0,
(In cos) (4) (o) = - -L . 41 ^
(In cos) ('5) (0) = 0,
(In cos) («) (0) = - ^ • 6! .
Beispiel 16. Sei f{x) eine im Punkt XQ beliebig oft differenzierbare Funktion. Wir nehmen weiter an, dass wir die Entwicklung fix)
= 4 + c'la; + • • • + c'^x"" + 0(x"+i)
ilirer Ableitung in einer Umgebung von Null kennen. Dann wissen wir aus der Eindeutigkeit der Taylor-Entwicklung, dass
(/')«(0) = fc!4 und somit /(*+^)(0) = fc!c^. Also ergibt sich fiir die Funktion f{x) selbst die folgende Entwicklung: I{^) = /(O) + ^ x + ^ x ^ + • • • + ( ; ^ a ; " + i + 0(x"+2) , die nacli einigen Vereinfachungen lautet: fix) = /(O) + ^ x + ^ x ^ + • • • + ^ i ^ a ; " + i + 0(x"+2) . 1 2 n +1 Beispiel 11. Wir wollen die Taylor-Entwicklung der Funktion /(x) = arctanx in 0 bestimmen. Da fix) = Y^ = (1 + x2)-i = 1 - x2 + x'' + (-l)"x2» + 0(x2»+2), erhalten wir laut den Uberlegungen in vorigem Beispiel, dass fix) = /(O) + i x - i x ^ + i x ^ - •. • + ^ ^ ' " + ^ + 0(x2"+^) , d.h. arctanx = x - -x^ + -x^ 3 5
+ ^^ ^ x 2 " + i + 0(x2"+3) 2n + 1
242
5 Differentialrechnung
Beispiel 18. Wir entwickeln auf ahnliche Weise die Funktion arcsin' x (1 — x^)~^''^ in einer Unigebung von Null und erhalten Scliritt fiir Scliritt: _i
_iC_i_i^
(1 _ ^ 2 ) - l / 2 ^ ^ ^ 1 2 ^ _ ] _ 4 ^ 4 ^ 2
22 - 2 ! "
1 3 1-3 arcsin X = x + -2— - 3- x + -r———-x 22-2!-5
l-3-^-(2n 2 " • n! 5 (2n
1)!!
(2n)!!(2n + l)
l)^2„^o(^2„+2^
2n+l
, n('^2n+3^
^
^
^
oder nach elenientaren Umforniungen: arcsin X = x + ^ x ^ + ^ x ^
+ • • • + K | L j W a ; 2 „ + i ^ o(3.2n+3) _
Hierbei bedeutet (2n - 1)!! := 1 • 3 • • • (2n - 1) und (2n)!! := 2 • 4 • • • (2n). Beispiel
19. Mit Hilfe der Beispiele 5, 12, 17 und 18 erhalten wir:
arctanx-sinx ,. [x - ^x^ + 0 ( x ^ ) ] - [x - 4 x ^ + 0 ( x ^ ) l lim ^ lim — — —^ x^o t a n x - arcsinx x^o [x + ^x^ + 0{x^)\ - [x + ^ x ^ + 0{x^)\
5.3.4 U b u n g e n u n d A u f g a b e n 1. Bestimmen Sie Zahlen a und 6 so, dass die Funktion f{x) = cos a; — -jiffs- von hoherer Ordnung infinitesimal ist als a; —>• 0. 2. Finden Sie lim x\^ -
(^X^•
3. Schreiben Sie ein Taylor-Polynom fiir e^ in Null, das es erlaubt, die Werte von e^ auf dem abgeschlossenen Intervall —1 < a: < 2 mit einer Genauigkeit von 10~^ zu bestimmen. 4. Sei / eine in 0 beliebig oft differenzierbare Funktion. Zeigen Sie: a) Ist / gerade, dann enthalt die Taylor-Reihe in 0 nur gerade Potenzen von x. b) Ist / ungerade, dann enthalt die Taylor-Reihe im Punkt 0 nur ungerade Potenzen von X.
5.3 Die zentralen Satze der DifFerentialrechnung
243
5. Zeigen Sie, dass / = 0 auf [-1,1], falls / G C^°°\-l,l] und /<"'(0) = 0 fiir n = 0 , 1 , 2 , . . . und falls eine Zahl C existiert, so dass sup \f^"Hx)\ < n\C fiir -i<x
nGN. 6. S e i / G C < " > f ] - l , l [ ) und
sup
|/(a;)| < 1. Sei mfc(/) = inf |/(*'(x)|, wobei /
ein Intervall ist, das in ] — 1,1[ enthalten ist. Zeigen Sie: a) Ist / in drei Intervalle / i , I2 und I3 unterteilt und ist fi die Lange von I2, dann gilt: rnkil) < -\rnk-i{Ii)
+ mk-iils)]
•
b) Hat / die Lange A, dann gilt: 2fc(fc+i)/2^*
mk{I) <
A*
c) Es existiert eine Zahl a „ , die nur von n abhangt, so dass fiir |/'(0)| > a„ die Punktion / ' " ' ( x ) mindestens n — 1 verschiedene Nullstellen in ] — 1,1[ besitzt. Hi n we is: Nutzen Sie Teil a) fiir Teil b) und mathematische Induktion. Nutzen Sie a) in c) und beweisen Sie durch Induktion, dass eine Folge Xki < Xk2 < • • • < Xk^. von Punkten im offenen Intervall ] — 1,1[ existiert, so dass f^''\xki) • f'"'°\xkij^t) < 0 fiir 1 < i < k — 1. 7. Die Punktion / sei auf einem offenen Intervall / mit [o, b] G I definiert und differenzierbar. Zeigen Sie: a) Die Punktion f (x) nimmt auf [0,6] (auch wenn sie nicht stetig ist!), alle Werte zwischen /'(o) und /'(6) an {Satz von Darhoux^ ). b) Existiert auch f"{x) auf ]o,6[, dann existiert ein Punkt ^ G]a, 6[, so dass
/'(6)-/'(a) = /"(e)(6-a). 8. Eine Punktion f{x) sei auf der ganzen reellen Geraden differenzierbar, ohne dass sie eine stetige Ableitung f'{x) besitzt (vgl. Beispiel 7 in Absatz 5.1.5). a) Zeigen Sie, dass f'{x) nur Unstetigkeiten zweiter Art besitzen kann. b) Pinden Sie den Pehler im folgenden „Beweis" der Stetigkeit von f'{x). Beweis. Sei xo ein beliebiger Punkt in R und f'{x) die Ableitung von / im Punkt XQ. Laut Definition der Ableitung und dem Mittelwertsatz gilt /'(^„) = lini f(^) - / ( ^ ° ) = liin /'(C) = lim / ' ( ? ) , x^XQ
X — Xo
x^XQ
5->a:o
wobei ^ ein Punkt zwischen xo und x ist und daher fiir a; —>• xo gegen xo strebt. D 9. Sei / auf dem Intervall / zweimal differenzierbar. Sei Mo = sup|/(a;)|. Mi = xei sup|/'(a;)| und M2 = sup|/"(a;)|. Zeigen Sie: xei xei G. Darboux (1842-1917) - franzosischer Mathematiker.
244
5 Differentialrechnung
a) 1st / = [—o,a], dann gilt \f {x)\ <—
{
+ —^—M2
Ml < 2VM0M2 , falls die Lange von / iiiclit kleiner ist als l^M^jM^
,
Ml < V2M0M2 , falls / = R ; c) Die Zahlen 2 und ^/2 in Teil b) konnen nicht durcli kleinere Zalilen ersetzt warden. d) Ist / p-mal auf R differenzierbar und sind Mo und Mp = sup \f^''\x)\ endlich, dann sind die Grofien M^ = sup |/*-*'(a;)|, 1 < k < p ebenfalls endlich und es gilt: Mk
< 2*(''-*'/"MO-*/''M*/*' .
H i n w e i s: Nutzen Sie die Aufgaben 6b) und 9b) und mathematisclie Induktion. 10. Die Punktion / sei im Punkt xo bis einschliefllicli (n + l)-ter Ordnung differenzierbar mit f^"~^^Hxo) i^ 0. Zeigen Sie, dass dann im Restglied nacli Lagrange in der Taylorschen Forniel r„(xo; x) = —/*"•' (xo + 0{x — xo) j (x - xo)" fiir 0 < 6 < 1 die Grofie 9 = 9{x) fiir x ^ xo gegen -^^ strebt. 11. Sei / eine n-nial differenzierbare Punktion auf einem Intervall / . Beweisen Sie die folgenden Aussagen: a) Verschwindet / in (n + 1) Punkten von / , dann existiert ein Punkt ^ £ / , so dass/(")(e) = 0. b) Seien x i , X 2 , . . . ,Xp Punkte im Intervall / . Dann existiert ein eindeutiges Polynom L(x) (das Lagrangesche Interpolationspolynom) vom Grad hochstens gleich (n — 1), so dass f(xi) = L{xi), i = 1,... ,n. Aufierdem existiert fiir x G I ein Punkt ^ e / , so dass
fix) - L(x) = k ^ l ^ i l _ L ( ^ ^ l ^ / ( " ) ( ^ ) . c) Seien xi, X2, • • • ,Xp Punkte im Intervall / und rn, 1 < i
fix ) = H(x) + ^"^ a^i)"^---(a^
a^»)"''^(n)(g)
^^ Ch. Hermite (1822-1901) - franzosischer Mathematiker, der Probleme der Analysis untersuchte und insbesondere bewies, dass e transzendent ist.
5.3 Die zentralen Satze der DifFerentialrechnung
245
Diese Formel wird Hermitesche Interpolationsformel genannt. Die Punkte Xi, i = l,...,p werdeii als Interpolationspunkte niit Vielfachheit rii bezeichnet. Sonderfalle der Hermite Interpolation sind die Lagrange Interpolation (s. Teil b) der Ubung) und die Taylorsclie Formel mit Restglied nacli Lagrange, das sicli fiir p = 1, d.li. bei der Interpolation mit einem einzigen Punkt der Vielfachheit n, ergibt. 12. Zeigen Sie: a) Zwischen zwei reellen Nullstellen des Polynoms P{x) mit reellen KoefRzienten liegt eine NuUstelle ihrer Ableitung P'{x). b) Besitzt das Polynom P{x) eine mehrfache NuUstelle, dann hat das Polynom P'{x) dieselbe NuUstelle, aber die Vielfachheit der NuUstelle von P'{x) ist um eins kleiner als die Vielfachheit der NuUstelle von P{x). c) Sei Q{x) der groflte gemeinsame Teller der Polynome P{x) und P'{x), wobei P'{x) die Ableitung von P{x) ist. Dann besitzt das Polynom -^j^ dieselben Nullstellen wie P{x) und alle Nullstellen besitzen Vielfachheit 1. 13. Zeigen Sie: a) Jedes Polynom P{x) erlaubt eine Darstellung als co+ci(a;—a;o)+ • • • +c„(a;—xo)". b) Es existiert ein eindeutiges Polynom vom Grad n, fiir das f{x) — P{x) = ol{x — xo)^] fiir E B x ^ xo- Hierbei ist / eine Punktion, die auf einer Menge E definiert ist und xo ist ein Haufungspunkt in E. 14. Mit Hilfe der Induktion fiir k, 1 < k definieren wir die finiten Differenzen vom Grad k der Punktion f in xo'A^f{xo; hi) := Af{xo; hi) = f{xo + hi) - f{xo) , A f{xo;hi,h2)
•= AAf{xo;hi,h2)
=
= (/(xo +hi+ fe) - fixo + fe)) - (/(xo + hi) - f{xo))
=
= fixo + hi + h-i) — f{xo + hi) — f{xo + h-i) + f(xo) , A 'f{xo;hi,...
,hk) ••= A ~^gk{xo;hi,...
mit gk{x) = A^f{x;hk)
= f{x + hk) -
,hk-i)
,
f{x).
a) Sei / G C*-"~^'[a,6] und wir nehmen an, dass /'"'(a;) zumindest im offenen Intervall ]a, b[ existiere. Liegen alle Punkte xo,xo + hi,xo + h2,xo + hi+h2, • • •, xo + hi + • • • + hn in ]o, b[, dann liegt im kleinsten abgeschlossenen Intervall, das alle diese Punkte enthalt, ein Punkt ^, so dass = f'-"\Ohi---hn
A"fixo;hi,...,h„)
•
h) (Fortsetzung.) Existiert / ' " ' ( x o ) , dann gelten die folgenden Abschatzungen: Zi"/(a;o;/ii,... ,/i„) - f^"\xo)hi
• • • hJ <
< sup | / ( " ' ( x ) - / ( " ) ( a ; o ) | - | / i i | •••!/»„I . xE.]a,b[ '
'
246
5 Differentialrechnung
c) (Fortsetzung.) Wir setzeii A"f{xo;h,... falls / ' " ' ( x o ) existiert, gilt: •'
^ '
,h) =: A"f{xo;h")-
h^o
Zeigen Sie, dass,
ft"
d) Zeigen Sie am Beispiel, dass der obige Grenzwert auch existiert, wenn / ' " ' ( x o ) nicht existent ist. H i n w e i s : Betracliten Sie etwa Zi^/(0;ft^) fiir die Punktion
fix) und zeigen Sie, dass h-tO
15.
h-'
a) Wenden Sie den Mittelwertsatz auf die Punktion -^ mit a > 0 an und zeigen Sie, dass die Ungleichung 1 1 / 1 «!+" < a\{n-l)"
1 n" ^
fiir n e N und a > 0 gilt. oo
b) Benutzen Sie das Ergebnis aus a) und zeigen Sie, dass die Reihe ^
-^ fiir
(T > 1 konvergiert.
5.4 Die Untersuchung von Funktionen mit den M e t h o d e n der Differentialrechnung 5.4.1 B e d i n g u n g e n fur die M o n o t o n i e e i n e r F u n k t i o n S a t z 1. Zwischen der Monotonie einer Funktion / : i? —>• M, die auf einem ojfenen Intervall ]a, b[= E differenzierbar ist, und dem Vorzeichen ihrer Ableitung / ' auf diesem Intervall gelten die folgenden Relationen: /'(x) /'(x) /'(x) /'(x) /'(x)
> > = < <
0 0 0 0 0
=^ / ist anwachsend =^ / ist nicht absteigend =^ / ist konstant =^ / ist nicht anwachsend =^ / ist absteigend
=^ =^ =^ =^ =^
f (x) /'(a;) /'(x) /'(x) /'(x)
> > = < <
0 0 0 0 0
, , , , .
Beweis. Die linke Spalte ist uns bereits aus dem Mittelwertsatz bekannt, aufgrund dessen /(X2) — / ( x i ) = /'(•f)(x2 — x i ) , mit xi,X2 £]a, &[. Dabei ist ^ ein P u n k t zwischen xi und X2. An dieser Gleichung lasst sich erkennen, dass fiir xi < X2 der Unterschied /(X2) — / ( x i ) genau dann positiv ist, wenn / ' ( ^ ) positiv ist.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
247
Die rechte Spalte der Behauptungen konnen wir unmittelbar aus der Definition der Ableitung erhalten. Wir woUen beispielsweise zeigen, dass f'{x) > 0 auf ]a, b[, wenn eine differenzierbare Funktion / auf ]a, b[ anwachst. Tatsachlich ist •> ^ '
h^o
h
Fiir /i > 0 ist f{x + h) - f{x) > 0. Und fiir / i < 0 gilt: f{x + h) - f{x) Daher ist der Bruch nach deni Limes-Zeichen positiv. Folgerichtig ist wie behauptet der Grenzwert ,f'{x) nicht negativ.
< 0. D
Anmerkung 1. Am Beispiel der Funktion f{x) = x^ wird deutlich, dass eine streng monoton anwachsende Funktion eine nicht negative Ableitung besitzt, aber nicht notwendigerweise eine, die immer positiv ist. In diesem Beispiel ist / ' ( 0 ) = 3 a ; 2 | „ = 0. Anmerkung 2. Im Ausdruck A ^ B ist A eine hinreichende Bedingung fiir B und B eine notwendige Bedingung fiir A, wie wir bereits an geeigneter Stelle betont haben. Daher konnen wir aus Satz 1 die folgenden Schlussfolgerungen Ziehen. Eine Funktion ist auf einem ojfenen Intervall genau dann konstant, wenn ihre Ableitung auf diesem Intervall gleich Null ist. Eine hinreichende Bedingung dafiir, dass eine auf einem ojfenen Intervall differenzierbare Funktion auf diesem Intervall absteigend ist, ist, dass ihre Ableitung in jedem Punkt des Intervalls negativ ist. Eine notwendige Bedingung dafiir, dass eine auf einem offenen Intervall differenzierbare Funktion auf diesem Intervall nicht anwachst, ist, dass ihre Ableitung in diesem Intervall nicht positiv ist. Beispiel 1. S e i / ( x ) = a;^ - 3 a ; - h 2 auf M. Dann ist f'{x) = 3 a ; 2 - 3 = 3(a;2 - 1). Da f'{x) < 0 fiir \x\ < 1 und f'{x) > 0 fiir |a;| > 1, konnen wir sagen, dass die Funktion auf dem offenen Intervall ] — oo, —1[ anwachst, auf ] — 1,1[ absteigt und wiederum auf ]1, -|-oo[ anwachst. 5.4.2 B e d i n g u n g e n fur e i n i n n e r e s E x t r e m u m e i n e r F u n k t i o n Mit dem Satz von Fermat (Satz 1 in 5.3) konnen wir den folgenden Satz aufsteUen. S a t z 2. (Notwendige Bedingungen fiir ein inneres E x t r e m u m ) . Eine der beiden folgenden Bedingungen muss notwendigerweise erfullt sein, damit ein Punkt XQ das Extremum einer auf einer Umgebung U{xo) dieses Punktes definierten Funktion f : U{xo) —>• M ist: Entweder ist die Funktion in XQ nicht differenzierbar oder es gilt f'{xo) = 0. Einfache Beispiele zeigen, dass diese notwendigen Bedingungen nicht hinreichend sind.
248
5 Differentialrechnung
Beispiel 2. Sei f{x) = x^. Dann ist /'(O) = 0, aber die Funktion besitzt in a;o = 0 kein Extremuni. iel 3. Sei C X fiir a; > 0 ,
fix) = { \^ 2x fiir a; < 0 . Diese Funktion hat in 0 einen Knick, aber offensichtlich weder eine Ableitung noch ein Extremuni in 0. Beispiel 4- Wir wollen das Maximum von f{x) = x'^ auf dem abgeschlossenen Intervall [—2,1] bestimmen. In diesem Fall ist offensichtlich, dass das Maximum im Endpunkt —2 angenommen wird, aber wir stellen hier einen systematischen Weg dafiir vor, das Maximum zu finden. Wir erhalten f'{x) = 2x und bestimmen als Nachstes alle Punkte auf dem offenen Intervall ] — 2,1[ in denen f'{x) = 0. In diesem Fall ist a; = 0 der einzige derartige Punkt. Das Maximum muss entweder einer der Punkte sein, fiir die f'{x) = 0 oder einer der Endpunkte, iiber die Satz 2 nichts aussagt. Daher miissen wir /(—2) = 4, /(O) = 0 und / ( I ) = 1 vergleichen, woraus wir folgern, dass der Maximalwert von f{x) = x"^ auf dem abgeschlossenen IntervaU [—2,1] gleich 4 ist und in —2, einem Endpunkt des Intervalls, angenommen wird. Mit den in Absatz 5.4.1 formulierten Zusammenhangen zwischen dem Vorzeichen einer Ableitung und der Monotonie der Funktion gelangen wir zu den folgenden hinreichenden Bedingungen fiir die Existenz oder die Abwesenheit eines lokalen Extremwertes in einem Punkt. Satz 3. (Hinreichende Bedingungen fiir ein Extremuni in Verbindung mit der ersten Ableitung). Sei f : U{xo) —>• M eine auf einer Umgebung des Punktes XQ definierte Funktion, die in diesem Punkt stetig ist und in einer punktierten Umgebung U{xo) dijferenzierbar ist. Sei (j {XQ) = {X £ U{XQ)\X < XQ} und U (xo) = {x G U{xo)\ X > xo}• Dann gelten die folgenden Schlussfolgerungen: a) (Vx e U~{xo) (fix)
< 0)) A (Vx e U^{xo) {f'{x) < 0)) ^ ^ (/ besitzt keinen Extremwert in XQ),
b) (Vx e U~{xo) (fix)
< 0)) A (Vx e il^ixo) (fix) > 0)) => ^ (XQ ist ein isoliertes lokales Minimum von f),
c) (Vx e
(fix)
> 0)) A (Vx e ;7+(xo) (fix) < 0)) => =^ (xo ist ein isoliertes lokales Maximum von f),
d) (Vx e U~{xo) (fix)
> 0)) A (Vx e tl^ixo) (fix) > 0)) => ^ (/ besitzt keinen Extremwert in XQ).
U~{XQ)
In Kurzform, aber weniger genau lasst sich sagen, dass ein Punkt ein Extremum ist, wenn die Ableitung beim Durchgang durch diesen Punkt das
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
249
Vorzeichen wechselt. Wechselt die Ableitung das Vorzeichen nicht, dann ist der P u n k t kein Extrenium. Wir merken sofort an, dass diese hinreichenden Bedingungen jedoch nicht notwendig fiir einen Extremwert sind, wie m a n am folgenden Beispiel erkennen kann. Beispiel
5. Sei
{
2x^ + x'^ sin i fiir a; 7^ 0 , 0
fiir a; = 0 .
Da x'^ < f{x) < 3a;^, ist klar, dass die Funktion ein isoliertes lokales Minim u m in xo = 0 besitzt. Aber die Ableitung f'{x) = 4a; + 2a; sin ^ — cos ^ hat in keiner punktierten einseitigen Umgebung dieses P u n k t e s ein einheitliches Vorzeichen. Dieses Beispiel verdeutlicht das Missverstandnis, das im Zusammenhang mit der eben formulierten abgekiirzten Aussage von Satz 3 auftreten kann. Wir wenden uns nun dem Beweis von Satz 3 zu. Beweis. a) Aus Satz 2 folgt, dass / auf JJ (XQ) streng absteigend ist. Da / in XQ stetig ist, gilt lim f{x) = f{xo) und folglich ist f{x) > / ( X Q ) U~ (a;o)9a:—>a:o
fiir X G tj (XQ). Mit denselben Uberlegungen erhalten wir / ( X Q ) > / ( x ) fiir X G U (XQ). Daher ist die Funktion in der gesamten Umgebung U{xo) streng absteigend und XQ ist ein E x t r e m u m . b) Wir folgern zunachst wie in a), dass / ( x ) > / ( X Q ) fiir x G JJ (XQ), da f{x) absteigend auf (j (XQ) und in XQ stetig ist. Wir folgern daraus, dass / auf (j (xo) ansteigt, dass / ( X Q ) < / ( x ) fiir x G (j (XQ). Somit besitzt / ein isoliertes lokales Minimum in XQ. Die Aussagen c) und d) werden ahnlich bewiesen. D S a t z 4 . (Hinreichende Bedingungen fiir ein E x t r e m u m in Abhangigkeit von Ableitungen hoherer Ordnung). Angenommen, eine Funktion f : U{XQ) -^ M, die auf einer Umgebung U{XQ) von XQ definiert ist, besitze Ableitungen hoherer Ordnung bis einschliefilich n (n >1) in XQ. Ist / ' ( x o ) = • • • = /'""^-'(xo) = 0 und f^ \XQ) ^ 0, dann gibt es keinen Extremwert in XQ, falls n ungerade ist. Ist n gerade, dann ist der Punkt XQ ein lokales Extremum und zwar ein isoliertes lokales Minimum, falls / ' " ' ( X Q ) > 0 und ein isoliertes lokales Maximum fiir f^^'{xo) < 0. Beweis.
Mit Hilfe der Taylorschen Formel fix)
- / ( x o ) = /(")(a;o)(x - x o ) " + a ( x ) ( x - XQ)" ,
(5.82)
wobei a ( x ) —>• 0 fiir x ^ xo, werden wir wie im Beweis des Satzes von Fermat argumentieren. Wir schreiben (5.82) neu: fix)
- / ( x o ) = (/(") (xo) + a ( x ) ) (x - x o ) " .
(5.83)
250
5 Differentialrechnung
Da /(")(a;o) 7^ 0 und a{x) -^ 0 fiir X ^ xo, besitzt die Summe / ( " ) ( x o ) + a{x) dasselbe Vorzeichen wie /'^"-'(XQ), wenn x geniigend nahe bei XQ ist. 1st n ungerade, dann wechselt der Faktor (x — XQ)" das Vorzeichen, wenn x durch XQ lauft und dadurch andert sich auch das Vorzeichen auf der rechten Seite von (5.83). Als Folge davon andert sich auch das Vorzeichen auf der Unken Seite, weswegen fiir n = 2k + 1 kein E x t r e m u m vorliegt. Ist n gerade, dann ist (x — XQ)" > 0 fiir x j^ XQ und daher ist in einer kleinen Umgebung von XQ das Vorzeichen der Differenz f{x) — f{xo) gleich dem Vorzeichen von /'^"-'(XQ), wie aus (5.83) offensichthch ist. D Wir wollen nun einige Beispiele betrachten. Beispiel 6. Das Brechungsgesetz der geometrischen Optik (SnelUussches Brechungsgesetz^^). Nach dem Fermatschen Prinzip legt ein Lichtstrahl den Weg zwischen zwei P u n k t e n in moglichst kurzer Zeit zuriick. Aus dem Fermatschen Prinzip und der Tatsache, dass der kiirzeste Weg zwischen zwei P u n k t e n eine Gerade mit den P u n k t e n als E n d p u n k t e n ist, folgt, dass sich in einem homogenen und isotropen Medium (das in jedem P u n k t und in jede Richtung identische Struktur besitzt) Licht in geraden Strahlen ausbreitet. Wir betrachten nun zwei Medien und nehmen an, dass sich das Licht von P u n k t Ai zum P u n k t A^ bewegt (vgl. Abb. 5.10).
Abb.
5.10.
Sind ci und C2 die Lichtgeschwindigkeiten in diesen Medien, dann betragt die Zeit fiir den Weg von Ai zu A^:
1
1
t{x) = —J hi + a;2 H
J h'^ + (a -
xY.
Nun suchen wir den Extremwert der Funktion t{x) durch die Ableitung
t'{x)
1
X
c\ ^/hf + x?
1
a—X
C2 ^ / i | + (a -
xY
0
W. Snell (1580-1626) - niederlandischer Astronom und Mathematiker.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
251
die uns in Ubereinstimmung mit der Schreibweise der Abbildung cj~ sin ai = C2 sin 0:2 liefert. Aus physikalischen Betrachtungen oder direkt aus der Form der Funktion t{x), die fiir a; —>• 00 ohne Grenzen anwachst, wird klar, dass der P u n k t mit t'{x) = 0 ein absolutes Minimum der stetigen Funktion t{x) ist. Somit folgt aus dem Fermatschen Prinzip das Brechungsgesetz 212.21 = £x_ Beispiel
7. Wir werden zeigen, dass fiir a; > 0 gilt: x " - aa; + a - 1 < 0 , fiir 0 < a < 1 ,
(5.84)
x"—
(5.85)
ax + a — 1>0,
fiir a < 0 oder 1 < a .
Beweis. Differenzieren der Funktion f{x) = x" — ax + a — 1 liefert /'(a;) = a{x"~^ — 1) und f'{x) = 0 fiir x = 1. Bei der Bewegung durcli den P u n k t 1 gelit die Ableitung fiir 0 < cc < 1 von positiven zu negativen Werten iiber und fiir a < 0 oder a > 1 von negativen zu positiven Werten. Im ersten Fall ist der P u n k t 1 ein isoliertes Maximum und im zweiten ein isoliertes Minimum (und, wie aus der Monotonie von / auf den Intervallen 0 < a; < 1 und 1 < x folgt, niclit einfacli nur ein lokales Minimum). Aber / ( I ) = 0, wodurcli wir die beiden Ungleicliungen (5.84) und (5.85) gezeigt liaben. Dabei liaben wir sogar gezeigt, dass beide Ungleicliungen fiir a; 7^ 1 streng gelten. D Wir merken an, dass (5.84) und (5.85) Erweiterungen der BernouUischen Ungleichung (vgl. Abschnitt 2.2 und Aufgabe 2 unten) sind, die wir bereits fiir natiirliche Exponenten a kennen, wenn wir x durch 1 + a; ersetzen. Durch elementare algebraische Umformungen konnen wir eine Reihe klassischer Ungleichungen, die fiir die Analysis sehr wichtig sind, aus den eben bewiesenen Ungleichungen erhalten. Wir werden nun diese Ungleichungen herleiten. a. Youngsche^^ U n g l e i c h u n g e n . Sei a > 0 und b > 0 und fiir p und q gelte, dass p ^ 0,1, g 7^ 0 , 1 und ^ + ^ = 1. Dann gelten
Die Gleichheit
a^/pfji/v <}.a+-b, p q
fiirp>
a^/pfji/v>}.a+-b, p
fiirp
I und
(5.86) (5.87)
q
gilt in (5.86) und (5.87) nur, wenn a = b.
Beweis. Es geniigt, in (5.84) und (5.85) x = j und a = - und dann - = 1 — zu setzen. D W. H. Young (1882-1946) - britisclier Matliematiker.
252
5 Differentialrechnung
b . Holdersche^^ U n g l e i c h u n g e n . Seien Xi > 0, t/i > 0, i = 1,... ,n und - + - = 1. Dann qilt: p
q
"
E^^2^^<(E^0 \Y.y')
' fiirp>l
(5.88)
und n
1 /
n
J2^^yi>{J2^') i=l
^
1 /
\J2yi)
i=l
'fiirp
(5.89)
i=l
Fur p < 0 wird in (5.89) angenommen, dass Xi > 0 (i = 1,... ,n). In (5.88) und (5.89) ist nur dann Gleichheit moglich, wenn die Vektoren (x^,..., x'f^) und (yf,..., y^) zueinander proportional sind. n
Beweis.
W i r wollen die Ungleichung (5.88) beweisen. Seien X = X] a;f > 0 i=l
und Y = '^ yf > 0- Wenn wir in (5.86) a = ^
u n d b = jr setzen, erhalten
i=l
wir X i / p y i / 9 - pX
qY
Wenn wir diese Ungleichungen iiber i von 1 bis n sunimieren, erhalten wir n
X'=^ i/pyi/9 < 1 , was zu (5.88) aquivalent ist. Ungleichung (5.89) erhalten wir auf ahnliche Weise aus (5.87). D a Gleichheit in (5.86) u n d (5.87) nur dann gilt, wenn a = b, folgern wir, dass Gleichheit in (5.88) und (5.89) nur dann gilt, wenn die Proportionalitaten x^ = Xyf oder y1 = Axf gelten. D c. Minkowskische^^ U n g l e i c h u n g e n . Seien Xi > 0, yi > 0, i = l , . . . , n . Dann gilt
{Y.(^^+yir)
<(E^f)
+(E2^f)
i=l
i=l
i=l
M^p>i
(5-90)
/«^^^ P
(5.91)
und n
{J2(^^+ Vif)
1/
n
> ( E ^f)
1/
n
+ ( E 2^f)
-, /
^® O. Holder (1859-1937) - deutsdier Mathematiker. ^^ H. Minkowski (1864-1909) - deutscher Mathematiker, dessen vierdimensionaler Raum die spezielle Relativitatstheorie substanziell erweiterte (ein pseudoeuklidischer Raum mit einer anderen Metrik).
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
253
Beweis. Wir wenden die Holdersche Ungleichung auf die Ausdriicke auf der rechten Seite der Gleichungen n
n
n
J2{xi + ViY = Y^ Xiixi + yi)P-^ + J2 Vii^i + ViY'^ i=l
i=l
i=l
an. Dann ist nach (5.88) und (5.89) die linke Seite von oben (fiir p > 1) bzw. von unten (fiir p < 1) durch folgenden Ausdruck beschrankt:
: E •<)'" (E(-. + yr)'" + ( E i-f)'" (E(-. + yr)'" i=l
i=l
i=l
i=l
Nach Division dieser Ungleichungen durch I J2i^i~^ ViY ]
1/3
gelangien wir zu
(5.90) und (5.91). Da wir die Bedingungen fiir Gleichheit in den Holderschen Ungleichungen kennen, konnen wir zeigen, dass in den Minkowskischen Ungleichungen nur dann Gleichheit gilt, wenn die Vektoren (a;i,..., a;„) und ( y i , . . . , 2/„) kollinear sind. D Fiir n = 3 und p = 2 stimmt die Minkowskische Ungleichung (5.90) offensichtlich niit der Dreiecksungleichung im drei-diniensionalen euklidischen Raum iiberein. Beispiel 8. Wir woUen ein weiteres einfaches Beispiel fiir den Gebrauch hoherer Ableitungen fiir das AufRnden lokaler Extremwerte betrachten. Sei f{x) = sina;. Da f'{x) = cosa; und f"{x) = — sinx, sind alle Punkte, in denen f'{x) = cosa; = 0, lokale Extrema von sina;, da in diesen Punkten /"(a;) = -sina; 7^ 0. Hierbei ist f"{x) < 0 fiir sina; > 0 und f"{x) > 0 fiir sina; < 0. Daher sind die Punkte, in denen cosa; = 0 und sina; > 0 lokale Maxima, und die mit cosa; = 0 und sina; < 0 lokale Minima von sina; (was natiirlich seit langem bekannt ist). 5.4.3 Bedingungen fur die Konvexitat einer Funktion Definition 1. Eine auf einem offenen Intervall ]a, 6[c M definierte Funktion / :]a, 6[—>• M ist konvex, wenn die Ungleichung /(ccixi + a^x^) < aif{xi)
+ a2f{x2)
(5.92)
fiir alle Punkte xi, X2 G]a, b[ und alle Zahlen ai > 0, a2 > 0 mit cci + 0:2 = 1 gilt. Ist diese Ungleichung fiir xi ^ X2 und aia2 7^ 0 streng erfiillt, dann ist die Funktion auf ]a, b[ streng konvex. Geometrisch interpretiert, bedeutet die Konvexitatsbedingung (5.92) fiir eine Funktion / :]a, 6[—>• K, dass die Punkte jedes Bogens des Graphen der
254
5 Differentialrechnung (X2,f(x2)).
{aixi + a2X2,aif{xi)
+ a2f{x2))
(x-i,f(x-i))
xi
X = a\X\
+ a2X2
X2
Abb. 5.11. Funktion unterhalb der Sehne zur gegeniiberliegenden Seite des Bogens liegen (vgl. Abb. 5.11). Tatsachlich enthalt die linke Seite von (5.92) den Wert / ( x ) der Funktion im P u n k t x = a\X\ +a2X2 G [a;i,2:2], und die rechte Seite enthalt den Wert in demselben P u n k t einer linearen Funktion, dessen (geradliniger) Graph durch die P u n k t e (a;i,/(a;i)) und {x2,,f{x2)) verlauft. Die Ungleichung (5.92) besagt, dass die Menge E = {{x,y) £M^\x £]a, b[ , f{x) < y} der P u n k t e der Ebene, die oberhalb des Graphen der Funktion hegen, konvex ist. Daher kommt der Ausdruck „konvex", der fiir die Funktion selbst iibernommen wird. D e f i n i t i o n 2. Gih die umgekehrte Ungleichung fiir die Funktion / :]a, 6[—>• ffi, dann wird die Funktion auf dem Intervall ]a, b[ als konkav bezeichnet oder auch als abwarts gekriimmt auf dem Intervall, im Unterschied zu einer konvexen Funktion, die aufwdrts gekriimmt auf ]a, b[ genannt wird. Da alle unsere folgenden Konstruktionen fiir eine konkave Funktion genau gleich wie fiir eine konvexe durchgefiihrt werden, werden wir uns auf Funktionen beschranken, die konvex sind. Wir geben zunachst der Ungleichung (5.92) eine neue Gestalt, die fiir unser Vorhaben besser geeignet ist. In den Gleichungen x = a\X\ + a2X2 und a i + 0:2 = 1 gilt: a\
und X2 — Xi
a2 X2 — Xi
SO dass (5.92) in der Form
X2 — Xi
X2 — Xi
geschrieben werden kann. Wenn wir die Ungleichungen a;i < a; < a;2 und xi < X2 beriicksichtigen, konnen wir mit X2 — xi multiplizieren und erhalten {X2 - X)f{xi)
+ (xi - X2)f{x)
+ {X - Xi)f{x2)
> 0
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
255
Wenn wir nun noch bedenken, dass a;2 — a;i = {x2 — x) + (x — xi), dann erhalten wir aus der letzten Ungleichung nach einfachen Umformungen: f{x) - fjXi)
^ f{x2) -
fix)
fiir a;i < a; < a;2 und jedes xi, X2 e]a, b[. Ungleichung (5.93) ist eine andere Art, die Definition fiir die Konvexitat der Funktion f{x) auf einem offenen Intervall ]a, h[ zu schreiben. Geometrisch interpretiert bedeutet (5.93) (vgl. Abb. 5.11), dass die Steigung der Sehne /, die (xi, f{xi)) mit (a;, f{x)) verbindet, nicht groBer ist (und bei strenger Konvexitat kleiner ist) als die Steigung der Sehne II, die [x, f{x)) mit (a;2, fix'i)) verbindet. Wir woUen nun annehmen, dass die Funktion / :]a, 6[—>• M auf ]a, h[ diflerenzierbar ist. Wenn wir nun x in (5.93) zunachst gegen xi und dann gegen X2 streben lassen, erhalten wir die Ungleichung
/'(.,) < / M - ^ < /'(.,), X2 — Xi
die aussagt, dass die Ableitung von / monoton ist. Wenn wir dies fiir eine streng konvexe Funktion betrachten, erhalten wir mit Hilfe des Mittelwertsatzes, dass ft ^ / f'u ^ / W - fi^i) / 1(^2) - fix) ,, ^ , w. X / [xi) < f (Ci) = < = / ( 6 ) < / (a;2) fiir xi < £,1 < X < ^2 < X2, d.h., aus strenger Konvexitat folgt, dass die Ableitung streng monoton ist. Ist daher eine differenzierbare Funktion / auf einem offenen Intervall ]a, b[ konvex, dann ist / ' nicht absteigend auf ]a, b[. Ist aufierdem / streng konvex, dann ist die Ableitung / ' auf ]a, b[ anwachsend. Diese Bedingungen stellen sich nicht nur als notwendig, sondern auch als hinreichend fiir die Konvexitat einer differenzierbaren Funktion heraus. Tatsachlich ist nach dem Mittelwertsatz fiir a<xi<x<X2
m^IM
= /'(^,) ,nd ZM^/M = /'(^,) ,
wobei xi < ^1 < a; < ^2 < a;2- Gilt /'(Ci) < /'(C2), dann ist die Bedingung (5.93) fiir die Konvexitat erfiillt (und strenge Konvexitat fiir /'(^i) < /'(^2))Damit haben wir den folgenden Satz bewiesen. Satz 5. Eine differenzierbare Funktion f :]a, b[-^ ffi ist auf dem offenen Intervall ]a, b[ genau dann konvex, wenn ihre Ableitung f auf]a, b[ nicht absteigend ist. Ein streng anwachsendes f entspricht einer streng konvexen Funktion.
256
5 Differentialrechnung
Wenn wir Satz 5 mit Satz 3 vergleichen, gelangen wir zu folgendem KoroUar: KoroUar. Eine zweimal differenzierbare Funktion f :]a, b[-^ ffi ist auf dem ojfenen Intervall ]a,b[ genau dann konvex, wenn f"{x) > 0 auf ]a,b[. Die Bedingung f"{x) > 0 auf]a,b[ ist hinreichend dafiir, dass f streng konvex ist. Wir konnen nun beispielsweise erklaren, warum die Graphen der einfachsten Elementarfunktionen mit der einen oder der anderen Art von Konvexitat gezeichnet werden. Beispiel 9. Wir wollen die Konvexitat von f{x) = x" auf der Menge x > 0 untersuchen. Da f"{x) = a{a — l)x"~'^, gilt f"{x) > 0 fiir a < 0 und cc > 1, d.h., fiir diese Exponenten a ist die Potenzfunktion x" streng konvex. Fiir 0 < a < 1 erhalten wir f"{x) < 0, so dass fiir diesen Exponenten die Funktion streng konkav ist. Die Falle a = 0 und a = 1 sind trivial: a;° = 1 und x^ = x. In beiden Fallen ist der Graph der Funktion eine Gerade (vgl. Abb. 5.18 auf S. 264). Beispiel 10. Sei f{x) = a*, 0 < a, a 7^ 1. Da f"{x) = a^ logj a > 0, ist die Exponentialfunktion a* fiir jeden zulassigen Wert der Basis a streng konvex auf K (vgl. Abb. 5.12).
Abb. 5.13.
Beispiel 11. Fiir die Funktion f{x) = log^j a; erhalten wir f"{x) = — s i ^ i so dass diese Funktion fiir 0 < a < 1 streng konvex ist und streng konkav fiir 1 < a (vgl. Abb. 5.13). Beispiel 12. Wir wollen die Konvexitat von f{x) = sin a; (vgl. Abb. 5.14) untersuchen. Da/"(a;) = —sin a;, erhalten wir auf den Intervallen TT • 2fc <x < 7r(2fc-|-l), dass f"{x) < 0, und auf den Intervallen 7r(2fc —1) < x < 7r-2fc, dass f"{x) > 0, fiir fc e Z. Daraus folgt beispielsweise, dass der Bogen des Graphen von sin a;
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
257
auf dem abgeschlossenen Intervall 0 < a; < |- auBer in den E n d p u n k t e n oberhalb der Sehne zwischen den E n d p u n k t e n liegt. Daher ist sin a; > -x fiir
0 < a ; < f.
y = cos X
y = sm X
A b b . 5.14. Wir woUen nun noch eine andere Charakteristik einer konvexen Funktion herausstellen, die zu der Aussage geometrisch aquivalent ist, dass ein konvexer Bereich in der Ebene vollstandig auf einer Seite einer Tangente an ihre Grenzlinie liegt. S a t z 6. Eine auf dem offenen Intervall ]a, b[ definierte und dijferenzierbare Funktion f :]a,b[-^ M. ist genau dann konvex auf]a,b[, wenn ihr Graph keine Punkte unterhalb jeder ihrer Tangenten besitzt. In diesem Fall ist es eine notwendige und hinreichende Bedingung fiir strenge Konvexitdt, dass alle Punkte des Graphen aufier den Beriihrpunkten streng oberhalb der Tangenten Beweis. N o t w e n d i g . Sei XQ G]a,b[. Die Gleichung der Tangente an den Graphen in (a;o,/(a;o)) lautet y = f{xo) +
f'ixo){x-xo)
so dass f{x)
-y{x)
= f{x)
- f{xo) - f'{xo){x-xo)
= ( / ' ( O - f'ixo)){x
- XQ) ,
wobei ^ ein P u n k t zwischen x und XQ ist. Da / konvex ist, ist die Funktion f'{x) nicht absteigend auf ]a,b[ und daher ist das Vorzeichen der Differenz / ( ^ ) — f'(xo) gleich dem Vorzeichen der Differenz x — XQ- Daher ist f{x) — y{x) > 0 in jedem P u n k t x G]a, b[. Ist / streng konvex, dann ist / ' auf ]a, b[ streng anwachsend und daher f{x) — y{x) > 0 fiir x G]a, b[ und x ^ a;o. H i n r e i c h e n d . Gilt die Ungleichung fix)
- y{x) = fix)
- fixo)
in alien P u n k t e n x,xo G]a,b[, dann ist
- f'ixo){x
- a;o) > 0
(5.94)
258
5 Differentialrechnung f{x) - fjxo)
, < / (a^o) lur X < xo ,
X — XQ
f{x) - f{xo) X — Xo
,, . > / (a^o) lur Xo < X .
Daher gilt fiir je drei Punkte xi, x, X2 e]a, b[ mit xi < a; < a;2 , dass f{x) - fjXi)
^ f{x2)
-fix)
Aus der strengen Ungleichheit in (5.94) folgt strenge Ungleichheit in dieser letzten Relation, die, wie wir erkennen konnen, mit der Definition (5.93) der Konvexitat einer Funktion iibereinstimmt. D Wir woUen nun einige Beispiele betrachten. Beispiel 13. Die Funktion f{x) = (f ist streng konvex. Die Gerade y = x + 1 ist in (0,1) Tangente an den Graphen dieser Funktion, da /(O) = e° = 1 und /'(O) = e^|^_g = 1. Laut Satz 6 folgern wir, dass fiir jedes a; £ M e"^ > 1 + a; gilt und dass diese Ungleichung fiir a; 7^ 0 sogar streng gilt. Beispiel 14- Wenn wir die strenge Konkavitat von In a; bedenken, konnen wir ahnlicli nacliweisen, dass die Ungleichung In a; < a; — 1 fiir a; > 0 gilt und dass fiir a; ^ 1 diese Ungleichung sogar streng gilt. Bei der Konstruktion von Graphen von Funktionen ist es niitzlich, die Wendepunkte eines Graphen bestimmen zu konnen. Definition 3. Sei / : U(xo) —^ K eine Funktion, die auf einer Umgebung U{xo) von Xo £ ffi definiert und differenzierbar ist. Ist die Funktion auf U (xo) = {x G U{xo)\x < XQ} konvex (bzw. konkav) und konkav (bzw. konvex) auf jj (xo) = {x G U{xo)\x > xo}, dann wird (a;o,/(a;o)) ein Wendepunkt des Graphen genannt. Daher andert sich die Kriimmungsrichtung des Graphen in einem Wendepunkt. Dies bedeutet insbesondere, dass der Graph der Funktion im Punkt [xo, f{xo)) von einer Seite der Tangente auf die andere wechselt. Wir konnen mutmafien, welches analytische Kriterium fiir die Abszisse XQ eines Wendepunkts gilt, wenn wir Satz 5 mit Satz 3 vergleichen. Um genauer zu sein, so lasst sich sagen, dass fiir eine in XQ zweimal differenzierbare Funktion / , da f'{x) in XQ entweder ein Maximum oder ein Minimum haben muss, f"{xo) = 0 gelten muss.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
259
1st nun die zweite Ableitung f"{x) auf U{XQ) definiert und besitzt sie iiberall auf JJ {XQ) dasselbe Vorzeichen und iiberall auf fj {XQ) das entgegengesetzte Vorzeichen, dann sind die hinreichenden Bedingungen erfiillt, damit f'{x) sowohl auf U {XQ) als auch auf fj {XQ) monoton ist, jedoch mit unterschiedlicher Art der Monotonie. Laut Satz 5 erfolgt der Wechsel der Kurvenkriimmung in ( X Q , / ( X Q ) ) , und folglich ist dieser P u n k t ein Wendepunkt. Beispiel 15. Bei der Betrachtung der Funktion f{x) = sin a; in Beispiel 12 haben wir die Bereiche bestinimt, in denen der Graph der Funktion konvex oder konkav ist. Wir woUen nun zeigen, dass die P u n k t e des Graphen mit den Abszissen x = Trfc, fc € Z Wendepunkte sind. Tatsachlich gilt f"{x) = — sina;, so dass f"{x) = 0 in a; = Trfc, fc € Z . Aui3erdem andert f"{x) das Vorzeichen in diesen P u n k t e n , wodurch eine hinreichende Bedingung erfiillt ist, damit diese P u n k t e Wendepunkte sind (vgl. Abb. 5.14 auf S. 257). Beispiel 16. Man soUte nicht meinen, dass es eine hinreichende Bedingung fiir einen Wendepunkt ist, wenn eine Kurve von einer Seite der Tangente auf die andere Seite der Tangente wechselt. Es kann schliefilich sein, dass die Kurve keinerlei einheitliche Kriimmung in der links- oder rechtsseitigen Umgebung des P u n k t e s besitzt. Ein Beispiel dafiir ist einfach konstruierbar, indem wir Beispiel 5, das aus diesem Zweck angefiihrt wurde, verandern. Sei
{
2a;^ + x^ sin -^ fm x ^ 0 , 0
fiir a; = 0 .
Dann ist x"^ < f{x) < 3a;^ fiir 0 < a; und 3a;^ < f{x) < x^ fiir a; < 0, so dass die a;-Achse in a; = 0 Tangente an den Graphen dieser Funktion ist. Die Funktion wechselt in diesem P u n k t von der unteren Halbebene in die obere Halbebene. Gleichzeitig ist die Ableitung von f{x) 6x'^ + 3a;^ sin J,- — 2 cos -^ fiir a; 7^ 0 0
fiir a; = 0
in keiner einseitigen Umgebung von a; = 0 monoton. Zum Abschluss kehren wir zur Definition einer konvexen Funktion (5.92) zuriick und zeigen den folgenden Satz. S a t z 7. (Jensen-Ungleichung^'^). Sei f :]a,b[-^ M. eine konvexe Funktion, seiPunkte in ]a, b[ und « ! , . . . , « „ nicht negative Zahlen, so dass Q : I - I - - - - - I - cin = 1- Dann
fiaixi
H
ist
h anXn) < aif{xi)
H
J. L. Jensen (1859-1925) - danischer Mathematiker.
h a„f{x„)
.
(5.95)
260
5 Differentialrechnung
Beweis. Fiir n = 2 stimnit (5.95) mit der Definition (5.92) einer konvexen Funktion iiberein. Wir werden nun zeigen, dass die Ungleichung (5.95) auch fiir n = m giiltig ist, wenn sie fiir n = m — 1 gilt. Der Klarlreit halber nehmen wir an, dass a„ ^ 0. Dann ist P = a2 + • • • + a„ > 0 und ^ + ••• + %- = 1. Aufgrund der Konvexitat der Funktion gilt f{aixi
H
h anXn) = f f aixi + pl-^x^ < aifixi)
H
h -^Xn)
] <
+ Pf(^-^X2 + ••• + -^^nj
,
da cci + /? = 1 und {^xi + • • • + %-a;„) £]a, b[. Mit der Induktionsannalime erhalten wir f[-J^2
+ ••• + —Xn)
< -JI(X2)
+ • • • + —I(Xn) •
Folglicli ist f{aixi
H
h anXn) < aif{xi) < aifixi)
+ (!Sfl—X2 H + a2f{x2) H
h -^-a^nj < h an.f{x„) .
Durcli Induktion folgern wir nun, dass (5.95) fiir jedes n £ N gilt (fiir n = 1 ist (5.95) trivial). D Wir merken an, dass der Beweis verdeutliclit, dass eine strenge JensenUngleichung einer strengen Konvexitat entspricht, d.li, sind die Zahlen ai,...,a„ ungleich Null, dann gilt Gleicliheit in (5.95) genau dann, wenn Xi
— • •• —
X'fi.
Fiir eine konkave Funktion erhalten wir natiirlicli die zu (5.95) entgegengesetzte Bezieliung: fiaixi
H
h anXn) > aif{xi)
H
h a„f{x„) .
(5.96)
Beispiel 17. Die Funktion f{x) = Inx ist auf der Menge der positiven Zahlen streng konkav. Somit gilt nach (5.96): a i In xi + • • • + a„ In a;„ < ln(Q;ia;i + • • • + anX„) oder x"^ • • • x"" < aiXi + • • • + anXn
(5.97)
n
fiir Xi > 0, ai >0, i = 1,... ,n und ^ a^ = 1. i=l
1st insbesondere ai = • • • = an = ^, dann erhalten wir die klassische Ungleichung
5.4 DifFerentialrechnung zur Untersuchung von Funktionen y/Xi---
Xn <
261
Xi + • • • + X.
(5.98) n zwischen dem geonietrischen und deni arithnietischen Mittel von n nicht negativen Zahlen. In (5.98) herrscht, wie oben bemerkt, nur dann Gleichheit, wenn xi = X2 = • • • = a;„. Wenn wir in (5.97) n = 2, ai = ^, a2 = •^y xi = a und X2 = b setzen, erhalten wir wiederum Ungleichung (5.86). Beispiel 18. Sei f{x) = x^, a; > 0 und p > 1. Da eine derartige Funktion konvex ist, erhalten wir y^aiXij
<^Q;ia;f. N-1
/ n
_
Wenn wir q = - ^ , ai = bfl ^bf]
,,
_ ,
und Xi = Uib^ '^^'
n
' ^
&f setzen,
erhalten wir die Holdersche Ungleichung (5.88) n
n
i=l
i=l
-, /
n
-,
i""(E-^"" i=l
mit p + ^ = 1 und p > 1. Fiir p < 1 ist die Funktion f{x) = x^ konkav und daher konnen fiir die zweite Holdersche Ungleichung (5.89) ahnhche Uberlegungen angestellt werden. 5.4.4 D i e R e g e l v o n L ' H o p i t a l Wir halten kurz inne, um eine spezielle, aber sehr niitzliche Regel zur Bestimmung des Grenzwertes eines Bruchs von Funktionen vorzustellen, die als Regel von I'HopitaP^ bekannt ist. S a t z 8. (Regel von I'Hopital). Angenommen, die Funktionen f :]a,b[-^ M. und g :]a, b[-^ M. seien auf dem ojfenen Intervall ]a, b[ (—oo < a < b < +oo) differenzierbar mit g'{x) ^ 0 auf]a,b[ und
fix) - ^ g'ix)
^ Afurx
^ a+ Q
{-oo< A<+oo) . y J
'^^ G. F. de I'Hopital (1661-1704) - franzosischer Mathematiker, ein fahiger Student von Johann Bernoulli. Er war Marquis und Bernoulli schrieb fiir ihn das erste Lehrbuch der Analysis in den Jahren 1691-1692. Der Teil dieses Lehrbuchs, der der DifFerentialrechnung gewidmet ist, wurde in etwas veranderter Form von I'Hopital unter seinem eigenen Namen veroffentlicht. Daher geht die „Regel von I'Hopital" tatsachhch auf Johann Bernoulli zuriick.
262
5 Differentialrechnung
Dann gilt ^ ^ -^ A fiirx ^ a + 0 9(x) in den beiden Fallen: 1° (/(a;) ^ 0) A {g{x) ^ O) fiir x ^ a + 0 , 2*^ g{x) —>• 00 fiir a; —>• a + 0.
Eine ahnliche Behauptung gilt fiir x ^ b — 0. Die Regel von I'Hopital kann in knappen Worten, wenn auch nicht ganz genau wie folgt formuliert werden. Der Grenzwert eines Bruchs von Funktionen ist gleich dem Grenzwert des Bruchs ihrer Ableitungen, falls diese existieren. Beweis. Ist g'{x) ^ 0, folgern wir aufgrund des Satzes von RoUe, dass g{x) auf ]a, b[ streng nionoton ist. Daher konnen wir, wenn wir zur Not das Intervall ]a, b[ zum Endpunkt a hin verkleinern, annehmen, dass g{x) ^ 0 auf ]a, b[. Nach dem verallgemeinerten Mittelwertsatz nach Cauchy existiert fiir x,y G ]a, b[ ein Punkt ^ £]a, b[, so dass
g{x) - g{y)
g'iO '
Wir wollen diese Gleichung in eine fiir uns praktische Gestalt umschreiben:
fi^)
fiy) , / ' ( O / ,
g{x)
g{x)
7'ff)l g'iO^
giy)a(x)) 9ix)'
Fiir X ^ a + 0 konnen wir y so gegen a + 0 streben lassen, dass fiy) g(x)
,n
A 9iy) g(x)
,n
—-— —>• 0 und —-— -^ 0 .
Dies ist offensichtlich unter jeder der beiden Annahmen 1° und 2°, die wir betrachten, moglich. Da ^ zwischen x und y liegt, gilt auch ,f —>• a + 0. Daher strebt die rechte Seite der letzten Gleichung (und daher auch die linke Seite) gegen A. D Beispiel
19. Mm ^i^
= Mm ^^^
= 1.
Dieses Beispiel soUte nicht als ein neuer unabhangiger Beweis der Relation 2ij^ —>• 1 fiir a; —>• 0 betrachtet werden. Tatsache ist, dass wir bei der Herleitung der Gleichung sin x = cos a; bereits von dem eben berechneten Grenzwert Gebrauch gemacht haben. Wir zeigen die RechtmaBigkeit der Anwendung der Regel von I'Hopital immer, nachdem wir den Grenzwert eines Bruchs der Ableitungen bestimmt haben. Dabei soUte man die Bedingungen 1° oder 2° nicht aus dem Auge verlieren. Die Wichtigkeit dieser Bedingungen konnen wir in folgendem Beispiel erkennen.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen Beispiel 20. Sei f{x) cos a; und ^^
263
= cosx, g{x) = sina;. Dann ist ,f'{x) = — sina;, g'{x)
-^ +oo fiir x —>• + 0 , wohingegen ^JTIY —>• 0 fiir a; ^
y\X)
g
=
+0.
\X)
21. Van
=
x->+oo x"
lini
X
—
x->+oo a*
=
lini
lim
=
x->+oo ax"
ax —
x^+coa-^lna
= •-• =
^
lim a:-> + oo
lini
x->+oo
= 0 fiir cc > 0 . ax"
a(a — 1) • • • (a — n + l)x
= 0
a* (In a ) "
fiir a > 1, da es fiir n > cc und a > 1 offensichtlich ist, dass ^^-^
> 0, falls
X —>• + 0 O .
Wir merken an, dass diese Kette von Gleicliungen rein hypotlietiscli ist, bevor wir nicht an einen Ausdruck gelangen, dessen Grenzwert wir bestimmen konnen. 5.4.5 D a s K o n s t r u i e r e n v o n G r a p h e n v o n F u n k t i o n e n Eine graphisclie Darstellung wird oft fiir eine visuelle Besclireibung einer Funktion benutzt. In der Regel ist eine derartige Darstellung bei der Diskussion qualitativer Fragen zur betracliteten Funktion hilfreicli. Fiir genaue Bereclinungen werden Graphen elier selten eingesetzt. In diesem Zusammenhang ist nicht so sehr eine gewissenhafte Reproduktion der Funktion in ihrem Graphen wichtig, sondern die Konstruktion einer Skizze des Graphen der Funktion, die die wichtigen Elemente ihres Verhaltens wiedergibt. In diesem Absatz werden wir allgemeine Methoden vorstellen, die bei der Konstruktion einer Skizze des Graphen einer Funktion eingesetzt werden. a. G r a p h e n d e r E l e m e n t a r f u n k t i o n e n Wir wiederholen zunachst, wie die Graphen der wichtigsten Elementarfunktionen aussehen. Dies sollte fiir das Weitere voUstandig beherrscht werden (Abb. 5.12-5.18). b. Beispiele von Skizzen von Graphen von Funktionen (ohne E i n s a t z d e r DifFerentialrechnung) Wir woUen jetzt einige Beispiele betrachten, in denen eine Skizze des Graphen einer Funktion einfach konstruiert werden kann, wenn wir die Graphen und Eigenschaften der einfachsten Elementarfunktionen kennen.
264
5 Differentialrechnung y
Abb. 5.18. Beispiel 23. Wir woUen den Graphen der Funktion h = log^
-3x+2 2
skizzieren. Wenn wir die Gleichung y = logx 2-3a:+2 •
1 log2(a;2-3a; + 2)
1 log2(a; - l)(x - 2)
beriicksichtigen, konnen wir nach und nach den Graphen des quadratischen Trinoms wi = a;^ — 3a; + 2, daraus y^ = log., yi{x) und schliei31ich y = —j-ry 2 \J^)
konstruieren (Abb. 5.19). Wir batten den Graphen dieser Funktion auch auf eine andere Art „erraten" konnen: Indem wir zunachst den Definitionsbereich der Funktion log^2_3j,^2 2 = (log2(a;2 — 3a; + 2)) bestimmen und das Verhahen der Funktion bei der Annaherung an Randpunkte des Definitionsbereichs und auf IntervaUen, dessen Endpunkte die Randpunkte des Definitionsbereichs sind, untersuchen. SchlieBhch zeichnen wir „glatte Kurven" unter Beriicksichtung des so bestimmten Verhahens in den Endpunkten der IntervaUe ein. 4- Die Konstruktion einer Skizze des Graphen der Funktion y = sin(a;^) ist in Abb. 5.20 dargesteUt.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
265
Wir haben diesen Graphen niit Hilfe bestinimter fiir diese Funktion charakteristischer P u n k t e , nanilich den P u n k t e n , in denen sin(a;^) = —1, sin(a;^) = 0 und sin(a;^) = 1, konstruiert. Zwischen zwei benachbarten P u n k t e n ist die Funktion monoton. Der Verlauf des Graphen nahe deni P u n k t x = 0, y = 0 wird dadurch bestimmt, dass sin(a;^) ~ x"^ fiir a; —>• 0. Es ist auBerdem hilfreich, dass diese Funktion gerade ist. Da wir nur von Skizzen anstelle von genauen Konstruktionen des Graphen einer Funktion reden, wohen wir der Einfachheit halber vereinbaren, unter „der Konstruktion des Graphen einer Funktion" „die Konstruktion einer Skizze des Graphen der Funktion" zu verstehen. Beispiel 25. Wir woUen den Graphen der Funktion y = X + arctan(a;^ — 1) (Abb. 5.21) konstruieren. Fiir x -^ —oo wird der Graph durch die Gerade y = X — ^ gut approximiert, wohingegen sie fiir a; ^ -l-oo durch y = x + ^ angenahert wird. Wir woUen nun ein hilfreiches Konzept einfiihren. D e f i n i t i o n 4. Die Gerade CQ + CIX wird Asymptote des Graphen der Funktion y = f{x) fiir x -^ —oo (oder x —>• -l-oo) genannt, wenn f{x) — (CQ + CIX) = o(l) fiir X -^ —00 (oder x —>• -l-oo).
yi = X — 3a; + 2
3/2
=log2yi{x)
y2[x) A b b . 5.19.
A b b . 5.20.
266
5 Differentialrechnung
y = ysix) + yz(x) Abb. 5.21. Folglich besitzt im gegenwartigen Beispiel der Graph die beiden Asymptoten y = X — ^ fiir a; —>• — oo und y = x -\- ^ fiir x -^ +oo. Gilt \f{x)\ -^ oo fiir x ^ a — 0 (oder fiir a; —>• a + 0), dann ist klar, dass der Graph der Funktion sich immer mehr an die vertikale Gerade x = a annahert, wenn x gegen a strebt. Wir nennen diese Gerade eine vertikale Asymptote des Graphen, im Gegensatz zu den in Definition 4 eingefiihrten Asymptoten, die stets schief verlaufen. Folghch besitzt der Graph in Beispiel 23 zwei vertikale Asymptoten und eine horizontale Asymptote (vgl. Abb. 5.19) (dieselbe Asymptote fiir x -^ —oo und fiir x -^ +oo). Aus Definition 4 folgt offensichtlich, dass Cl
lim a:->-oo
Co =
lim
fi^) X
{f{x) — cix)
5.4 DifFerentialrechnung zur Untersuchung von Funktionen 1st f{x) — (co + cix + • • • + c„x") Allgemeinen: •>—00
/(=s) a;"
.
fix)
im C„-l
Co
=
lim
-Cn 1-1
267
= 0(1) fiir x -^ —00, dann ist im
x'^
(f{x)-{cix-\
|-c„a;")) .
a;—)- — 0 0
Diese hier fiir den Fall a; —>• — CXD formulierten Gleicliungen sind natiirlich aucli fiir den Fall x -^ +00 giiltig. Sie konnen benutzt warden, um das asymptotisclie Verhalten des Graphen einer Funktion f{x) mit Hilfe des Graplien des zugehorigen algebraischen Polynoms ci + cix + • • • + c„x" zu besclireiben. Beispiel 26. Seien (p, (f) Polarkoordinaten in der Ebene. Angenomnien, ein P u n k t bewege sich in der Ebene so, dass P — P(*) = 1 ~ 6~* cos —t und Lp = Lp(t) = 1 — e
sm—t
zur Zeit t (t > 0). Wir suchen die Trajektorie des Punktes. Dazu zeichnen wir zunachst die Graphen von p{t) und (p{t) (s. Abb. 5.22a und Abb. 5.22b). Wenn wir nun beide eben konstruierte Graphen gleichzeitig betrachten, konnen wir die allgenieine Form der Trajektorie des P u n k t e s beschreiben (vgl. Abb. 5.22c).
1
2
3
t
b.
A b b . 5.22.
268
5 Differentialrechnung
c. Einsatz der Differentialrechnung zur Konstruktion des Graphen einer Funktion Wie wir gesehen haben, lassen sich allgemeine Eigenschaften in den Graphen vieler Funktionen verdeutlichen, ohne dafiir mehr als einfache Betrachtungen anzustellen. Wenn wir jedoch die Skizze genauer anfertigen wollen, konnen wir dann, wenn die Ableitung der untersuchten Funktion nicht zu kompliziert ist, die Differentialrechnung als Hilfsmittel einsetzen. Wir werden dies anhand von Beispielen demonstrieren. Beispiel 27. Wir konstruieren den Graphen der Funktion y = f{x) fiir f{x) = |a; + 2|e-i/=^ . Die Funktion f{x) ist fiir a; € ffi \ 0 definiert. Da e~^/* —>• 1 fiir a; ^ oo, folgt, dass
{
—(x + 2) fiir a; —>• — oo ,
{x + 2) fiir X —>• +oo . Als Nachstes ist offensichtlich, dass \x + 2|e~^/^ -^ +oo fiir a; —>• — 0 und |a;+2|e-i/=' ^ 0 fiir a; ^ +0. SchlieBlich ist klar, dass f{x) > 0 und / ( - 2 ) = 0. Aufgrund dieser Beobachtungen konnen wir bereits einen ersten Entwurf des Graphen anlegen (s. Abb. 5.23a). Wir wollen nun zur Sicherheit iiberpriifen, ob diese Funktion auf den IntervaUen ] — oo,—2[, [—2,0[ und ]0,+oo[ monoton ist, ob sie wirklich diese Asymptoten besitzt und ob die Konvexitat des Graphen richtig dargestellt ist. Da r _x'+x+'2f^-i/x ^ f a l l s a ; < - 2 ,
n^) = I
[ 2d±|+2e-i/=5 ^ falls - 2 < a; und a; ^ 0 , und f'{x) ^ 0, konnen wir die folgende Tabelle aufstellen: Intervall Vorzeiclien von f'{x) Verlialten von f(x)
] - oo,-2[ — +oo \ 0
]-2,0[ + 0 ^ +oo
]0,+oo[ + 0 /^ +oo
In den Bereichen, in denen die Ableitung konstantes Vorzeichen besitzt, zeigt die Funktion, wie wir wissen, die entsprechende Monotonie. Das Symbol + o o \ , 0 in der unteren Zeile der Tabelle bezeichnet eine monotone Abnahme der Funktionswerte von +oo auf 0, und 0 /^ +oo bezeichnet einen monotonen Anstieg von 0 auf +oo.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
269
2-10
A b b . 5.23. Wir beobachten, dass f'{x) -^ - 4 e ~ ^ / ^ fiir x -^ - 2 - 0 und f'{x) -)• 4e~^/^ fiir X —>• — 2 + 0, so dass der P u n k t (—2,0) eine Spitze im Graphen (ein Knick wie im Graphen der Funktion |a;|) ist und kein regularer P u n k t , wie in Abb. 5.23a dargestellt. Als Nachstes ist f'{x) ^ 0 fiir a; —>• + 0 , so dass der G r a p h vom Ursprung aus tangential zur a;-Achse verlaufen sollte (bedenken Sie die geometrische Bedeutung von /'(a;)!). Wir wollen nun das asymptotische Verhalten der Funktion fiir a; ^ — oo und X —>• +0O genauer untersuchen. Da e~^/^ = 1 — x~^ + o{x~^) fiir a; ^ oo, folgt, dass —X — 1 + o(l) fiir X -^ —00 , |a; + 2|e"-l/x X + 1 + o(l)
fiir X -^ +00 ,
so dass tatsachlich y = —x — 1 fiir x -^ —oo und y = x + 1 fiir x -^ + o o die schiefen Asymptoten sind. Aus diesen Daten konnen wir bereits eine ziemlich verlassliche Skizze des Graphen erstellen, aber wir wollen noch welter gehen und die Konvexitatsbereiche des Graphen bestinimen, indem wir die zweite Ableitung berechnen: 3a;
e-^/''
, falls a; < - 2
x^
/"(^)
2 - 3 a ; e ^/* , faUs - 2 < a; und a; 7^ 0 . x^ Da f"{x)
= 0 nur fiir x = 2 / 3 , erhalten wir die folgende Tabelle:
Intervall
] - 00,-2[
]-2,0[
]0,2/3[
]2/3,+oo[
Vorzeichen von f"{x)
—
+
+
—
Kriinimung von f{x)
aufwarts
abwarts
aufwarts
abwarts
270
5 Differentialrechnung
Da die Funktion in a; = 2/3 differenzierbar ist und f"{x) das Vorzeichen wechselt, wenn x diesen Punkt passiert, ist der Punkt (2/3, /(2/3)) ein Wendepunkt des Graphen. Ware die Ableitung f'{x) irgendwo Null gewesen, ware iibrigens mit Hilfe der Tabelle der Werte von f"{x) die Entscheidung moglich gewesen, ob der entsprecliende Punkt ein Extremwert ist. In diesem Fall besitzt f'{x) jedoch keine NuUstelle, obwolil die Funktion in a; = —2 ein lokales Minimum besitzt. Sie ist in diesem Punkt stetig und ,f'{x) wechselt vom Positiven zum Negativen, wenn x durch diesen Punkt verlauft. Dennoch konnen wir an der Veranderung der Werte von f{x) auf dem entspreclienden Intervall erkennen, dass die Funktion in a; = — 2 ein Minimum besitzt, wobei wir natiirlich die Gleicliung /(—2) = 0 beriicksichtigen. Wir konnen nun einen genauere Skizze des Graphen dieser Funktion zeichnen (s. Abb. 5.23b). Wir fassen die Ergebnisse in einem weiteren Beispiel zusammen. Beispiel 28. Seien (x, y) die kartesischen Koordinaten in der Ebene. Angenommen, ein sich bewegender Punkt habe zur Zeit t (t > 0) die Koordinaten t 1 - ^ 2
, und
t - 2^3 y^
1 - ^ 2
•
Wir suchen die Trajektorie des Punktes. Wir beginnen mit einer Skizze der Graphen der beiden Koordinatenfunktionen x = x{t) und y = y{t) (s. Abb. 5.24a und 5.24b). Der zweite Graph ist etwas interessanter als der erste. Deswegen werden wir beschreiben, wie er zu konstruieren ist. Wir konnen das Verhalten der Funktion y = y{t) fiir t -^ +0, t —>• 1 — 0, t —>• 1 + 0 und die Asymptote y{t) = 2t + o(l) fiir t —>• +00 unmittelbar aus dem analytischen Ausdruck von y{t) erkennen. Nach Berechnung der Ableitung ., , 1-5*2 + 2*4 2/W = (l_,2)2 bestimmen wir ihre Nullstellen: ti « 0, 5 und ^2 ~ 1, 5 im Bereich t > 0. Nun konnen wir aus der Tabelle Intervall Vorzeichen von
y(t)
Verhalten von y{t)
]0,ti[
]
]ht2[
]t2,-|-00[
+
-
-
+
O^y(ti)
y{ti) \
-00
+00
\yit2)
y{t2)
/"+00
die Bereiche der Monotonie und die lokalen Extremwerte y{ti) « | (ein Maximum) und 2/(^2) ~ 4 (ein Minimum) feststellen.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
271
y
y
>\ '^ X X X^b \\^ \^^ \>s
Xr
\ ^ v
-4
s 1 1\ 1 \
'
-3 \ \ s2
\ -1 \ -1,2 0
1 1 X2
X
2
rX^ A b b . 5.24. Wenn wir nun beide Graphen x = x[t) und y = y{t) gleichzeitig untersuchen, konimen wir zu der Skizze der Trajektorie des P u n k t e s in der Ebene (s. Abb. 5.24c). Diese Skizze kann noch prazisiert werden. So konnen wir beispielsweise das asymptotische Verhalten der Trajektorie bestimmen. Da lim ^JH = —1 und lim (y(t)+x(t)) = 2, ist die Gerade y = —x + 2 eine Asymptote in beiden Enden der Trajektorie. Dies entspricht der Annaherung von t an 1. Es ist auch klar, dass die Gerade x = 0 eine vertikale Asymptote fiir den Teil der Trajektorie fiir t -^ +oo ist.
272
5 Differentialrechnung Als Nachstes bestimmen wir ,
yt
1 - 5*2 + 2*4
Es lasst sich einfach erkennen, dass die Funktion i-5"+2ti monoton von 1 auf —1 abnimmt, wenn u von 0 auf 1 ansteigt und dass sie von —1 auf +oo anwachst, wenn u von 1 auf +oo ansteigt. Aus der Monotonie von y'^ lassen sich Folgerungen zur Kriimmung der Trajektorie in den entsprechenden Bereichen ziehen. Wenn wir das eben Gesagte beriicksichtigen, konnen wir die folgende genauere Skizze der Trajektorie des P u n k t e s zeichnen (s. Abb. 5.24d). Wenn wir die Trajektorie auch fiir t < 0 betrachtet batten, h a t t e uns die Tatsache, dass x{t) und y{t) ungerade Funktionen sind, bereits die eingezeichneten Kurven in der ajy-Ebene durch Spiegelung im Ursprung geliefert. Wir wollen nun einige der Ergebnisse als sehr allgenieine Empfehlungen fiir die Vorgehensweise bei der Konstruktion eines Graphen einer analytisch gegebenen Funktion zusammenfassen. Sie lauten: 1°. Bestimmen Sie den Definitionsbereich der Funktion. 2°. Stellen Sie offensichtliche besondere Eigenschaften der Funktion fest (z.B., ob sie gerade oder ungerade oder periodisch ist und ob sie mit wohl bekannten Funktionen nahezu identisch ist). 3°. Bestimmen Sie das asymptotische Verhalten der Funktion bei Annaherung an die R a n d p u n k t e des Definitionsbereichs und bestimmen Sie insbesondere vorhandene Asymptoten. 4°. Bestimmen Sie die Intervalle, in denen die Funktion monoton ist, und kennzeichnen Sie lokale Extremwerte. 5°. Finden Sie die Kriimmungseigenschaften des Graphen und deuten Sie Wendepunkte an. 6°. Betonen Sie alle charakteristischen P u n k t e des Graphen, insbesondere Schnittpunkte mit den Koordinatenachsen, falls diese vorhanden und berechenbar sind. 5.4.6 U b u n g e n u n d A u f g a b e n 1. Seieii X = {xi,. . . , Xn) und a = ( a i , . . . , an) mit Xj > 0, a; > 0 fiir i = 1,...
,n
n
und ^ ai = 1. Zu jeder Zahl t ^ 0 betrachten wir den Mittelwert voni Grad t der i=l
Zahlen xi,...
,Xn mit Gewichten ai: Mt{x,a)
= I y ^ ajXj • i= l
Fiir ai = • • • = a„ = -^ erhalten wir insbesondere fiir t = —1,1, 2 das harmonische, aritlimetische bzw. quadratische Mittel.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
273
Zeigen Sie: a) lim Mt{x ", d.h., der Grenzwert entspricht dem geometrischen Mittel. b) lim Mt{x,a.) = max Xi . t—>+oo
c)
l
lim Mt{x,a) t—> —oo
= miii Xi . l
d) Mt{x, a) ist eine iiiclit absteigende Punktion von t auf R und sie ist anwachsend, wenn n > 1 und alle Zalilen Xi ungleicli Null sind. 2. Zeigen Sie, dass |1 +x\'' > 1 + px + Cp(pp{x), wobei Cp eine Konstante ist, die nur von p abliangt, r \xf fiir |a;| < 1 , (pp{x) = i
falls
1
[ \x\'' fiir |a;| > 1 , und ipp{x) = |x|'' auf R fiir 2 < p. 3. Beweisen Sie, dass cos a; < ( ^ ^ )
fiir 0 < |a;| < f.
4. Untersuclien Sie die Punktion f{x) und konstruieren Sie iliren Graplien fiir *) fix) = arctan log2 cos (TTX+
^j,
b) fix) = arccos ( | — sin a; 1, c) fix) = ^x{x + 3)^. d) Konstruieren Sie die Kurve, die in Polarkoordinaten durch die Gleicliung ip = •f,-^, p > 0 definiert wird, und bestimmen Sie ilir asymptotisches Verhalten. e) Vorausgesetzt, Sie kennen den Graphen der Punktion y = f(x). Zeigen Sie, wie Sie dann den Graplien der Punktionen f(x) + B, Af{x), f{x + 6), f(ax) und insbesondere —f(x) und f(—x) erlialten. 5. Zeigen Sie, dass fiir / G C(]a,6[J die Punktion / auf ]a,h[ konvex ist, wenn die Ungleichung J x i
+X2\
^
f(xi)
+
fix-z)
fiir alle Punkte xi, X2 G]a, b[ gilt. 6. Zeigen Sie: a) Ist eine konvexe Punktion / : R —>• R besclirankt, dann ist sie konstant. b) Gilt fiir eine konvexe Punktion / : R —> R km X—> —oo
fix)
,.
fix)
^^-^^^ =
km
^^-^^^ = 0 ,
X
X—>+oo
„
X
dann ist / konstant. c) Piir jede auf einem offenen Intervall a < x < +oo (oder — oo < x < a) konvexe Punktion / strebt der Bruch '^-^ gegen einen endlichen Grenzwert oder gegen Unendlicli, wenn x im Definitionsbereicli der Punktion gegen Unendlich gelit.
274
5 Differentialrechnung
7. Zeigeii Sie, dass fiir eine konvexe Punktion / :]o, 6[—>• R gilt: a) In jedem Punkt x e]o, h[ besitzt die Punktion eine linksseitige Ableitung f'_ und eine rechtsseitige Ableitung / ^ mit f'-ix) < f'+ix), die folgendermafien definiert sind: lim / ( ^ + ' * ) --fix)
f'-ix)
h^-0
h
f'+ix)
/i-^+o
h
-fix)
b) Die Ungleichung f'j^{xi) < f'-ix-z) gilt fiir a;i,a;2 G]O, 6[ und xi < X2c) Die Menge der Spriinge des Graphen von f{x) (fiir die f'-ix) ^ f'+ix)) hoclistens abzahlbar.
ist
8. Die Legendre-Transformatiov?^ einer auf eineni Intervall / C R definierten Punktion / : / —> R wird gegeben durch: /*(<) = s u p [txxei ^
f{x)]
. '
Zeigen Sie: a) Die Menge / * = { * £ R|/*(t) G R} (d.li. /*(<) ^ oo) ist entweder leer oder bestelit aus eineni einzigen Punkt oder ist ein Intervall auf der Geraden. Im letzten Pall ist die Punktion /* (t) auf /* konvex. b) Ist / eine konvexe Punktion, dann ist /* ^ 0, und fiir /* G C{I*) gilt:
ijy = sup (xt-fit))
=fix)
fiir alle x £ I. Somit ist die Legendre-Transformation einer konvexen Punktion involutiv (Die zweifache Anwendung fiihrt zur Ausgangsfunktion). c) Die folgende Ungleichung gilt: xt < f{x) + fit)
fiir a; G / und t G /* .
d) Ist / eine konvexe differenzierbare Punktion, dann ist f*it) = txt — f(xt), wobei Xt durch die Gleichung t = f'ix) bestimmt wird. Benutzen Sie diese Gleichung fiir eine geometrische Interpretation der Legendre-Transformierten /* und ihr Argument t, die deutlich macht, dass die Legendre-Transformation eine Punktion ist, die auf der Menge der Tangenten an den Graphen von / definiert ist. e) Die Legendre-Transformation der Punktion f{x) = ^x" fiir a > 1 und a; > 0 ist die Punktion /*(t) = •kt'^, fiir t > 0 und -^ + i = 1. Benutzen Sie diese Tatsache unter Beriicksichtigung von c), um die Youngsche Ungleichung, die wir bereits kennen, zu erhalten: ,/3 xt < —x" + —t'
Q
P
f) Die Legendre-Transformation der Punktion f{x) = e^ ist die Punktion /*(t) t In I , t > 0 und fiir a; G R und t > 0 gilt die Ungleichung: xt < ei' + t\a - . e A. M. Legendre (1752-1833) - beriihmter franzosischer Mathematiker.
5.4 DifFerentialrechnung zur Untersuchung von Funktionen
275
9. Krummungsradius, Zentrum der Kriimmung einer Kurve in eineni Punkt. Angenommen, eiii Punkt bewege sich in der Ebene und gehorche dabei eineni Gesetz, das durch ein Paar zweifach differenzierbarer Koordinatenfunktionen der Zeit x = x{t) und y = y(t) gegeben wird. Dabei beschreibt der Punkt eine Kurve, die in der parametrischen Form x = x{t) und y = y{t) gegeben ist. Ein Spezialfall einer derartigen Definition ist der des Graphen einer Punktion y = f(x), wobei man x = t und y = f(t) setzt. Wir suchen nach einer Zahl, die die Kriimmung der Kurve in einem Punkt charakterisiert. Denn der Kehrwert des Kriimmungsradius eines Kreises dient als Anzeichen fiir das Ausmafl der Kriimmung des Kreises. Wir werden von diesem Zusammenhang Gebrauch machen. a) Finden Sie die Tangente und die normalen Komponenten at und a„ der Beschleunigung a = {x{t),y{t)j des Punktes, d.h., schreiben Sie a als die Summe at + a „ , wobei at zum Geschwindigkeitsvektor v(t) = ( i ( i ) , y ( t ) J kollinear ist. Daher zeigt at entlang der Tangente der Trajektorie und a„ zeigt entlang der Normalen an die Trajektorie. b) Zeigen Sie, dass die Gleicliung
|an(t)| fiir die Bewegung entlang eines Kreises mit Radius r gilt, c) Fiir eine Bewegung entlang einer Kurve wird unter Beriicksiclitigung von b) die Grofie
^'
W{t)\
natiirlicherweise als Kriimmungsradius der Kurve im Punkt ( a;(i), y(i) J bezeichnet. Zeigen Sie, dass der Kriimmungsradius aus der Formel • 2
r(t)
•2^''/^
\xy-
xy\
bereclinet werden kann. d) Der Kehrwert des Kriimmungsradius wird absolute Kriimmung Kurve im Punkt {x{t),y{t)]
einer ebenen
genannt. Die Grofie
( ^ 2 + 2)2)3/2
wird Kriimmung genannt. Zeigen Sie, dass das Vorzeichen der Kriimmung den Drelisinn der Kurve relativ zu seiner Tangente angibt. Bestimmen Sie die pliysikalisclie Bedeutung der Kriimmung. Zeigen Sie, dass die Kriimmung des Graphen einer Funktion y = f{x) in einem Punkt {x,f{x)\
mit der Formel k{x) -
^"(^^
[1 + {y'Yf^
276
5 Differentialrechnung
berechnet werden kann. Vergleichen Sie die Vorzeichen von k{x) und y"{x) mit der Art der Konvexitat des Graphen. f) Wahleii Sie die Konstanten o, 6 und R so, dass der Kreis {x — of + {y — h)^ = R^ die grofltmogliche Beriihrung mit der vorgegebenen parametrisierten Kurve X = x{t), y = y{t) besitzt. Dabei nehmen wir an, dass x(t) und y(t) zweifach difFerenzierbare Funktionen sind und dass {x{to),y{to)\ ^ (0,0). Dieser Kreis wird Schmiegekreis der Kurve im Punkt {xo,yo) genannt. Sein Zentrum wird Zentrum der Kriimmung der Kurve im Punkt {xo,yo) genannt. Zeigen Sie, dass sein Radius dem in b) definierten Kriimmungsradius der Kurve in diesem Punkt entspricht. g) Bin Korper befinde sich auf der Spitze eines Eisbergs mit parabolischem Querschnitt. Die Gleichung des Querschnitts lauten x + y^ = 1 mit x > Q, y > Q. Unter dem Einfluss der Schwerkraft fange der Korper ohne vorherigen Stofl an zu rutschen. Bestimmen Sie die Trajektorie der Bewegung des Korpers, bis dieser den Boden erreicht.
5.5 Komplexe Zahlen und Zusammenhange zwischen Elementarfunktionen 5.5.1 K o m p l e x e Z a h l e n So wie die Gleichung a;^ = 2 in der Menge Q der rationalen Zahlen keine Losung besitzt, besitzt die Gleichung x^ = —1 keine Losung in der Menge M der reellen Zahlen. Und genauso, wie wir das Symbol \ / 2 mit der Losung von x^ = 2 verbinden und sie mit rationalen Zahlen kombinieren, um so neue Zahlen der Form ri + \/2r2 mit r i , r 2 £ Q zu erhalten, fiihren wir das Symbol i als Losung von x^ = —1 ein und kombinieren diese Zahl, die auBerhalb der reellen Zahlen liegt, mit reellen Zahlen und arithmetischen Operationen in ffi. Eine, neben vielen anderen, bemerkenswerte Eigenschaft dieser Erweiterung des Korpers ffi der reellen Zahlen ist, dass in dem sich ergebenden Korper C der komplexen Zahlen jede algebraische Gleichung mit reellen oder komplexen Koeffizienten losbar ist. Wir woUen dies nun ausfiihren. a. A l g e b r a i s c h e E r w e i t e r u n g d e s K o r p e r s ffi In den Fufistapfen von Euler fiihren wir eine Zahl i als die imagindre Einheit ein, so dass i^ = —1. Die Wechselwirkung zwischen i und reeUen Zahlen besteht darin, dass wir Zahlen y £ ffi mit i multiplizieren konnen und diese P r o d u k t e zu reellen Zahlen addieren konnen. Dadurch entstehen notwendigerweise Zahlen der Form iy und x + iy mit x,y G ffi, die wir nach Gauss komplexe Zahlen nennen. Mit den iiblichen Operationen einer kommutativen Addition und einer kommutativen Multiplikation, die in Verbindung mit der Addition auf der
5.5 Komplexe Zahleii und Elementarfunktionen
277
Menge der Objekte der Form x + iy distributiv ist, gelangen wir zu folgenden Definitionen: (xi + iyi) + {x2 + 12/2) := {xi + X2) + i{yi + 2/2)
(5.99)
und (xi + iyi) • {x2 + m)
•= (a;ia;2 - 2/12/2) + i(a;i2/2 + X2yi) •
(5.100)
Zwei komplexe Zahlen xi + iyi und X2 + i2/2 sind genau dann gleich, wenn xi = X2 und 2/1 =2/2Wir identifizieren die reellen Zahlen a; € M mit den Zahlen der Form x + i-O und i mit der Zahl 0 + i • 1. Die Rolle der 0 iibernimmt, wie wir aus (5.99) erkennen konnen, die Zahl 0 + i • 0 = 0 € M. Die Rolle der 1 kommt, wie wir aus (5.100) erkennen konnen, der Zahl 1 + i • 0 = 1 € ffi zu. Aus den Eigenschaften der reeUen Zahlen und den Definitionen (5.99) und (5.100) folgt, dass die Menge der komplexen Zahlen ein Korper ist, der K als Teilkorper enthalt. Wir bezeichnen den Korper der komplexen Zahlen mit C und typische Elemente iiblicherweise mit z oder w. Der einzige nicht oiTensichtliche P u n k t beim Nachweis, dass C ein Korper ist, ist die Behauptung, dass jede komplexe Zahl z = x + iy ungleich Null eine Inverse z~^ beziiglich der Multiplikation (einen Kehrwert) besitzt, d.h. z • z~^ = 1. Wir woUen dies zeigen. Wir nennen die Zahl x — iy die zu z = x + iy konjugierte Zahl und bezeichnen sie mit z. Wir halten fest, dass z • z = (x"^ + y'^) + i • 0 = x'^ + y"^ ^ 0 fiir z ^ 0. Somit erhalten wir als Kehrwert z~^: 2 I 2 • z = 2^ 2 — i 2I 2 • b. Geometrische Interpretation des Korpers C Nachdem wir die algebraischen Operationen (5.99) und (5.100) fiir komplexe Zahlen eingefiihrt haben, benotigen wir eigentlich das Symbol i, das uns zu diesen Definitionen gefiihrt hat, nicht mehr, denn wir konnen die komplexe Zahl z = X -\-iy mit dem geordneten P a a r {x, y) reeller Zahlen identifizieren. Dabei wird x Realteil und y Imaginarteil der komplexen Zahl z genannt (die Schreibweisen dafiir sind a; = R e z und y = I m z . ) Nun konnen wir aber, wenn wir das P a a r {x,y) als kartesische Koordinaten eines P u n k t e s der Ebene M^ = M x ffi auiTassen, komplexe Zahlen mit den P u n k t e n dieser Ebene oder mit zwei-dimensionalen Vektoren mit den Koordinaten (x, y) identifizieren. Mit einer derartigen Interpretation als Vektoren entspricht die koordinatenweise Addition (5.99) komplexer Zahlen der Vektoraddition. Diese Interpretation fiihrt uns natiirlicherweise auBerdem zum Absolutbetrag \z\ einer komplexen Zahl als den Betrag oder die Lange des entsprechenden Vektors {x,y),d.h. \z\ = \Jx? -I- 2/^ , fiir z = X ^ iy .
(5.101)
278
5 Differentialrechnung
Dariiber hinaus vermittelt sie uns eine Moglichkeit, den Abstand zwischen komplexen Zahlen zi und z^ als den Abstand zwischen den entsprechenden Punkten der Ebene zu verstehen, d.h., als \Z\ - Z2\
^{xi
- X2Y + (2/1 - 2/2)2 .
(5.102)
Die Menge der komplexen Zahlen, interpretiert als die Menge der Punkte der Ebene, wird komplexe Ebene genannt und ebenfalls mit C bezeichnet, wie auch die Menge der reeUen Zahlen und die reelle Gerade beide durch M symbolisiert werden. Ein Punkt der Ebene ist auch in Polarkoordinaten (r, (f) definierbar, die mit den kartesischen Koordinaten durch X = r cos (p und
(5.103)
y = r sin cp
verbunden sind. Daher konnen wir die komplexe Zahl z = x + iy
(5.104)
auch in folgender Form darstellen: z = r{cosLp+ isin(p) .
(5.105)
Die Ausdriicke (5.104) und (5.105) werden algebraische bzw. trigonometrische (Polar-) Darstellung der komplexen Zahlen genannt. Im Ausdruck (5.105) wird die Zahl r > 0 der Betrag der komplexen Zahl z (da, wie wir an (5.103) sehen, r = \z\) genannt und ip das Argument von z. Das Argument ist nur fiir z ^ 0 von Bedeutung. Da die Funktionen cos cp und sin (p periodisch sind, ist das Argument einer komplexen Zahl nur bis auf ein Vielfaches von 27r eindeutig bestimmt und das Symbol Argz bezeichnet die Menge moglicher Winkel der Form (p + 2nk, k G Z, wobei (p jeder Winkel ist, der (5.105) erfiillt. Wenn wir fiir jede komplexe Zahl einen Winkel ip G Argz eindeutig festlegen woUen, miissen wir uns im Voraus auf den Bereich einigen, aus dem wir cp wahlen. Dieser Bereich ist iiblicherweise entweder 0 < cp < 2TT oder —TT < (p < TT. Wurde eine derartige Vereinbarung getroffen, sagen wir, dass ein Zweig (oder das Hauptargument) des Arguments gewahlt wurde. Die Werte des Arguments im vereinbarten Bereich werden iiblicherweise als arg z bezeichnet. Die Polardarstellung (5.105) komplexer Zahlen ist fiir das Ausfiihren der Multiplikation von komplexen Zahlen hilfreich. Sind namlich zi = ri{cos(pi+ism(pi) Z2 = r2(cos(y92+isin(^2) , dann gilt
und
5.5 Komplexe Zahleii und Elementarfunktionen
279
z\- Z2 = (ri cosip\ + iri sin>^\){r2 cosip^ + w^ sinLp^) = = [TI^I COS (yPi cos ip'2 — r\r2 sin ipi sin (^92) + + i(rir2 sin (yPi cos (^^2 + T^T^ COS ly^i sin Lp^) oder 2:1 • 2:2 = r i r 2 (cos((y9i + (j32) + i sin((^i +(^22)) .
(5.106)
Werden also zwei komplexe Zahlen niiteinander niultipliziert, dann niultiplizieren wir ilire Betrage und addieren ihre Arguniente. Wir merken an, dass wir tatsaclilich gezeigt haben, dass fiir px £ kx%z\ und (y92 G ArgZ2 gilt, dass p\^ P'l £ Arg (z\ • Z'l). Da aber das Argument nur bis auf ein Vielfaclies von 27r definiert ist, konnen wir auch Arg {zx • Z2) = Arg zi + Arg Z2
(5.107)
schreiben, wobei wir diese Gleichung als Mengenoperation verstehen, d.h., die Menge auf der rechten Seite entspricht der Menge aller Zahlen der Form (pi + p2 init pi £ Arg 21 und p2 G ArgZ2. Daher ist es sinnvoU, die Summe der Arguniente im Sinne der Mengenoperation (5.107) zu verstehen. Mit diesem Verstandnis fiir die Gleichheit von Argumenten konnen wir beispielsweise festhalten, dass zwei komplexe Zahlen genau dann gleich sind, wenn ihre Betrage und ihre Arguniente gleich sind. Die folgende Formel von de Moivre^^ ergibt sich durch Induktion aus (5.106): Ist z = r(cos(y9 + isiniyj) , dann ist z " = r"(cos WyS + i sin Wys) .
(5.108)
Unter Beriicksichtigung der Erklarungen zuni Argument einer komplexen Zahl konnen wir die Formel von de Moivre benutzen, urn explizit alle komplexen Losungen der Gleichung z " = a anzugeben. Setzen wir namlich a = p(cos ip + i sin z/;) , dann erhalten wir mit (5.108), dass 2;" = r " (cos np + i sin np) mit r = ^ und np = ^ + 27rfc, fc £ Z, woraus wir ¥ ' & = „ + ^k erhalten. Offensichtlich ergeben sich nur fiir k = 0 , 1 , . . . , n — 1 verschiedene komplexe Zahlen. Soniit erhalten wir n verschiedene Wurzeln von a: Zk = -R/pfcos {— + —k) + i s i n f — + —hX] (fc = 0 , 1 , . . . , n - 1) . \ \n n J \n n >> Ist insbesondere a = 1, d.h. p = 1 und ^ = 0, dann erhalten wir die wurzeln: '2TT,\
Zk
. .
/2TT,
\ / j T = cos ( —fc ) + isin ( — k ]
(fc = 0 , 1 , . . . , n — 1) .
A. de Moivre (1667-1754) - britischer Mathematiker.
Einheits-
280
5 Differentialrechnung
Diese Punkte sind auf deni Einheitskreis in den Ecken eines regularen nEcks angeordnet. In Verbindung niit der geonietrischen Interpretation der komplexen Zahlen ist es sinnvoU, sich an die geometrische Interpretation der arithmetischen Operationen niit ihnen zu erinnern. Fiir ein festes & £ C kann die Summe z + b a\s Abbildung von C auf sich selbst betrachtet werden, d.h. z i-^ z + b. Diese Abbildung ist eine Translation der Ebene urn den Vektor b. Fiir ein festes a = |a|(cos(y9 + isin(y9) ^ 0 kann der Punkt az als Abbildung z 1-^ az von C auf sich selbst betrachtet werden. Diese entspricht einer Verkettung einer Streckung um den Faktor \a\ und einer Rotation um den Winkel ip e Arga. Dies wird aus (5.106) deuthch. 5.5.2 Konvergenz in C und Reihen mit komplexen Gliedern Der Abstand zwischen komplexen Zahlen (5.102) versetzt uns in die Lage, die e-Umgebung einer Zahl ZQ G C als die Menge {z € C| |z — 2;o| < s} zu definieren. Diese Menge ist eine Scheibe (ohne Kreisrand) mit Radius s und Zentrum in {xo,yo) fiir ZQ = XQ + iyo. Wir sagen, dass eine Folge {z„} komplexer Zahlen gegen ZQ £ C konvergiert, wenn lim \zn — zo\ = 0. n—)-oo
Aus den Ungleichungen max{|a;„ - xo\, \yn - yo\} < W - ^o| < |a;„ - a;o| + \yn - 2/o| (5.109) ist klar, dass eine Folge komplexer Zahlen genau dann konvergiert, wenn die Folgen der Real- und der Imaginarteile beide konvergieren. In Analogie zu Folgen reeller Zahlen wird eine Folge komplexer Zahlen {zn} fundamental oder eine Cauchy-Folge genannt, wenn zu jedem e > 0 ein Index N GN existiert, so dass \zn — Zm\ < £ fiir alle n,m > N. Die Ungleichung (5.109) macht deutlich, dass eine Folge komplexer Zahlen genau dann eine Cauchy-Folge ist, wenn die Folgen der Real- und der Imaginarteile beide Cauchy-Folgen sind. Wenn wir das Cauchysche Konvergenzkriterium fiir Folgen reeller Zahlen beriicksichtigen, erhalten wir auf der Basis von (5.109) den folgenden Satz: Satz 1. (Cauchysches Konvergenzkriterium). Eine Folge komplexer Zahlen konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Wenn wir die Summe einer Reihe komplexer Zahlen ZI+Z2
+
\-Zn-\
(5.110)
als Grenzwert der Teilsummen s„ = zi + • • • + Zn fiir n ^ co interpretieren, erhalten wir auch das Cauchysche Konvergenzkriterium fiir die Reihe (5.110).
5.5 Komplexe Zahleii und Elementarfunktionen
281
Satz 2. Die Reihe (5.110) konvergiert genau dann, wenn fiir jedes e > 0 ein N G'N existiert, so dass \z.rr, + --- + Z.a\<S
(5.111)
fiir beliebiges n > m > N. Daraus konnen wir erkennen, dass 2;„ —>• 0 fiir n ^ co eine notwendige Bedingung fiir die Konvergenz der Reihe (5.110) ist. (Dies wird jedoch bereits aus der Definition der Konvergenz deutlich.) Wie im Reellen heifit die Reihe (5.110) absolut konvergent, wenn die Reihe \zi\ + \z2\+---
+ \Zn\+---
(5.112)
konvergiert. Aus der Ungleichung \Zm-\
\- Zn\ < \Zm\-\
h \Zn\
und dem Cauchyschen Konvergenzkriterium folgt, dass eine Reihe (5.110) konvergiert, wenn sie absolut konvergiert. Beispiele Die Reihen
und
konvergieren absolut fiir alle z € C, da die Reihen
2')
l^l + il^l' + ^l^l' + ---
und
3')
1 , ,o2
I
1^
l_|4
l + ^N^ + 4, z
fiir jedes \z\ £ M konvergieren. Wir merken an, dass wir dabei die Gleichung |z"| = |z|" benutzt haben.
282
5 Differentialrechnung
Beispiel 4- Die Reihe 1 + z + z"^ + • • • konvergiert absolut fiir |2;| < 1 und ihre Summe ist s = jz^- Sie konvergiert fiir |z| > 1 nicht, da die Glieder dann nicht gegen Null streben. Reihen der Gestalt co+ci{z-zo)
+ --- + Cn{z - zo)" + •••
(5.113)
werden Potenzreihen genannt. Wenn wir das Cauchysche Kriterium (Absatz 3.1.4) auf die Reihe |co| + \ci{z - zo)\ + ••• + \cniz - zo)"\ + •••
(5.114)
anwenden, konnen wir folgern, dass diese Reihe konvergiert, wenn \z - zo\ < ( lim
\/\c^\)
n—)-oo
und dass fiir I2; — zo| > ( hm
A/|C„|)
ihre Gheder nicht gegen Null streben.
n—)-oo
Daraus erhalten wir den folgenden Satz: S a t z 3 . (Cauchy-Hadamard^'*). Die Potenzreihe (5.113) konvergiert halb der Scheibe \z — zo\ < R mit Zentrum in ZQ und Radius R= lim
^ j = . ^|c„|
inner-
(5.115)
n—>oo
Dies ist die Cauchy-Hadamard Formel. In jedem Punkt aufierhalb der Scheibe divergiert die Potenzreihe. inneren Punkt der Scheibe konvergiert die Potenzreihe absolut.
In jedem
Anmerkung. Satz 3 schweigt sich dariiber aus, was auf dem Rand \z — zo\ = R passiert, da alle logisch zulassigen Moghchkeiten wirkhch auftreten konnen. Beispiele Die Reihen 00
5)
E ^z" n=l n =l 00
6)
-J
E --" 1
"
n=l
und
'
^—1 n'-
n=l
'^'^ J.Hadamard (1865-1963) - bekannter franzosischer Mathematiker.
5.5 Komplexe Zahleii und Elementarfunktionen
283
konvergieren auf der Einheitsscheibe \z\ < 1, aber die Reihe 5) divergiert in jedem Punkt z mit \z\ = 1. Die Reihe 6) divergiert fiir z = 1 und (wie sich zeigen lasst) konvergiert fiir z = — 1. Die Reihe 7) konvergiert absolut fiir \z\ = 1, da IJyz"! = -^. Wir miissen den moglicherweise entarteten Fall im Hinterkopf behalten, dass i? = 0 in (5.115), was in Satz 3 nicht beriicksichtigt wurde. In diesem Fall schrumpft die Konvergenzscheibe auf einen einzigen Punkt ZQ, in dem die Reihe (5.113) konvergiert. Das folgende Ergebnis ist ein offensichtliches KoroUar zu Satz 3. KoroUar (Erster Abelsche Satz zu Potenzreihen). Konvergiert die Potenzreihe (5.113) in einem Wert z*, dann konvergiert sie sogar absolut fiir jeden Wert von z, fiir den \z — zo\ < \z* — zo\ gilt. Die bisher erhaltenen Satze konnen als einfache Erweiterungen bereits bekannter Tatsachen betrachtet werden. Wir werden nun zwei allgemeine Satze iiber Reihen beweisen, die wir bisher in keiner Weise bewiesen haben, obwohl wir teilweise einige der Fragen, die sie anschneiden, diskutiert haben. Satz 4. Konvergiert eine Reihe zi + Z2 + • • • + Zn + • • • komplexer Zahlen absolut, dann konvergiert auch die Reihe z„^ + z„2 + • • • + Zn^, + • • •, die wir durch Umordner?^ ihrer Glieder erhalten, absolut zu derselben Summe. oo
Beweis. Mit Hilfe der Konvergenz der Reihe ^
|z„| wahlen wir zu gegebenem
n=l oo
e > 0 ein A^ e N, SO dass
J2
\^n\ < £•
n=N+l
Wir finden dann einen Index K £ N, so dass alle Glieder in der Summe SN = zi + • • • + ZN unter den Gliedern der Summe Sk = z^ + • • • + z„^, fiir oo
k > K sind. Ist s = '^ z„, dann erhalten wir fiir k > K: \S-Sk\<\s-SN\
+ \SN-Sk\<
^ n=N+l
\Zn\+
^ \Zn\ < 2e . n=N+l
Somit haben wir gezeigt, dass Sk ^ s fiir fc —>• oo. Wenn wir das eben Bewiesene auf die Reihen |zi| + |2;2| + • • • + \zn\ + • • • und \zni \ + {zn^l + • • • + |z„j, I + • • • anwenden, dann stellen wir fest, dass die Letztere konvergiert. Somit ist Satz 4 voUstandig bewiesen. D Unser nachster Satz beschaftigt sich mit dem Produkt zweier Reihen (oi + a2 +
h a„ H
) • (6i + &2 H
\-bn + • • •) •
^^ Das Glied mit Index k in der Reihe ist Zr^,, das in der urspriinglichen Reihe den Index nk trug. Dabei gehen wir davon aus, dass die Abbildung N 9 fc i-> n;i £ N eine bijektive Abbildung auf die Menge N ist.
284
5 Differentialrechnung
Das Problem dabei ist, dass es nach Entfernen der Klamniern keine natiirliche Ordnung fiir die Summation aller moglichen Paare Uibj gibt, da dabei zwei Summationsindizes auftreten. Wir konnten daher eine Reihe schreiben, die die Produkte Oj&j in beliebiger Reihung besitzt. Bei absolut konvergenten Reihen ist, wie wir gerade gesehen haben, die Summe aber unabhangig von der Anordnung der Glieder. Daher sind wir daran interessiert, ob die Reihe mit den Ghedern Uibj absolut konvergiert. Satz 5. Das Produkt von absolut konvergenten Reihen ist eine absolut konvergente Reihe, deren Summe dem Produkt der Summen der multiplizierten Reihen entspricht. Beweis. Wir beginnen mit der Bemerkung, dass wir zu jeder beliebigen endlichen Summe "^Ojbj mit Gliedern der Form Ojbj immer ein N finden, so dass das Produkt der Summen AN = oi + • • • + ajv und BN = bi + • • • + bN alle Glieder dieser Summe enthalt. Daher gilt N
N
N
oo
oo
J2aibj < J2 l«^^il < E l"^^il = E l°^l • E l^il ^ E l°^l • I E l^il ' oo
woraus folgt, dass die Reihe ^
Oibj absolut konvergiert und dass ihre Summe
unabhangig von der Anordnung der Faktoren eindeutig bestimmt ist. Daher konnen wir die Summe etwa aus dem Grenzwert der Produkte der Summen A„ = oi + • • • + a„ und B„ = &! + ••• + &„ bestimmen. Aber A„Bn -^ AB oo
oo
fiir n —>• 00 mit A = ^
a„ und B = '^ bn- Damit ist der Beweis von Satz 5
n=l
n=l
abgeschlossen.
D
Das folgende Beispiel ist sehr wichtig. oo
oo
Beispiel 8. Die Reihen X] ^ a " und J2 '^.^"^ konvergieren absolut. Wir woln=0
n^=0
len im Produkt dieser Reihen alle Monome der Form a"b"^, die den gleichen Grad n + m = k ergeben, gruppieren. Damit erhalten wir die Reihe oo
.
^
-.
E( E VA^" n\ m\ =0
n+m=A
Nun ist aber 1
1
n\m\
/
^
1
1
k\^n\{k-n)\
m+n=k
k\^^'
n=0
und daher erhalten wir: oo
^
OO
j:-^-"-j:-r=T.T^(-+f>)'n! •'—' m ! -'—' fc! n=0
m=0
fc=0
(5-116)
5.5 Komplexe Zahleii und Elementarfunktionen
285
5.5.3 Eulersche Formel und Z u s a m m e n h a n g e zwischen Elementarfunktionen In den Beispielen 1-3 formulierten wir in C die absolute Konvergenz der Reihen, die wir erhalten, wenn wir die Taylor-Reihe der auf M definierten Funktionen e^, sin a;, und cos a; auf die komplexe Ebene erweitern. Aus diesem Grund sind die folgenden Definitionen fiir die Funktionen e^, cos 2;, und s i n z in C nur natiirlich: e-' = e x p z • " -^ + T ! ^ + 2 ! ^ ' ^ 3 ! ^ ^ ^ ' " ' cosz
:= 1 -—z"^ 2!
+—z* - ••• 4!
sin 2; := z - —z^ + —z^ 3! 5!
^^'^^^^
und
(5.118)
.
(5.119)
Nach einem Vorschlag von Euler^^ woUen wir in (5.117) die Substitution z = iy vornehmen. Indem wir die Glieder der Teilsummen der sich ergebenden Reihe geeignet anordnen, erhalten wir
1 + ^(iy) + ^(i2/)' + ^i^yf lo
^y
+ ^iwY
+ ^iwf
+ ••• =
I4
A - / !
I s
+^y
-•••j+ij^y-^y
1
+^
d.h., cosy + i s i n y .
(5.120)
Dies ist die beriihmte Eulersche Formel. Bei ihrer Herleitung haben wir ausgenutzt, dass i^ = —1, i^ = —i, i'* = 1, i5 = i und so weiter. Die Zahl y in (5.120) kann entweder eine reelle Zahl oder eine beliebige komplexe Zahl sein. Aus den Definitionen (5.118) und (5.119) folgt, dass cos{—z) = cosz sm{—z)
und
= — sin 2; ,
d.h., cosz ist eine gerade Funktion und sin(—z) eine ungerade Funktion. Folglich ist e~'^ = cosy — isin2/ . ^® L. Euler (1707-1783) - bedeutender Mathematiker und Fachmann fiir theoretische Mechanik mit schweizerischer Abstammung, der den Grofiteil seines Lebens in St. Petersburg zubrachte. Laplace formulierte seine Bedeutung folgendermaflen: „Euler ist der gemeinsame Lehrer aller Mathematiker der zweiten Halfte des achtzehnten Jahrhunderts."
286
5 Differentialrechnung Wenn wir diese letzte Gleichung niit (5.120) konibinieren, erhalten wir cosy = :r(e'^ + e~'^) und sin 2/ = — (e'^ — e~'^) .
Da y jede beliebige komplexe Zahl sein kann, sollten wir diese Gleichungen neu formulieren, so dass die Schreibweise keinen Zweifel an dieser Tatsache lasst: cosz = x(e'^+e~'^) und (5.121) sinz = r7(e'^—e~'^) . Nehmen wir daher an, dass exp^; durch (5.117) definiert ist, dann konnen wir (5.121), die zu den Entwicklungen (5.118) und (5.119) aquivalent sind, wie die Fornieln cosh 2/ = :^(e^+e~^) und (5.122) sinhz = -fe^ — e~^) 2^ ^ als Definitionen der entsprechenden Winkel- und Hyperbelfunktionen betrachten. Wenn wir alle Betrachtungen iiber trigononietrische Funktionen, die uns zu diesem Schritt gefiihrt haben, aber nicht streng mathematisch gerechtfertigt waren (obwohl sie uns zur Eulerschen Formel gefiihrt haben), vergessen, dann konnen wir jetzt einen typischen niatheniatischen Trick anwenden und die Formeln (5.121) und (5.122) als Definitionen betrachten und aus diesen rein formal alle Eigenschaften der Winkel- und trigonometrischen Funktionen erhalten. So konnen etwa die wichtigen Gleichungen cos^ z + sin^ z = 1 und cosh^ z — sinh^ z = 1 unmittelbar bewiesen werden. Die komplizierteren Eigenschaften, wie etwa die Formeln fiir die Sunime fiir Cosinus und Sinus, erhalten wir aus der charakteristischen Eigenschaft der Exponentialfunktion exp(2;i + Z2) = exp(zi) • exp(2;2) ,
(5.123)
die sich offensichthch aus der Definition (5.117) und (5.116) ergibt. Wir woUen die Formeln fiir den Cosinus und den Sinus einer Summe herleiten.
5.5 Komplexe Zahleii und Elementarfunktionen
287
Zunachst erhalten wir mit der Eulerschen Formel gi(^i+22) ^ pog(^^ +Z2)+i sm{zi + Z2) ,
(5.124)
aber andererseits aus den Eigenschaften der Exponentialfunktion und der Eulerschen Formel auch gi(2i+^2) _ gi2igi22 _ (^QQg^-^ + isin2;i)(cosz2 -l-isinz2) = = (cos 2:1 cos 2:2 — sinzi sinz2) + i(sin2;i cos 22 + coszi sin 22) . (5.125) Waren zi und Z2 reelle Zahlen, dann konnten wir die Real- und die Imaginarteile der Zahlen in den Gleichungen (5.124) und (5.125) gleich setzen und so die erwiinschten Formeln erhalten. Da wir sie fiir jedes zi, 22 € C beweisen wollen, nutzen wir aus, dass cos z gerade und sin z ungerade ist und gelangen so zu einer weiteren Gleichung: g-i(2i+22) = (coszi cos2;2 — sinzi sin2;2) — i(sinzi cos2;2-I-cos^i sinz2) . (5.126) Wenn wir nun (5.125) und (5.126) kombinieren, erhalten wir cos(zi-I-22) = -(e'^^^"*"^^'-I-e"''^^"*"^^') = cos zi cos Z2 — sin zi sin Z2 , sin(zi-I-22) = — (e'*^^^+^^-'— e~'*^^^+^^-') = sin zi cos 22-I-cos zi sin 22 . Die entsprechenden Formeln fiir die Hyperbelfunktionen cosh z und sinh z konnen wir vollstandig analog erhalten. Wie wir aus (5.121) und (5.122) sehen konnen, sind diese Funktionen iibrigens mit cosz und sinz folgendermafien verkniipft: coshz = cosiz und sinhz = —isiniz . Es ist jedoch sehr schwierig, geometrisch simple Tatsachen wie die Gleichung siuTT = 0 oder cos(z -I- 27r) = cosz aus den Definitionen (5.121) und (5.122) zu erhalten. Daher sollten wir, auch wenn wir nach Prazision streben, nicht die Probleme vergessen, in denen diese Funktionen ganz natiirlich auftreten. Deswegen werden wir an dieser Stelle nicht versuchen, die moglichen Schwierigkeiten im Zusammenhang mit den Definitionen (5.121) und (5.122), die bei der Beschreibung von Eigenschaften trigonometrischer Funktionen auftreten, zu iiberwinden. Wir werden auf diese Funktionen nach Einfiihrung der Theorie der Integration zuriickkommen. Im Augenblick hatten wir nur die Absicht, die erstaunliche Verschmelzung scheinbar vollstandig verschiedener Funktionen zu demonstrieren, was ohne einen Ubergang zu den komplexen Zahlen unmoglich gewesen ware.
288
5 Differentialrechnung Wenn wir als bekannt voraussetzen, dass fiir a; € M cos(a; + 2TT) = cos a; , sin(a; + 2TT) = sina; , cos 0 = 1 , sin 0 = 0
gelten, dann erhalten wir aus der Eulerschen Forniel (5.120) die Beziehung + 1= 0
(5.127)
in der die wichtigsten Konstanten verschiedener mathematischer Gebiete vertreten sind: 1 (arithmetisch), TT (geometrisch), e (analytisch) und i (algebraisch). Aus (5.123) und (5.127) wie auch (5.120) erkennen wir, dass exp(z + i27r) = exp z , d.h., die Exponentialfunktion ist auf C eine periodische Funktion mit der rein imaginaren Periode T = i2Tr. Wenn wir die Eulersche Formel beriicksichtigen, konnen wir nun die trigononietrische Schreibweise (5.105) fiir eine komplexe Zahl in die Form
bringen, wobei r der Betrag von z ist und ip ihr Argument. Die Formel von de Moivre wird dadurch sehr einfach:
5.5.4 Analytischer Zugang zur Potenzreihendarstellung einer Funktion Eine auf einer Menge E C C definierte Funktion w = f{z) einer komplexen Variablen mit komplexem Funktionswert w ist eine Abbildung f : E ^ C Der Graph einer derartigen Funktion ist eine Teilmenge von C x C=M^ x M^ =ffi'* und daher nicht auf traditionelle Weise darstellbar. Um diesen Verlust etwas auszugleichen, arbeitet man iiblicherweise mit zwei Kopien der komplexen Ebene C, um Punkte im Definitionsbereich in einer, und Punkte des Wertebereichs in der anderen anzudeuten. In den unten angefiihrten Beispielen ist der Definitionsbereich E und ihr Abbild unter der entsprechenden Abbildung angefiihrt. In Ubereinstimmung mit der allgemeinen Definition von Stetigkeit nennen wir eine Funktion f(z) einer komplexen Variablen im Punkt ZQ £ C stetig, wenn fiir jede Umgebung V[f{zQ)) ihrer Werte /(ZQ) eine Umgebung U{ZQ) existiert, so dass f{z) G V(^f{zo)) fiir alle z G U{zo). In Kurzform: hm f{z) = fizo) .
5.5 Komplexe Zahleii und Elementarfunktionen id 9.
289
iv
ly
®
1
@
0
X
1
2
u
Z 1-^ Z + 1 = W
A b b . 5.25. id 10.
w
iv 2i
©
@
i i 0
0
X
u
z 1-^ z + i = w A b b . 5.26. id 11.
A b b . 5.27. Diese Zusammenhange ergeben sich aus den Gleichungen i = e"^'^, z = re'*' und \z = re^^'^'^'^''^', d.h., es liegt eine Drehung uni den Winkel |- vor.
id 12.
iy
0
Z 1-^ Z
= W
A b b . 5.28. 1st namlich z = re'*', dann gilt z'^ = r^e'^*'.
290
5 Differentialrechnung oiel IS.
iy
A b b . 5.29. iel 14-
A b b . 5.30. Aus den Beispielen 12 und 13 ist klar, dass diese Punktion die Einheitsscheibe auf sich abbildet, die dabei aber zweimal iiberdeckt wird.
iel 15.
(n = 3)
A b b . 5.31. Ist z = re'*', dann ist nach (5.128) a" = r"e'"*', so dass in diesem Fall das Bild der Scheibe mit Radius r eine Scheibe mit Radius r" ist, wobei jeder Bildpunkt aus n verschiedenen Punkten der urspriinglichen Scheibe (die in den Ecken eines regularen n-Ecks sitzen) hervorgeht. Die einzige Ausnahme bildet der Punkt w = 0, dessen Urbild der Punkt z = 0 ist. Fiir 2; —>• 0 ist die Funktion a" jedoch infinitesimal der Ordnung n, so dass wir sagen konnen, dass die Punktion in z = 0 eine Null der Ordnung n besitzt. Wenn wir diese Art von Vielfachheit beriicksichtigen, konnen wir nun sagen, dass die Zahl der Urbilder jedes Punktes w unter der Abbildung z i-^ z" = w genau n ist. Insbesondere besitzt die Gleichung z" = 0 die n zusammenfallenden Losungen zi = • • • = Zn = 0-
5.5 Komplexe Zahleii und Elementarfunktionen
291
Die Ableitung einer Funktion f(z) im Punkt ZQ wird wie im reellen Fall definiert als
f{zo) = lim M^IM z^zo
,
(5.129)
Z — ZQ
falls dieser Grenzwert existiert. Gleichung (5.129) ist aquivalent zu f{z) - f{zo) = f'{zo){z - zo) + o{z - zo)
(5.130)
fiir z ^ ZQ. Sie entspricht der Definition der Dijferenzierbarkeit einer Funktion im Punkt ZQ. Da die Definition der Differenzierbarkeit im Komplexen der entsprechenden Definition fiir reelle Funktionen entspricht und da die arithmetischen Eigenschaften der Korper C und ffi gleich sind, konnen wir sagen, dass alle allgemeinen Regeln fiir die Differentiation auch im Komplexen gelten. Beispiel 16. {f+9nz) = f'{z)+g'{z), if-gnz) = f{z)g{z) + fiz)9'{z), igofnz)=g'{f{z))-f{z), so dass fiir f{z) = z^ gilt, dass /'(z) = 1 • 2; + z • 1 = 2z. Fiir f{z) = z" haben wir f'{z) = nz""^ und fiir Pn{z)
= Co + Ci{z - Zo) -\
h C„(z - Z Q ) "
ergibt sich P;(z) = ci + 2c2(z - Zo) + • • • + ncn{z - zo)"-^ . 00
Satz 6. Die Summe einer Potenzreihe f{z) = ^ c„(z —ZQ)" ist innerhalh der n=0
Scheibe, in der sie konvergiert, eine unendlich oft dijferenzierbare Funktion. Aufierdem gilt
n=0
^/(")(zo),
n = 0,l,
Beweis. Die Ausdriicke fiir die KoefRzienten folgen offensichtlich aus den Ausdriicken fiir f^^'{z) fiir k = n und z = ZQ. Fiir den Beweis der Formel fiir f^''' (z) geniigt es, diese Formel fiir fc = 1 zu zeigen, da die Funktion /'(z) dann der Summe einer Potenzreihe entspricht.
292
5 Differentialrechnung Wir wollen also zeigen, dass die Funktion Lp{z) =
^
n c „ ( z — zo)"~^
n=l
tatsachlich die Ableitung von f{z) ist. Wir beginnen mit der Anmerkung, dass nach C a u c h y - H a d a m a r d (5.115) der Konvergenzradius der abgeleiteten Reihe mit dem Konvergenzradius R der urspriinglichen Potenzreihe von f{z) iibereinstimnit. Um die Schreibweise zu vereinfachen, werden wir von nun an annehmen, dass ZQ = 0, d.h., f{z)
oo
= ^
oo
c „ z " , ip{z)
n=0
n=l
""~^, und dass diese Reihen
fiir |z| < i? konvergieren. Da eine Potenzreihe ini Inneren der Konvergenzscheibe absolut konvergiert, halten wir fest (und das ist entscheidend), dass die Abschatzung ^n-ll In-l < n|c„|r"~^ fiir \z\ < r < R gilt und dass die Reihe E
n\c„\r"-^ konvergiert. Daher existiert fiir jedes e > 0 ein Index N, so dass oo
E
e < - 3
<
nc„z
n=N+l
n=N+l
fiir \z\ < r. Daher liegt in jeder Scheibe |2;| < r die Funktion (p{z) innerhalb von | der A^-ten Teilsumnie der sie definierenden Reihe. Nun seien ( und z beliebige P u n k t e dieser Scheibe. Nach der Umformung
/(C)-/(^)
_-^
/-n
Ec»T" n=l
^
E Cn{C-'+C-'z
+ -- + Czn—'2
,n-l^
n=l n-l + ••• + z und der Abschatzung \cn{C )| < \c„\nr n-l konnen wir nun wie oben folgern, dass der gesuchte Differenzenquotient innerhalb | der Teilsumnie der sie definierenden Reihe gleich ist, vorausgesetzt, dass |C| < ?" und \z\ < r. Daher erhalten wir fiir |C| < r und \z\ < r:
fiO-fiz)
c-
N
ip{z) <
E'
c^ c-
N
Y^
ncnz"-^ + 2-
n=l
Wenn wir nun z festhalten und ( gegen z streben lassen und zum Grenzwert in der endlichen Summe iibergehen, dann bleibt die rechte Seite dieser letzten Ungleichung kleiner als e, wenn ( nahe genug bei z ist, und daher trifft dies auch fiir die linke Seite zu. Somit haben wir fiir jeden P u n k t z in der Scheibe |2;| < r < i? gezeigt, dass f'{z) = f{z). Da r behebig ist, gilt dies fiir jeden P u n k t der Scheibe \z\ < R. D
5.5 Komplexe Zahleii und Elementarfunktionen
293
Mit diesem Satz konnen wir die Klasse von Funktionen niit konvergenter Taylor-Reihe spezifizieren: Eine Funktion ist in einem Punkt ZQ G C analytisch, wenn sie in einer Umgebung des Punktes in der folgenden („analytischen") Form dargestellt werden kann: oo f{z)
=
J2cn{z-Zor, n=0
d.h. als Summe einer Potenzreihe in z — ZQ. Es ist nicht schwer zu beweisen (vgl. Aufgabe 7 unten), dass die Summe einer Potenzreihe in jedem inneren Punkt der Scheibe, deren Radius der Konvergenzradius der Reihe ist, analytisch ist. Unter Beriicksichtigung der Definition einer analytischen Funktion konnen wir das folgende Korohar aufstellen. KoroUar. a) Ist eine Funktion in einem Punkt analytisch, dann ist sie unendlich oft in diesem Punkt differenzierbar und ihre Taylor-Reihe konvergiert in einer Umgebung dieses Punktes gegen sie. b) Die Taylor-Reihe einer in einer Umgebung eines Punktes definierten und in diesem Punkt unendlich oft differenzierbaren Funktion konvergiert genau dann in einer Umgebung des Punktes gegen die Funktion, wenn die Funktion analytisch ist. In der Funktionentheorie einer komplexen Variablen lasst sich etwas Bemerkenswertes zeigen, das kein Analogon in der Funktionentheorie einer reellen Variable besitzt. Es stellt sich heraus, dass eine in einer Umgebung eines Punktes ZQ G C differenzierbare Funktion f{z) in diesem Punkt analytisch ist. Dies ist sicherlich erstaunlich, da dann aus dem eben bewiesenen Satz folgt, dass eine Funktion, die in einer Umgebung eines Punktes einmal differenzierbar ist, in dieser Umgebung beliebig oft differenzierbar ist. Auf den ersten Blick ist dies genauso iiberraschend wie die Tatsache, dass wir, indem wir zu M eine Losung i der besonderen Gleichung z"^ = —1 hinzufiigen, einen Korper C erhalten, in dem jedes algebraische Polynom losbar ist. Wir beabsichtigen, die Tatsache, dass die Nullstellen eines algebraischen Polynoms P{z) in C liegen, auszunutzen und werden sie aus diesem Grund beweisen. Wir erhalten dadurch auBerdem eine gute Veranschaulichung der einfachen Konzepte komplexer Zahlen und der Funktionen mit komplexen Variablen, die wir in diesem Abschnitt eingefiihrt haben. 5.5.5 Algebraische Abgeschlossenheit des Korpers C der komplexen Zahlen Wenn wir beweisen konnen, dass die NuUsteUen jedes Polynoms P{z) = CQ -\c\z-\-- - •-\-Cnz", n >1 mit komplexen Koeffizienten in C enthalten sind, dann gibt es fiir uns keine Notwendigkeit mehr, den Korper C zu erweitern, well eine algebraische Gleichung in C nicht losbar ist. In diesem Sinne entspricht die
294
5 Differentialrechnung
Behauptung, dass alle NuUstellen jedes Polynoms P{z) in C enthalten sind, der Aussage, dass der Korper C algebraisch abgeschlossen ist. Daniit wir eine klare Vorstellung davon bekomnien, warum die NuUstellen jedes Polynoms in C enthalten sind, wohingegen wir inffiu.U. keine NuUstellen finden konnen, geben wir zunaclist eine geonietrische Interpretation koniplexer Zalilen und Funktionen einer koniplexen Variablen. Wir merken an, dass
^W = - " ( ^ + '
Cl
so dass P{z) = Cnz" + o{z") fiir \z\ —>• oo. Da wir eine Nullstelle von P{z) suchen, konnen wir nach Division der Gleichung P{z) = 0 durcli c„ sagen, dass der fiihrende Koeffizient c„ von P{z) gleich 1 ist und daher sclireiben: P(z) = ^" + o(z") fiir \z\ ^ o o
(5.131)
Nun wird (vgl. Beispiel 15) der Kreis mit Radius r unter der Abbildung z 1-^ z" auf den in 0 zentrierten Kreis mit Radius r" abgebildet. Folglich wird unter der Abbildung w = P{z) fiir geniigend grofie Werte von r das Bild des Kreises |^| = r mit einem kleinen relativen Fehler dem Kreis |w| = r" in der w-Ebene entsprechen (Abb. 5.32). Dabei ist es wichtig, dass das Bild in jedem Fall eine Kurve sein wird, die den Punkt w = 0 umschliefit.
I (n = 2)
Abb. 5.32. Wenn wir die Scheibe \z\ < r als einen Film betrachten, der auf den Kreis |z| = r ausgedehnt ist, dann wird dieser Film in einen Film abgebildet, der auf das Bild dieser Scheibe unter der Abbildung w = P{z) ausgedehnt ist. Da letzterer den Punkt w = 0 umschlieBt, muss ein Punkt dieses Films mit w = 0 iibereinstimmen und daher gibt es einen Punkt ZQ in der Scheibe \z\ < r, der unter der Abbildung w = P{z) auf w = 0 abgebildet wird, d.h., P{ZQ) = 0. Diese intuitive Argumentation fiihrt uns auf mehrere wichtige und niitzliche topologische Konzepte (den Grad eines Wegs beziiglich eines Punktes und die Mannigfaltigkeit), mittels derer ein voUstandiger Beweis moglich wird, der, wie wir sehen werden, nicht nur fiir Polynome giiltig ist. Diese Betrachtungen wiirden uns ungliicklicherweise von dem Hauptgegenstand, den wir gerade
5.5 Komplexe Zahleii und Elementarfunktionen
295
untersuchen, ablenken. Aus diesem Grund werden wir einen anderen Beweis anfiihren, der eher niit den Konzepten ini Einklang steht, die wir bereits beherrschen. S a t z 7. Jedes
Polynom P{z) = Co + c i z H
vom Grad n > 1 mit komplexen
Koejfizienten
h c„2;" besitzt eine NuUstelle in C.
Beweis. Ohne Verlust der Allgemeinheit konnen wir annehnien, dass Cn = iSei a = inf \P(z)\. Da P(z) =z"(l + ^ ^ ^ + • • • + ^ ) , erhalten wir
und offensichtlich ist |-P(^)| > max{l,2/x} fiir \z\ > R, falls R geniigend grofi ist. Folglich liegen die P u n k t e der Folge {zk} in denen 0 < |-P(2;fc)| — fJ. < j innerlialb der Sclieibe \z\ < R. Wir werden zeigen, dass es einen P u n k t ZQ G C gibt (und dass er in dieser Sclieibe liegt), fiir den |P(zo)| = /U. Dazu merken wir an, dass fiir Zk = Xk+iyk gilt: max{|a;fc|, |2/fc|} < \zk\ < R- Daher sind die Folgen reeller Zahlen {xk} und {i/k} beschrankt. Wenn wir zunachst eine konvergente Teilfolge {xki} aus {xk} und dann eine konvergente Teilfolge {t/k, } aus {i/ki} wahlen, dann erhalten wir eine Teilfolge Zk, = Xk^ + iyui der Folge {zk}, die einen Grenzwert lim Zk, = lini Xki + i lim y^, = XQ + iyo = ZQ besitzt und m—)-oo
"^
m—)-oo
"^
m—)-oo
"^
da |zfc,^ I —>• |2;o| fiir m —>• oo, folgt, dass \zo\ < R. Um also eine schwerfallige Schreibweise zu vermeiden und nicht imnier zu Teilfolgen iibergehen zu miissen, werden wir annehmen, dass die Folge {zk} ihrerseits konvergiert. Aus der Stetigkeit von P{z) in ZQ £ C folgt, dass lim P{zk) = P{zo)- Dann fe—)-oo
ist aber27 \P{zo)\ = lim \P{zk)\ = Hfe—)-oo
Wir werden nun annehmen, dass /x > 0, und diese Annahme benutzen, um einen Widerspruch zu erhalten. Ist P{zo) ^ 0, dann betrachten wir das Polynom Q[z) = ^^p^^Nach der Konstruktion gilt (9(0) = 1 und \Q{z)\ = Da (5(0) = 1, besitzt das Polynom Q{z) die folgende Gestalt: Q{z) = 1 + quz'' + 9fc+iz^+l + • • • + g„2;" , ^^ Beacliten Sie bitte, dass wir auf der einen Seite gezeigt liaben, dass wir aus jeder Folge komplexer Zahlen, deren Betrage beschrankt sind, eine konvergente Teilfolge herausgreifen konnen, und auf der anderen Seite einen weiteren moglichen Beweis des Satzes erhalten haben, dass eine stetige Punktion auf einem abgeschlossenen Intervall ein Minimum besitzt, wie wir es hier fiir die Scheibe \z\ < R getan haben.
296
5 Differentialrechnung
wobei \qk\ ^ 0 und 1 < fc < n. 1st g^ = pe"'^, dann erhalten wir fiir ip = ^^-j^, dass qk • (e'^)^ = pe^'^e'^'^"*) = pe'"" = -p = -\qk\. dass \Qire'n\
Somit gilt fiir z = re'*',
< |1 + QkZ^l + (kfc+i^'+'l + • • • + |g„^"|) =
= l-r^(kfc|-r|gfc+i|
r"-*|g„|) < 1 ,
wenn r geniigend nahe bei 0 liegt. Aber |(3(2;)| > 1 fiir 2; £ C. Dieser Widerspruch zeigt, dass P{zo) = 0. D Anmerkung 1. Der erste Beweis des Satzes, dass jede algebraische Gleichung niit koniplexen Koeffizienten eine Losung in C besitzt (was traditionell als Fundamentalsatz der Algebra bezeiclinet wird), wurde von Gauss geliefert, der ganz allgeniein den sogenannten „iniaginaren" Zahlen Leben einhauchte, indeni er niehrere tiefgriindige Anwendungen fiir sie lieferte. Anmerkung 2. Ein Polynom P{z) = QQ + • • • + a„z" mit reellen Koeffizienten besitzt, wie wir wissen, nicht immer reelle Nullstellen. Es besitzt jedoch im Vergleicli zu eineni beliebigen Polynom mit koniplexen Koeffizienten die uniibliche Eigenschaft, dass P{z) mit ZQ auch in ZQ eine NuUstelle besitzt. Tatsachlich folgt aus der Definition der komplex Konjugierten und den Regeln fiir die Addition komplexer Zahlen, dass (zi + ZQ) = zi + Z2- AUS der trigonometrischen Darstellung einer koniplexen Zahl und den Regeln fiir die Multiplikation komplexer Zahlen folgt, dass {zi • Z2) = (rie''^i • r2e''^2) = T.^T..^Qi{ipi+f-2) rir2e"'(*'^+^") = n e " ' * ' ! • rge"'^^ = zi • Z2 Somit ist P{zo) = ao H
h a„2;ff = oo H
1- a„Zo = OQ H
1- On-^o =
Pi^o)
und fiir P(zo) = 0 gilt folglich P(zo) = P(zo) = 0. KoroUar 1. Jedes Polynom, P{z) = CQ + • • • + c„2;" vom Grad n > 1 mit komplexen Koeffizienten erlauht eine Darstellung der Form P{z)
mit zi,...,z„ verschieden eindeutig.
= Cn{z-Zi)---{z-Zn)
,
(5.132)
G C (wobei die Zahlen zi,...,Zn nicht notwendigerweise alle sind). Diese Darstellung ist bis auf die Anordnung der Faktoren
Beweis. Mit Hilfe der Polynomdivision, bei der ein Polynom P{z) durch ein anderes Polynom Q{z) mit kleinerem Grad dividiert wird, gelangen wir zu
5.5 Komplexe Zahleii und Elementarfunktionen
297
P{z) = q{z)Q{z) + r{z), wobei q{z) und r{z) Polynome sind. Der Grad von r{z) ist dabei kleiner als der Grad m von Q{z). 1st daher m = 1, dann ist r{z) = r eine einfache Konstante. Sei zi eine Nullstelle des Polynoms P{z). Dann gilt P{z) = q{z){z — zi)-\-r. Daher gilt P{zi) = r, woraus folgt, dass r = 0. Ist also zi eine Nullstelle von P{z), dann erhalten wir die Darstellung P{z) = (z — zi)q{z). Der Grad des Polynoms q(z) ist n — 1, und wir konnen fiir n — 1 > 1 die Argumentation fiir q{z) wiederholen. Durcli Induktion erhalten wir P{z) = c{z — zi) • • • (z — Zn)Da cz" = c„2;" gelten muss, erhalten wir c = Cn• KoroUar 2. Jedes Polynom P{z) = OQ + " •" + On-z" ^^ reellen Koeffizienten kann als ein Produkt Unearer und quadratischer Polynome mit reellen Koejfizienten dargestellt werden. Beweis. Dies folgt aus KoroUar 1 und Anmerkung 2, aufgrund derer mit jeder Nullstelle Zk von P{z) auch Zk eine NuUsteUe ist. Wenn wir die Multiphkation (z — Zk){z — Zk) im Produkt (5.132) ausfiihren, erhalten wir das quadratische Polynom z"^ — [zu + Zk)z + \zk\'^ mit reellen Koeffizienten. Die Zahl c„, die gleich a„ ist, ist in diesem Fall eine reelle Zahl und kann in eine der Klammern gezogen werden, ohne dadurch den Grad des Faktors zu verandern. D Wenn wir in (5.132) identische Faktoren zusammenfassen, konnen wir das Produkt neu schreiben: P{z) = cn{z - zif'
•••{z-
zj,f-
.
(5.133)
Die Zahl kj wird Vielfachheit der Nullstelle Zj genannt. Da P{z) = (z - Zj)^'Q{z), wobei Q{zj) ^ 0, folgt, dass P'{z) = kj{z - Zjf'-^Q{z)
+ {z- Zjf'Q'{z)
= {z- Zjf'-^R{z)
,
wobei R{zj) = kjQ{zj) ^ 0. Wir gelangen so zu folgender Schlussfolgerung: KoroUar 3. Jede Nullstelle Zj der Vielfachheit kj > 1 eines Polynoms P{z) ist eine Nullstelle der Vielfachheit kj — 1 der Ableitung P'{z). Noch sind wir nicht in der Lage, die Nullstellen des Polynoms P{z) zu bestimmen, aber wir konnen dieses letzte KoroUar und die Darstellung (5.133) benutzen, um ein Polynom p{z) = (z — zi) • • • (z — Zp) zu finden, dessen Nullstellen mit denen von P{z) iibereinstimmt, aber die Vielfachheit 1 besitzen. Mit dem euklidischen Algorithmus konnen wir zunachst den groBten gemeinsamen Teller q(z) von P{z) und P'{z) finden. Nach KoroUar 3, der Darstellung (5.133) und Satz 7 ist das Polynom q{z) bis auf einen konstanten Faktor gleich (z — zi)''^~^ • • • {z — Zp)*^""^. Daher erhalten wir, nach Division von P{z) durch q{z) bis auf einen konstanten Faktor, den wir entfernen konnen, indem wir durch den Koeffizienten von z"^ dividieren, ein Polynom p{z) = {z - zi)---{zZp).
298
5 Differentialrechnung
Nun betrachten wir das Verhaltnis R{z) = TJW- zweier Polynome, wobei Q{z) ^ konstant. 1st der Grad von P{z) grofier als Q{z), dann konnen wir den Divisionsalgorithmus anwenden und erhalten fiir P{z) die Darstellung p{z)Q{z) + r{z), wobei p{z) und r{z) Polynome sind und der Grad von r{z) kleiner ist als der von Q{z). So gelangen wir zur Darstellung R{z) = p{z) + QT-), wobei der Brucli ^T^y ein ecliter Bruch ist in dem Sinne, dass der Grad von r{z) kleiner ist als der von Q{z). Das KoroUar, das wir aufstellen wollen, beliandelt die Darstellung eines echten Bruchs als eine Summe von Briichen, die sogenannte Partialbruchzerlegung. KoroUar 4. a) Sei Q{z) = {z — zi)^^ • • • {z — Zp)^'' und Qt|t ein echter Bruch. P( z)
Dann existiert eine eindeutige Darstellung des Bruchs TJW- der Gestalt
b) Sind P{x) und Q{x) Polynome mit reellen Koeffizienten und Q{x)
= {x-Xif^
• • • {x - Xi)'" {x"^ + PlX + qi)""^
• • • {x^ + PnX + QnT'^
dann existiert eine eindeutige Darstellung des echten Bruchs ^^ stalt
,
der Ge-
wobei Ojk, bjk und Cjk reelle Zahlen sind. Wir nierken an, dass es eine universelle Metliode zur Auffindung der Entwicklungen (5.134) und (5.135) gibt, die unter dem Namen Methode der unbestimmten Koeffizienten bekannt ist, obwohl diese Methode nicht immer den kiirzesten Weg bietet. Dabei werden alle Ausdriicke auf der rechten Seite von (5.134) und (5.135) auf einen gemeinsamen Nenner gebracht und dann die sich ergebenden Koeffizienten des Zahlers den entsprechenden Koeffizienten von P{z) gleichgesetzt. Das sich dabei ergebende lineare Gleichungssystem besitzt wegen KoroUar 4 immer eine eindeutige Losung. Da wir in der Regel an der Entwicklung eines bestimmten Bruchs interessiert sind, den wir nach der Methode der unbestimmten Koeffizienten erhalten, benotigen wir nichts anderes von KoroUar 4 als die Gewahr, dass wir die Methode immer sicher anwenden konnen. Aus diesem Grund werden wir uns nicht die Miihe machen, den Beweis durchzufiihren. Er wird iiblicherweise algebraisch in Kursen zu moderner Algebra und analytisch in Kursen der Funktionentheorie komplexer Variabler erbracht. Wir wollen ein besonders ausgewahltes Beispiel betrachten, um das eben Erklarte zu veranschaulichen.
5.5 Komplexe Zahleii und Elementarfunktionen
299
Beispiel 17. Seien P{x) = 2a;® + 3x^ + 6x* + 6x^ + lOx^ + 3a; + 2 , Q{x) = x"^ + 3a;® + 5x^ + 7x* + 7x^ + 5x^ + 3a; + 1 . Wir suchen die Partialbruchentwicklung (5.135) fiir den Bruch •^^• Zunachst einmal wird das Problem dadurch erschwert, dass wir die Faktoren des Polynoms Q{x) nicht kennen. Deshalb woUen wir zunachst vielfache Nullstellen von Q(x) entfernen. Dazu bilden wir Q'(x) = 7x^ + 18a;'5 + 25x^ + 28x^ + 21a;2 + lOx + 3 . Nach sehr ermiidenden, aber moglichen Berechnungen erhalten wir mit dem euklidischen Algorithmus den groi^ten gemeinsamen Teiler von Q{x) und Q'ix): d{x) = a;" + 2a;^ + 2a;2 + 2x + 1 . Der hier angefiihrte groBte gemeinsame Teiler hat eine 1 als fiihrenden Koeffizienten. Die Division von Q{x) durch d{x) liefert das Polynom q{x) = X + X + X + 1 , das dieselben NuUsteUen wie Q{x) besitzt, allerdings nur mit Vielfachheit 1. Die NuUstelle in —1 konnen wir einfach erraten. Die Division von q(x) durch X + 1 ergibt a;^ + 1. Somit ist q{x) = {x + l){x'^ + 1) , und nach Division von d{x) durch a;^ + 1 und a; + 1 erhalten wir die Faktorisierung von d{x), d{x) = (a; + l)2(a;2 + l) und daraus die Faktorisierung Q{x) = {x + lf{x^
+ lf
.
Daher suchen wir nach Korollar 4b eine Entwicklung des Bruchs Tjf^ in der Form P{x) _ Oil Q(x) x +1
ai2 (a;+ 1)2
ai3 (a; +1)3
biix + cii a;2 + 1
bi2X + ci 2 (a;2 + 1)2
Dazu bestimmen wir einen gemeinsamen Teiler auf der rechten Seite und setzen die Koeffizienten des sich ergebenden Nenners mit denen von P(x) gleich und gelangen so zu einem System von sieben Gleichungen mit sieben Unbekannten, dessen Losung uns schlieBlich zu folgender Entwicklung fiihrt: P(x) Qix)
1 x+1
2 (a;+ 1)2
1 (a; + 1)3
a; - 1 a;2 + 1
a; + 1 (a;2 + 1)=
300
5 Differentialrechnung
5.5.6 U b u n g e n u n d A u f g a b e n 1. Verwenden Sie die geometrische Interpretation einer komplexen Zahl bei folgenden Problemen: a) Erklaren Sie die Ungleichungen |ai + 22! < |^i| + |^2| und l^i + • • • + a^l < \zi\ + --- + \Zn\. b) Bestimmen Sie die Lage der Punkte in der komplexen Ebene, die die Beziehung | a - l | + |a + l| < 3 erfiillen. c) Beschreiben Sie alle n-ten Einheitswurzeln und bestimmen Sie ihre Summe. d) Erklaren Sie die sich durch die Abbildung «!->•« ergebende Umformung der komplexen Ebene. 2. Bestimmen Sie die folgenden Summen: a) l + g + b) 1 + g +
hg", h g" H
fiir |g| < 1,
c) l+e'»' + --- + e'"»', d) e) f) g) li) i)
l + r e ' * ' + - - - + r"e™'', 1 + re'*' + • • • + r"(i"'f + • • • fiir \r\ < 1, 1 + r cos (/3 + • • • + r" cos rup, 1 + r cos (/3 + • • • + r" cosTup + • • • fiir \r\ < 1, 1 + r sin 93 + • • • + r" sin mp, 1 + r sin 93 + • • • + r" sin mp + • • • fiir \r\ < 1.
3. Bestimmen Sie den Betrag und das Argument der komplexen Zahl lim (1 + und zeigen Sie, dass diese Zahl gleich e^ ist. 4.
b) c) d) e) 5.
a) Zeigen Sie, dass die Gleichung e™ = a in w die Losung «; = In \z\ +iArg z hat. Es ist ganz natiirlich, w als den natiirlichen Logarithmus von z zu betrachten. Somit ist w = Ln z keine funktionale Beziehung, da Arg z mehrere Werte besitzt. Bestimmen Sie Ln 1 und Lni. Sei z" = e"^"'. Finden Sie 1" und i'. Berechnen Sie mit Hilfe der Darstellung w = sinz = 55-(e'^ — e~'^J einen Ausdruck fiir z = arcsinw. Gibt es Punkte in C, in denen | sinz] = 2?
a) Untersuchen Sie, ob die Punktion f{z) = jr^ in alien Punkten der Ebene C stetig ist. b) Entwickeln Sie die Punktion -r-r—r in einer Potenzreihe und bestimmen Sie ihren Konvergenzradius. c) Losen Sie Teil a) und b) fiir die Punktion YTX^TTI wobei A £ R ein Parameter ist. Konnen Sie eine Vermutung aufiern, wie der Konvergenzradius von der relativen Lage bestimmter Punkte in der Ebene C abhangt? Liefle sich diese Beziehung alleine auf Basis der reellen Gerade verstehen, d.h. durch Entwicklung der Punktion JT^T^, mit A G R und x G R?
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften 6.
301
a) Untersuchen Sie, ob die Cauchy-Punktion
fiz) = I [ in 2; = 0 stetig ist. b) Ist die Einschrankung /
0,
z=0
der Funktion / in a) auf die reelle Gerade stetig? IE
c) Existiert die Taylor-Reihe der Funktion / in a) im Punkt zo = 0? d) Gibt es in einem Punkt zo G C analytische Funktionen, deren Taylor-Reihen nur ini Punkt zo konvergieren? oo
e) Erfinden Sie eine Potenzreihe ^
Cn(z — zo)^, die nur in einem Punkt zo kon-
n=0
vergiert. oo
7.
a) Nehmen Sie in der Potenzreihe Yl ^ n ( a — o)" die formale Substitution a —o = n=0
(z — Zo) + (zo — a) vor und fassen Sie gleiche Glieder zusammen. Sie erhalten oo
so eine Reihe ^
C„{z — zoY und Ausdriicke fiir ihre KoefEzienten in Ak und
n=0
{zo-af, fc = 0 , 1 , . . . . b) Die urspriingliche Reihe konvergiere auf der Scheibe j^; — o| < R mit |ao — a| = r < R. Zeigen Sie, dass dann die Reihe, die C„, n = 0 , 1 , . .. definiert, absolut oo
konvergiert und dass die Reihe Yl Cn{z — zo)" fiir j^; — 2;o| < R — r konvergiert. oo
n=0
c) Sei f{z) = Y ^n{z — a)" auf der Scheibe j^; — a| < -R und \zo — a\ < R. Zeigen n=0
Sie, dass die Funktion / auf der Scheibe j^; — ao| < R— \zo — a\ die Darstellung oo
fi^) = Y Cn{z — Zo)" zulasst. n=0
8. Zeigen Sie: a) Wenn der Punkt z G C sich entlang der Kreises \z\ = r > 1 bewegt, dann bewegt sich der Punkt w = z + z~^ entlang einer Ellipse mit Zentrum in Null und Foki in ±2. b) Wenn eine komplexe Zahl quadriert wird (genauer gesagt unter der Abbildung w I—> lip), dann wird eine derartige Ellipse auf eine Ellipse mit einem Fokus in 0 abgebildet, die zweimal durchlaufen wird. c) Bei der Quadrierung komplexer Zahlen wird jede in Null zentrierte Ellipse auf eine Ellipse mit einem Fokus in 0 abgebildet.
5.6 Beispiele zur Anwendung der DifFerentialrechnung in den Naturwissenschaften In diesem Abschnitt wollen wir einige Probleme aus den Naturwissenschaften untersuchen, die sich zwar in ihrer Forniulierung unterscheiden aber, wie wir sehen werden, eng verwandte mathematische Modelle besitzen. Dieses
302
5 Differentialrechnung
Modell ist kein anderes als eine sehr einfache DifFerentialgleichung der uns interessierenden Funktion. Die Untersuchung eines dieser Beispiele - das ZweiKorper Problem - fiihrte uns zur Konstruktion der Differentialrechnung. Eine nahere Untersuchung des dabei erhaltenen Gleichungssystems war zu der Zeit unnioglich. Nun werden wir einige Probleme betrachten, die mit unserem jetzigen Wissensstand vollstandig losbar sind. Abgesehen von dem Vergniigen mathematische Werkzeuge in einem Spezialfall angewendet zu sehen, werden wir aus der Reihe von Beispielen in diesem Abschnitt aufierdem zusatzliches Vertrauen ini Hinblick auf die Definition der Exponentialfunktion exp x gewinnen und zwar sowohl wegen der Natiirlichkeit mit der die auftritt, als auch beziiglich ihrer Erweiterung ins Komplexe. 5.6.1 Bewegung eines Korpers mit veranderlicher Masse Wir betrachten eine Rakete, die sich geradlinig in den Raum bewegt und dabei weit von anziehenden Korpern entfernt ist (Abb. 5.33).
ruR
rtiT
Abb. 5.33. Sei M{t) die Masse der Rakete (inklusive des Treibstoffs) zur Zeit t, V{t) ihre Geschwindigkeit zur Zeit t und w die Geschwindigkeit (relativ zur Rakete), mit der der Treibstoff aus der Raketendiise bei Verbrennung austritt. Wir woUen eine Verbindung zwischen diesen GroBen herstellen. Mit diesen Annahmen konnen wir die Rakete mit Treibstoff als ein abgeschlossenes System betrachten, dessen Impuls (Bewegungsgrofie) mit der Zeit erhalten bleibt. Zur Zeit t betragt der Impuls des Systems M{t)V{t). Zur Zeit t + h betragt der Impuls der Rakete mit dem verbliebenen Treibstoff M{t + h)V{t + h), und der Impuls AI der in dieser Zeit ausgestofienen Masse \AM\ = \M{t + h)- M{t)\ = -{M{t + h)- M{t)) liegt zwischen den Grenzen {y{t) - uj)\AM\ < AI < {y{t + h)- uj)\AM\ , d.h. AI = {V{t) - uj)\AM\ + a{h)\AM\. Aus der Stetigkeit von V{t) folgt, dass a{h) -^ 0 iiir h ^ 0. Wenn wir die Impulse des Systems zu den Zeiten t und t + h gleichsetzen, erhalten wir M{t)V(t)
=M{t + h)V(t + h) + {V(t) - uj)\AM\ + a(h)\AM\
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften und nach Einsetzen von \AM\ ergibt sich:
= —(^M{t + h) — M{t))
303
und Vereinfachungen
M(t + h){V(t + h) - V{t)) = = -uj{M(t
+ h) -M{t))
+a{h){M(t
+ h)-M{t))
.
Die Division dieser letzten Gleichung durch h und Ubergang zum Grenzwert fiir h ^ 0 liefert M{t)V'{t) = -ujM'(t) . (5.136) Dies ist die Beziehung zwischen V{t), M{t) und ihren Ableitungen, nach der wir gesucht haben. Mit Hilfe dieser Gleichung zwischen ihren Ableitungen miissen wir nun die eigentliche Beziehung zwischen den Funktionen V{t) und M{t) finden. Ini Allgemeinen ist dies in dieser Reihenfolge schwerer als die Beziehung zwischen den Ableitungen aufzustellen, wenn wir bereits die Beziehung zwischen den Funktionen kennen. In unsereni Fall besitzt das Problem jedoch eine voUstandig elementare Losung. Tatsachlich konnen wir nach Division von (5.136) durch M{t) diese Gleichung unischreiben zu V'{t) = {-ujhiM)'{t) . (5.137) Sind aber die Ableitungen zweier Funktionen auf einem Intervall gleich, dann konnen sich die Funktionen selbst auf diesem Intervall hochstens urn eine Konstante unterscheiden. Daher folgt aus (5.137), dass V{t) = -uj\nM{t)+c.
(5.138)
Ist etwa die Geschwindigkeit V{Q) = VQ zur Zeit t = 0 bekannt, so wird durch diese Anfangsbedingung die Konstante c vollstandig bestimmt, denn wir erhalten dann aus (5.138), dass c = Vo
+uj\nM{{])
und wir konnen daraus die gesuchte FormeP^ bestimmen: V(t) = V^+u^\nj^.
(5.139)
Ist TTT-R die Masse der Raketenhiille und TTT-T die Masse des Treibstoffs und V die Endgeschwindigkeit, die die Rakete nach Verbrennung alien Treibstoffs ^® Diese Forniel wird manchmal mit deni Namen von K. E. Tsiolkowski (1857-1935), einem russischen Wissenschaftler und Begriinder der Theorie des Raumflugs, in Zusammenhang gebracht. Es hat aber den Anschein, dass sie im Jahre 1897 zuerst durch den russischen Fachmann fiir theoretische Mechanik, I. V. Meshcherski (1859-1935), in einer Studie zur Dynamik eines Punktes mit veranderlicher Masse formuliert wurde.
304
5 Differentialrechnung
erreicht, dann erhalten wir nach Substitution von M(0) =
TTT-R
+
TOT
und
M{t) = TTT-R, dass
Diese letzte Gleichung zeigt sehr deutlich, dass die Endgeschwindigkeit nicht so sehr vom Verhaltnis TTT-T/WR im Logarithmus abhangt als von der Austrittsgeschwindigkeit uj, die von der Art des Treibstoffs abhangt. Aus dieser Formel folgt insbesondere, dass fiir Vb = 0 folgende Treibstoffmenge vorhanden sein muss, um eine Rakete mit Eigenmasse mn auf die Geschwindigkeit V zu beschleunigen: mT =
TOR
(e^/- - l) .
5.6.2 Die barometrische Hohenformel Dies ist die Bezeichnung fiir die Formel, die die Abhangigkeit des atmospharischen Drucks von der Hohe iiber dem Meeresspiegel angibt. Sei p{h) der Druck in der Hohe h. Da p{h) dem Gewicht der Luftsaule auf einer Flache von 1 cm^ in der Hohe h entspricht, folgt, dass sich p{h + A) von p{h) um das Gewicht der Luftsaule im Quader mit der Grundflache 1 cm^ und der Hohe A unterscheidet. Sei p{h) die Dichte der Luft in der Hohe h. Da p{h) stetig von h abhangt, konnen wir annehmen, dass die Masse dieser Luftmenge durch die Formel piO [g/cm^] • 1 [cm2] . A [cm] = pi^A [g] wiedergegeben wird, wobei ^ eine Hohe zwischen h und h + A ist. Daher ist das Gewicht dieser Masse^® g • p{£,)^Somit ist p(h + A)-p(h) = -gp(0^Nach Division dieser Gleichung durch A und Ubergang zum Grenzwert fiir A ^ 0 und Beriicksichtigung von ^ —>• /i erhalten wir p'ih) = -gp{h) .
(5.140)
Somit ist die Veranderung des atmospharischen Drucks zur Dichte der Luft in der entsprechenden Hohe proportional. Wir erhalten eine Gleichung fiir die Funktion p{h), wenn wir die Funktion p{h) aus (5.140) ehminieren. Nach dem Gesetz von Clapeyron^^ (das ideale ^® Innerhalb des Bereichs, in dem die Atmosphare spiirbar ist, konnen wir g als Konstante betrachten. ^° B. P. E. Clapeyron (1799-1864) - franzosischer Physiker mit Thermodynamik als Spezialgebiet.
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
305
Gasgesetz) hangen der Druck p, das molare Volumen V und die Temperatur T (in Kelvin^^) folgenderniaBen zusanimen: ^ = R ,
(5.141)
wobei R die sogenannte universelle Gaskonstante ist. Bezeichnet M die Masse eines Mols Luft und V sein Volumen, dann ist p = y-, so dass wir mit (5.141) 1 Wenn wir A = ^T
M R
R
setzen, ergibt sich also: p = X{T)p.
(5.142)
Wenn wir nun davon ausgehen, dass die Temperatur der Luftschicht, die wir beschreiben wollen, konstant ist, erhalten wir schlieBlich aus (5.140) und (5.142), dass
P'{h) = --fpC.)
(5.143)
Diese Differentialgleichung kann als
p'ih) p{h)
9 A
oder als {\np)'{h) =
(-!' geschrieben werden. woraus wir folgern , dass \np{h) = - 9i, , bzw. p(h) = e' • e-^s/X)h Der Faktor e" lasst sich aus der bekannten Anfangsbedingung p(0) = po zu e" = PQ bestimmen. Somit gelangen wir zu folgender Abhangigkeit zwischen Druck und Hohe: p = PQe-^B/X)h ^
(5;^44)
Fiir Luft mit R a u m t e m p e r a t u r (etwa 300 K = 27° C) ist der Wert von A bekannt: A K, 7, 7 • 10* (cm/s)^. Aufierdem wissen wir, dass g K, lO^cm/s^. Wenn wir diese Zahlenwerte fiir g und A einsetzen, nimmt (5.144) seine endgiiltige Form an. Insbesondere konnen wir aus (5.144) erkennen, dass der Druck um den Faktor e ( « 3) abnimmt, wenn wir auf eine Hohe von 1 0 ^cm = 7,7 km steigen. Der Druck nimmt um denselben h = A — = 7 , 7 - 10 Faktor zu, falls m a n in einem Minenschacht um etwa 7, 7 km absteigt. W. Thomson (Lord Kelvin) (1824-1907) - beriihmter britischer Physiker.
306
5 Differentialrechnung
5.6.3 Radioaktiver Zerfall, Kettenreaktionen und Kernreaktoren Es ist bekannt, dass die Kerne schwerer Elemente zu sporadischem (spontanem) Zerfall neigen. Dieses Phanomen wird natiirliche Radioaktivitdt genannt. Das hauptsachliclie statistische Gesetz fiir die Radioaktivitat (das dementsprechend fiir nicht zu geringe Mengen und Konzentrationen einer Substanz zutrifft) besagt, dass die Zahl der Zerfallsvorgange in einem kleinen Zeitintervall h, das zur Zeit t beginnt, zu h und zur Zahl N{t) der Atome der Substanz, die bis zur Zeit t nicht zerfallen sind, proportional ist, d.h. N{t + h)-
N(t) « -XN(t)h
,
wobei A > 0 ein numerischer KoefRzient ist, der fiir das jeweilige chemische Element charakteristisch ist. Daher erfiillt die Funktion N{t) die nun bekannte Differentialgleichung N'{t) = -XN{t)
,
(5.145)
aus der folgt, dass N{t) = Noe- -\t wobei No = N{0) die Anfangszahl der Atome der Substanz ist. Die Zeit T bis zu der die Halfte der anfanglichen Anzahl von Atomen zerfallen ist, wird Halbwertszeit der Substanz genannt. Die Gr6i3e T lasst sich aus der Gleichung e""^-^ = ^ bestimmen, d.h. T = ^^ « ^ ^ . So ist beispielsweise fiir Polonium-210 (Po^^°) die Halbwertszeit ungefahr 138 Tage, fiir Radium226 (Ra^^®) T « 1600 Jahre, fiir Uran-235 (U^^S) T « 7,1 • 10^ Jahre und fiir sein Isotop U^^s T « 4, 5 • 10^ Jahre. Eine Kernreaktion ist eine Wechselwirkung von Kernen oder eines Kerns mit Elementarteilchen, die zum Entstehen eines neuen Kerns fiihrt. Dies kann die Kernfusion sein, bei der die Verschmelzung leichter Kerne zur Bildung schwererer Kerne fiihrt (z.B. zwei Kerne schweren Wasserstoffs - Deuterium ergeben einen Heliumkern unter Freisetzung von Energie). Es kann auch der Zerfall eines Kerns sein und die Bildung eines oder mehrerer Kerne leichterer Elemente. Insbesondere tritt ein derartiger Zerfall in ungefahr der Halfte der Falle ein, wenn ein Neutron auf einen U^^^ Kern trifft. Der Zerfall des Uraniumkerns fiihrt zur Bildung von 2 oder 3 neuen Neutronen, die dann mit weiteren Kernen in Wechselwirkung treten konnen, was dazu fiihrt, dass diese zerfallen, was eine weitere Multiplikation der Zahl der Neutronen bewirkt. Eine Kernreaktion dieser Art wird Kettenreaktion genannt. Wir werden ein theoretisches mathematisches Modell fiir eine Kettenreaktion eines radioaktiven Elements beschreiben, um die Veranderung der Zahl N(t) der Neutronen als eine Funktion der Zeit zu bestimmen. Wir nehmen an, dass die Substanz Kugelform mit Radius r besitzt. Ist r nicht zu klein, werden einerseits neue Neutronen im Zeitintervall h beginnend zur Zeit t erzeugt. Deren Zahl ist zu h und N{t) proportional. Andererseits
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
307
gehen auch einige der Neutronen fiir die Reaktion verloren, wenn sie sich aui3erhalb der Kugel bewegen. 1st V die Geschwindigkeit der entstehenden Neutronen, dann konnen nur solche Neutronen die Kugel in der Zeit h verlassen, die innerhalb der Entfernung vh des Randes liegen. Von diesen allerdings nur die, deren Bewegungsrichtung ungefahr in Richtung des Radiusvektors zeigt. Wenn wir annehmen, dass diese Neutronen einen festen Anteil aller Neutronen in der Kugel ausmachen und dass Neutronen ungefahr gleichformig in der Kugel verteilt sind, konnen wir sagen, dass die Zalil der verlorenen Neutronen ini Zeitintervall h zu N{t) und zum Verhaltnis zwisclien dem Volumen der Randschicht und dem Volumen der Kugel proportional ist. Das eben Gesagte fiihrt uns zu der Gleichung N{t + h)- N{t) « aN{t)h - -N{t)h (5.146) r (da das Volumen der Randschicht etwa Airr'^vh betragt und das Volumen der Kugel f^rr^ ist). Dabei hangen die Koeffizienten a und /3 nur von der vorliegenden radioaktiven Substanz ab. Nach Division mit h und Ubergang zum Grenzwert in (5.146) fiir /i —^ 0 erhalten wir o N'{t)=[a--jN{t) (5.147) und daraus N{t) = No exp
(«-7>}
Aus dieser Formel konnen wir erkennen, dass fiir (ct — f) > 0 die Zahl der Neutronen mit der Zeit exponentieU anwachst. Die Art dieses Anwachsens ist unabhangig von der Anfangsbedingung A^o derart, dass die Substanz praktisch in einem sehr kurzen Zeitintervall voUig zerfallt und dabei eine ungeheure Energiemenge freigesetzt wird - dies fiihrt zu einer Explosion. Ist (a — f ) < 0, schwacht sich die Reaktion sehr schneU ab, da mehr Neutronen verloren gehen als erzeugt werden. Fiir den Fall dazwischen, d.h. a — ^ = 0 , beobachtet man ein Gleichgewicht zwischen der Erzeugung von Neutronen und ihrem Verlust fiir die Reaktion, wodurch die Zahl der Neutronen ungefahr gleich bleibt. Der Wert r, fiir den a — ^ = 0, wird kritischer Radius und die Masse der Substanz im Kreis dieses Volumens wird kritische Masse der Substanz genannt. Fiir U^^^ liegt der kritische Radius bei etwa 8, 5 cm und die kritische Masse bei etwa 50 kg. In Kernreaktoren, in denen durch eine Kettenreaktion einer radioaktiven Substanz Dampf erzeugt wird, gibt es eine kiinstliche Neutronenquelle, die das spaltbare Material mit einer gewissen Anzahl n von Neutronen pro Einheitszeit versorgen. Daher andert sich fiir einen Atomreaktor die Gleichung (5.147) etwas zu: N'{t)=
(a--)N{t)+n.
(5.148)
308
5 Differentialrechnung
Diese Gleichung kann auf dieselbe Weise gelost werden wie (5.147), da (a-p%)N(t)+n der Ableitung der Funktion ^ ; ^ In [{a - f)N(t) + n] fiir a — ^ ^ 0 entspricht. Folglich besitzt die Losung von (5.148) die Form C ]Voe("-/5/^)* - ^ ^ [1 - e("-'3/'-)*] fur a - f ^ 0 , N{t) = \ I No+nt fiir a - f = 0 . An dieser Losung konnen wir sehen, dass fiir cc — -^ > 0 (iiberkritische Masse) eine Explosion auftritt. 1st die Masse unterkritisch, d.h. a — ^ < 0, wird der Vorgang sehr rasch zu
Nit) #-a gelangen. Wird daher die Masse der radioaktiven Substanz im unterkritischen Bereich aber nahe an der kritischen Masse gehalten, dann erhalten wir unabhangig von der Starke der zusatzlichen Neutronenquelle, d.h. unabhangig von n, hohere Werte von N(t) und folglich grofiere Energie aus deni Reaktor. Es ist sehr heikel, den Prozess im unterkritischen Bereich zu halten, und es ist in der Praxis nur durch sehr komplizierte automatische KontroUsysteme moglich. 5.6.4 In der Atmosphare fallende Korper Wir wollen uns nun mit einem Korper und seiner Geschwindigkeit v{t) beschaftigen, der unter dem Einfluss der Schwerkraft auf die Erde fallt. Gabe es keinen Luftwiderstand, wiirde die Gleichung v{t) = g
(5.149)
fiir einen Fall aus relativ niedriger Hohe gelten. Diese Beziehung ergibt sich aus dem zweiten Newtonschen Gesetz ma = F und dem allgemeinen Gesetz der Schwerkraft, aufgrund dessen fiir /i
Mm
Ein sich in der Atmosphare bewegender Korper erfahrt einen Widerstand, der von der Geschwindigkeit der Bewegung abhangt. Als Folge davon steigt die Geschwindigkeit eines schweren Korpers im freien Fall in der Atmosphare nicht beliebig an, sondern stabilisiert sich auf einem Niveau. So erreicht etwa ein Fallschirmspringer in den unteren Schichten der Atmosphare eine konstante Geschwindigkeit zwischen 50 und 60 Meter pro Sekunde. Fiir den Geschwindigkeitsbereich zwischen 0 und 80 Meter pro Sekunde werden wir annehmen, dass der Luftwiderstand zur Geschwindigkeit proportional ist. Die Proportionalitatskonstante hangt natiirhch von der Gestalt des
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
309
Korpers ab. Manchnial gibt man dieseni Korper Stronilinienform (eine Bombe) , wohingegen in anderen Fallen das entgegengesetzte Ziel verfolgt wird (ein Fallscliirm). Wenn wir die Krafte, die auf den Korper wirken, gleicli setzen, dann gelangen wir zu folgender Gleicliung, die fiir einen in der Atmospliare frei fallenden Korper erfiillt sein muss: mv{t) = mg — av .
(5.150)
Wir teilen diese Gleichung durcli m, bezeichnen ^ mit /3 und erhalten so: i,{t) = -pv+g
.
(5.148')
Wir sind dabei zu einer Gleichung gelangt, die sich von (5.148) nur durch die Schreibweise unterscheidet. Wenn wir —(]v{t) + g = f{t) setzen, dann erhalten wir aus (5.148'), da /'(t) = —(]v'{t), die aquivalente Gleichung
fit) = -pf(t) , die abgesehen von der Schreibweise mit (5.143) und (5.145) iibereinstimmt. Somit fiihrt uns auch dieses Problem auf eine Gleichung, die als Losung die Exponentialfunktion fit) = /(0)e-'3* besitzt. Daraus folgt, dass die Losung von (5.148')
vit) = ^g+ {vo - | )e-/3t lautet, woraus sich die folgende Losung der Grundgleichung (5.150) ergibt: vit) = -g+
(vo - -g)e-("/™)* .
(5.151)
Dabei ist VQ = w(0) die vertikale Anfangsgeschwindigkeit des Korpers. Aus (5.151) konnen wir ersehen, dass ein in der Atmosphare fallender Korper fiir a > 0 einen stationaren Zustand erreicht, in dem vit) « —g. Im Unterschied zum freien Fall im luftleeren Raum hangt daher die Fallgeschwindigkeit nicht nur von der Form des Korpers, sondern auch von seiner Masse ab. Fiir a ^ 0 strebt die rechte Seite von (5.151) gegen VQ + gt, d.h. zur Losung von (5.149), die wir fiir a = 0 aus (5.150) erhalten. Mit Hilfe von Gleichung (5.151) konnen wir eine Vorstellung davon bekommen, wie schnell die Grenzgeschwindigkeit beim Fall in der Atmosphare erreicht wird. Wird z.B. ein Fallschirm von einer Person mit Durchschnittsgewicht nach einem freien Fall, bei dem der Springer eine Geschwindigkeit von ca. 50 Meter pro Sekunde erreicht hat, geoffnet, dann wird die Geschwindigkeit drei Sekunden nach Offnung des Schirms bei ungefahr 12 Meter pro Sekunde liegen.
310
5 Differentialrechnung
falls der Schirm fiir eine Fallgeschwindigkeit von etwa 10 Meter pro Sekunde entworfen wurde. Tatsachlich erhalten wir mit den eben angefiihrten Daten und Gleichung (5.151), dass ^g « 10, -^ « 1 und VQ = 50m/s, so dass (5.151) die Form v{t) = 10 + 40e-* annimmt. Da e^ « 20, erhalten wir fiir t = 3, dass v « 12m/s. 5.6.5 Die Zahl e und ein erneuter Blick auf die Funktion exp a; An Beispielen haben wir gezeigt (vgl. auch die Ubungen 3 und 4 am Ende dieses Abschnitts), dass eine Vielzahl natiirlicher Phanomene mathematisch durch dieselbe Differentialgleichung beschrieben werden kann, namlich fix)
= afix) ,
(5.152)
deren Losung f{x) eindeutig bestimmt ist, wenn die „Anfangsbedingung" /(O) angegeben wird. Dann ist
fix) = /(0)e"- . Wir haben friiher die Zahl e und die Funktion e* = exp x sehr formal eingefiihrt, indem wir dem Leser versichert haben, dass e wirklich eine wichtige Zahl ist und exp a; wirklich eine wichtige Funktion. Nun ist klar, dass selbst dann, wenn wir diese Funktion nicht schon friiher bekannt gemacht hatten, es nun notwendig gewesen ware, sie als Losung der wichtigen und doch einfachen Gleichung (5.152) einzufiihren. Genauer gesagt, hatte es geniigt, die Funktion zu bestimmen, die (5.152) fiir einen gewissen Wert von a, z.B. a = 1, lost. Denn die allgemeine Gleichung (5.152) kann auf diesen Fall reduziert werden, wenn wir zu einer neuen Variable t iibergehen, die mit x durch x = —, (a j^ 0) verbunden ist. Tatsachlich erhalten wir so
at
und anstelle der Gleichung f'{x) = af{x) Oder F'{t) = F(t). Daher woUen wir die Gleichung fix)
= fix)
gelangen wir zu aF'{t) = aF{t)
(5.153)
betrachten und die Losung dieser Gleichung, die /(O) = 1 erfiillt, mit exp a; bezeichnen. Wir woUen priifen, ob diese Definition mit unserer vorigen Definition von exp a; iibereinstimmt.
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
311
Dazu woUen wir den Wert von f{x) beginnend bei /(O) = 1 berechnen und dabei annehmen, dass / (5.153) erfiillt. Da / differenzierbar ist, ist / auch stetig. Aber dann folgt aus (5.153), dass f'{x) ebenfalls stetig ist. Aui3erdem folgt aus (5.153), dass / auch eine zweite Ableitung f"{x) = f'{x) besitzt und dass / im AUgemeinen beliebig oft differenzierbar ist. Da die Veranderungsrate f'{x) der Funktion f{x) stetig ist, verandert sich die Funktion / ' , wenn sich ihre Argumente in eineni kleinen Intervall h verandern, nur sehr wenig. Daher ist f{xo + h) = f{xo) + /'(^)/i ~ f{xo) + f'{xo)h. Wir woUen diese Naherungsformel benutzen und das Intervall von 0 bis x in kleinen Schritten der Grofie /i = ^, n € N abschreiten. Mit XQ = Q und a;fc+i = Xk + h soUten wir fixk+i) « f{xk) + f'{xk)h erhalten. Wenn wir (5.153) und die Bedingung /(O) = 1 beriicksichtigen, ergibt sich f{x) = f{Xn) « fiXn-l) = !{Xn-l){l
+ f'{Xn-l)h
+ h)^
= f{Xn-2)il
=
[l{Xn-2) + f {Xn-2)h){l + h) =
+ hf^---^
f{xo)il
+ hr =
= /(0)(l +
ft)"=(l
+ ^)".
Es scheint trivial (und dies kann bewiesen werden), dass die Naherung in der Formel f{x) K, (l + f ) umso genauer ist, je kleiner die Schrittweite h = ^ ist. Daher gelangen wir zu der Folgerung, dass
fix) = hm (1 + - )
.
Insbesondere werden wir, falls wir die Gr6i3e / ( I ) = lim (l + - ) " mit e bezeichnen und zeigen, dass e 7^ 1, erhalten, dass fix) = lim (l + -Y
= lim(l + tY/^ = lim [(1 + t^/^V
= (f ,
(5.154)
da wir wissen, dass u" -^ v" fiir u ^ v. Auf diese Weise losen wir (5.153) numerisch, wodurch wir zu (5.154) gelangen. Diese Methode wurde vor langer Zeit von Euler vorgeschlagen und eulersches Polygonzugverfahren genannt. Dieser Name hangt mit der geometrischen Bedeutung der so ausgefiihrten Berechnungen zusammen. Denn die Losung f{x) (oder besser ihr Graph) der Gleichung wird durch einen Naherungsgraphen ersetzt, der aus aneinander gesetzten Strecken besteht, die auf den entsprechenden abgeschlossenen Intervallen [xk,Xk+i] (fc = 0 , . . . ,n — 1) durch die Gleichungen y = f{xk) + f'{xk){x — Xk) gegeben werden (vgl. Abb. 5.34).
312
5 Differentialrechnung
0 h 2h A b b . 5.34.
Wir sind bereits auf die Definition der Funktion exp x als Summe der Pooo
tenzreihe ^
^ x " gestoi3en. Diese Definition konnen wir auch aus (5.153)
n=0
erhalten, wenn wir die haufig angewendete Methode der unbestimmten Koejfizienten anwenden. Wir suchen nach einer Losung von (5.153) als Summe einer Potenzreihe f{x)
= Co + CiX + • • • + CnX" +
(5.155)
deren Koeffizienten bestimmt werden soUen. Wie wir gesehen haben (vgl. Satz 6 in Abschnitt 5.5), folgt aus (5.155), dass c„ = ^ ^ ^ . Nach (5.153) ist aber /(O) = /'(O) = • • • = /(")(0) = • • • und da /(O) = 1, ist c„ = -^. Daher ist, falls /(O) = 1 und die Losung die Gestalt (5.155) besitzt, notwendigerweise:
fi^)
1
1 7X" + • •
1 + Yi^ + ^^^ +
Wir batten unabhangig davon zeigen konnen, dass die Funktion, die durch diese Reihe definiert wird, tatsachlich differenzierbar ist (und nicht nur in X = 0) und dass sie (5.153) und die Anfangsbedingung /(O) = 1 erfiillt. Wir werden uns jedoch nicht bei diesem Punkt aufhalten, da wir nur zum Ziel hatten, zu priifen, ob die Losung von (5.153) mit der Anfangsbedingung /(O) = 1 damit iibereinstimmt, was wir bisher mit der Funktion exp a; gemeint haben. Wir merken an, dass (5.153) in der komplexen Ebene hatte untersucht werden konnen, d.h., wir batten x als beliebige komplexe Variable betrachten konnen. Dabei bleiben die angestellten Uberlegungen giiltig, obwohl die geometrische Intuition des Eulerschen Verfahrens verloren geht. Daher erwarten wir, dass die Funktion 1
1 1!
1 2! z' +
die natiirliche Losung der Gleichung
1
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
313
fiz) = f{z) ist, die die Bedingung /(O) = 1 erfiillt. 5.6.6
Schwingungen
Wenn ein an einer Feder hangender Korper aus seiner Gleichgewichtslage ausgelenkt wird, indem er beispielsweise angehoben und dann losgelassen wird, dann wird er um seine Gleichgewichtslage schwingen. Angenonimen, eine Kraft wirke auf eine P u n k t m a s s e m, die sich frei entlang der a;-Achse bewegen kann. Diese Kraft F = —kx ist zur Auslenkung des P u n k t e s proportional^^. Wir woUen ferner annehmen, dass wir die Anfangsposition XQ = a;(0) der P u n k t m a s s e und ihre Anfangsgeschwindigkeit VQ = a;(0) kennen. Wir suchen nach der Abhangigkeit x = x{t) der Position des P u n k t e s niit der Zeit. Nach deni Newtonschen Gesetz kann das Problem in der folgenden, rein mathematischen Gestalt geschrieben werden: mx{t)
= -kx{t)
(5.156)
mit den Anfangsbedingungen XQ = a;(0) und x{0) = VQ. Wir woUen (5.156) als x{t) + —x{t) m
= 0
(5.157)
neu schreiben und wiederum versuchen, die Exponentialfunktion zu benutzen. Wir wollen insbesondere die Zahl A so wahlen, dass die Funktion x{t) = e'^* Gleichung (5.157) erfiillt. Mit der Substitution x{t) = e"^* in (5.157) erhalten wir
V
mJ
oder A^ + - = 0 , m
(5.158)
d.h., Ai = —\/ — ^ und A2 = \/ — ^- Da m > 0, erhalten wir fiir fc > 0 zwei imaginare Zahlen Ai = —\\— und A2 = U/ — • Wir b a t t e n mit dieser Moglichkeit nicht gerechnet; wir wollen unsere Untersuchung jedoch fortsetzen. Laut den Eulerschen Fornieln gilt ^^ Im Fall einer Feder wird der Koeffizient fc > 0, der die Starke der Feder charakterisiert, auch Elastizitdtsmodul genannt.
314
5 Differentialrechnung ^—'i^Jkjrat _ AWk/nit
_
k_ m
COS
A
COS
m
ism
—t m
ism
A
und
m
Da DiflFerenzieren nach der reellen Variablen t bedeutet, dass die Real- und die Imaginarteile der Funktion e"^* jeder fiir sich differenziert wird, muss (5.157) von beiden Funktionen cos\/^t und sm\/^t erfiillt werden. Und dies trifft tatsachlich zu, wie sich direkt zeigen lasst. Somit haben wir mit Hilfe der Exponentialfunktion zwei Losungen von (5.157) erhalten und jede Linearkombination a;(t) = ci cos \ / — t + C2 sin \ / — t (5.159) Vm Vm dieser beiden Losungen ist oflFensichtlich ebenso eine Losung von (5.157). Wir wahlen die Koeffizienten ci und C2 in (5.159) aus den Bedingungen Xo
a;(0) i;(0)
c\
und c\
t + C2
sm
cos
C2 t=0
Daher ist die Funktion x(i) = Xo cos
A
•Wo
m
k_
(5.160)
m
m
die gesuchte Losung. Mit Hilfe von Standardumformungen konnen wir (5.160) in der Gestalt x{t)
9
Xn +
oTn WQ
.
— sm
k —t + a m
(5.161)
schreiben, wobei Xo
arcsm "-0 ^
,,2 m '^O fc
Daher wird die P u n k t m a s s e fiir fc > 0 periodische Schwingungen mit der Periode T = l-K^f^ ausfiihren, d.h. mit der Frequenz ^ = ^ \ j ^ Amplitude \lx\
und der
+ W Q ^ . Wir konnen diese Aussagen machen, da aus physika-
lischen Griinden klar ist, dass die Losung (5.160) eindeutig ist (vgl. Aufgabe 5 am Ende dieses Abschnitts). Die durch (5.161) beschriebene Bewegung wird einfache harmonische Schwingung genannt und (5.157) als Gleichung eines einfachen harmonischen Oszillators bezeichnet.
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
315
Wir wollen uns nun dem Fall fc < 0 in (5.158) zuwenden. Dann sind die Funktionen e'^^* = exp ( — \/——t) und e"^^* = exp {\/——t) reelle Losungen von (5.157) und niit ihnen auch die Funktion a;(t) =cie^i*+C2e^=^* .
(5.162)
Die Konstanten ci und C2 konnen wir aus den Bedingungen XQ
= x{0) = ci + C2
und
Wo = i;(0) = ciAi + C2A2 bestimmen. Dieses Gleichungssystem besitzt immer eine eindeutige Losung, da seine Determinante A2 — Ai ungleich Null ist. Da die Zahlen Ai und A2 ungleiches Vorzeichen haben, konnen wir an (5.162) erkennen, dass die Kraft F = —kx fiir fc < 0 nicht nur keine Anstalten macht, den Punkt in seine Gleichgewichtslage in a; = 0 zuriickzubringen, sondern stattdessen den Punkt mit der Zeit unendlich weit aus der Gleichgewichtslage bringt, falls XQ oder VQ ungleich Null sind. In diesem Fall ist a; = 0 also ein instabiler Gleichgewichtspunkt. Zum Abschluss wollen wir eine sehr natiirliche Veranderung von (5.156) betrachten, die die Niitzlichkeit der Exponentialfunktion und der Eulerschen Formeln, die eine Verbindung zwischen den wichtigen Elementarfunktionen herstellt, sogar noch deuthcher macht. Wir wollen annehmen, dass sich das betrachtete Teilchen in eineni Medium (Luft oder eine Fliissigkeit) bewegt, dessen Widerstand nicht vernachlassigbar ist. Angenommen, die Widerstandskraft sei zur Geschwindigkeit des Punktes proportional. Dann miissen wir anstelle von (5.156) mx{t) = —ax{t) — kx{t) schreiben, was wir zu x{t) + —x(t) + -x{t) = 0 (5.163) m m umformen. Wenn wir wiederum eine Losung der Form x{t) = e^^ suchen, gelangen wir diesmal zur quadratischen Gleichung
A^ + —A+ — = 0 , m
m
deren Nullstellen Ai 2 = -15^ ± ^»\-^"''' lauten. Fiir d — Amk > 0 erhalten wir zwei reelle Nullstellen Ai und A2 und die Losung ist mit (5.162) identisch. Wir wollen den interessanteren Fall fiir a^ — Amk < 0 etwas genauer untersuchen. Beide Nullstellen Ai und A2 sind dann komplex, aber nicht rein imaginar:
316
5 Differentialrechnung Ai = A2 =
a 2m
a
. \/4mfc — a^ 1 2m
una
. \/4mfc
- : ^ + i 2m
2m
In diesem Fall liefert uns die Eulersche Formel I-! X I I ( I — - — 1 1 (cos (jjt — i sin ujt) exp 2m
gA2t
und
6xp ( — 7;—t ] (cos Lot + i sin cot) \ 2m /
mit w = ^/4mk" m " • Somit gelangen wir zu den beiden reellen Losungen exp ( — 2 ^ ) coscot und exp ( — 2 ^ ) sinwt von (5.163), die wir nur schwerlicli erraten batten. Nun sucben wir eine Losung der Ausgangsgleicbung als Linearkombination dieser beiden: x{t) = exp ( t](ci cosujt + C2 sinwt) . (5.164) V 2m / Dabei wablen wir ci und C2 so, dass die Anfangsbedingungen a;(0) = XQ und a;(0) = VQ erfiillt werden. Das sicb ergebende lineare Gleichungssystem besitzt, wie sich zeigen lasst, immer eine eindeutige Losung. Nacb einigen Umformungen erhalten wir die Losung des Problems (5.164) in folgender Form: x(t) = A exp ( 1] siniujt + a) , (5.165) V 2m / wobei A und a Konstanten sind, die durch die Anfangsbedingungen bestimmt werden. Aufgrund des Faktors exp ( — ^t) sind die Schwingungen fiir a > 0 und m > 0 geddmpft, wobei die Dampfung der Amplitude vom Verhaltnis •=• abhangt. Dagegen andert sich die Frequenz der Schwingung ^ w = T~\/:^ — (o^) ATT
y
Til
\ Alii
nicht mit der Zeit. Die GroBe uj hangt ebenfalls von den
/
^^
Verhaltnissen — und ^ ab, was wir bereits in (5.163) b a t t e n erkennen konnen. Fiir a = 0 erhalten wir wiederum die ungedampfte harmonische Schwingung in (5.161) fiir (5.157). 5.6.7 U b u n g e n u n d A u f g a b e n 1. Effektivitdt eines Raketenantriebs. a) Sei Q die chemische Energie einer Einheitsmasse Raketentreibstoff und uj die Austrittsgeschwindigkeit des TreibstofFs. Dann ist |a;^ die kinetische Energie einer Einheitsmasse TreibstofFs nach Verbrennung. Der Koeffizient a in der Gleichung ^uj'^ = aQ bringt die EfFektivitat des Verbrennungs- und Ausstromprozesses des TreibstofFs zum Ausdruck. Fiir FestkorpertreibstofF (rauchFreies Pulver) ist a; = 2 km/s und Q = 1000 kcal/kg und Fiir fliissigen TreibstoFF (Benzin mit SauerstofF) a; = 3 km/s und Q = 2500 kcal/kg. Bestimmen Sie die EfFektivitat Q Fiir die beiden Alternativen.
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
317
b) Die EfFektivitat einer Rakete wird als das Verhaltnis ihrer endgiiltigen kinetischen Energie m a ^ zur chemischen Energie des Treibstoffs rmQ definiert. Stellen Sie niit Hilfe von (5.139) eine Forniel fiir die Effektivitat einer Rakete in Abhangigkeit von TUR, TUT, Q und a (vgl. Teil a)) auf. c) Bestimmen Sie die EfFektivitat eines Automobils niit einem Diisenmotor mit fliissigem TreibstofF, wenn das Automobil auF die in Stadten iibliche Geschwindigkeit 50 km/Std beschleunigt wird. d) Bestimmen Sie die EfFektivitat eines Raketenantriebs mit Fliissigem TreibstofF, der einen Satelliten in eine niedere UmlauFbahn um die Erde transportiert. e) Bestimmen Sie die Endgeschwindigkeit, Fiir die ein Raketenantrieb mit fliissigem TreibstoFF maximal effektiv ist. F) Welches Massenverhaltnis rriT/mR erzielt, unabhangig von der Treibstoffart, die hochstmogliche Effektivitat? 2. Die barometrische
Hohenformel.
a) Stellen Sie mit HilFe der Daten in Absatz 5.6.2 eine Formel Fiir einen Korrekturterm auF, der die Abhangigkeit des Drucks von der Temperatur der LuFtsaule beriicksichtigt. Die Temperatur darF sich dabei (abhangig von der Jahreszeit) im Bereich ±40° C bewegen. b) Benutzen Sie (5.144), um die Abhangigkeit des Drucks von der Erhohung der Temperatur von —40° C, 0° C und 40° C zu berechnen und vergleichen Sie diese Ergebnisse mit denen, die Sie durch ihre NaherungsFormel aus Teil a) erhalten. c) Angenommen, die LuFttemperatur in der Saule andere sich mit der Hohe nach dem Gesetz T'(ft) = —QTO, wobei To die LuFttemperatur auF der Erdoberflache ist und Q w 7 • 10~^cm~'^. Leiten Sie eine Formel Fiir die Abhangigkeit des Drucks von der Hohe unter diesen Bedingungen her. d) Bestimmen Sie den Druck in einer Mine in einer TieFe von 1 km, 3 km und 9 km mit HilFe von der in Teil c) auFgestellten Formel. e) LuFt besteht unabhangig von der Hohe etwa zu 1/5 aus Sauerstoff. Der Partialdruck von Sauerstoff betragt auch etwa 1/5 des LuFtdrucks. Fiir eine besondere Fischart darF der Partialdruck von Sauerstoff nicht unter 0,15 Atmospharen sinken. Kann man diese Spezies in einem Fluss auF Meereshohe finden? Kann man diese Spezies auch in einem Fluss finden, der in 3, 81 km Hohe in den Titicacasee miindet? 3. Radioaktiver Zerfall a) Durch Messung des Anteils radioaktiver Substanzen und ihrer ZerFallsprodukte in Erzproben der Erde kann unter der Annahme, dass urspriinglich keine ZerFallsprodukte vorlagen, das Alter der Erde (zumindest seit der Zeit, als das Erz entstand) bestimmt werden. Angenommen, in einem Stein seien m Gramm einer radioaktiven Substanz und r Gramm seines ZerFallsprodukts. Setzen Sie die Halbwertszeit T der Substanz als bekannt voraus und bestimmen Sie die Zeit, zu der der ZerFall begann, und den Betrag der radioaktiven Substanz in der Probe bei gleichem Volumen zur AnFangszeit. b) Radiumatome in einem Erz machen ungeFahr 10~^^ aller Atome aus. Wie hoch war der Radiumanteil vor 10^ 10" und 5 • 10® Jahren? (Das Alter der Erde wird auF etwa 5 • 10® Jahre geschatzt.)
318
5 Differentialrechnung
c) Bei der Diagnose von Nierenerkrankungen wird oft die Fahigkeit der Niere gemessen, aus dem Blut verschiedene absichtlich in den Korper eingefiihrte Substanzen wie z.B. Creatinin (der „Creatinin-clearence Test") zu entfernen. Bin Beispiel fiir einen umgekehrt verlaufenden Prozess ist die Wiederherstellung der Hamoglobinkonzentration im Blut eines Spenders oder bei eineni Patienten, der plotzlich eine grofle Menge Blut verloren hat. In all diesen Falle geliorcht die Abnalime der eingefiihrten Substanz (oder umgekehrt die Erzeugung einer geniigenden Menge) dem Gesetz A^ = iVoe"*^'', wobei N die Menge (in anderen Worten, die Zahl der Molekiile) der Substanz im Korper nach einer Zeit t nach der Einnahme der Menge No ist und T ist die sogenannte Lebensdauer: Die Zeit die vergangen ist, bis noch 1/e der urspriinglich eingenommen Menge im Korper ist. Die Lebensdauer ist, wie sich unschwer zeigen lasst, etwa 1,44 mal grofler als die Halbwertszeit, die der Zeit entspricht, die zur Abnahme auf die Halfte der Substanz benotigt wird. Angenommen, eine radioaktive Substanz verlasst den Korper niit einer durch die Lebensdauer TQ charakterisierten Zeit und gleichzeitig zerfalle sie spontan mit der Lebensdauer TZ. Zeigen Sie, dass in diesem Fall die Lebensdauer T, die die Zeit angibt, die die Substanz im Korper bleibt, durch die Beziehung T~^ = T^ + Tz~^ gegeben wird. d) Eine gewisse Blutmenge mit 201 mg Eisen sei einem Spender entnommen worden. Um diesen Verlust von Eisen zu kompensieren, wurden dem Spender Eisensulfattabletten verordnet, die eine Woche lang dreimal taglich eingenommen werden sollen. Jede Tablette enthalt 67 mg Eisen. Die Menge an Eisen im Spenderblut normalisiert sich exponentiell mit einer Lebensdauer von etwa sieben Tagen. Bestimmen Sie die ungefahre Menge an Eisen in den Tabletten, die vom Blut in einer Woche aufgenommen werden miissen, um die normale Eisenkonzentration im Blut wiederherzustellen. e) Eine bestimme Menge radioaktiven Phosphors P^^ wurde verabreicht, um bei einem Patienten einen bosartigen Tumor zu diagnostizieren. Danach wird in regelmafiigen Zeitabstanden die Radioaktivitat in der Haut des Oberschenkels gemessen. Die Abnahme der Radioaktivitat gehorcht einem exponentiellen Gesetz. Da die Halbwertszeit von Phosphor mit 14, 3 Tagen bekannt ist, ist es daher moglich, die Lebensdauer der abnehmenden Radioaktivitat durch biologische Ursachen zu messen. Bestimmen Sie diese Konstanten, falls bei der Beobachtung festgestellt wurde, dass die Lebensdauer fiir die Gesamtabnahme der Radioaktivitat 9,4 Tage (vgl. Teil c)) betrug. 4. Absorption von Strahlung. Durchqueren Strahlen ein Medium, wird ein Teil der Strahlung absorbiert. In vielen Fallen (lineare Theorie) kann man annehmen, dass die Absorption beim Durchgang durch eine Schicht, die zwei Einheiten dick ist, dieselbe ist wie die Absorption beim Durchqueren zweier Schichten mit Einheitsdicke. a) Zeigen Sie, dass die Absorption von Strahlung mit diesen Annahmen dem Gesetz / = /oe~*' geniigt, wobei /o die Strahlungsintensitat ist, die auf die absorbierende Substanz fallt, / ist die Intensitat nach dem Durchgang durch eine Schicht der Dicke / und k ist ein Koeffizient, dessen physikalische Dimension zur Lange in vers ist. b) Bei Lichtabsorption durch Wasser hangt der Koeffizient k von der Wellenlange des einfallenden Lichts etwa wie folgt ab: Fiir ultraviolettes Licht
5.6 Beispiele zur DifFerentialrechnung in den Naturwissenschaften
319
ist fc = 1,4- 10~^cm~'^, fiir blaues ist fc = 4, 6 • 10"''cm"'^, fiir griines k = 4, 4 • 10~^ cni~^ und fiir rotes k = 2,9 • 10~^ cni"'^. Sonnenlicht falle senkrecht auf die Oberflache eines klaren 10 Meter tiefen Sees. Vergleichen Sie die Intensitaten der oben angefiihrten Lichtkomponenten oberhalb der Wasserflache und am Grund des Sees. 5. Das Bewegungsgesetz eines Punktes x = x{t) erfiille die Gleichung m,x + kx = 0 der harmonischen Schwingung. Zeigen Sie: a) Die Groi^e E = IIl£iil + h£M
igt konstant {E = K + U ist die Summe der
kinetischen Energie K = '"'••'\^^'^> des Punktes und seiner potentiellen Energie U = ^ ^ zur Zeit t). b) Ist x{0) = 0 und a;(0) = 0, dann ist x{t) = 0. c) Es existiert eine eindeutige Bewegung x = x(t) mit den Anfangsbedingungen x(0) = xo und x{0) = vod) Bewegt sich der Korper in einem Medium mit Reibung und erfiillt x = x{t) die Gleichung mx + ax + kx = 0, a > 0, dann nimmt die Grolie E (vgl. Teil a)) ab. Bestimmen Sie die Abnahme und erklaren Sie die physikalische Bedeutung dieses Ergebnisses, wobei Sie die physikalische Bedeutung von E beriicksichtigen. 6. Bewegung nach dem Hookeschen^^ Gesetz (der ebene Oszillator). Um in Absatz 5.6.6 und fiir Aufgabe 5 Gleichung (5.156) fiir einen linearen Oszillator zu entwickeln, woUen wir die Gleichung mv(t) = —kr(t) betrachten, wobei r(i) der Radiusvektor einer Punktmasse m ist, die sich im Raum unter der Anziehung einer zentripetalen Kraft bewegt, die zum Abstand |r(t)| vom Zentrum proportional ist. Die Proportionalitatskonstante ist k > 0. Eine derartige Kraft tritt auf, wenn der Punkt mit einer elastischen Hookeschen Verbindung verbunden ist; etwa einer Feder mit Federkonstanten k. a) Zeigen Sie durch Ableitung des Vektorprodukts r(i) x r(t), dass die Bewegung in der Ebene ablauft, die durch das Zentrum, den Radiusvektor der Anfangsposition ro = r(to) und den Vektor der Anfangsgeschwindigkeit ro = r(to) festgelegt wird (ein ebener Oszillator). Sind die Vektoren ro = r(io) und ro = r(to) kollinear, dann verlauft die Bewegung entlang einer Geraden, die das Zentrum und den Vektor ro enthalt (der lineare Oszillator, der in Absatz 5.6.6 betrachtet wurde). b) Zeigen Sie, dass die Bahn eines ebenen Oszillators eine Ellipse bildet und dass die Bewegung periodisch ist. Bestimmen Sie die Periode. c) Zeigen Sie, dass die Grofie E = mr^(t) + kr^{t) erhalten bleibt (mit der Zeit konstant bleibt). d) Zeigen Sie, dass die Anfangsbedingungen ro = r(io) und ro = r(io) die nachfolgende Bewegung des Punktes vollstandig bestimmen. ^^ R. Hooke (1635-1703) - britischer Wissenschaftler, ein vielseitiger Gelehrter und Experimentator. Er entdeckte die Zellstruktur von Gewebe und fiihrte den Begriff Zelle ein. Er war einer der Vater der mathematischen Theorie der Elastizitat und der Wellentheorie des Lichts. Er stellte die Gravitationshypothese und das Gesetz der Gravitationswechselwirkung auf.
320
5 Differentialrechnung
7. EUiptizitdt von Planetenbahnen. Das vorige Beispiel erlaubt es, die Bewegung eines Punktes unter Einwirkung einer zentralen Hookeschen Kraft in einer Ebene zu betrachten. Angenommen, diese Ebene ist die Ebene der komplexen Variablen z = x + iy. Die Bewegung wird durch zwei reelle Punktionen x = x(t) und y = y(t) bestimmt, oder, was dasselbe ist, durch eine komplexe Punktion z = z{t) der Zeit t. Der Einfachheit halber nehnien wir in Aufgabe 6 an, dass m = 1 und fc = 1. Wir betrachten die einfachste Gleichungsform einer derartigen Bewegung z{t) = —z(t). a) Aus Aufgabe 6 wissen wir, dass die Losung dieser Gleichung mit den speziellen Anfangsdaten zo = z(to) und zo = z(to) eindeutig ist. Bestimmen Sie sie in der Porm z{t) = cie'* + C2e~'* und zeigen Sie wiederum mit Hilfe der Eulerschen Pormel, dass die Bahnkurve eine in Null zentrierte Ellipse ist. (In besonderen Pallen kann es ein Kreis werden oder zu einer Strecke entarten - bestimmen Sie diese.) b) Die Bewegung eines Punktes z{t) geniige der Gleichung z{t) = —z{t). Sei T ein (Zeit-)Parameter, der mit t durch die Beziehung T = T{t) verbunden ist, so dass ^ = |2;(i)|^. Zeigen Sie unter Beriicksichtigung der Invarianz von |i(t)|^ + |2;(i)|^ wahrend der Bewegung des Punktes z{t), dass der Punkt vj{t) = z'^{t) die .2
Bewegungsgleichung ^^^ = —c-r^ erfiillt, wobei c eine Konstante ist und w = w{t{T)]. Dies zeigt den Zusammenhang zwischen der Bewegung in einem zentralen Hookeschen Kraftfeld und der Bewegung in einem Newtonschen Gravitationsfeld. c) Vergleichen Sie dies mit dem Ergebnis aus Aufgabe 8 in Abschnitt 5.5 und beweisen Sie, dass Planetenbahnen Ellipsen sind. d) Palls Sie Zugang zu einem Computer haben, woUen wir uns nochmals dem eulerschen Polygonzugverfahren, das in Absatz 5.6.5 beschrieben wurde, zuwenden. Berechnen Sie zunachst verschiedene Werte von e^ nach diesem Verfahren. (Beachten Sie, dass dieses Verfahren nichts aufier der Definition des Differentials benutzt, bzw. genauer gesagt, die Pormel f{xn) ~ f{xn-i) + f'{xn-i)h fiir 1^ — Xn
Xn—\.)
Nun sei r(t) = [x{t),y{t)^,
ro = r(0) = (1,0), ro = r(0) = (0,1) und i^(t) =
— , v* a. Berechnen Sie mit Hilfe der Pormeln r{tn) w r(t„_i) + v(t„_i)/i
und
v(t„) K, v(t„_i)-|-a(t„_i)/i , mit v(t) = r(t) und a(i) = v(t) = f(t), die Trajektorie des Punktes mit dem Polygonzugverfahren. Betrachten Sie das Aussehen der Trajektorie und wie ein Punkt sich darauf mit der Zeit bewegt.
5.7 Stammfunktionen Wir haben bei den Beispielen des vorigen Abschnitts gesehen, dass es in der Differentialrechnung nicht nur wichtig ist, Funktionen ableiten und Beziehungen zwischen diesen Ableitungen aufstellen zu konnen, sondern insbesondere auch, Funktionen aus den Beziehungen, die ihre Ableitungen erfiillen, zu
5.7 Stammfunktionen
321
finden. Das einfachste derartige Problem, aber, wie wir sehen werden, ein sehr wichtiges, ist, eine Funktion F(x) zu finden, wenn wir ihre Ableitung F'{x) = f{x) kennen. Dieser Abschnitt gibt eine einfiihrende Diskussion dieser Fragestellung. 5.7.1 Stammfunktionen und das unbestimmte Integral Definition 1. Eine Funktion F(x) ist auf einem Intervall eine Stammfunktion einer Funktion /(a;), wenn F auf dem Intervall differenzierbar ist und die Gleicliung F'{x) = f{x) erfiillt, oder, was dasselbe ist, dF{x) = f{x) dx. Beispiel 1. Die Funktion F{x) = arctana; ist auf der gesamten reellen Geraden eine Stammfunktion von f{x) = Y+JTI da arctan'a; = Y+JTBeispiel 2. Die Funktion F{x) = arccot ^ ist auf der Menge der positiven reellen Zalilen und auf der Menge der negativen reellen Zahlen eine Stammfunktion von f{x) = YT^^ da fiir a; ^ 0 gilt:
^'(^) =
7TT2 • ( - 4 ) = T ^ 1 _|_ (Ly
\
x/1
= •^(^) •
1 + x''
Was konnen wir zur Existenz einer Stammfunktion sagen und wie lautet die Menge der Stammfunktionen einer Funktion? Bei der Integralreclmung werden wir den wiclitigen Beweis fiiliren, dass jede auf einem Intervall stetige Funktion auf diesem Intervall eine Stammfunktion besitzt. Wir geben dem Leser zwar diese Information, wir werden in diesem Abschnitt allerdings nur die folgenden cliarakteristisclien Eigenscliaften der Menge der Stammfunktionen einer Funktion auf einem Intervall benutzen, die wir bereits (vgl. Absatz 5.3.1) aus dem Mittelwertsatz kennen. Satz 1. Seien Fi{x) undF2{x) zwei Stammfunktionen von f {x) auf demselben Intervall. Dann ist ihre Differenz Fi (x) — F2 {x) auf diesem Intervall konstant. Die Voraussetzung, dass Fi und F2 auf einem zusammenhangenden Intervall verglichen werden, ist essentiell, wie wir im Beweis dieses Satzes betont haben. Wir erkennen dies beim Vergleich der Beispiele 1 und 2, in denen die Ableitungen von Fi (x) = arctan x und F2 (x) = arccot ^ auf dem gesamten Bereich M \ 0, den sie gemeinsam besitzen, iibereinstimmen. Wir erhalten allerdings Fi (x) — F2 (x) = arctan x — arccot — = arctan x — arctan a; = 0 X
fiir X > 0 aber auch Fi{x) — F2{x) = —TT fiir a; < 0. Denn fiir a; < 0 gilt arccot ^ = TT -I- arctana;.
322
5 Differentialrechnung
Wie die Operation des Differenzierens, die mit deni Nanien „ Differentiation" bezeichnet wird und die mathematische Bezeichnung dF{x) = F'{x) dx tragt, so wird die Operation des Bestimmens einer Stammfunktion „unbestimmte Integration" genannt und mit der mathematischen Schreibweise f{x) dx
(5.166)
fiir das unbestimmte Integral von f{x) auf dem vorgegebenen Intervall symbolisiert. Wir werden also den Ausdruck (5.166) als Schreibweise fiir jede der Stammfunktionen von / auf dem betrachteten Intervall benutzen. In der Schreibweise (5.166) wird das Zeichen J das Zeichen fiir das unbestimmte Integral genannt, / heifit der Integrand und f{x) dx wird als Differentialform bezeichnet. 1st F{x) eine beliebige Stammfunktion von f{x) auf dem Intervall, dann folgt aus Satz 1, dass auf dem Intervall f{x)dx
=
F{x)+C
(5.167)
gilt, d.h., jede andere Stammfunktion kann aus einer bestimmten Stammfunktion F{x) durch Addition einer Konstanten erhalten werden. Gilt F'{x) = f{x), d.h., ist F eine Stammfunktion von / auf einem IntervaU, dann erhalten wir aus (5.167), dass f{x) dx = dF{x) = F'{x) dx = f{x) dx.
(5.168)
AuBerdem folgt aus (5.167), da wir unter einem unbestimmten Integral jede Stammfunktion verstehen, dass dF{x) = / F'{x) dx = F{x) + C.
(5.169)
Die Formeln (5.168) und (5.169) eroffnen eine Umkehrung zwischen der Differentiation und der unbestimmten Integration und tatsachlich sind diese Operationen bis auf die in (5.169) auftretende unbestimmte Konstante C zueinander invers. Bis zu diesem Punkt haben wir nur die mathematische Natur der Konstanten C in (5.167) untersucht. Wir wollen ihr nun an einem einfachen Beispiel eine physikalische Bedeutung verleihen. Angenommen, ein Punkt bewege sich entlang einer Geraden, so dass seine Geschwindigkeit v{t) als Funktion der Zeit t bekannt ist (etwa v{t) = v). Ist x{t) die Koordinate des Punktes zur Zeit t, dann erfiillt die Funktion x{t) die Gleichung x{t) = v{t), d.h., x{t) ist eine Stammfunktion von v(t). Konnen wir die Position eines Punktes auf
5.7 Stammfunktionen
323
der Geraden bestimnien, wenn wir seine Geschwindigkeit in einem bestimmten Zeitintervall kennen? Sicherlich nicht. Aus der Geschwindigkeit und dem Zeitintervall konnen wir die Lange s des in dieser Zeit zuriickgelegten Weges bestimnien, aber nicht die Position auf der Geraden. Die Position ist jedoch vohstandig bestimmt, wenn sie auch nur zu einem Augenblick bekannt ist, etwa bei t = 0, d.h., wenn die Anfangsbedingung x{0) = XQ gegeben ist. Bevor wir die Anfangsbedingung kennen, konnte die Bewegung durch jede Gleichung der Form x{t) = x{t) + c beschrieben werden, wobei x{t) jede bestimmte Stammfunktion von v(t) sein kann und c eine beliebige Konstante. Ist die Anfangsbedingung x{0) = x{0) +c = XQ aber erst einmal bekannt, verschwindet jeghche Unbestimmtheit; denn wir miissen x{0) = x{0) + c = XQ, d.h. c = XQ — x{0) und x{t) = XQ + [x{t) — a;(0)], kennen. Diese letzte Formel beinhaltet nur physikahsche GroBen, da die behebige Stammfunktion x nur als Differenz auftritt, die den zuriickgelegten Weg oder die Entfernung von der bekannten Anfangsposition x{0) = XQ bestimmt.
5.7.2 D i e w i c h t i g s t e n a l l g e m e i n e n M e t h o d e n zur B e s t i m m u n g einer S t a m m f u n k t i o n In Ubereinstimmung mit der Definition des Symbols (5.166) fiir das unbestimmte Integral bezeichnet dieser Ausdruck eine Funktion, deren Ableitung der Integrand ist. Mit dieser Definition konnen wir, wenn wir (5.167) und die Differentiationsregeln beachten, die folgenden Regeln aufstellen: a. b.
/ [au{x) + I3v{x)) dx = a (uv)'dx
u{x) dx + (]
= / u'{x)v{x)dx+
/ u{x)v'(x)
v{x) dx + c . (5.170) dx + c .
(5.171)
c. Gilt f{x) dx = F{x) + c auf einem Intervall Ix und ist cp : It ^ Ix eine glatte (stetig Abbildung des Intervalls It auf Ix, dann ist: if o if){t)^'{t)
dt={Fo
^) {t)+c.
dijferenzierbare)
(5.172)
Die Gleichungen (5.170), (5.171) und (5.172) konnen wir durch Ableiten der rechten und der linken Seite erhalten, wenn wir dabei die Linearitat der Ableitung in (5.170), die Regel zur Ableitung eines P r o d u k t s in (5.171) und die Regel fiir die Ableitung einer verketteten Funktion in (5.172) benutzen. Die Ableitungsregeln ermoglichen es uns, lineare Kombinationen, Produkte und Verkettungen von bekannten Funktionen zu differenzieren. Wir werden sehen, dass die Gleichungen (5.170), (5.171) und (5.172) es uns in vielen
324
5 Differentialrechnung
Fallen erlauben, die Suche nach einer Stammfunktion einer Funktion entweder auf die Konstruktion von Stammfunktionen fiir einfachere Funktionen oder auf Stammfunktionen, die bereits bekannt sind, zuriickzufiiliren. Eine Anzalil derartiger bekannter Stammfunktionen konnen wir aus der folgenden kurzen Tabelle fiir unbestimmte Integrale entnehmen. Wir erhalten sie, indem wir die Tabelle der Ableitungen der wichtigen Elementarfunktionen (vgl. Absatz 5.2.3) neu sclireiben: x " dx = ^ - a ; " + ^ + c a + 1
(a^-1),
— dx = In |a;| + c , X
a'^dx = J
a'' + c
(0 < a ^ 1)
In a e"^ dx = e"" + c ,
sin xdx
= — cos x + c ,
cos xdx
= sin x + c ,
—T;— dx = t a n X + c ,
dx = —cot X + c ,
sin X 1
I arcsin x + c
; dx \ / l — x^ 1
1 — arccos x + c , I arctan x + c ,
• dx
1 + x^
I —arccot x + c
sinh X dx = cosh x + c , cosh X dx = sinh x + c , dx = t a n h x + c , cosh^ X sinh X
dx = —cothx + c
5.7 Stammfunktionen
/
,
325
dx = In la; + yx"^ ± 11 + c ,
dx = - In l-x2 2
1 +x 1 — X
+c
Jede dieser Formeln kann auf dem Intervall der reellen Geraden M, auf der der entsprechende Integrand definiert ist, benutzt werden. Existiert mehr als ein derartiges Intervall, kann sicli die Konstante c auf der recliten Seite von einem Intervall zum anderen andern. Wir woUen nun einige Beispiele betrachten, in denen die Regeln (5.170), (5.171) und (5.172) angewendet werden. Wir beginnen zunachst mit einer einfiihrenden Annierkung. Da andere Stammfunktionen durch die Addition von Konstanten gefunden werden konnen, wenn wir erst einmal eine Stammfunktion zu einer gegebenen Funktion auf einem Intervall kennen, treffen wir die Vereinbarung, dass wir der Einfachheit halber die beliebige Konstante nur zum Endresultat, das eine bestimmte Stammfunktion der vorgegebenen Funktion ist, addieren. a. L i n e a r i t a t d e s u n b e s t i m m t e n I n t e g r a l s Diese Uberschrift bedeutet, dass die Stammfunktion einer Linearkombination von Funktionen aus derselben Linearkombination von Stammfunktionen der Funktionen erhalten werden kann, wie aus (5.170) folgt. tiel 3. (oo + OLix + • • • + anx") dx = = oo / 1 da; + oi / a; da; + • • • + a „ / x" dx = 1 2 c + aox + —aix"^ + • • •H rcina;""'""'" -aix H + 2 n+ 1
I xA
1 \2 . r / o , _ 1;= ) dx = {x^+2^/x-\—Ida; Vx/ J \ x) / a;^ dx + 2 / a;^/^ da; + / -dx=
-x^ + -a;^/^ + In |a;| + (
/ cos^ — da; = / - (1 + cos x) da; = - / (1 + cos x) dx
J
2
J 2^
'
2.1 '
1 /"i , 1 /• J - / 1 da; H— / cos xdx 2. 2.
'
1 1 • = —x A— sm x + c 2 2
326
5 Differentialrechnung
b. Partielle Integration Gleichung (5.171) kann wie folgt umgeschrieben werden: .(xMx) = / . ( x ) d . ( x ) + / . ( x ) d . ( . ) + c Oder, was dasselbe ist, u{x) dv{x) = u{x)v{x) — / 11(2;) du{x) + c .
(5.171')
Dies bedeutet, dass die Suche nach einer Stammfunktion fiir die Funktion u{x)v'{x) auf die Suche nach einer Stammfunktion fiir v{x)u'{x) zuriickgefiihrt werden kann. Dabei wird die Ableitung auf den anderen Faktor verschoben. Dies ist in (5.171') dargestellt. Formel (5.171') wird partielle Integration genannt. 6.
lna;da; = a;lna;— / a;d In a; = a; In a;— = xlnx-lldx
x • — dx = = xlnx-x
+ c.
iel 7. x^e'' dx =
x^ de'' = x^e'' -
= x'^e^ -2
e"" dx^ = x^e'' - 2 I xe"" dx =
X de^ = x'^e^ - 2 ( xe^ - j e" dx = x'^ff - 2xe=" + 2e=" + c = (x^ - 2x + 2)e=" + c .
c. Anderung der Variablen in einem unbestimmten Integral Aus (5.172) konnen wir folgern, dass man bei der Suche nach einer Stammfunktion fiir die Funktion (/ o ip){t) • (p'{t) folgendermaBen vorgehen kann:
ifo^m-ip'{t)dt=
I f{ip{t))dipit) = fix) dx = F{x) + c = F{if{t)) + c
d.h., wir andern zunachst die Variable ip{t) = x im Integranden und wechseln zur neuen Variablen x. Nachdem wir die Stammfunktion als eine Funktion von X bestimmt haben, kehren wir nach der Substitution x = (p{t) zur alten Variablen t zuriick.
5.7 Stammfunktionen
tdt l+t2
1 f d(t2 + 1) 1+^2
da;
1 f dx
dx 2 sin I cos I
smx
1 -ln|a;|
c= -ln(r+
d(|) ,2 x_ t a n I cos^ I d(tanu)
dw t a n u cos^ u
J
327
l)+c
dv
tan u
V
= In Iwl + c = In I tanwl + c = In t a n — 2
+c
Wir haben nun verschiedene Beispiele betrachtet, in denen die Eigenschaften a,b und c des unbestimmten Integrals fiir sich benutzt wurden. Tatsachlich warden diese Eigenschaften in der Mehrzahl der Falle gemeinsam eingesetzt. Beispiel 10. / sin 2x cos 3a; da; = - / (sin 5a; — sin x) da; = sin 5a; da;
1 2
sin X dx
fl - / sin5a;d(5a;) + cosa;
1 /• . , 1 1 1 — / sm M dw + - cos X = —-To, '^^^ ^ + o cos X + c±.\j
Zi
I
_LU
Z
1 1 - cos X — — COS bx + c Beispiel
11. X d arcsin x
•arcsina;d. = . a r c s i n . . X arcsin x
X = ^
vT—
, . I da; = X arcsin a; + 2 a;2
1 a; arcsin a ; + - I u
'
du
'
fd{l-x^)
yr
•
x^
1/2
; arcsin x + u ' + c X arcsin
x + vT
x^ + c
12. cos bxdx
= - I cos bx de"^ a 1 1 e"* cos &x - - / e"* d cos &x = - e " * cos 6a; H— / e"* sin 6a; dx a a J a aJ
= - e " * cos bx -\—-
sin bx de"* = - e " * cos &x H—-e'^'" sin 6a;
- ^ / e""^ d sin bx
a cos bx + b sin 6x 2 a
6^ II a^
e"* cos bx dx
328
5 Differentialrechnung
Aus diesem Ergebnis konnen wir folgern, dass
/
e
„_
, , a cos 6a;+ & sin 6a; cos ox ax = —— i
Da a + ib
a^ + b'^ acosbx + bsiribx „_ .asinx — bcosbx „.. a2 + 62 ^ a2+&2
die Stammfunktion der Funktion e("+''')* = e"* cos 6a; + ie"^ sin 6a; ist, batten wir aucb mit Hilfe der Eulerschen Formel zu diesem Ergebnis gelangen konnen. Es wird hilfreicb sein, dies im Hinterkopf zu bebalten. Fiir reelle Werte von X konnen wir dies einfach direkt durcb Ableitung der Realteile und der Imaginarteile der Funktion _L_e(''+'*)=^ nachweisen. Insbesondere erhalten wir auch aus diesem Ergebnis, dass a sin bx — b cos 6a; e'" + c 62 Bereits diese kleine Anzahl von betrachteten Beispielen geniigt, um zu zeigen, dass man beim Auffinden von Stammfunktionen selbst fiir die einfachsten Funktionen oft darauf angewiesen ist, Zuflucht bei zusatzlichen Umformungen und schlauen Techniken zu suchen. Dies ist ganz anders als bei der Ableitung verketteter Funktionen, deren Ableitungen wir kannten. Es stellt sich heraus, dass diese Schwierigkeiten nicht zufallig sind. Im Unterschied zur Differentiation kann beispielsweise die Suche nach einer Stammfunktion fiir eine einfache Funktion zu einer Funktion fiihren, die keine Verkettung einfacher Funktionen ist. Aus diesem Grund sollte man unter „der Suche nach einer Stammfunktion" nicht die manchmal unmogliche Aufgabe verstehen, „eine Stammfunktion einer gegebenen elementaren Funktion mit Hilfe von elementaren Funktionen zu formulieren". Im Allgemeinen ist die Klasse der elementaren Funktionen ein sehr kiinstliches Objekt. Es gibt sehr viele besondere Funktionen, die fiir Anwendungen wichtig sind, die mindestens genauso ausfiihrlich untersucht und tabelliert wurden, wie etwa sin a; oder e*. So ist z.B. der Integralsinus Si x die Stammfunktion J ^^SJE. (\X zur Funktion 2ij^, die fiir a; —>• 0 gegen Null geht. Eine derartige Stammfunktion existiert, sie ist aber wie alle anderen Stammfunktionen von ^^SJE. keine Verkettung elementarer Funktionen. Ganz ahnlich ist auch die Funktion f cosx Lix = / da; ,
die durch die Bedingung Cia; ^ 0 fiir a; ^ oo charakterisiert wird, keine elementare Funktion. Die Funktion Cix wird Integralcosinus genannt.
5.7 Stammfunktionen
329
Die Stammfunktion f r ^ der Funktion j - ^ ist ebenfalls keine elementare J ma;
In x
Funktion. Eine der Stammfunktionen dieser Funktion wird mit lia; bezeichnet und Integrallogarithmus genannt. Sie geniigt der Bedingung lia; ^ 0 fiir X —>• +0. (Genaueres zu den Funktionen Si a;, Cix und lia; in Abschnitt 6.5.) Wegen dieser Scliwierigkeiten bei der Suclie nacli Stammfunktionen wurden selir ausfiilirliclie Tabellen unbestimmter Integrale zusammengetragen. Um diese Tabellen jedocli sinnvoU nutzen zu konnen und um zu vermeiden, auf diese Tabellen auch in einfaclien Fallen zuriickgreifen zu miissen, ist einige Erfalirung im Umgang mit unbestimmten Integralen notwendig. Der Rest dieses Absclmitts ist der Integration einiger speziellen Klassen von Funktionen gewidmet, deren Stammfunktionen als Verkettungen von elementaren Funktionen formuliert werden konnen. 5.7.3 Stammfunktionen rationaler Funktionen Wir wollen uns dem Problem der Integration von J R{x)dx, wobei R{x) = ^() ein Bruch von Polynomen ist, zuwenden. Wie uns aus der Algebra bekannt ist (s. (5.135) in Absatz 5.5.4), konnen wir, wenn wir im Reellen arbeiten, oline den Zahlenbereicli zu verlassen, jede derartige Funktion als eine Summe
^^^i^^^t{i,^)^t{tjM^)
(-3,
ausdriicken. Dabei ist p{x) ein Polynom (das nur dann bei der Division von P{x) durch Q{x) auftritt, wenn der Grad von P{x) nicht kleiner ist als der Grad von Q{x)), Ujk, bjk und Cjk sind eindeutig bestimmte reelle Zalilen und Q(x) = (a;-a;i)^i • • • {x - xi)'" {x^ + pix + qi)""^ • • • (a;^+p„a; + g„)"". Wir liaben bereits in Abschnitt 5.5 diskutiert, wie die Entwicklung (5.173) zu finden ist. Ist die Entwicklung (5.173) erst einmal konstruiert, dann lasst sich die Integration von R{x) auf die Integration der einzelnen Summationsglieder reduzieren. In Beispiel 1 haben wir bereits ein Polynom integriert, so dass nur noch die Integration von Briichen der Form 1
1
bx + c
-^ ,
^j
rr ) nut k G ri (x — a)'' und —T (x^ + px + q)'' zu betrachten ist. Das erste dieser Probleme lasst sich unmittelbar losen, da 1 ^
( '
I
^(x-a)-''+^+ciurk^l, In la; — al + c
fiir k = 1 .
330
5 Differentialrechnung
Mit dem Integral bx + c • (x^ + px + q)^
ax
verfahren wir folgenderniaBen: Wir formen das Polynom x"^ -\- px + q zu X + | p ) + ((/ — \p'^) uin, wobei q — jp^ > 0, da das Polynom x"^ + px + q keine reellen NuUstellen besitzt. Wenn wir x+hp ^p = u und q—jp^ q—\i = a} setzen erhalten wir hx ^ c f au + P (x^ + px + q)'' J (u^ + a^)'' wobei a = b und /? = c — ^bp. Als Naclistes erhalten wir ,^^ (u2+a2)fc
l/d(.^+a^) 2 J (u2+a2)fc 2 ( ^ ( ^ 2 + a2)-*+i fiir
fc^l (5.175)
i ln(M2 + a^)
fiir fc = 1
so dass nur noch die Untersucliung des Integrals du (u2 + a2)*
(5.176)
verbleibt. Mit partieller Integration und einfachen Umformungen gelangen wir zu du
u
(u2+a2)fc
(^2+^2)6
u (M2+a2)fc
„,
^^ f + 2k J
/• (^2 + a2) _ Q,2 j
(i^2+a2)fc+l
V? du (y2+Q2)fc+l ^
„,^
„,
9^
(u2+a2)*
was uns zur rekursiven Gleichung 'fc+i
1 u 2k-I 2fca2 (u2 + a2)fc + ^TT-^^* 2kd
(5-177)
fiihrt. Sie ermoglicht es uns, den Exponenten k im Integral (5.176) zu verringern. Aber Ii ist einfach berechenbar: f du If d(2i) 1 u /i = / — = - / liti— = - arctan - + c . J u^ + a^ a J X + (-) o, a
(5.178)
Also konnen wir mit (5.177) und (5.178) auch die Stammfunktion (5.176) berechnen.
5.7 Stammfunktionen
331
Somit haben wir den folgenden Satz bewiesen: S a t z 2. Die Stammfunktion jeder rationalen Funktion R{x) = TJQ- kann als Ausdruck rationaler Funktionen und der transzendenten Funktionen In und arctan formuUert werden. Der rationale Teil der Stammfunktion wird, falls er auf einen gemeinsamen Nenner gebracht wird, alle Faktoren des Polynoms Q{x) enthalten, allerdings sind die Vielfachheiten um eins geringer als im Ausgangspolynom Q{x). Beispiel
13. Wir woUen / —-r — dx berechnen. J ( a ; 2 - l ) ( a ; + 2) Da der Integrand ein teilerfremder Bruch ist und die Faktorisierung des Zahlers in das P r o d u k t {x—l){x+l){x+2) bekannt ist, konnen wir unmittelbar eine Partialbruchzerlegung forniulieren: 2x2 + 5a; + 5 _ A {x-l){x + l){x + 2)~ x - l
B x+l
C x + 2'
^'
'
Wenn wir die rechte Seite von (5.179) auf einen gemeinsamen Nenner bringen, erhalten wir 2a;2 + 5a; + 5 _ (A + B + C)x^ + (3A + B)x + (2A - 2B - C) ( a ; - l ) ( a ; + l)(a; + 2) (a; - l)(a; + l)(a; + 2) Indem wir die entsprechenden KoefRzienten im Zahler gleichsetzen, erhalten wir das Gleichungssystem
A + B + C --= 2 , 3A + B = 5, 2A — 2B — C --= 5 , aus dem wir {A, B, C) = (2, —1,1) bestimmen. In diesem Fall liatten wir diese Zahlen im Kopf berechnen konnen. Tatsachhch fiihrt die Multiplikation von (5.179) mit a; — 1 und anschhefiendes Setzen von a; = 1 zu einer Gleichung mit A auf der rechten Seite. Links wiirde dann der Wert des Bruchs, den wir nach Kiirzen des Faktors a; — 1 erhalten, fiir a; = 1 stehen, d.h., A = 2+^+^ = 2. Auf ahnliche Weise lassen sich B und C bestimmen. Somit ist 2a;2 + 5a; + 5 , ^ f dx ( a ; 2 - l ) ( a ; + 2) • da; = 2J / x - 1
f dx - J/ x + l
f dx +J x + 2
2 1 n | a ; - 11 - l n | a ; + l | + l n | a ; + 2| + c = In Beispiel
{x-iy{x X — 1
14- Wir woUen eine Stammfunktion der Funktion R{x)
x"^ - 2x^ + 4:X^ - 5a;'' + 4a;^ - 5x'^ - x ( a ; - l ) 2 ( a ; 2 + l)2
+ 2)
+ c.
332
5 Differentialrechnung
bestimnien. Wir beginnen niit der Annierkung, dass dies ein uneigentlicher Bruch ist. Daher entfernen wir die Klanimern und bestimnien den Nenner zu Q{x) = x^ — 2x^ + 3x* — Ax^ + 3a;^ — 2a; + 1 und dividieren damit den Zahler, wodurch wir erhalten: ^5 _ ^4
^'''
" "" +
I
3 _ o^2 _
(X-I)2(x2+1)2
9
•
Dann suchen wir eine Partialbruchentwicklung des eigentlichen Bruchs x^ -x^ +x^ - 3a;^ -2x (a;-l)2(a;2 + l)2
_ A B ~ {x - IJ^^^iT^^
Cx + D Ex + F {x'^ + 1)2 + ^2 + 1 ' ^ '
'
Natiirlich konnten wir diese Entwicklung auf die iibliche Weise erhalten, indem wir das Gleichungssystem aus sechs Gleichungen und sechs Unbekannten forniulieren. Wir woUen jedoch andere technische Moglichkeiten, die nianchmal benutzt werden, vorstellen. Wir finden den KoefRzienten A durch Multiplikation von (5.180) mit (x — 1)^ und anschliei3endem Setzen von x = 1. Das Ergebnis ist A = —1. Wir bringen dann den Bruch i—^^, in welcheni A die bekannte Zahl —1 ist, auf die hnke Seite von (5.180). Dies fiihrt zu x^ +x^ +2x'^ +X-1 ( a ; - l ) ( x 2 + l)2
_ B Cx + D Ex + F " ; ^ ^ ^ + (a;2 + 1)2 + ^2 + 1 '
^'
'
woraus wir durch Multiphkation mit x — 1 und anschhei3endem Setzen von X = 1 schhei3hch B = 1 finden. Wenn wir nun den Bruch —^ auf die hnke Seite von (5.181) bringen, gelangen wir zu x'^ +X + 2 _ Cx + D Ex + F ft^iso^ (a;2 + 1)2 - (a;2 + 1)2 + ^2 + 1 • i • > Nachdem wir fiir die rechte Seite von (5.182) einen gemeinsamen Nenner gefunden haben, konnen wir die Zahler x"^ +x + 2 = Ex^ +Fx'^ + (C + E)x + {D + F) gleichsetzen, woraus folgt, dass £; = 0 , F =1, C + E= 1 , D + F = 2, Oder {C,D,E,F) = (1,1,0,1). Wir kennen nun alle KoefRzienten in (5.180). Nach Integration ergeben die ersten beiden Briiche -^^ bzw. In |x — 1|. Dann ist
5.7 Stammfunktionen Cx + D ^ /• x + 1 , ax = I -^^^ --77 ax (x2+l)2 J (x2 + l)2 1 f d(a;2 + 1) f dx 2 J (a;2 + 1)2 'J (a;2 + 1)2 niit
,
dx
1
x
333
2{x^ + 1)
1
^2 = / (^F^T)i = 2WTW+r^^*^*^"^ wie sich aus (5.177) und (5.178) ergibt. SchlieBlich erhalten wir Ex + F ^ f 1 ^ — dx = -T. dx = arctan x . a;2 + 1 J x^ + 1 Wenn wir alle Integrale zusammenfassen, ergibt sich T — TrrT', 7T + 7:7~:^ rrr + ln |a^-l| + 7: arctana; + c . / R(x) dx = -x"^-\ J 2 x - l 2(x2 + 1 ) 2(a;2 + 1)2 ' ' 2 Wir woUen nun einige haufig anzutrefFende unbestimmte Integrale betrachten, deren Berechnung auf das AufRnden der Stammfunktion einer rationalen Funktion zuriickgefiihrt werden kann. 5.7.4 Stammfunktionen der Form / ii(cos a;, sin a;) da; Sei R{u,v) eine rationale Funktion in u und w, d.h. ein Quotient von Polynonien ^."'"N , die lineare Kombinationen von Monomen u™w", m = 0,1, 2 . . . und n = 0 , 1 , . . . sind. Es gibt verschiedene Methoden, um das Integral / R{cos x, sin x) dx zu berechnen. Eine ist voUstandig allgeniein anwendbar, wenngleich sie nicht inimer die effektivste ist. a. Wir substituieren t = tan | . Da 1 - tan2 I 2 tan | cosx = l + t a nrr-r, a; — l + t a n 2 f 2 f ' sin ^"^-^ dx ,, , 2dt ™ = T; 2 cos2o~r I ^' d.h. ' ' dx 1 + tan2 | folgt, dass J i?(cosx,sinx)da; = y ^ ( ^ Y T ^ ' T T ^ J T T ^
'
wodurch das Problem auf die Integration einer rationalen Funktion reduziert wird.
334
5 Differentialrechnung
Diese Methode fiihrt jedoch zu einer sehr koniplizierten rationalen Funktion. Daher soUte man ini Hinterkopf behalten, dass in vielen Fallen andere Metlioden zur Verfiigung stelien, um den Integranden in eine rationale Funktion umzuwandeln. b . Bei Integralen der Form J i?(cos^ a;, sin x)dx oder J r{tanx)dx, wobei r{u) eine rationale Funktion ist, ist t = tana; eine praktische Substitution, da 2
1
.0
tan^ X
cos X = 1 + tan^Ti— X , sm X 1 + tan^ x dx dt dt = ::— , d.li. da; 1+^2 • Wenn wir diese Substitutionen durclifiihren, erhalten wir jeweils: / i?(cos^ a;, sin^ x) da; = Rl r-, rr 1 r J ^ ^ J \l + t^' 1 + t^J 1 + t^ r(tana;) dx = r{t)1+^2
und
•
c. Bei Integralen der Form i?(cosa;,sin2 a;) sina;da; oder / i?(cos^ a;,sina;) cosa;da; konnen wir die Funktionen sin x und cos x ins Differential ziehen und die Substitutionen t = cos a; oder t = sin a; vornehmen. Nach diesen Substitutionen nelimen die Integrale die folgende Form an: - / R{t, 1 - f) dt Oder / i?(l -t^,t)dt
.
Beispiel 15. dx sin a;
( 1 J 3+ j
^
2dt 1 + t'^
dt _ 2 /• d ( t + | ) _ 2 /" 3t2 + 2t + 3 3j ^t+lf +l 3J
du u^+{^f
1 3u 1 3t+l 1 3 tan f + 1 = —;= arctan — = + c = —;= arctan •;=^ + c = —;= arctan ^= hc . ^/2 2V2 ^2 2v/2 ^2 2^2 Hierbei liaben wir die allgemeine Methode mit der Substitution t = tan |benutzt. Beispiel 16. dx f dx (sin a; + cos x)2 J cos2 a;(tana; + 1)^2 dtana; f dt 1 1 + c (tan a;+1)2 i (t +1)2 t+l 1 + tana;
5.7 Stammfunktionen
335
17. dx 2 sin 3a; — 3 cos^ 3a; + 1
da; cos2 3a; (2 tan^ 3a; - 3 + (1 + tan^ 3a;))
d tan 3a; 3tan2 3 x - 2
dyft
At 1 3 . / 3*2 - 2
3-2 V 3 1*2-1 M-1 1 In + c6^6 M+ 1
I f Au 3^6 y u2 - 1
|t-l
1 In 6^6
tan 3a; +c
|t+l
6^6
In tan 3a; -
+ c.
Beispiel 18. cos^ X Ax sin X
cos2 a;d sin x sin X
(1 - f) At 1 4 sin'* X
(r^-t-5)d*=
5.7.5 Stammfunktionen der Form /
1 + c. 6 sin^ x
R(x,y{x))Ax
Sei R{x,y) wie in Absatz 5.7.4 eine rationale Funktion. Wir woUen einige spezielle Integrale der Form R[x,y{x))
Ax
betrachten, wobei y = y{x) eine Funktion von x ist. Erstens ist es klar, dass dann, wenn wir die Substitution x = x{t) vornehmen, so dass beide Funktionen x = x{t) und y = y{t) rationale Funktionen von t sind, dass dann x'{t) auch eine rationale Funktion ist und R{x,y{x))Ax=
I
R{x{t),y{x{t)))x'{t)dt
gilt, d.li., das Problem wird auf die Integration einer rationalen Funktion zuriickgefiilirt. Wir wollen die folgenden besonderen Auswalilen fiir die Funktion y = y{x) betrachten. a. Ist y = \ "'^V'ri ™^ n € N, dann erhalten wir nacli Setzen von t" =cx+d """V'j X=
d-t"
-b —, a — c-t
wodurch der Integrand rational wird.
y =t ,
336
5 Differentialrechnung
Beispiel 19.
x+1
'(f^)
da; = / tdiT ] =tT dt - / r dt : J Vi-ts; 1-^3 J i-t^
= t-
t^ + l ^ f T+ t-2
' :;
dt
2f(...^-.J^' - + -ln 1 - t - - / -!^
.. Idt K.—^dt 4
*
lln\l-t\-lln
X 2 2 / IN = arctan —= [t -\— + c , wobei t = .,
VE
ysV
2/
—1
M x+1
b . Wir wollen den Fall y = \/ax'^ + bx + c untersuclien, d.h. Integrale der Form lR{x,Vax'^+bx + c)dx. Durcli quadratisclie Erganzung des Trinoms ax"^ + bx + c und einer geeigneten linearen Substitution konnen wir den Allgemeinfall auf einen der drei folgenden Spezialfalle zuriickfiihren:
f R{t,^/WTT)dt,
I R{t,^/t'^ -I) dt ,
I R{t,^/l-f^)dt
. (5.183)
Um diese Integranden in rationale Funktionen umzuformen, geniigt es, die folgenden Substitutionen vorzunelimen: v/t2 + l = tu + l Oder ^/f^ + \ = tu - 1 oder Vt^ +'i^ = t-u , •sjf^ - 1 = u[t - 1) Oder •sjt'^ - 1 = u{t + 1) oder \fW^ \J\-t'^
= u{l - t) Oder \/l-t'^
= u{l +1) oder \/l-t'^
=t-u =tu±l
, .
Diese Substitutionen wurden vor langer Zeit von Euler vorgeschlagen (vgl. Aufgabe 3 am Ende dieses Absclmitts). Wir wollen als Beispiel zeigen, dass das erste Integral nach der ersten Substitution in ein Integral mit einer rationalen Funktion iibergeht. 1st namlich ^/t"^ + 1 = tw + 1, dann ist t^ + 1 = i^v? + 2tu + 1, woraus wir schlieBen, dass 2u
5.7 Stammfunktionen
337
und somit
VFTT
1-U2
Somit erhalten wir t und v P + T als rationale Ausdriicke von u und folgerichtig wurde das Integral auf ein Integral einer rationalen Funktion reduziert. Die Integrale (5.183) konnen auch reduziert werden, wenn wir die Substitutionen t = sinli (p, t = cosh cp und t = sin cp (oder t = cos ip) ausfiiliren: R{smh ip, cosh ip) cosh ip dip,
/ R(cosh ip, sinh cp) sinhip dip
und i?(sin ip, cos ip) cos ip dip oder — / i?(cos ip, sin ip) sin ip dip 20. dx + Va;2 + 2a; + 2
f dx J x + ^{x + lf + 1
f dt J t - 1 + Vt^+T
Wenn wir v P + T = u — t setzen, erhalten wir 1 = u^ — 2tu, woraus folgt, dass t = ",, ^. Daher ist 2u
• du -
— 1 J t - l + VWTT 27 u - l \ u^J 2.1 u u1 /• du 1, , ,, 1 /• A 1 1 1A +27 ^ i > ^ = 2 i " i " - i i + 2 y i ^ 7 3 T - ^ - - j dw 1 u-l _ l n | ^ - l | + -ln + — + c. 2u Nun miissen wir noch die Substitutionen aufschliisseln: u = t + v P + T und t = x + l. c. EUiptische Integrale. Eine andere wichtige Klasse von Integralen besitzt die Form R{x,^JP{x)\dx , (5.184) wobei P{x) ein Polynom vom Grad n > 2 ist. Wie Abel und Liouville gezeigt haben, kann ein derartiges Integral im Allgemeinen nicht mit Hilfe von elementaren Funktionen ausgedriickt werden. Fiir n = 3 und n = 4 wird (5.184) ein eUiptisches Integral genannt und fiir n > 4 ein hypereUiptisches. Durch einfache Substitutionen kann gezeigt werden, dass das allgemeine elliptische Integral bis auf Ausdriicke, die mit elementaren Funktionen formulierbar sind, auf die folgenden drei Standardfalle zuriickgefiihrt werden kann:
338
5 Differentialrechnung dx
/
-x2)(l-fc2a;2) '
f
J ViT-- x 2 ) ( l - f c 2 a ; 2 )
'
dx , (l + / i a ; 2 ) ^ ( l - x 2 ) ( l - f c 2 x 2 )
(5.185) (5.186) (5.187)
Dabei sind h und k Parameter, wobei der Parameter k in alien drei Fallen im Intervall ]0,1[ liegt. Nach Substitution von x = sin ip konnen diese Integrale auf die folgenden kanonischen Integrale und Kombinationen davon zuriickgefiihrt werden: ^
^^
,
(5.188)
V l —fc2sin2 If l-k'^sin^ipdip
,
dip
{1 - h sin2 ip) v^l - fc2 sin2 ip
(5.189)
(5.190)
Die Integrale (5.188), (5.189) und (5.190) werden elliptische Integrale erster, zweiter und dritter Ordnung genannt (auch als Legendresche Normalform) . Die Symbole F{k,(p) und E{k,(p) bezeichnen die besonderen elliptischen Integrale (5.188) und (5.189) der ersten und zweiten Ordnung, die F{k, 0) = 0 und E{k,0) = 0 erfiillen. Die Funktionen F{k, cp) und E{k, cp) werden haufig benutzt und aus diesem Grund wurden sehr ausfiihrliche Wertetabellen fiir 0 < fc < 1 und 0 < ip < 7r/2 zusammengestellt. Wie Abel gezeigt hat, ist es nur natiirlich, elliptische Integrale in der komplexen Ebene im engen Zusammenhang mit sogenannten elliptischen Funktionen zu untersuchen. Diese Funktionen stehen mit elliptischen Integralen im selben Zusammenhang, wie etwa die Funktion sin a; mit dem Integral f I "^ = arcsinw.
5.7.6 Ubungen und Aufgaben 1. Methode nach Ostrogradski^ zur Ahtrennung des rationalen Teils des Integrals eines teilerfremden rationalen Bruchs. Sei QT|T eiii teilerfremder Bruch, q{x) das Polynom mit denselben Nullstellen mit Vielfachheit 1 wie Q{x) und Qi{x) = ^rf) • ^'' M. V. Ostrogradski (1801-1861) - bekannter russischer Fachmami fiir theoretische Mechanik und Mathematik, einer der Begriinder des angewandten Forschungsbereichs der Petersburger mathematischen Schule.
5.7 Stammfunktionen
339
Zeigen Sie: a) Es gilt die folgende Formel von Ostrogradski:
P{x) , _ Piix) , [Ekld, f p{x) f£(^d,-h(El+
(5191)
wobei 7r4§T und ^T^T teilerfremde Briiche sind und f ^^ dx ist eine transzendeiite Funktion. (Aus diesem Grund wird der Bruch „^ ^J ^^ (5.191) der rationale Teil des Integrals / -^j^- Ax genannt.) b) In der Formel P{x) Q(x)
fPi{x)\ ^ p(x) \Qi{x) J q{x)
die wir durch Ableitung der Ostrogradski-Formel erhalten, kann der Bruch ( Off) ) ^^'-^ geeigneten Kiirzungen den Nenner Q{x) besitzen. c) Die Polynome q{x), Qi{x) und dann auch die Polynome p{x), Pi(x) konnen algebraisch gefunden werden, ohne dass wir auch nur die NuUstellen von Q{x) kennen. Daher kann der rationale Teil des Integrals (5.191) voUstandig ohne Berechnung der gesamten Stammfunktion erhalten werden. d) Trennen Sie den rationalen Teil des Integrals (5.191) ab, fiir P{x) = 2x^ + 3a;^ + &x* + &x^ + lOx^ + 3a; + 2 , Q{x) = X + 3x + 5a; + 7a; + 7a; + hx + 3 ^ + 1 (vgl. Beispiel 17 in Abschnitt 5.5). 2. Angenommen, wir suchen die Stammfunktion
/•
i?(cos x, sin x) Ax ,
(5.192)
wobei R(u,v) = „;"''"'; eine rationale Funktion ist. Zeigen Sie: a) Ist R{—u,v) = R{u,v), dann besitzt R{u,v) die Form Ri{v'^,v). b) Ist R{—u,v) = —R{u,v), dann wird durch R{u,v) = u • R2{v?,v) und die Substitution t = sin a; das Integral (5.192) in ein rationales umgeformt. c) Ist R{—u, —v) = R{u, v), dann wird durch R{u, w) = i?3 ( ^, f^ 1 und die Substitution t = t a n x das Integral (5.192) in ein rationales umgeformt. 3. Integrale der Form Rlx,\/ax'^+hx
+ cjAx.
a) Zeigen Sie, dass das Integral (5.193) durch die folgende eulersche auf ein Integral einer rationalen Funktion reduziert werden kann: t = ^/ax^ + hx + c ± ^yEx, fiir a > 0,
/
(5.193) Substitution
^ ^^ falls xi und X2 reelle NuUstellen des Trinoms ax -\-bx -\- c sind. X — X2
340
5 Differentialrechnung
b) Sei {xo, yo) ein Punkt der Kurve y^ = ax^+hx+c und t die Steigung der Geraden, die durch (xo,yo) lauft und diese Kurve im Punkt {x,y) schneidet. Driicken Sie die Koordinaten (x,y) durch {xo,yo) aus und stellen Sie einen Zusammenhang zwischen diesen Formeln und der eulerschen Substitution her. c) Die durch die algebraische Gleichung P{x, y) = 0 definierte Kurve besitze eine parametrische Beschreibung x = x{t) und y = y{t) durch die rationalen Funktionen x(t) und y{t). Zeigen Sie, dass das Integral J R{x, y{x)) Ax, wobei R{u, v) eine rationale Punktion ist und y{x) eine algebraische Funktion, die die Gleichung P{x,y) = 0 erfiillt, auf ein Integral einer rationalen Punktion reduziert werden kann. d) Zeigen Sie, dass das Integral (5.193) immer auf eine der drei folgenden Integraltypen reduziert werden kann: dx / — J (x {x — Xo)* • Vax'^ +hx + • {Ax + B) Ax {x'^ + px + a)'""'- • \/ax'^ +hx + c
/ , ^(-) d., J \/ax'^ + bx + c oder /
4.
•
a) Zeigen Sie, dass das Integral
I-
'(a + bx"'Y' Ax ,
wobei m, n und p rationale Zahlen sind, auf das Integral f{a + btffAt
(5.194)
zuriickgefiihrt werden kann, wobei p und q rationale Zahlen sind. b) Das Integral (5.194) kann durch elementare Punktionen ausgedriickt werden, wenn eine der drei Zahlen p, q und p + q ganzzahlig ist. (Tschebyscheff zeigte, dass es keine anderen Palle gibt, fiir die das Integral (5.194) durch elementare Punktionen ausgedriickt werden kann.) 5. EUiptische Integrale. Zeigen Sie: a) Jedes Polynom vom Grad drei niit reellen KoefRzienten besitzt eine reelle Nullstelle Xo und kann durch die Substitution x — xo = t^ auf ein Polynom der Porni t^{at* + bt^ + ct^ + dt -\- e) reduziert werden, wobei a ^ Q ist. b) Ist R{u, v) eine rationale Punktion und P ein Polynom vom Grad 3 oder 4, dann kann die Punktion Pix, ^/P{x)\ auf die Porm Ri it, \Jat^ + fci^ + • • • + e 1 reduziert werden, wobei o 7^ 0 ist. c) Ein Polynom vom Grad vier ax"^ + bx^ + • • • + e lasst sich als das Produkt aixP'-\-p\x-\-q\)(3p' -\-p2x-\-q2) darstellen und kann immer durch die Substitution X = s|±f auf die Porm (M^+N^t^)(M^+N2t^) ^, j^^^ werden. d) Eine Punktion R[x, \Jax'^ + bx^ + • • • + e 1 lasst sich durch die Substitution x = 2|±f auf die Porm
zuriickfiihren.
Ri (t, ^/A{l + mif^){l
+ m2f^)J
5.7 Stammfunktionen
341
e) Eine Funktion R{x, ^ y ) kann als Summe Ri{x, y) H ai£i£2 dargestellt werden, wobei -Ri und R2 rationale Punktionen sind. f) Jede rationale Funktion kann als Summe gerader oder ungerader rationaler Punktionen dargestellt werden. g) 1st die rationale Funktion R{x) gerade, dann besitzt sie die Form r(x^); ist sie ungerade, besitzt sie die Form xr{x'^), wobei r{x) eine rationale Funktion ist. li) Jede Funktion R{x, y ^ ) kann auf folgende Form reduziert werden:
i) Jedes Integral der Form J Rix, ^/P{x)\ vier ist, kann auf ein Integral
I
Ax, wobei P{x) ein Polynom vom Grad
r(t") At V ^ ( l + mit2)(l + m2t2)
reduziert werden, wobei r(i) eine rationale Funktion ist und A = ± 1 . j) Ist \mi\ > {m-zl > 0, dann wird eine der Substitutionen ~Jrnit = x, = .'" oder ^mit = , '" das Integral ^/mit = V l — x'^, \/mit f
,
auf die Form f
•' ^ A ( l + m i t 2 ) ( i + m 2 t 2 )
.
reduzieren, wobei f ei-
•' y ( l - a ; 2 ) ( i _ ; i 2 j , 2 )
ne rationale Funktion und 0 < fc < 1 ist. k) Leiten Sie eine Formel fiir die Verkleinerung der Exponenten 2n und m fiir die folgenden Integrale her: x^" r x'" Ax J J(l-x^)(l-k^x^)' s/il - x''){l - k'^x'')'
fr Ax J ix-'(x-'-a - a)"' • -s/{l - x''){l - k'^x-') '
1) Jedes elliptische Integral
/ R(x,^/P{x)\
Ax ,
wobei P ein Polynom vom Grad vier ist, kann bis auf Ausdriicke aus elementare Punktionen auf eine der kanonischen Formen (5.185), (5.186) und (5.187) reduziert werden. m) Driicken Sie das Integral f .'^^ durch kanonische elliptische Integrale aus. n) Driicken Sie die Stammfunktionen der Punktionen '
, '" „ und Vcos 2x
,
'"
durch
v c o s a —cosx
elliptische Integrale aus. 6. Finden Sie bis auf eine lineare Funktion Ax + B Stammfunktionen mit Hilfe der unten eingefiihrten Schreibweise fiir die folgenden, nicht elementaren besonderen Punktionen:
f e""
a) Ei (x) = / —da; (Integralexponential). J X smx Ax (Integralsinus). b) Si (x) = / '"""^ J
X
c) Ci (x) = / J
Ax (Integralcosinus X
342
5 Differentialrechnung smh X
/
X
cosh X
/
dx (Integralsinus hyperbolicus). da; (Integralcosinus hyperbolicus).
f) Die Fresnel-Integrale S{x) = I sinx dx und C{x) = I COST dx . g)
(Integrallogarithmus).
7. Zeigen Sie, dass die folgenden Gleichungen bis auf eine Konstante wahr sind: a) Ei (x) = li (x) b) Chi(x) = i Ei (x) + Ei (-a;)]. c) Shi (x) = i E i ( x ) - E i ( - x ) l . d) Ei (ix) = C i » + iSi (x) e) e'"/''#(a;e-'"/'*) =
C{x)+iS(x).
8. Eine Differentialgleichung der Form dy _ fix) dx 5(2/) wird Gleichung mit separierbaren Variablen genannt, da sie zu 9{y)dy = fix)dx
,
in der die Variablen x und y separiert sind, umformuliert werden kann. Danach lasst sich die Gleichung wie folgt durch Berechnung der entsprechenden Integrale berechnen: / 9(y)
/
fix)dx + c
Losen Sie die folgenden Gleichungen: Ix'^yy' + y' = 2. xyy' = Vl + x^. y' = cos(y + x), mit u(x) = y{x) + x. x^y — cos22/ = 1. Finden Sie die Losung, die die Bedingung y{x) —>• 0 fiir x —> +00 erfiillt. e) ^y'(x) = Si(x). i) vlM= c{x).
a) b) c) d)
'
cos X
^
'
9. Ein Fallschirmspringer sprang aus einer Hohe von 1, 5 km und offnete seinen Schirm in einer Hohe von 0, 5 km. Wie lange dauerte der Fall bis zur OfFnung des Schirms? Gehen Sie dabei von der Endgeschwindigkeit beim Fall eines Menschen durch Luft normaler Dichte von 50 m/s aus. Losen Sie das Problem unter der Annahme, dass der Luftwiderstand proportional ist zu: a) der Geschwindigkeit, b) dem Quadrat der Geschwindigkeit. Vernachlassigen Sie die Anderung des Drucks mit der Hohe.
5.7 Stammfunktionen
343
10. Es ist bekannt, dass die Geschwindigkeit beim Austritt von Wasser aus einer kleinen Offnung im Bodeii eines Kessels ziemlich genau durch die Formel 0, &\/2gH beschrieben werdeii kanii, wobei g die Erdbeschleunigung und H die Hohe der Wasseroberflache oberhalb der Offnung ist. Bin zylindrisches Pass wird aufrecht hingestellt und besitzt am Boden eine Offnung. Die Halfte des Wassers des vollen Passes flieflt in 5 Minuten aus. Wie lange dauert es, bis alles Wasser ausgeflossen ist? 11. Welclie Form sollte ein fester rotationssymmetrisclier Kessel liaben, damit die Wasseroberflaclie mit konstanter Gescliwindigkeit sinkt, wenn das Wasser im Boden ausfliefit? (vgl. Aufgabe 10 fiir die Anfangsdaten). 12. In einer 10^ m^ grofien Werkstatt liefern Ventilatoren 10^ m^ Priscliluft pro Minute, die 0, 04% CO2 entlialt. Dieselbe Luftmenge wird ausgeblasen. Um 9:00 morgens beginnen die Arbeiter und nacli einer lialben Stunde ist der Gelialt an CO2 in der Luft um 0,12% gestiegen. Berechnen Sie den Gehalt an Kohlendioxid in der Luft um 14:00.
6 Integralrechnung
6.1 Definition des Integrals und Beschreibung der Menge der integrierbaren Funktionen 6.1.1 Problemstellung und einfiihrende Betrachtungen Angenommen, ein Punkt bewege sich entlang der reellen Geraden, wobei s{t) seine Koordinate zur Zeit t ist und v{t) = s'{t) seine Geschwindigkeit zu derselben Zeit t. Angenommen, wir kennen die Position s{to) des Punktes zur Zeit to und seine Geschwindigkeit zu jeder Zeit. Mit diesen Informationen wollen wir fiir jedes t > to die Position s{t) berechnen. Wenn wir davon ausgehen, dass sich die Geschwindigkeit v{t) kontinuierhch andert, kann die Verschiebung des Punktes in einem kleinen ZeitintervaU naherungsweise als das Produkt v{T)At der Geschwindigkeit in einem behebigen Moment T in diesem Intervall und der GroBe des ZeitintervaUs berechnet werden. Aus dieser Uberlegung heraus unterteilen wir das IntervaU [to,t], indem wir einige Zeiten ti (i = 0,...,n) markieren, so dass to < ti < • • • < tn = t und die IntervaUe [tj_i, tj] klein sind. Sei Ati = ti — ti-i und Ti G [ti-i,ti]. Dann erhalten wir die Naherungsgleichung n
sit) - s(to) ~ J2 "(^') '^^i • Entsprechend unserem Gedankenexperiment wird diese Naherungsgleichung umso genauer, je kleiner die TeihntervaUe des abgeschlossenen IntervaUs [to,t] werden. Wenn die Lange A des groi^ten dieser IntervaUe gegen NuU strebt, konnen wir schhei3en, dass der Grenzwert die folgende exakte Gleichung erfiiUt: n
hm V v{Ti)Ati = s{t) - s{to) .
(6.1)
i=l
Diese Gleichung ist nichts anderes als die Newton-Leibniz Formel (Fundamentalsatz der Infinitesimalrechnung), die fiir die ganze Analysis von zentraler
346
6 Integralrechnung
Bedeutung ist. Sie versetzt uns auf der einen Seite in die Lage, eine Stammfunktion s{t) numerisch aus ihrer Ableitung v{t) zu bestimmen und erlaubt n
es auf der anderen Seite, den Grenzwert der Summe ^ v{Ti)Ati auf der lini=l
ken Seite aus einer Stammfunktion s{t), die irgendwie bestimmt wurde, zu berechnen. Derartige Summen, sogenannte Riemannsche Summen, finden wir in zahlreichen Situationen. Beispielsweise wollen wir wie schon Archimedes versuchen, die Flache unterhalb der Parabel y = x'^ auf dem abgeschlossenen Intervall [0,1] zu bestimmen (vgl. Abb. 6.1). Ohne allzu sehr ins Detail zu gehen und ohne Klarung
0
Xi Xi+i
1
X
A b b . 6.1.
der Frage, was die Flache in einer Abbildung bedeutet (darum werden wir uns spater kiimmern), werden wir wie Archimedes vorgehen und die Abbildung mit einigen Figuren ausmalen - Rechtecken, deren Flache wir zu berechnen wissen. Nachdem wir das abgeschlossene Intervall [0,1] durch Punkte 0 = a;o < a;i < • • • < a;„ = 1 in winzige abgeschlossene Intervalle [xi-i,Xi] unterteilt haben, konnen wir offensichtlich die gewiinschte Flache a als Summe der Flachen der in der Abbildung gezeigten Rechtecke verstehen: '^ ~ ^^l-l^Xi
,
mit Axi = Xi — Xi-i. Wenn wir f{x) = x'^ und ^i = Xi-i setzen, konnen wir die Formel umschreiben zu n i=l
In dieser Schreibweise bilden wir den Grenzwert n
limV/(C,)Zia;, = r7, A-s-O
^—'
(6.2)
6.1 Definition des Integrals
347
wobei A wie oben die Lange des groi^ten Intervalls [ 1 der Unterteilung ist. Formel (6.2) unterscheidet sich von (6.1) nur in der Schreibweise. Wenn wir fiir einen Augenblick die geometrische Bedeutung von /(^j) Axi vergessen und X als Zeit und f{x) als Geschwindigkeit sehen, gelangen wir zu einer Stammfunktion F{x) der Funktion f{x) und erhalten so nach (6.1), dass a = F(1)-F(0). In unserem Fall ist f{x) = a;^, so dass F{x) = ^x^ + c und a = F{1) — F(0) = ^. Dies stimmt mit dem Ergebnis, das Archimedes durcli direkte Bereclinung des Grenzwertes in (6.2) erhalten hat, iiberein. Ein derartiger Grenzwert einer Sumnie wird Integral genannt. Daher stellt die Newton-Leibniz Formel (6.1) einen Zusammenhang zwischen dem Integral und der Stammfunktion her. Wir wenden uns nun der genauen Formulierung und dem allgemeinen Beweis dessen, was wir eben heuristisch erhalten haben, zu. 6.1.2 Definition des Riemannschen Integrals a. Unterteilungen Definition 1. Fine Unterteilung P eines abgeschlossenen Intervalls [a,b] ist eine endliche Menge von Punkten XQ, ... ,Xn des Intervalls, so dass a = XQ < xi < • • • < x„ = b.
Die Intervalle [ ], (i = 1,... ,n) werden Intervalle der Unterteilung P genannt. Die groBte Lange der Intervalle der Unterteilung P, die mit A(P) symbolisiert wird, wird Schrittweite oder Gitterfunktion der Unterteilung genannt. Definition 2. Wir sprechen von einer Punkten {P,0 auf dem abgeschlossenen lung P von [a,b] vorliegt und wir einen Intervalle der Unterteilung [a;j_i,a;j] (i =
Unterteilung mit ausgezeichneten Intervall [a,b], wenn eine UnterteiPunkt ^i £ [a;j_i,a;j] in jedem der 1,... ,n) gewahlt haben.
Wir symbolisieren die Menge der Punkte {^i,... ,^„} mit dem einfachen Buchstaben ^. b. Eine Basis der Menge der Unterteilungen Wir betrachten die folgende Basis B = {B^} in der Menge V der Unterteilungen mit ausgezeichneten Punkten auf einem vorgegebenen Intervall [a,b]. Das Element B^, d > 0 der Basis B besteht aus alien Unterteilungen mit ausgezeichneten Punkten (P, ^) auf [a,b] fiir die A(P) < d. Wir woUen zeigen, dass {B^} mit d > 0 tatsachlich eine Basis in V ist. Zunachst einmal ist B^ ^ 0 , denn es ist offensichthch, dass zu jeder Zahl d > 0 eine Unterteilung P von [a, b] mit Schrittweite A(P) < d existiert
348
6 Integralrechnung
(etwa eine Unterteilung in n kongruente abgeschlossene Intervalle). Aber dann existiert auch eine Unterteilung (P, ^) mit ausgezeichneten Punkten, fiir die A(P) < d. Des Weiteren ist es fiir di > 0, ^2 > 0 und d = minjdi, ^2} oflFensichtlich, dass i?di n Bci2 = B^ £ B. Daher ist B = {B^} tatsachlich eine Basis in V. c. Riemannsche Summen Definition 3. Ist eine Funktion auf dem abgeschlossenen Intervall [a, b] definiert und ist (P, ^) eine Unterteilung mit ausgezeichneten Punkten auf diesem abgeschlossenen Intervall, dann ist n
a{!-P,S,):=Y,f{S,i)Axi,
(6.3)
i=l
mit Axi = Xi — Xi-i, die Riemannsche Summe der Funktion / zur Unterteilung (P,^) mit ausgezeichneten Punkten auf [a,b]. Daher ist zu der vorgegebenen Funktion / die Riemannsche Summe cr{f;P,£,) eine Funktion ^(p) = a{f;p) auf der Menge V aller Unterteilungen p = (-P, 0 niit ausgezeichneten Punkten auf dem abgeschlossenen Intervall Da in "P eine Basis B existiert, konnen wir den Grenzwert der Funktion ^(p) auf dieser Basis untersuchen. d. Das Riemannsche Integral Sei / eine auf einem abgeschlossenen Intervall [a, b] definierte Funktion. Definition 4. Die Zahl / ist das Riemannsche Integral der Funktion / auf dem abgeschlossenen Intervall [a,b], faUs fiir jedes e > 0 ein (5 > 0 existiert, so dass
E/(^^)^«
< e
fiir jede Unterteilung (P,^) mit ausgezeichneten Punkten auf [a,b], deren Schrittweite A(P) kleiner als 6 ist. Da die Unterteilungen p = {P,£,), fiir die A(P) < 6, die Elemente Bg der oben eingefiihrten Basis B auf der Menge V der Unterteilungen mit ausgezeichneten Punkten bilden, ist Definition 4 aquivalent zur Aussage / = lim^fp) , B
6.1 Definition des Integrals
349
d.h., das Integral / ist auf B der Grenzwert der Riemannschen Summen der Funktion / niit entsprechenden Unterteilungen mit ausgezeichneten Punkten a u f [a,b].
Es ist nur natiirlich, die Basis B mit A(P) ^ 0 zu bezeichnen. Damit kann die Definition des Integrals neu geschrieben werden: n
^=.}T
E/(^^)^«^-
(6.4)
Das Integral von f{x) auf [a, b] wird mit
f{x) dx bezeichnet. Dabei werden die Zahlen a und b die unteren und oberen Integrationsgrenzen genannt. Die Funktion / wird Integrand und x die Integrationsvariable genannt und f{x) dx wird als Differentialform bezeichnet. Somit ist also: (6.5)
Definition 5. Eine Funktion / ist auf dem abgeschlossenen Intervall [a,b] Riemann-integrierbar, wenn der Grenzwert der Riemannschen Summen in (6.5) fiir A(P) —>• 0 existiert (d.h., das Riemannsche Integral ist definiert). Die Menge der auf einem abgeschlossenen Intervall [a, b] Riemann-integrierbaren Funktionen wird mit IZ[a, b] bezeichnet. Da wir fiir eine Weile keine anderen Integrale auBer den Riemannschen Integralen betrachten, vereinbaren wir, der Einfachheit halber, nur „Integral" und „integrierbare Funktion" anstelle von „Riemannsches Integral" und „Riemann-integrierbare Funktion" zu sagen. 6.1.3 Die Menge der integrierbaren Funktionen Laut Definition des Integrals (Definition 4) und ihren Umformungen zu (6.4) und (6.5) ist ein Integral der Grenzwert einer gewissen Spezialfunktion ^(p) = a{f; P, ^), die Riemannsche Summe, die auf der Menge V der Unterteilungen p = (-P, 0 n^it ausgezeichneten Punkten definiert ist. Dieser Grenzwert wird auf der Basis B, die wir als A(P) —>• 0 bezeichnet haben, in V gebildet. Daher hangt die Integrierbarkeit einer Funktion / auf [a, h\ von der Existenz dieses Grenzwertes ab. Nach dem Cauchyschen Konvergenzkriterium existiert der Grenzwert genau dann, wenn fiir jedes e > 0 ein Element Bg G B existiert, so dass
350
6 Integralrechnung \
fiir beliebige Unterteilungen p', p" in Bg. Genauer formuliert bedeutet das eben Gesagte, dass fiir jedes e > 0 ein 6 > 0 existiert, so dass
Wif;P',a-'yif;P",n\<s Oder, was dasselbe ist, < e i=l
(6.6)
i=l
fiir beliebige Unterteilungen {P',£,') und {P",^") mit ausgezeichneten Punkten auf dem Intervall [a, b] mit A(P') < 6 und A(P") < S. Wir werden das eben forniulierte Cauchysche Kriteriuni benutzen, urn zunachst eine einfache notwendige Bedingung und dann eine hinreichende Bedingung fiir die Riemann-Integrierbarkeit einer Funktion aufzustellen. a. Eine notwendige Bedingung fur die Integrierbarkeit Satz 1. Eine notwendige Bedingung fiir die Riemann-Integrierbarkeit einer auf einem abgeschlossenen Intervall [a, b] definierten Funktion f ist, dass f auf [a, b] beschrankt ist. In Kurzform: (/ £ TZ[a, b]) ^ (/ ist beschrankt auf [a, b]) . Beweis. Ist / niclit auf [a, b] beschrankt, dann ist in jeder Unterteilung P von [a,b] die Funktion / zumindest in einem der Intervalle [a;j_i,a;j] von P unbeschrankt. Dies bedeutet aber, dass wir den Punkt ^j £ [ 1 auf verschiedene Weise wahlen konnen, so dass |/(^j)Z\a;j| behebig groB wird. Dann n
kann aber die Riemannsche Summe a{f;P,^)
= ^ f{^i)Axi
betragsmaBig
i=l
ebenfalls beliebig groB werden, wenn wir nur den Punkt ^i in diesem Intervall verandern. Es ist daher klar, dass es in so einem Fall keinen endlichen Grenzwert der Riemannschen Summe geben kann. Dies war allerdings bereits aus dem Cauchyschen Kriterium klar, da (6.6) in diesem Fall auch fiir beliebig feine Unterteilungen nicht erfiillt sein kann. D Wir wir sehen werden, ist die so erhaltene notwendige Bedingung weit davon entfernt, sowohl notwendig als auch hinreichend fiir die Integrierbarkeit zu sein. Sie setzt uns jedoch in die Lage, unsere Untersuchungen auf beschrankte Funktionen einzuschranken.
6.1 Definition des Integrals
351
b. Eine hinreichende Bedingung fiir die Integrierbarkeit und die wichtigsten Klassen integrierbarer Funktionen Wir beginnen niit einigen Schreibweisen und Annierkungen, die wir bei den weiteren Erklarungen benutzen werden. Wir vereinbaren, dass wir fiir eine vorgegebene Unterteilung P auf dem Intervall [a, b] a = XQ < xi < • • • < Xn = b das Symbol Z\j benutzen, um das Intervall [a;j_i,a;j] zu bezeichnen und Axi fiir die Differenz Xi — Xi-i. Wird eine Unterteilung P des abgesclilossenen Intervalls [a, b] aus der Unterteilung P durch Hinzufiigen neuer Punkte gewonnen, werden wir P eine Verfeinerung von P nennen. Bei der Konstruktion einer Verfeinerung P einer Unterteilung P werden einige (vielleiclit aucli alle) der abgesclilossenen Intervalle Z\j = [a;j_i,a;j] der Unterteilung P wieder welter unterteilt: Xi-i = Xio < ••• < Xim = Xi. In dieseni Zusamnienhang wollen wir die Punkte von P doppelt indizieren. Bei der Schreibweise Xij bedeutet der erste Index, dass Xij £ Z\j, und der zweite Index ist die gewohnliche Nummer des Punktes im abgeschlossenen Intervall Z\j. Nun ist es nur natiirlich Axij := Xij — Xij-i und Aij := [xij-i,Xij] zu definieren. Dalier ist Axi = Axu + • • • + Axim • Als Beispiel fiir eine Unterteilung, die eineJVerfeinerung fiir sowohl die Unterteilungen P' als auch P" ist, konnen wir P = P' L) P" wahlen, d.h. die Vereinigung der Punkte der beiden Unterteilungen P' und P". Wir wiederholen schliefilich, dass uj{f; E) wie zuvor die Oszillation der Funktion / auf der Menge E bezeichnet, d.h. i^{f-,E):=
sup x' ,x"€E
\f{x')-f{x")\.
Insbesondere ist w(/; Z\j) die Oszillation von / auf dem abgeschlossenen Intervall Z\j. Diese Oszillation ist notwendigerweise endlich, falls / eine beschrankte Funktion ist. Wir wollen nun eine hinreichende Bedingung fiir die Integrierbarkeit aufstellen und beweisen. Satz 2. Eine hinreichende Bedingung fiir die Integrierbarkeit einer beschrdnkten Funktion f auf einem abgeschlossenen Intervall [a, b] ist, dass fiir jedes e > 0 eine Zahl 6 > 0 existiert, so dass
Y,<^i.f;A)Axi <e i=l fiir jede Unterteilung P von [a,b] mit Schrittweite X{P) < 6.
352
6 Integralrechnung
Beweis. Sei P eine Unterteilung von [a, b] und P eine Verfeinerung von P. Wir wollen den Unterschied zwischen den Rieniannschen Sumnien a(f; P, ^) — a(f; P, ^) abschatzen. Mit Hilfe der oben eingefiihrten Schreibweise konnen wir folgendes forniulieren:
Hf;P,i)-'T{f;P,0\ i=l j=l
i=l j=l
i=l
i=l
j=l
E E (/(^^i) - f(^i))^^v ^ E E l/(^^i) - fi^iM^ii < i=l j=l
n
i=l rii
j=l
n
< E E ^(/; ^i)^^ij = E ^(/; ^^)^^^ i=i
i=l
j=i
Bei dieser Berechnung haben wir die Gleichung Ax
^ Axij und die i=i
Ungleichung |/(CJJ) — / ( 6 ) l < '^(/S'^j) ausgenutzt, die giiltig sind, da ^ij e Z\jj C Ai und Ci £ "^j. Aus der Abschatzung fiir die DifFerenz der Riemannschen Sumnien folgt, dass wir fiir jedes e > 0 ein 6 > 0 finden, so dass
k(/;^,a-^(/;^,0|<| fiir jede Unterteilung P von [a, b] mit Schrittweite A(P) < 6, jede Verfeinerung P von P und jede Wahl der Mengen der ausgezeichneten Punkte ^ und ^, falls die Funktion die hinreicliende Bedingung erfiillt, die in der Aussage von Satz 2 forniuliert wurde. Sind nun {P',C) und {P",£,'') beliebige Unterteilungen mit ausgezeichneten Punkten auf [a, b], deren Sclirittweiten A(P') < 6 und A(P") < 6 erfiillen, dann muss nach dem eben Bewiesenen fiir die Unterteilung P = P' U P", die fiir beide Unterteilungen eine Verfeinerung ist, gelten:
Hf;P,0-'T{f;P'\n\
<
Daraus folgt, dass |a(/;P',n-^(/;^",m<e vorausgesetzt, dass A(P') < S und A(P") < 6. Dalier existiert nach dem Cauchyschen Kriterium der Grenzwert der Riemannschen Sumnien:
6.1 Definition des Integrals
353
n
d.h./e7^[a,&].
D
KoroUar 1. (/ £ C[a,b]) ^ (/ £ TZ[a,b]), d.h., jede auf eineni abgeschlossenen Intervall stetige Funktion ist auf diesem abgeschlossenen Intervall integrierbar. Beweis. Ist eine Funktion auf einem abgeschlossenen Intervall stetig, dann ist sie aucli darauf beschrankt, so dass die notwendige Bedingung in diesem Fall erfiillt ist. Aber eine auf einem abgeschlossenen IntervaU stetige Funktion ist auf diesem Intervall gleichmaBig stetig. Daher existiert zu jedem e > 0 ein (5 > 0, so dass uj{f;A) < j ^ auf jedem abgeschlossenen IntervaU A C [a, 6], dessen Lange kleiner als 5 ist. Somit erhalten wir fiir jede Unterteilung P mit Schrittweite A(P) < 6, dass n
V w(/; Ai)Axi ^—' 1=1
n
< - ^ V Axi = T^{b - a) = e . b — a ^—' b—a 1=1
Nach Satz 2 konnen wir folgern, dass / € TZ[a, h\.
D
KoroUar 2. Ist eine auf einem abgeschlossenen Intervall [a,b] beschrdnkte Funktion f mit Ausnahme einer endlichen Punktmenge iiberall stetig, dann ist f e 7^[a,6]. Beweis. Sei w(/; [a,b]) < C < oo. Wir nehmen an, dass / auf [a,b] k Unstetigkeitsstellen besitzt. Wir werden beweisen, dass die hinreichende Bedingung fiir die Integrierbarkeit der Funktion / erfiillt ist. Zu vorgegebenem e > 0 wahlen wir die Zahl 5i = -^^r^ und konstruieren die (5i-Umgebung zu jedem der k Unstetigkeitsstellen von / auf [a, h\. Das Komplement der Vereinigung dieser Umgebungen in [a, b] besteht aus einer endlichen Zahl abgeschlossener Intervalle. Dabei ist / auf jedem dieser IntervaUe stetig und folghch gleichmaBig stetig. Da die Anzahl dieser IntervaUe endhch ist, existiert zu gegebenem e > 0 ein (52 > 0, so dass auf jedem Intervall Z\, dessen Lange kleiner als 82 ist und das vollstandig in einem der eben genannten abgeschlossenen IntervaUe hegt, in denen / stetig ist, uj{f]A) < 2(b-a) SiltWir wahlen nun 6 = min{(5i,(52}. Sei P eine behebige UnterteUung von [a, b] fiir die A(P) < 5. Wir teilen n
die Summe ^ w(/; Ai)Axi,
die zur Unterteilung P gehort, in zwei Telle:
i=l n
J2 ^ ( / ; A)Zixi = ^ ' a j ( / ; Ai)Axi + J2"ojif; Ai)Axi
.
i=\
Die Summe ^ ' enthalt die Glieder, die zu den Intervallen Z\j der Unterteilung gehort, die keine gemeinsamen Punkte mit irgendeiner der (5i-Umgebungen der
354
6 Integralrechnung
Unstetigkeitsstellen besitzen. Fiir diese Intervalle Z\j erhalten wir uj{f; Z\j) < 2(T^ und folglich
E'-(/; ^o^-« < ^
E'^-« < ^ ( ^ -«) = !•
Die Sumnie der Langen der verbleibenden Intervalle der Unterteilung P betragt, wie wir einfach selien konnen, hochstens {S+2di+d)k < 4:-§^-k und daher ist
E"^(/; A)4x, < c J2"Ax, < c • ^ = I. Daher erhalten wir fiir A(P) < S, dass
Y^uj{f;Ai)Axi
<e
1=1
d.h., die hinreichende Bedingung fiir die Integrierbarkeit ist erfiillt und somit ist / e 7^[a,&]. D KoroUar 3. Eine auf einem abgeschlossenen Intervall monotone Funktion ist auf diesem Intervall integrierbar. Beweis. Aus der Monotonie von / auf [a, &] folgt, dass a;(/; [a,b])=\f{b)—f{a)\. Sei e > 0 gegeben. Wir setzen 6 = ^^^TZTTT^- Sei f{b) — f{a) ^ 0, da ansonsten / konstant ist und dann unzweifelhaft integrierbar ist. Sei P eine beliebige Unterteilung von [a, b] mit Schrittweite \{P) < 6. Dann erhalten wir unter Beriicksichtigung der Monotonie von / , dass n
n
i=l
i=l
n
i=l
6 Y.{f{Xi)-f{Xi.,))
S\f{b)-f(a)\
i=l
Daher erfiillt / die hinreichende Bedingung fiir die Integrierbarkeit und folglich ist / e7^[a,&]. D Eine monotone Funktion kann eine (abzahlbar) unendliche Menge von Unstetigkeitsstellen auf einem abgeschlossenen IntervaU haben. So ist beispielsweise die folgenderniaBen definierte Funktion ( 1 - 2 ^ fiir 1 - 2 ^ <x <1-^
,
neN,
fix) = I [
1
fiir X = 1
auf [0,1] nicht absteigend und besitzt in jedem Punkt der Form 1 — ^ , n € N eine Unstetigkeit.
6.1 Definition des Integrals
355
Anmerkung. Wir halten fest, dass wir, obwohl wir im Augenblick mit reellen Funktionen auf eineni Intervall umgehen, keinen Gebrauch von der Ann a h m e gemacht haben, dass die Funktion reell, anstelle von komplex ist. Sogar vektorwertige Funktionen auf dem abgeschlossenen Intervall [a, b] sind nicht ausgeschlossen. Dies gilt fiir die Definition des Integrals und bei den oben bewiesenen Satzen mit Ausnahnie von KoroUar 3. Auf der anderen Seite gilt das Konzept der oberen und unteren Riemannschen Sumnien, das wir nun betracliten wollen, nur fiir Funktionen mit reellen Werten. D e f i n i t i o n 6. Sei / : [a, 6] —>• M eine Funktion mit reellen Werten, die auf dem abgeschlossenen Intervall [a, b] definiert und besclirankt ist. Sei P eine Unterteilung von [a, b] und seien Z\j (« = 1 , . . . , n) die Intervalle der Unterteilung P und seien rrii = inf f{x) und Mj = sup f{x){i = l,...,n). Die Summen n
sif;P)
•=
'^niiAxi i=l
und n
S{f;P):=Y,MiAxi i=l
werden untere bzw. obere Riemannsche Summen der Funktion / auf dem Intervall [a, b] zur Unterteilung P dieses Intervalls^ genannt. Die Summen s{f;P) und S{f;P) werden auch untere bzw. obere Darboux-Summen zur Unterteilung P von [a, b] genannt. Ist (P,^) eine beliebige Unterteilung mit ausgezeichneten P u n k t e n auf [a,b], dann ist offensiclitlich sif;P)<'yif;P,0<Sif;P).
(6.7)
L e m m a 1.
s{f;P)
= infa(/;P,a,
S{f;P)
= supa(/;P,ai
Beweis. Wir wollen z.B. beweisen, dass die obere Darboux-Summe zur Unterteilung P des abgeschlossenen Intervalls [a, b] die kleinste obere Schranke der Riemannschen Summen zur Unterteilung mit ausgezeichneten P u n k t e n (P, ^) ist, wobei das Supremum iiber alle Mengen ^ = ( ^ i , . . . ,Cn) ausgezeichneter P u n k t e gebildet wird. ^ Der Ausdruck „Rieniannsche Sumnie" ist hierbei nicht ganz exakt, da rrsj und Mi nicht inimer Werte der Funktion / in eineni Punkt ^i £ Ai sind.
356
6 Integralrechnung
Mit Riicksicht auf (6.7) geniigt der Beweis, dass fiir jedes e > 0 eine Menge ^ ausgezeichneter Punkte existiert, so dass S{f;P)
(6.8)
Nach Definition der Zahlen Mj gibt es fiir jedes i £ { 1 , . . . , n} einen Punkt 6 G Ai, in dem Mi < /(^i) + jr^- Sei ^ = (^i,. •., Cn)- Dann ist n
n
n
i=l
i=l
i=l
womit der Beweis der zweiten Behauptung des Lemmas abgeschlossen wird. Die erste Behauptung wird ganz ahnlich bewiesen. D Aus diesem Lemma und der Ungleichung (6.7) leiten wir unter Beriicksichtigung der Definition des Riemannschen Integrals den folgenden Satz her. Satz 3. Eine beschrdnkte reelle Funktion / : [a, 6] —>• M ist genau dann auf [a, b] Riemann-integrierbar, wenn die folgenden Grenzwerte existieren und zueinander gleich sind: 1=
hm
s(/;P)
und
1=
hm
S(f;P).
(6.9)
In diesem Fall ist der gemeinsame Wert I = £= I gleich dem Integral b
f{x)dx . Beweis. Existieren die Grenzwerte (6.9) und stimmen sie iiberein, konnen wir aus den Eigenschaften des Grenzwertes und aus (6.7) folgern, dass die Riemannsche Summe einen Grenzwert besitzt und dass
Ist auf der anderen Seite / € TZ[a, b], d.h., existiert der Grenzwert hm
a{f;P,0=I,
dann folgern wir aus (6.7) und (6.8), dass der Grenzwert existiert und dass 1 = 1. Ganz ahnlich konnen wir beweisen, dass
lim
s(f:P)
A(P)^0
^•''
lim
S{f;P)
= I = I. ^
-
= I D
6.1 Definition des Integrals
357
Als Konsequenz von Satz 3 erhalten wir die folgende Verscharfung von Satz 2. Satz 2'. Es ist eine notwendige und hinreichende Bedingung fiir die RiemannIntegrierbarkeit einer auf einem abgeschlossenen Intervall [a, b] definierten Funktion f : [a, b] -^ M, dass gilt: n
lim
y^u:{!-Ai)Axi
= Q.
(6.10)
Beweis. Unter Beriicksichtigung von Satz 2 miissen wir nur nachweisen, dass die Bedingung (6.10) notwendig dafiir ist, dass / integrierbar ist. Wir merken an, dass uj{f; Z\j) = Mi — mi und dass daher n
n
J2 w(/; A)Axi i=l
= J2{Mi-
mi)Axi
= Sif; P) - s ( / ; P) ,
i=l
weswegen (6.10) nun aus Satz 3 folgt, falls / £ TZ[a, b].
D
c. Der Vektorraum 7t[a,b] Es lassen sich viele Operationen auf integrierbaren Funktionen ausfiihren, ohne sich dadurch auBerhalb der Klasse der integrierbaren Funktionen TZ[a, b] zu entfernen. Satz 4. Seien ,f,g G TZ[a,b]. Dann gilt: a){f + g)£n[a,b]. b) (af) £ TZ[a,b], wobei a ein numerischer Koejfizient ist. c)\f\Gn[a,b]. ^) f\[cd]^ ^[C' d]' M « h d] C [a, b]. e){f-g)GTZ[a,b]. Wir betrachten ini Augenblick nur Funktionen mit reellen Werten, aber wir woUen doch anmerken, dass die Eigenschaften a), b), c) und d) auch fiir koniplexe und vektorwertige Funktionen gelten. Fiir vektorwertige Funktionen ist das Produkt f • g im AUgemeinen nicht definiert, so dass Eigenschaft e) in diesem Zusammenhang nicht betrachtet wird. Diese Eigenschaft gilt jedoch auch fiir Funktionen mit komplexen Werten. Wir woUen nun Satz 4 beweisen. Beweis. a) Diese Behauptung ist offensichtlich, da n
n
n
J2if + gm)^Xi = J2 fi^i)^Xi + E5(6)^a;, .
358
6 Integralrechnung b) Diese Behauptung ist oflFensichtlich, da n
n
c) Da uj{\f\;E) < uj{f;E), konnen wir schreiben: n
n
J2oji\f\;Ai)Axi
< ^aj(/;Z\,)Z\xi ,
«=1
i=l
woraus wir mit Satz 2 folgern konnen, dass (/ € TZ[a, b]) ^ (|/| £ TZ[a, b]). d) Wir wollen zeigen, dass die Einschrankung / L , auf [c,d\ einer auf dem abgeschlossenen Intervall [a, b] integrierbaren Funktion / auch auf [c, d] integrierbar ist, falls [c,d\ C [a,b]. Sei TT eine Unterteilung von [c,d]. Indem wir Punkte zu TT liinzufiigen, erweitern wir sie zu einer Unterteilung P des abgeschlossenen Intervalls [a,b], so dass A(7r) < A(P). Es ist klar, dass dies imnier moglicli ist. Wir konnen dann
E,^(/lM];^O^a;, < J2^uj{f;Ai)Axi schreiben, wobei ^ ^ die Summe iiber alle Intervalle der Unterteilung TT ist und X]p die Summe iiber alle Intervalle von P. Mit unserer Konstruktion erhalten wir A(7r) -^ 0 fiir A(P) —>• 0 und daher konnen wir nach Satz 2' aus dieser Ungleichung folgern, dass (/ £ TZ[a, b]) ^ (/e7^[c,d]), falls [c,d\ C [a,b]. e) Wir zeigen zunachst, dass fiir / e TZ[a, b] auch /^ £ TZ[a, b]. Sei / £ TZ[a,b], dann ist / auf [a,b] beschrankt. Sei |/(a;)| < C < oo auf [a,b]. Dann ist | / ' ( x i ) - f{x2)\
= |(/(xi) + fix,))
und daher ujif'^;E) < 2Cujif;E),
• [fix,)
- fix,))
I < 2C\fix,)
-
fix,)\
falls E C [a,b]. Somit ist
n
n
J2ojif;Ai)Axi
< 2CY,'^if-Ai)Axi
,
woraus wir mit Satz 2' schlieBen konnen, dass (/£7^[a,6])^(/2£7^[a,6]). Wir wenden uns nun dem allgemeinen Fall zu. Dazu schreiben wir die Gleichung
{f-g){^) = \[{f +
9)'\^)-{f-g)\x)].
Aus dieser Gleichung und dem eben bewiesenen Ergebnis konnen wir zusammen mit dem bereits bewiesenen Teilen a) und c) folgern, dass (/ £ 7^[a, b\) A (ff £ 7^[a, 6]) ^ (/ • 5 £ 7^[a, b\) .
U
6.1 Definition des Integrals
359
Sie wissen bereits von ihrem Algebrastudium, was ein Vektorraum ist. Funktionen mit reellen Werten, die auf einer Menge definiert sind, konnen addiert und mit einer reellen Zalil multipliziert werden, wobei beide Operationen punktweise durchgefiihrt werden. Das Ergebnis ist wieder eine Funktion mit reellen Werten auf derselben Menge. Werden Funktionen als Vektoren betrachtet, dann konnen wir zeigen, dass alle Axiome eines Vektorraums iiber dem Korper der reellen Zalilen gelten und dass die Menge der Funktionen mit reellen Werten einen Vektorraum beziiglicli der punktweisen Addition und Multiplikation mit reellen Zalilen bilden. In den Teilen a) und b) von Satz 4 wurde behauptet, dass die Addition von integrierbaren Funktionen und die Multiplikation einer integrierbaren Funktion mit einer Zahl nicht aufierhalb der Klasse TZ[a, b] der integrierbaren Funktionen fiilirt. Daher ist TZ[a, b] selbst ein Vektorraum - ein Unterraum des Vektorraums der auf einem abgeschlossenen Intervall [a, b] definierten Funktionen mit reellen Werten. d. K r i t e r i u m n a c h L e b e s g u e fur d i e R i e m a n n - I n t e g r i e r b a r k e i t einer Funktion Zum Abschluss stellen wir fiir den Augenblick ohne Beweis einen Satz von Lebesgue vor, der eine intrinsische Beschreibung einer Riemann-integrierbaren Funktion erlaubt. Dazu fiihren wir das folgende Konzept ein, das auch fiir sich genommen wertvoll ist. D e f i n i t i o n 7. Eine Menge i? C ffi besitzt das Mafi Null (im Sinne von Lebesgue), wenn fiir jede Zahl e > 0 eine Uberdeckung der Menge E durch ein hochstens abzahlbares System von Intervallen {Ik} existiert, deren Langen oo
summiert hochstens e ist, d.h. '^ \Ik\ < £• fc=i oo
Da die Reihe ^
\Ik\ absolut konvergiert, spielt die Summationsreihen-
fc=i
folge der Langen der Intervalle der Uberdeckung keine Rolle (vgl. Satz 4 in Absatz 5.5.2), so dass die Definition eindeutig ist. L e m m a 2. a) Ein Punkt und eine endliche Anzahl von Punkten sind Mengen mit dem Mafi Null. b) Die Vereinigung einer endlichen oder abzahlbaren Anzahl von Mengen mit dem Mafi Null ist eine Menge mit dem Mafi Null. c) Eine Teilmenge einer Menge mit dem Mafi Null besitzt selbst das Mafi Null. d) Ein abgeschlossenes Intervall [a, b] mit a < b ist keine Menge mit Mafi Null.
360
6 Integralrechnung
Beweis. a) Ein Punkt wird von einem Intervall niit einer Lange, die beliebig kleiner ist als jede vorgegebene Zahl e > 0, iiberdeckt. Daher ist ein Punkt eine Menge mit dem Mai3 Null. Der Rest von a) folgt aus b). b) Sei E = L) E" eine hoclistens abzahlbare Vereinigung von Mengen E" n
mit dem Mafi Null. Sei e > 0, so konstruieren wir zu jedem _E" eine Uberdeckung {IJ}} von E"-, so dass ^ \I^\ < ^ . k
Da die Vereinigung einer hochstens abzahlbaren Ansammlung von liochstens abzahlbar vielen Mengen selbst wieder hochstens abzahlbar ist, bilden die Intervalle /^, k,n £ N eine hochstens abzahlbare Uberdeckung der Menge E und e e £
Ei^^" n.k
Die Reihenfolge der Indizes n und k in X] l-^fc*! spielt bei der Summation keine Rolle, da die Reihe fiir jede Summationsreihenfolge zu derselben Summe konvergiert, sobald sie auch nur fiir eine Anordnung konvergiert. Dies ist hier der Fall, da jede Teilsumme der Reihe durch e von oben beschrankt ist. Daher ist E eine Menge mit dem Mafi Null im Sinne von Lebesgue. c) Diese Aussage folgt offensichthch unmittelbar aus der Definition einer Menge mit dem Mafi Null und der Definition einer Uberdeckung. d) Da jede Uberdeckung eines abgeschlossenen IntervaUs durch offene Intervalle eine endliche Uberdeckung enthalt, deren Langensumme offensichthch nicht die Summe der Langen der Intervalle der urspriinglichen Uberdeckung iibersteigt, geniigt es zu zeigen, dass die Summe der Langen von offenen Intervallen, die eine endliche Uberdeckung eines abgeschlossenen IntervaUs [a, h] bilden, nicht kleiner ist als die Lange b — a des abgeschlossenen IntervaUs. Wir werden dies durch Induktion iiber die Anzahl der Intervalle in der Uberdeckung beweisen. Fiir n = 1, d.h., wenn das abgeschlossene Intervall [a, 6] in einem offenen IntervaU (cc,/?) enthalten ist, ist offensichthch, dass a < a < b < P und fi — a> h — a. Angenommen, die Aussage sei bis einschliefihch des Indexes fc £ N bewiesen. Wir betrachten eine Uberdeckung, die aus fc + 1 offenen Intervallen besteht. Wir greifen ein IntervaU (ai, 02) heraus, das den Punkt a enthalt. Ist Q^2 > &, dann ist 0:2 — cti > h — a und das Ergebnis ist bewiesen. Ist a < a2
6.1 Definition des Integrals
361
ist, was fiir uns auf den ersten Blick sehr iiberraschend ist, wenn wir dies vergleichen mit Teil d) desselben Lemmas. Definition 8. Gilt eine Eigenschaft fiir alle Punkte einer Menge X, auBer moglicherweise fiir Punkte einer Menge mit dem Mai3 Null, dann sagen wir, dass diese Eigenschaft fast iiherall auf X oder in fast jedem Punkt von X gilt. Wir formulieren nun das Integrierbarkeitskriterium nach Lebesgue. Satz. Eine auf einem abgeschlossenen Intervall definierte Funktion ist genau dann auf diesem Intervall Riemann-integrierbar, wenn sie beschrdnkt und in fast jedem Punkt stetig ist. Dies bedeutet: (/ e TZ[a, &]) <^ (/ ist besclirankt auf [a, b]) A A (/ ist fast iiberall stetig auf [a, &]) . Offensichtlicli konnen wir ganz einfacli die KoroUare 1, 2 und 3 und Satz 4 aus diesem Satz und den in Lemma 2 bewiesenen Eigenscliaften von Mengen mit dem Mafi Null herleiten. Wir werden diesen Satz liier nicht beweisen, da wir ilin nicht benotigen, um mit den sehr regularen Funktionen, die wir gegenwartig behandeln, umzugehen. Die wesentlichen Ideen beim Kriterium nach Lebesgue konnen wir jedoch unmittelbar erklaren. Satz 2' enthielt ein Kriterium fiir die Integrierbarkeit, das durch Glein
chung (6.10) zum Ausdruck gebracht wird. Die Summe ^ w(/; Ai)Axi
kann
i=l
auf der einen Seite daher klein sein, well die Faktoren uj{f;Ai), die in kleinen Umgebungen von Punkten, in denen die Funktion stetig ist, klein sind. Enthalten jedoch einige der abgeschlossenen Intervalle Z\j Unstetigkeitsstellen der Funktion, dann strebt uj{f; Z\j) fiir diese Punkte nicht gegen NuU und zwar unabhangig davon, wie fein wir die Unterteilung P auf dem abgeschlossenen Intervall [a,b] machen. Jedoch gilt uj{f;Ai) < uj{f;[a,b]) < oo, da / auf [a, b] beschrankt ist. Daher ist die Summe der Gheder, die Unstetigkeitspunkte enthalten, ebenfalls klein, falls die Summe der Langen der Intervalle der Unterteilung, die die Menge der Unstetigkeitsstellen iiberdecken, gering ist; genauer gesagt, faUs das Anwachsen der Oszillationen der Funktion auf einigen Intervallen der Unterteilung durch die GroBe der Gesamtlange dieser Intervalle kompensiert wird. Eine prazise Darstellung und Formulierung dieser Beobachtungen fiihrt zum Kriterium nach Lebesgue. Wir wollen nun zwei klassische Beispiele anfiihren, um die Eigenschaft der Riemann-Integrierbarkeit einer Funktion zu erklaren.
362
6 Integralrechnung
Beispiel 1. Die auf dem Intervall [0,1] definierte Dirichlet-Funktion
{
1 fiir a; e Q , 0 fiir a; e M \ Q ,
ist auf dieseni Intervall nicht integrierbar. Denn zu jeder Unterteilung P von [0,1] liegt in jedeni Intervall Z\j der Unterteilung sowolil ein rationaler Punkt ^[ als auch ein irrationaler Punkt ^". Dann ist
i=l
wahrend i=\
Daher kann die Riemannsche Sunime der Funktion T>{x) fiir A(P) —>• 0 keinen Grenzwert besitzen. Aus der Sicht des Kriteriums nacli Lebesgue ist die Nicht-Integrierbarkeit der Dirichlet-Funktion auch offensichtlich, da T>{x) in jedem Punkt in [0,1] unstetig ist, was, wie wir in Lemma 2 gezeigt haben, keine Menge mit dem Mafi NuU ist. Beispiel 2. Wir betrachten die Riemann-Funktion
{
^ , fiir X G Q , wobei x = ^ ein teilerfremder Bruch ist , 0 , fiir a; e K \ Q .
Wir haben diese Funktion bereits in Absatz 4.1.2 untersucht und wir wissen, dass Tl{x) in alien irrationalen Punkten stetig ist und unstetig in alien rationalen Punkten aufier der 0. Daher ist die Menge der UnstetigkeitssteUen von Tl{x) abzahlbar und folglich ist ihr MaB gleich Null. Nach dem Kriterium von Lebesgue ist Tl{x) auf jedem Intervall [a, 6] C M Riemann-integrierbar, obwohl in jedem Intervall jeder Unterteilung des Integrationsintervalls eine Unstetigkeitsstelle dieser Funktion liegt. Beispiel 3. Wir wollen nun ein weniger klassisches Problem und Beispiel betrachten. Sei / : [a, 6] ^ ffi eine auf [a, h] integrierbare Funktion mit Werten im Intervall [c, d\, auf dem eine stetige Funktion g : [c, li] —>•ffidefiniert ist. Dann ist die verkettete Funktion 5 o / : [a, 6] ^ M offensichthch definiert und stetig in all den Punkten von [a, h], in denen / stetig ist. Nach dem Kriterium nach Lebesgue folgt, dass g o f £ TZ[a, b]. Wir werden nun zeigen, dass die Verkettung zweier beliebiger integrierbarer Funktionen nicht immer integrierbar ist.
6.1 Definition des Integrals
363
Wir betrachten die Funktion ^(a;) = |sgn|(a;). Diese Funktion ist gleich 1 fiir a; 7^ 0 und 0 fiir a; = 0. Wir stellen fest, dass die Verkettung {g o f){x) auf dem abgeschlossenen Intervall [1,2] genau der Dirichlet-Funktion V{x) entspricht, wenn wir die Riemann-Funktion als / nehmen. Daher fiihrt die Gegenwart auch nur einer Unstetigkeit der Funktion g{x) zur Nicht-Integrierbarkeit der verketteten Funktion g ° f • 6.1.4 U b u n g e n u n d A u f g a b e n 1. Satz von Darboux. a) Seien s(f; P) und S{f; P) die untere und die obere Darboux-Sumnie zu einer Unterteilung P des abgeschlossenen Intervalls [o, 6] fiir eine auf diesem Intervall definierte und beschrankte Funktion / mit reellen Werten. Zeigen Sie, dass
P
Integral und das obere Darboux-Integral von / auf dem abgeschlossenen Intervall [a, h] genannt. Zeigen Sie, dass / < / . d) Beweisen Sie den Satz von Darboux: / =
lim
s(f; P ) ,
I =
lim
S(f; P ) .
e) Zeigen Sie, dass (/ G 7^[a, 6]) <^ (/ = / ) . f) Zeigen Sie, dass / G TZ[a, h] genau dann, wenn fiir jedes e > 0 eine Unterteilung P von [o, b] existiert, so dass S{f; P) — s{f; P ) < e. 2. Die Cantor-Menge mit Lebesgue-Mafi Null. a) Die in Aufgabe 7 in Abschnitt 2.4 beschriebene Cantor-Menge ist nicht abzahlbar. Zeigen Sie, dass sie nichtsdestotrotz eine Menge mit Lebesgue-Mafi 0 ist. Zeigen Sie, wie die Konstruktion der Cantor-Menge verandert werden kann, um eine analoge Menge „voller Locher" zu erhalten, die keine Menge mit Mafi Null ist. (Eine derartige Menge wird ebenfalls eine Cantor-Menge genannt). b) Zeigen Sie, dass die auf [0,1] definierte Funktion, die aufierhalb einer CantorMenge 0 ist und 1 auf der Cantor-Menge, genau dann Riemann-integrierbar ist, wenn die Cantor-Menge das Mafi Null besitzt. c) Konstruieren Sie eine nicht absteigende stetige und nicht konstante Funktion auf [0,1], deren Ableitung aufier in den Punkten einer Cantor-Menge mit Mafi Null iiberall Null ist.
364
6 Integralrechnung
3. Das Kriterium nach Lebesgue a) Zeigen Sie direkt (ohne Ausnutzung des Kriteriums nach Lebesgue), dass die Riemann-Funktion in Beispiel 2 integrierbar ist. b) Zeigen Sie, dass eine beschrankte Funktion genau dann zu TZ[a, b] gehort, wenn fiir je zwei Zahlen e > 0 und S > 0 eine Unterteilung P von [a, h] existiert, so dass die Sunime der Langen der Intervalle der Unterteilung, auf der die Oszillationen der Funktion grofier als e ist, hochstens gleich S ist. c) Zeigen Sie, dass / £ TZ[a, b] genau dann, wenn / auf [o, b] beschrankt ist und fiir jedes e > 0 und 5 > 0 die Menge der Punkte in [a, b], in denen die Oszillation von / grofier als e ist, durch eine endliclie Menge offener Intervalle iiberdeckt werden kann. Die Sunime der Langen dieser Intervalle ist kleiner als 6 (das Kriterium nach du Bois-ReymoncP). d) Beweisen Sie niit Hilfe der vorigen Teilaufgabe das Kriterium fiir die RiemannIntegrierbarkeit einer Funktion nach Lebesgue. 4. Zeigen Sie, dass fiir reelle Funktionen / , p G 7?.[a, 6] gilt: max{/, g} G 7?.[a, 6] und min{/, g} G 7^[o,6]. 5. Zeigen Sie: a) Sind / , p G Ti,[a,b] und f{x) = g{x) fast iiberall auf [a, 6], dann gilt 0
0
I f{x)dx
= /
gix)dx
b) Ist / G TZ[a,b] und f{x) = g(x) fast iiberall auf [a,b]. Dann kann g dennoch nicht Riemann-integrierbar auf [o, b] sein, und zwar selbst dann nicht, wenn g auf [a, b] definiert und beschrankt ist. 6. Integration einer vektorwertigen
Funktion
a) Sei r(i) der Radiusvektor eines Punktes, der sich im Raum bewegt, ro = r(0) die Ausgangsposition des Punktes und v(i) der Geschwindigkeitsvektor als Funktion der Zeit. Zeigen Sie, wie r(t) von ro und v(t) abhangt. b) Lasst sich die Integration vektorwertiger Funktionen auf die Integration von Funktionen niit reellen Werten zuriickfiihren? c) Gilt das in Satz 2' formulierte Kriterium fiir die Integrierbarkeit auch fiir vektorwertige Funktionen? d) Gilt das Kriterium nach Lebesgue fiir die Integrierbarkeit von vektorwertigen Funktionen? e) Welche Konzepte und Tatsachen dieses Abschnitts lassen sich auf Funktionen mit komplexen Werten iibertragen? P. du Bois-Reymond (1831-1889) - deutscher Mathematiker.
6.2 Linearitat, Additivitat und Monotonie des Integrals
365
6.2 Linearitat, Additivitat und Monotonie des Integrals 6.2.1 Das Integral als lineare Funktion auf dem Raum 7t[a,b] Satz 1. Sind f und g auf dem abgeschlossenen Intervall [a,b] integrierbar, dann ist eine lineare Kombination af + Pg auch auf [a, b] integrierbar und es gilt: b
b
{af + Pg){x) dx = a
b
f{x) dx + (] a
g{x) dx .
(6-11)
a
Beweis. Wir betrachten eine Riemannsche Summe fiir das Integral auf der linken Seite von (6.11) und fornien sie folgendermafien um: n
n
n
Y.^af + pgm)Axi =aJ2 I^^^i i—l
i=l
+ /?E5(6)^a;, .
(6.12)
i=l
Da die rechte Seite dieser letzten Gleichung gegen die Linearkombination von Integralen, die auf der rechten Seite von (6.11) stehen, strebt, wenn die Schrittweite X{P) der Unterteilung gegen 0 geht, muss auch die linke Seite von (6.12) fiir A(P) —^ 0 einen Grenzwert besitzen. Dieser Grenzwert muss mit dem Grenzwert auf der rechten Seite iibereinstimmen. Daher ist (af+Pg) £ TZ[a, b] und (6.11) ist giiltig. D Wenn wir TZ[a, b] als Vektorraum iiber dem Korper der reellen Zahlen b
betrachten und das Integral j f{x)dx
als eine Funktion mit reellen Werten,
a
die fiir Vektoren in TZ[a, b] definiert ist, dann stellt Satz 1 sicher, dass das Integral eine lineare Funktion auf dem Vektorraum TZ[a, b] ist. Um jegliche Verwirrung zu vermeiden, werden auf Funktionen definierte Funktionen iiblicherweise Funktionale genannt. Wir haben also gezeigt, dass das Integral ein lineares Funktional auf dem Vektorraum der integrierbaren Funktionen ist. 6.2.2 Das Integral als eine additive Funktion des Integrationsintervalls b
Der Wert des Integrals / f{x) dx = I{f; [a, b]) hangt sowohl vom Integranden a
als auch vom abgeschlossenen Intervall ab, iiber dem das Integral gebildet wird. Ist beispielsweise / £ TZ[a,b], dann ist, wie wir wissen, / L , e TZ[a,l3] fiir [a, /?] C [a, b], d.h., das Integral j f{x) dx ist definiert und wir konnen seine Abhangigkeit vom abgeschlossenen Integrationsintervall [a, (3] untersuchen.
366
6 Integralrechnung
L e m m a 1. Sei a < b < c und / £ TZ[a,c]. Dann gilt / L /L
, € TZ[b,c\ und die folgende
fix)
,, € TZ[a,h\ una
Gleichung^:
dx = / fix)
dx + / fix)
dx .
(6.13)
Beweis. Zunachst einmal halten wir fest, dass die Integrierbarkeit der Einschrankungen von / auf die abgeschlossenen Intervalle [a, b] und [b, c] durch Satz 4 in Abschnitt 6.1 garantiert ist. c
Als Nachstes konnen wir zur Berechnung des Integrals / fix)
dx als Grenz-
a
wert einer Riemannschen Summe jede beliebige Unterteilung von [a, c] wahlen, da / € TZ[a,c]. Wir warden im Folgenden nur solche Unterteilungen von [a,c] betrachten, die den P u n k t b enthalten. OfFensichtlich werden durch jede derartige Unterteilung mit ausgezeichneten P u n k t e n (P, ^) auch Unterteilungen (P',C') und ( P " , ^ " ) von [a,b] und [b,c] erzeugt, wobei P = P' U P" und Dann gilt aber die folgende Gleichung zwischen den entsprechenden Riemannschen Sumnien:
'yif;P,0
= 'yif;P',a
+
'yif;P",n-
Da A(P') < A(P) und A(P") < A(P), wird fiir geniigend kleines A(P) jede dieser Riemannschen Summen in das entsprechende Integral in Gleichung (6.13) iibergehen, die folglich giiltig sein muss. D Um die Anwendbarkeit dieses Ergebnisses etwas zu erweitern, kehren wir kurzfristig wiederum zur Definition des Integrals zuriick. Wir haben das Integral als den Grenzwert der Riemannschen Summen n
i=l
von Unterteilungen mit ausgezeichneten P u n k t e n (P, ^) des abgeschlossenen Integrationsintervalls [a, b] definiert. Eine Unterteilung besteht aus einer endlichen monotonen Folge von P u n k t e n xo,xi,... ,Xn, wobei XQ dem unteren E n d p u n k t a und x„ dem oberen E n d p u n k t b des Intervalls entspricht. Wir haben bei der Konstruktion angenommen, dass a < b. Wenn wir nun zwei beliebige P u n k t e a und b nehmen, ohne dabei a < 6 zu fordern, und a als die untere Intergrationsgrenze und b als die obere Intergrationsgrenze betrachten, ^ Wir erinnern daraii, dass / | B die Einschrankung der Funktion / auf die Menge E, die im Definitionsbereich von / enthalten ist, bedeutet. Rein formal betrachtet, hatten wir auf der rechten Seite von (6.13) die Einschrankung von / auf die Intervalle [a, h] und \b, c] schreiben soUen, anstatt nur / .
6.2 Linearitat, Additivitat und Monotonie des Integrals
367
werden wir niit unserer Konstruktion wieder zu einer Sunime wie in (6.14) gelangen. Dabei kann nun fiir a < b gelten, dass Axi > 0 (i = 1,... ,n) und fiir a > b, dass Axi < 0 (« = 1 , . . . , n ) , da Axi = Xi — Xi-i. Daher wird sich fiir a > b die Summe (6.14) von der Riemannschen Summe mit derselben Unterteilung des abgeschlossenen Intervalls [b, a] (b < a) nur durch das Vorzeichen unterscheiden. Aus dieser Betrachtung heraus treffen wir die folgende Vereinbarung: 1st a > b, dann ist b
a
f{x)dx:=—
/ f{x)dx.
a
(6.15)
b
In diesem Zusammenhang ist es nur natiirlich, f(x)dx:=0
(6.16)
zu setzen. Nach diesen Vereinbarungen gelangen wir unter Beriicksichtigung von Lemma 1 zu folgender wichtigen Eigenschaft des Integrals. Satz 2. Seien a,b,c G ffi und sei f eine integrierbare Funktion, die auf dem grofiten abgeschlossenen Intervall, das zwei dieser Punkte als Endpunkt besitzt, definiert ist. Dann ist die Einschrankung von f auf jedes der anderen abgeschlossenen Intervalle in diesem Intervall ebenfalls integrierbar, und es gilt die folgende Gleichung: b
c
fix) dx+ a
a
f fix) dx+ b
f fix) da; = 0 .
(6.17)
c
Beweis. Wegen der Symmetrie von (6.17) bzgl. a, b und c konnen wir ohne Beschrankung der Allgemeinheit annehmen, dass a = minja, 6,c}. Ist max{a, b,c} = c und a < b < c, dann gilt nach Lemma 1, dass b
c
fix) dx + a
b
c
fix) dx —
fix) da; = 0 ,
a
woraus wir, wenn wir die Vereinbarung (6.15) beriicksichtigen, (6.17) erhalten. Ist max{a, b,c} = b und a < c < b, dann gilt nach Lemma 1, dass e
b
fix) dx +
b
fix) dx —
fix) da; = 0 ,
368
6 Integralrechnung
woraus wir, wenn wir die Vereinbarung (6.15) beriicksichtigen, wiederum (6.17) erhalten. Sind schlieBlich zwei der Punkte a, b und c gleich, dann ergibt sich (6.17) aus den Vereinbarungen (6.15) und (6.16). D Definition 1. Angenonimen, wir ordnen jedeni geordneten Paar (cc,/?) von Punkten a, /3 £ [a, b] eine Zahl I{a, /3) zu, so dass /(a,7)=/(a,/?)+/(/3,7) fiir jedes Punktetripel Q;,/?,7 £ [a,b] gilt. Dann wird die Funktion I{a, (3) als eine auf in [a, b] enthaltenen Intervallen definierte additive (orientierte) Intervallfunktion bezeichnet. 1st / £ TZlA, B] und a,b,c G [A, B], dann konnen wir, wenn wir I (a, b) = b
J f{x)dx
setzen, aus (6.17) folgern, dass
a c
b
fix) dx= a
c
I fix) dx+ I fix) dx , a
(6.18)
b
d.h., das Integral ist auf dem Integrationsintervall eine additive Intervallfunktion. Die Orientierung des Intervalls entspringt in dieseni Fall unserer Anordnung der Endpunkte des Intervalls, indem wir vorgeben, welches der erste (die untere Integrationsgrenze) und welches der zweite Punkt (die obere Integrationsgrenze) ist. 6.2.3 Abschatzung des Integrals, Monotonie des Integrals und der Mittelwertsatz a. Eine allgemeine Abschatzung des Integrals Wir beginnen mit einer allgemeinen Abschatzung des Integrals, die, wie wir spater sehen werden, auch fiir Integrale von Funktionen gilt, die nicht notwendigerweise reelle Werte annehnien. Satz 3. Sei a < b und f £ TZ[a, b]. Dann ist auch | / | £ TZ[a, b] und es gilt die folgende Ungleichung: b
b
fix)dx
< l\f\{x)dx.
(6.19)
Ist \f\{x) < C auf [a,b], dann gilt: b
\f\ix)dx
.
(6.20)
6.2 Linearitat, Additivitat und Monotonie des Integrals
369
Beweis. Fiir a = b sind die Behauptungen trivial, so dass wir annelimen, dass a < b. Zum Beweis des Satzes geniigt die Erinnerung daran, dass (vgl. Satz 4 in Abschnitt 6.1) | / | £ TZ[a,b] und dass wir die folgende Abscliatzung fiir die Riemannsche Summe ( T ( / ; P , ^) sclireiben konnen:
E fi^i)^^i i=l
< E 1/(^^)1 l^^^^l = E \fi^i)\^^i i=l
i=l
C(& - a)
i=l
Der Ubergang zum Grenzwert fiir X{P) —>• 0 liefert f{x) dx < /
\.f\{x)dx
b. Monotonie des Integrals und erster Mittelwertsatz Die folgenden Ergebnisse gelten speziell fiir Integrale von Funktionen mit reellen Werten. Satz 4. Seien a < b, / i , / 2 G Tl[a,b] und sei fi{x) < f'lix) X G [a, b]. Dann gilt b
in jedem Punkt
b
/ i (x) dx < / /2 (x) dx
3.21)
Beweis. Fiir a = & ist die Beliauptung trivial.Fiir a < b geniigt es, die folgende Ungleichung fiir die Riemannschen Summen zu schreiben: E/i(?^)^«^^<E/2(Ci)^a;, i=l
i=l
Sie gilt, da Axi > 0 (« = 1 , . . . , n). Der Grenziibergang zu A(P) -^ 0 beendet den Beweis. D Der Satz lasst sich als Monotonieeigenscliaft des Integrals mit einer Funktion als Argument interpretieren. Satz 4 besitzt eine Reihe niitzliclier Korollare. KoroUar 1. Sei a < b, f G TZ[a,b] und m < f{x) X € [a, b]. Dann gilt
< M in jedem Punkt
b
m-{b-a)<
I fix) dx<M-{b-a) a
und insbesondere fiir 0 < f{x) auf [a, b], dass b
0 < / fix) dx .
(6.22)
370
6 Integralrechnung
Beweis. Wir erhalten Relation (6.22) indem wir jeden Ausdruck in der Ungleichung m < f{x) < M integrieren und Satz 4 anwenden. D KoroUar 2. Sei f G TZ[a,b], m =
inf f{x)
und M =
xe[a,b]
sup ,f{x).
Dann
xe[a,b]
existiert eine Zahl n £ [m,M], so dass b
f{x) dx = ft • (b — a) .
(6.23)
Beweis. 1st a = b, dann ist die Behauptung trivial. 1st a ^ b, setzen wir b
ji = -j^ J f{x)dx.
Aus (6.22) folgt dann, dass m < // < M fiir a < &.
a
Nun wecliseln aber beide Seiten von (6.23) ihr Vorzeiclien, wenn wir a und b vertauschen und dalier ist (6.23) aucli fiir & < a giiltig. D KoroUar 3. Fiir f £ C[a, b] existiert ein Punkt ^ G [a, b], so dass b
f{x)dx
= f{0{b-a).
(6.24)
Beweis. Nacli dem Zwischenwertsatz fiir stetige Funktionen gibt es einen Punkt ^ in [a, b], fiir den /(^) = ft, falls m = min f{x) < ft < max f{x) = M . xE[a,b]
xE[a,b]
Daher folgt (6.24) aus (6.23).
D
Gleicliung (6.24) wird oft als erster Mittelwertsatz der Integration bezeichnet. Wir woUen diesen Ausdruck fiir den folgenden, etwas allgemeineren Satz benutzen. Satz 5. (Erster Mittelwertsatz der Integration). Seien f,g £ TZ[a,b], m = inf f{x) und M = sup f{x). Ist g nicht negativ (oder nicht positiv) auf xe[a,b]
x€[a,b]
[a,b], dann gilt b
b
/ (/ • 9){^) dx = n a
g{x) dx ,
(6.25)
a
wobei n £ [m, M]. Ist aufierdem f £ C[a,b], dann existiert ein Punkt ^ £ [a,b], so dass b
b
{f-g){x)dx
= f{0fg{x)dx.
(6.26)
6.2 Linearitat, Additivitat und Monotonie des Integrals
371
Beweis. Da das Vertauschen der Integrationsgrenzen zu einem Vorzeichenwechsel auf beiden Seiten von (6.25) fiihrt, konnen wir diese Gleichung fiir den Fall a < b beweisen. Da ein Vorzeiclienwechsel in g{x) aucli auf beiden Seiten von (6.25) zu einem Vorzeiclienwechsel fiihrt, konnen wir ohne Einschrankung der Allgemeinheit annehmen, dass g{x) > 0 auf [a,b]. Da m = inf f{x) und M = sup f{x), erhalten wir fiir g{x) > 0: xehM xe[a,b] mg{x)
< f{x)g{x)
<
Mg{x).
Da m • g G TZ[a,b], f • g G TZ[a,b] und M • g G TZ[a,b], erhalten wir durch Anwendung von Satz 4 und Satz 1, dass b
b
m / g{x) dx <
b
f{x)g{x)
dx < M
g{x) dx .
(6.27)
b
1st J g{x) dx = 0, dann ist aus diesen Ungleichungen offensichtlich, dass (6.25) a
gilt. b
1st Jg{x)
dx ^ 0, dann erhalten wir mit (6.27), wenn wir
if • g)ix)dx setzen, dass m
min f{x) x^[a^b]
und M = m a x f{x).
U
x^[a,b\
Wir merken an, dass sich (6.23) aus (6.25) fiir g{x) = 1 auf [a, b] ergibt. c. D e r z w e i t e M i t t e l w e r t s a t z d e r I n t e g r a t i o n Der sogenannte zweite Mittelwertsatz'^ ist bedeutend spezieller und empfindlicher im Kontext des Riemannschen Integrals. Mit einer zusatzlichen, oft akzeptablen Bedingung an die Funktion kann Satz 6 in diesem Abschnitt einfach aus dem ersten Mittelwertsatz erhalten werden. Vergleichen Sie in diesem Zusammenhang Aufgabe 3 am Ende von Abschnitt 6.3.
372
6 Integralrechnung
Um den Beweis dieses Satzes nicht zu verkomplizieren, werden wir eine niitzliche hinfiihrende Diskussion fiihren, die auch fiir sich genonimen interessant ist. Abelsche
Umformung.
Diese Bezeichnung wird fiir die folgende Umformung
n
der Summe ^
^
k
aj&j benutzt. Sei Afc = X] Oj und sei AQ = 0. Dann gilt
aih = ^{Ai-
Ai_i)bi
Aibi - ^
Aj_i&i =
n—1
n
= ^
= ^
Aibi - ^
i=l
n—1
Aibi+i = Anbn - Aobi + ^
i=0
Ai{bi -
bi+i).
1=1
Somit ist n
n—1
Y^ aibi = {Anbn - Aobi) + Y^ Ai{bi - h+i) i=l
(6.28)
i=l
Oder, da AQ = 0: n—1
n
Y, aibi = Anbn+ i=l
Y,Mbi-bi+i)
.
(6.29)
i=l
Mit der Abelschen Umformung lasst sich das folgende Lemma leicht beweisen. k
L e m m a 2. ErfiiUen die Zahlen A^ = X] Q« {k = 1,...
,n) die
Ungleichungen
i=l
m < Ak < M, sind die Zahlen bi (i = 1,... fiir i = 1,... ,n — 1, dann ist
,n) nicht negativ und gilt bi > 6j+i
n
mbi
< Mbi .
(6.30)
i=l
Beweis. Wenn wir ausnutzen, dass 6n > 0 und bi — bi+i > 0 fiir i = 1,..., erhalten wir mit (6.29), dass n
Y i=l
n—1
aibi <Mbn
+ Y
^^^i
- ^'+i) = ^ ^ » + ^ ( ^ 1 - ^») = ^ ^ 1 •
i=l
Die linke Ungleicliung von (6.30) wird ahnlicli bewiesen. L e m m a 3 . Sei f £ TZ[a, b], dann ist fiir jedes x £ [a, b] die F{x) = I f(t)dt
definiert,
n—1,
und es gilt F{x) € C[a,b].
D Funktion (6.31)
6.2 Linearitat, Additivitat und Monotonie des Integrals
373
Beweis. Die Existenz des Integrals in (6.31) fiir jedes x £ [a, b] ist bereits aus Satz 4 in Absclinitt 6.1 bekannt. Dalier bleibt nur zu zeigen, dass die Funktion F{x) stetig ist. Da / £ TZ[a,b], gilt | / | < C < oo in [a,b]. Sei x G [a,b] und X + h G [a,b]. Dann konnen wir mit der Additivitat des Integrals und den Ungleichungen (6.19) und (6.20) sagen, dass x-\-h
\F{x + h) - F{x)\
fit) dt - / fit) dt x-\-h
x+h
fit) dt <
\f(t)\dt
Hierbei haben wir Ungleichung (6.20) benutzt und dabei beriicksichtigt, dass iiir h < 0 gilt: x+h
\fit)\dt
\fit)\dt x-\-h
\fit)\dt x+h
Wir haben also gezeigt, dass fiir x und x + h in [a, b] gilt: \F{x + h) - F{x)\
3.32)
Daraus ergibt sich oflFensichtlich, dass die Funktion F in jedem Punkt in [a, b] stetig ist. D Wir beweisen nun ein Lemma, das bereits eine erste Version des zweiten Mittelwertsatzes ist. Lemma 4. Seien f,g€ TZ[a, b] und g eine auf [a, b] nicht negative und nicht anwachsende Funktion. Dann existiert ein Punkt ^ G [a,b], so dass
if • 9){x) dx = gia) / f{x) dx .
3.33)
Bevor wir zum Beweis iibergehen, halten wir fest, dass in (6.33), im Unterschied zu (6.26) im ersten Mittelwertsatz, die Funktion f{x) Integrand bleibt und nicht die monotone Funktion g. Beweis. Um (6.33) zu beweisen, versuchen wir wie in den anderen Beweisen die entsprechende Riemannsche Summe abzuschatzen. Sei P eine Unterteilung von [a,b]. Wir schreiben zunachst die Gleichung
374
6 Integralrechnung b
^
Xi
j {f •g)dx = 'Y^ / {f-g){x)(ix = J—1
n
*i
= '^a{xi-i)
n
^i
j f{x)Ax + 'Y^ / [g(x)-g(xi_i)]/(a;)dx
und zeigen dann, dass die letzte Summe fiir \{P) -^ 0 gegen Null strebt. Da / £ TZ[a,h\, folgt, dass \f{x)\ < C < oo auf [a,b]. Daher erhalten wir mit den bereits bewiesenen Eigenschaften des Integrals, dass n y X I / [9ix)-9ixi-i)]f{x)dx
n *i < X ! / Idix) - g{xi-i)\\f{x)\dx n
<^Y.
<
n
\!
j
Hx)-9{xi-i)\Ax
fiir A(P) -!• 0, da g e 7^[a, b] (vgl. Satz 2 in Abschnitt 6.1). Daher ist b
n
if-9)ix)dx=
'•^'
lim '^g(xi-i)
/ f{x)dx.
i=l
(6.34)
Wir wollen nun die Summe auf der rechten Seite von (6.34) abschatzen. Wenn wir
Fix) = / fit) dt setzen, erhalten wir mit Lemma 3 eine in [a, b] stetige Funktion. Sei m = min Fix) und M = max Fix) . xE[a,b]
xE[a,b]
Xi
Da /
fix) dx = Fixi) — F(a;j_i), folgt, dass n J29{xi-i) A 1 i=l
y / fix)dx "^
n = J2{Fixi) A
- Fixi-i))gixi-i)
.
(6.35)
1
Wenn wir nun beriicksichtigen, dass g auf [a, b] nicht negativ und nicht anwachsend ist und tti = Fixi) - Fixi-i)
,
bi =
gixi-i)
6.2 Linearitat, Additivitat und Monotonie des Integrals
375
setzen, erhalten wir mit Lemma 2, dass n
mg{a) < ^
{F{xi) - F{xi-i))g{xi-i)
< Mg{a)
,
(6.36)
da k
Ak = J2ai
= F{xk) - Fixo)
= F{xk) - F ( a ) = Fixt)
.
i=l
Wir haben nun gezeigt, dass die Summen in (6.35) die Ungleichungen in (6.36) erfiillen und erinnern nun an (6.34). Damit erhalten wir b
mg{a) < f {f • g){x) dx < Mg{a)
.
(6.37)
1st g{a) = 0, dann ist die zu beweisende Gleichung (6.33), wie wir aus (6.37) ablesen konnen, ofFensichtlicli wahr. Ist g{a) > 0, setzen wir b
if • g){x)dx
.
9{a) a
Aus (6.37) folgt dann, dass m < ji < M. Aus der Stetigkeit von F{x)
=
X
J f{t) dt auf [a, b] ergibt sicli dalier, dass ein P u n k t ^ € [a, b] existiert, in dem a
^iO
= A*- Genau das ist die Aussage von (6.33).
D
S a t z 6. (Zweiter Mittelwertsatz der Integration). Seien ,f,g G TZ[a,b] und g eine in [a,b] monotone Funktion. Dann existiert ein Punkt ^ G [a,b], so dass b
i
b
( / • 9)ix) dx = g{a) j f{x) dx + g{b) / f{x) dx . a
a
(6.38)
C
Gleichung (6.38) (wie auch (6.33)) wird auch oft Bonnet^
zugeschrieben.
Beweis. Sei g eine in [a, b] nicht absteigende Funktion. Dann ist G{x) = g{b) — g{x) eine in [a, b] nicht negative und nicht anwachsende integrierbare Funktion. Wir wenden (6.33) an und erhalten b
£.
( / • G) [x) dx = G{a) I fix)
dx .
(6.39)
^ P. O. Bonnet (1819-1892) - franzosischer Matheniatiker und Astronom. Seine wichtigsten niatheniatischen Arbeiten behandeln die DifFerentialgeonietrie.
376
6 Integralrechnung Nun ist aber b
b
b
( / • G) dx = g{b) I f{x) dx — a
i
{f • g){x) dx a
i
G{a) I f{x)dx
und
i
= g{b) I f{x)dx
— g{a) / f{x)dx
.
Wenn wir diese Gleichungen und die Additivitat des Integrals beriicksichtigen, gelangen wir aus (6.39) zu Gleichung (6.38), die zu beweisen war. Ist g eine nicht anwachsende Funktion, erhalten wir mit G{x) = g{x)—g{b) eine in [a, b] nicht negative und nicht anwachsende integrierbare Funktion, daraus ergibt sich wiederum (6.39) und daraus (6.38). D
6.2.4 U b u n g e n u n d A u f g a b e n 1. Sei / G TZ[a,b] und f{x) > 0 auf [a,h]. Zeigeii Sie: a) Nimmt die Funktion f(x) in eineni stetigen Punkt xo G [a, b] den positiven Wert f{xo) > 0 an, dann gilt die strenge Ungleichung: b
I f{x)dx
>0.
a b
b) Aus / f{x) da; = 0 folgt, dass f{x) = 0 in fast alien Punkten von [o, b]. a
2. Seien / £ TZ[a, h], m = inf f{x) und M = sup f{x). Zeigen Sie: ]a,6[
]o,i)[
b
a) / f{x) Ax = fi{b — a), mit (i G [m, M] (vgl. Aufgabe 5a in Abschnitt 6.1). a
b) Ist / in [a,h] stetig, dann existiert ein Punkt ^ G [a,h], so dass b
j f{x)Ax
=
f{i)(b-a).
a
3. Sei / G C[a,6], f{x) > 0 in [a, 6] und M = max/(a;). Zeigen Sie, dass [o,i)]
/ b
\
lim I I p{x)Ax\
1/"
=M .
6.3 Das Integral und die Ableitung
377
4. a) Zeigen Sie, dass fiir / £ TZ[a, h] und p >0 auch \f\'' £ TZ[a, h]. b) Gehen Sie von der Holderschen Ungleichung fiir Sumnien aus und zeigen Sie die Holdersche Ungleichung fiir Integrale®
jU-g){x)Ax
a
•{j\g\'{x)Ax
a
a
fiir f,g£ 7^[o,6], p > 1, g > 1 und i + i = 1. c) Wir beginnen bei der Minkowskischen Ungleichung fiir Sumnien und erhalten die Minkowskische Ungleichung fiir Integrale: f
0
j\f
+ g\%x)Ax
fiir f,g£ 7?.[a, 6] und p > 1. Zeigen Sie, dass sich fiir 0 < p < 1 der Vergleichsoperator andert. d) Zeigen Sie, dass fiir eine stetige und konvexe Punktion / auf R und eine beliebige stetige Punktion {p auf R die Jensen-Ungleichung
/ jiy"^(t)dtj <\jf{m)>^t 0
/
0
fiir c f^ 0 gilt.
6.3 Das Integral und die Ableitung 6.3.1 D a s I n t e g r a l u n d d i e S t a m m f u n k t i o n Sei / eine auf einem abgeschlossenen Intervall [a, b] Riemann-integrierbare Funktion. Wir wollen auf dieseni Intervall die Funktion
F{x) = / f{t) At betrachten, die oft als Integral mit verdnderlicher wird.
(6.40) oberer Grenze
bezeichnet
Die algebraische Holdersche Ungleichung fiir p = q = 2 wurde zuerst durch Cauchy im Jahre 1821 erhalten und tragt seinen Namen. Die Holdersche Ungleichung fiir Integrale wurde zuerst 1859 durch den russischen Mathematiker B. J. Bunjakowski (1804-1889) aufgestellt. Diese wichtige Integralungleichung (fiir p = q = 2) wird Bunjakowski- Ungleichung, Cauchy-Bunjakowski- Ungleichung Oder nach dem deutschen Mathematiker H. K. A. Schwarz (1843-1921), in dessen Arbeiten sie 1884 auftrat, Schwarzsche Ungleichung genannt.
378
6 Integralrechnung
Aus / £ TZ[a,h\ folgt, dass / L . € 7l[a,x\ fiir [a,x\ C [a,b]. Daher ist die Funktion x i->- F{x) eindeutig fiir x € [a, 6] definiert. Ist |/(t)| < C < +0O auf [a, 6] (und / ist als integrierbare Funktion auf [a, 6] beschrankt), dann folgt aus der Additivitat des Integrals und einer einfachen Abschatzung, dass \F{x + h)-F{x)\
(6.41)
fiir a;,a; + /i £ [a, 6]. In der Tat liaben wir dies bereits ini vorigen Abschnitt beini Beweis von Lemma 3 untersucht. Aus (6.41) folgt insbesondere, dass die Funktion F auf [a, b] stetig ist, so dass also F e C[a, &]. Wir untersuclien nun die Funktion F etwas genauer. Das folgende Lemma ist fiir das Weitere von zentraler Bedeutung. Lemma 1. Sei f € Tl[a,h] und sei f in einem Punkt x G [a,b] stetig. Dann ist die Funktion F auf [a, b] durch (6.40) definiert. F ist im Punkt x dijferenzierbar und es gilt die folgende Gleichung:
F'{x) = fix) . Beweis. Seien x.,x + h € [a, &]. Wir woUen die Differenz F{x + h) — F{x) abschatzen. Aus der Stetigkeit von / in a; folgt, dass f{t) = f{x) + A{t), wobei A{t) ^ 0 fiir t —>• a;, t £ [a, b]. Wenn wir den Punkt x festhalten, dann ist die Funktion A{t) = f{t) — f{x) in [a, 6] integrierbar, da sie der Differenz der integrierbare Funktion 11->- f{t) und der Konstanten f{x) entspriclit. Wir bezeiclmen sup \A{t)\ mit M{h), wobei I{h) das abgeschlossene Intervall mit t€Hh)
den Endpunkten x,x + h G [a,b] ist. Laut Voraussetzung gilt M{h) —>• 0 fiir Wir sclireiben nun X
x+h
x+h
F{x + h)- F{x) = I fit) At- j fit) dt= I fit) dt = a
a
x-\-h
X x-\-h
ifix) + Ait)) dt= wobei
x-\-h
[ fix) dt+
x+h
Ait) dt = aih)h gesetzt liaben. Aus
[ Ait) dt = fix)h + aih)h ,
3 Das Integral und die Ableitung x-\-h
x+h A{t) dt < \A{t)\At
379
x+h <
M{h)dt
M{h)\h\
folgt, dass \a{h)\ < M{h) und somit a{h) ^ 0 fiir /i ^ 0 (und zwar so, dass X + h G [a,b]).
Somit haben wir fiir eine in einem Punkt x G [a, b] stetige Funktion gezeigt, dass bei Verschiebungen um h von diesem Punkt aus, so dass x + h G [a,b], gilt: F{x + h)-F{x)= f{x)h + a{h)h , (6.42) wobei a{h) -^ 0 iiir h ^ 0. Dies bedeutet aber, dass die Funktion F{x) auf [a, b] im Punkt x £ [a, b] differenzierbar ist und dass F'{x) = f{x). D Ein sehr wichtiges Korollar von Lemma 1 folgt unmittelbar. KoroUar 1. Jede auf einem abgeschlossenen Intervall [a,b] stetige Funktion f : [a,b] ^ M. besitzt eine Stammfunktion, und jede Stammfunktion von f auf [a, b] besitzt die Form
T{x)
fit) dt + c,
3.43)
wobei c eine Konstante ist. Beweis. Wir kennen die Folgerung (/ £ C[a, 6]) =^ (/ € TZ[a,b]), so dass nacli Lemma 1 die Funktion (6.40) eine Stammfunktion zu / auf [a, b] ist. Aber zwei Stammfunktionen J^(x) und F{x) derselben Funktion konnen sich auf einem abgeschlossenen Intervall nur um eine Konstante unterscheiden. Daher ist J^{x) = F{x) + c. D Fiir spatere Anwendungen ist es angebraclit, das Konzept der Stammfunktion in der folgenden Definition etwas zu erweitern. Definition 1. Eine auf einem Intervall der reellen Geraden stetige Funktion X H^ T{x) wird Stammfunktion (oder verallgemeinerte Stammfunktion) der auf demselben Intervall definierten Funktion x ^ f{x) genannt, falls die Gleicliung J^'{x) = f{x) in alien, auBer in endlicli vielen, Punkten des Intervalls gilt. Wenn wir diese Definition beriicksichtigen, konnen wir zeigen, dass das folgende Korollar gilt. Korollar 1'. Eine auf einem abgeschlossenen Intervall [a,b] definierte und beschrankte Funktion mit einer endlichen Anzahl von Unstetigkeitsstellen besitzt eine (verallgemeinerte) Stammfunktion auf diesem Intervall, und jede Stammfunktion von f auf[a,b] besitzt die Form (6.43).
380
6 Integralrechnung
Beweis. Da die Funktion / nur eine endliche Anzahl von Unstetigkeiten besitzt, ist / £ TZ[a, b] und nach Lemma 1 ist die Funktion (6.40) eine verallgemeinerte Stammfunktion fiir / auf [a, b]. Wie wir bereits betont haben, haben wir dabei beriicksichtigt, dass nach (6.41) die Funktion (6.40) auf [a, b] stetig ist. Ist !F{x) eine andere Stammfunktion von / auf [a, b], dann ist J^{x) — F{x) eine stetige Funktion, die auf jedem der endlich vielen Intervallen konstant ist, in die die Unstetigkeitsstellen von / das abgeschlossene Intervall [a, b] unterteilen. Aber dann folgt aus der Stetigkeit von lF{x) — F{x) auf ganz [a, 6], dass T{x) — F{x) = konstant auf [a, h\. D 6.3.2 Fundamentalsatz der Integral- und DifFerentialrechnung Satz 1. Sei / : [a, &] —>• ffi eine beschrdnkte Funktion mit einer endlichen Anzahl von Unstetigkeitsstellen. Dann ist f £ TZ[a, b] und es gilt
3.44)
wobei J^ : [a,b] ^ M. eine Stammfunktion
von f auf [a, b] ist.
Beweis. Wir wissen bereits, dass eine auf einem abgeschlossenen Intervall besclirankte Funktion, die nur eine endlich Anzahl von Unstetigkeitsstellen besitzt, integrierbar ist (vgl. Korollar 2 nach Satz 2 in Abschnitt 6.1). Die Existenz einer verallgemeinerten Stammfunktion J^(x) zur Funktion / auf [a, b] ist durch Korollar 1' garantiert, auf Grund dessen J^{x) die Form (6.43) besitzt. Wenn wir in (6.43) x = a setzen, erhalten wir J-'{a) = c und daher J^(x) = / f(t) dt + T{a) Insbesondere ist
f{t)At =
T{b)-T{a),
was, bis auf die Schreibweise fiir die Integrationsvariable, ganz genau mit Gleichung (6.44), die zu beweisen war, iibereinstimmt. D Gleichung (6.44) ist von zentraler Wichtigkeit fiir die ganze Analysis. Sie wird Newton-Leibniz Formel oder Fundamentalsatz der Integral- und Differentialrechnung genannt.
6.3 Das Integral und die Ableitung
381
Die DifFerenz !F{h) — T{a) von Funktionswerten wird oft T{x) | geschrieben. Mit dieser Schreibweise ninimt der Fundanientalsatz die folgende Form an:
Da beide Seite der Formel ihr Vorzeichen wechseln, wenn wir a und h vertauschen, ist die Formel fiir jede Relation zwischen den Betragen von a und b giiltig, d.li. sowolil fiir a < & als auch fiir a >b. In Ubungen der Analysis wird der Fundamentalsatz hauptsaclilich dazu benutzt, um das Integral auf der linken Seite zu berechnen. Dies mag zu einer etwas verzerrten Vorstellung seiner Verwendung fiihren. Tatsaclilich werden Integrale selten mit Hilfe einer Stammfunktion bestimmt. Haufiger greift man auf die direkte Berechnung auf einem Computer mit hocli entwickelten numerischen Methoden zuriick. Dem Fundamentalsatz kommt eine Schliisselrolle in der Theorie der mathematisclien Analysis als solclies zu, da er Integration und Differentiation miteinander verbindet. In der Analysis besitzt er eine weitreicliende Erweiterung in Gestalt des sogenannten verallgemeinerten Satzes von Stokes''. Im nachsten Absatz geben wir ein Beispiel fiir den Einsatz des Fundamentalsatzes in der Analysis. 6.3.3 Partielle Integration bestimmter Integrale und die Taylorsche Formel Satz 2. Sind die Funktionen u{x) und v{x) auf einem abgeschlossenen Intervall mit den Endpunkten a und b stetig dijferenzierbar, dann gilt (u • v'){x) dx = [u- v)\ — I {v • u'){x) dx .
(6.45)
Ublicherweise wird diese Formel in der Kurzform udv = u • v\ — I vdu gesclirieben und Formel fiir die partielle Integration eines bestimmten Integrals genannt. Beweis. Nacli der Regel zur Ableitung eines Produkts von Funktionen gilt {u • v)'{x) = (u' • v){x) + (u • v'){x) . G. G. Stokes (1819-1903) - britischer Physiker und Mathematiker.
382
6 Integralrechnung
Laut Voraussetzung sind alle Funktionen in dieser letzten Gleichung stetig und daher auf dem Intervall mit den Endpunkten a und b integrierbar. Mit Hilfe der Linearitat des Integrals und dem Fundamentalsatz erhalten wir b
{u • v){x)\
=
b
(u • v){x)dx + a
{u-v'){x)dx.
D
a
Wir erhalten die Taylorsche Formel mit integralem Restglied als Korollar. Angenommen, die Funktion t i->- f{t) habe auf dem abgesclilossenen Intervall mit den Endpunkten a und b n stetige Ableitungen. Mit Hilfe des Fundamentalsatzes und (6.45) fiihren wir die folgende Kette von Umformungen durcli, in denen alle Ableitungen und Substitutionen auf der Variablen t ausgefiilirt werden. fix) - f{a) = I fit) dt = -J
f{t){x
- ty dt =
a X
-f'{t){x-t)f+
ff"{t){x-t)dt
f{a){x-a)-\l
f"{t){{x-tf)'dt
r{a){x-a)-\r'(t){^-t?\i + \j r"m^-t?dt = a X
f'{a){x -a) + lna)(x
- af - ^
f f"'{t) {{x - t)^)' dt
/'(a)(x-a) + i/"(a)(x-a)2 + ...+ + V^r^t - / ( " - i ) ( a ) ( x - a)»-i + r„_i(a;x) 2 • 3 • • • (n — 1) wobei r„_i(a;a;)
(n-iy.
/(")(t)(a;-t)"-idt
3.46)
Damit haben wir das folgende Korollar bewiesen. Korollar 2. Die Funktion t i->- f{t) habe auf dem abgeschlossenen Intervall mit den Endpunkten a und x bis inklusiver n-ter Ordnung stetige Ableitungen. Dann gilt die Taylorsche Formel fix) = f{a) + ^.f'{a){x 1!
- a) + • • • + - ^ — / ( " " i ) {a){x - a)"-' + r„_i (a; x) [n — 1)!
mit dem in (6.46) formulierten integralen Restglied r„_i(a;a;).
6.3 Das Integral und die Ableitung
383
Wir betonen, dass die Funktion {x — t)"~^ ihr Vorzeichen auf dem abgeschlossenen Intervall mit den Endpunkten a und x nicht verandert. Da diesem Intervall stetig ist, folgt aus dem ersten Mittelwertsatz, dass ein Punkt ^ existiert, so dass X
rn-i{a-x) = ^-^jf(-)(t)(x-tr-'dt
=
a X
a
[n — 1)\
\
n
I a
n\
Wir liaben so wiederum das bereits bekannte Restglied nacli Lagrange im Satz von Taylor erhalten. Nacli Aufgabe 2d) in Absclinitt 6.2 konnen wir annelimen, dass ^ im ofFenen Intervall mit den Endpunkten a und x liegt. Diese Argumentation konnen wir wiederholen und dabei den Ausdruck /(")(0(a;-^)"-* mit fc £ [1 , n] in (6.46) aufierhalb des Integrals zielien. Die Restglieder nach Cauchy und Lagrange ergeben sicli fiir fc = 1 und k = n. 6.3.4 Anderung der Variablen in einem Integral Eine der zentralen Methoden der Integralrechnung ist die Anderung der Variablen, auch Substitution genannt, in einem bestimmten Integral. Diese Formel ist fiir die Integration genauso wiclitig wie die Formel zur Ableitung einer verketteten Funktion in der Differentialreclmung. Unter bestimmten Voraussetzungen konnen wir diese beiden Formeln durch den Fundamentalsatz miteinander verbinden. Satz 3. Sei ip : [a,P] -^ [a,b] eine stetig dijferenzierbare Abbildung des abgeschlossenen Intervalls a < t < P auf das abgeschlossene Intervall a < x < b, so dass (p{a) = a und (p{P) = b. Dann ist fiir jede stetige Funktion f{x) auf [a, 6] die Funktion f{ip{t))Lp'{t) auf dem abgeschlossenen Intervall [a, P] stetig und es gilt
f{x)dx = I f{cp{t)y{t)dt.
(6.47)
a
Beweis. Sei T{x) eine Stammfunktion von f{x) auf [a, b]. Dann ist nach dem Satz zur Differentiation einer verketteten Funktion die Funktion T{ip{t)') eine Stammfunktion der Funktion f (^(p{t)) f'(t). Diese Funktion ist stetig, da sie auf dem abgesclilossenen Intervall [a, /3] die Verkettung und das Produkt stetiger Funktionen ist. Nach dem Fundamentalsatz der Differential- und Integralrechb
nung ist / fix) dx = T{b)-T{a)
13
und J f [fit)) cp'(t) dt = J^ifiP))
-J^{ip{a)).
384
6 Integralrechnung
Nach Voraussetzung ist aber (p{a) = a und Lp{(]) = b, so dass (6.47) tatsachlich giiltig ist. D In Formel (6.47) wird deutlich, wie angenehm es ist, dass wir nicht nur das Symbol fiir die Funktion, sondern die gesamte Differentialform f{x)dx als Symbol fiir die Integration benutzen. Dadurch konnen wir automatiscli den riclitigen Integranden erhalten, wenn wir die neue Variable x = (p{t) unter dem Integral substituieren. Um das Ganze nicht durcli einen beschwerliclien Beweis zu komplizieren, haben wir in Satz 3 absichtlicli den tatsachlich moglichen Anwendungsbereich von (6.47) eingeschrankt, um im Beweis den Fundamentalsatz anwenden zu konnen. Wir wenden uns nun dem zentralen Satz zur Veranderung der Variablen zu, dessen Voraussetzungen sich etwas von denen in Satz 3 unterscheiden. Der Beweis dieses Satzes wird direkt auf der Definition des Integrals als Grenzwert Riemannscher Summen aufbauen. Satz 4. Sei cp : [a, P] —>• [a,b] eine stetig dijferenzierbare streng monotone Abbildung des abgeschlossenen Intervalls a < t < P auf das abgeschlossene Intervall a < x < b, so dass in den Endpunkten (p{a) = a, (p{P) = b oder (p{a) = b, (piP) = a gilt. Dann ist fiir jede auf [a, b] integrierbare Funktion f{x) die Funktion f{'pit))f'{t) auf [a,P] integrierbar und es gilt HP)
P
/ f(x) dx -= 1 f{^{t)y{t)dt. ifi{a)
3.48)
a
Beweis. Da ip eine streng monotone Abbildung von [a, P] auf [a,b] ist, wobei die Endpunkte ineinander abgebildet werden, erzeugt jede Unterteilung Pf (a = to < • • • < tn = P) des abgeschlossenen IntervaUs [a, P] eine entsprechende Unterteilung P^ von [a, b] mit Xi = (p{ti) (i = 0,... ,n). Wir bezeichnen die Unterteilung P^ mit (p{Pt). Hierbei ist XQ = a, falls (p{a) = a und XQ = b, faUs (p{a) = b. Aus der gleichmafiigen Stetigkeit von Lp auf [a,P] folgt, dass fiir X(Pt) -^ 0 auch X(P^) = X{ip{Pt)) gegen NuU strebt. Mit Hilfe des Mittelwertsatzes formen wir die Riemannsche Summe '^{f;Px,0 wie folgt um:
Y,f{^i)Axi = Y^f{ii){xi-Xi.,) i=l
=
1=1 n
J2f{'Pin))^'{n){ti-ti.i) i=l
n
= J2f{^in))^'in)Ati i=l
Hierbei ist Xi = (p{ti), £,i = (p{Ti), £,i liegt im abgeschlossenen Intervall mit den Endpunkten Xi-i und Xi und TJ und fj liegen im Intervall mit den Endpunkten tj_i und tj (i = 1,... ,n).
6.3 Das Integral und die Ableitung
385
Als Nachstes gilt
i=l
i=l n
+
J2f{ip{Ti)){^'{fi)-^'{Ti))AU 1=1
Wir wollen diese letzte Summe abscliatzen. Da / £ 7l[a, 6], ist die Funktion / auf [a, 6] besclirankt. Sei |/(a;)| < C auf [a,b]. Dann ist
Y^f{^{T)){^'{n)-^'{n))Au
i=l
i=l
wobei Ai das abgesclilossene Intervall mit den Endpunkten tj_i und tj ist. Diese letzte Summe strebt fiir X{Pt) —>• 0 gegen Null, da f' auf [a, (]] stetig ist. Daher liaben wir nachgewiesen, dass n
n
Y,!{S,i)Axi = J2f{^in))^'{n)Au + j , i=l
i=l
wobei 7 —>• 0 fiir X{Pt) —>• 0. Wir haben bereits darauf liingewiesen, dass X{Px) —>• 0, falls X{Pt) -^ 0. Aber / e TZ[a, b], so dass die Summe auf der linken Seite dieser letzten Gleichung fiir X{Px) —>• 0 gegen das Integral /
f{x)dx
strebt. Daher besitzt fiir X{Pt) —>• 0 die rechte Seite der Gleichung denselben Grenzwert. n
Wir konnen die Summe J2 f{v{Ti))f'{Ti)^ti
aber als vollig beliebige Rie-
i=l
mannsche Summe fiir die Funktion f{'pit))f'{t) zur Unterteilung Pf mit ausgezeichneten Punkten T = ( r i , . . . , r„) betrachten. Denn auf Grund der strengen Monotonie von ip kann jede Menge von Punkten r aus einer entsprechenden Menge ^ = ( ^ i , . . . , ^„) ausgezeichneter Punkte in der Unterteilung Px = ^{Pt) erhalten werden. Daher ist der Grenzwert dieser Summe per definitionem gleich dem Integral der Funktion f(^Lp{t))ip'{t) iiber dem abgeschlossenen Intervall [a,/?] und wir haben gleichzeitig sowohl die Integrierbarkeit von f{'pit))f'{t) auf [a,(]] als auch (6.48) bewiesen. D 6.3.5 Einige Beispiele Wir wollen nun einige Beispiele zum Gebrauch dieser Formeln und den in den letzten beiden Abschnitten bewiesenen Satzen iiber Eigenschaften von Integralen betrachten.
386
6 Integralrechnung 1. 7r/2
/ V 1 — a;2 dx =
/
yl — S\T? tcostdt
-7r/2
-1
=
/
cos^tdt
-7r/2
7r/2 7r/2
= -
/ ( l + c o s 2 t ) d t = - f t + -sin2t~j
^
-7r/2
^
2
-77/2
Bei der Berechnung des Integrals haben wir die Substitution x = sint vorgenommen und dann, nachdem wir die Stammfunktion fiir den sich ergebenden Integranden nach dieser Substitution bestimmt haben, den Fundamentalsatz angewendet. Natiirlich batten wir auch anders vorgehen konnen. Wir batten fiir die Funktion V l — x'^ sehr miihsam die Stammfunktion ^x^/l — x'^ + |-arcsina; finden und dann den Fundamentalsatz einsetzen konnen. Dieses Beispiel zeigt, dass wir gliicklicberweise mancbmal bei der Berecbnung bestimmter Integrale auf das AufRnden einer Stammfunktion fiir den vorgegebenen Integranden verzichten konnen. Beispiel 2. Wir wollen zeigen, dass a)
7r
TV
/ sin mx cos nx dx = 0 , h)
/ sin^ mx dx = TT , c) —TV
— 7r
TV
/ cos^ nxdx = TT —7r
fiir 171,71 G'N. 7r
7r
sin mx cos nxdx = - / (sin(n + m)x — sin(n — m)x) dx = - (
cosfn + m)x H
cos(n — m)x ]
0,
fiir n — m ^ Q. Der Fall n — m = 0 kann getrennt betrachtet werden und fiir diesen Fall gelangen wir offensichtlich zu demselben Ergebnis. b)
/ sin^ mx dx = - / (1 — cos2m,x) dx = T:[X — -— sin2m,x I — IT TT
c)
—IT
TT
/ cos^ nxdx = - / (1 + cos2nx) dx = - (a; + -— sin2nx) J 2J 2\ 2n /
TT .
1.3 Das Integral und die Ableitung
387
Beispiel 3. Sei / £ 7?,[—a, a]. Wir werden zeigen, dass f
a
2 / /(x) da; , falls / eine gerade Funktion ist f{x) dx = < 0,
falls / eine ungerade Funktion ist .
Ist f{—x) = /(a;), dann gilt a
0
f{x)dx=
a
I f{x)dx+ -a
I f{x)dx=
I f{-t){-l)dt+
j f{x)dx
0
a
0
a
f{-t)
a
dt+ I fix) dx=
0
a
0
a
I [fi-x)
0
=
+ f{x)) dx = 2 I f{x) dx .
0
0
Ist f{—x) = —f{x), dann erhalten wir durch dieselben Berechnungen, dass a
fix) dx=
I
{fi-x)
+ fix)) dx=
-a
I Odx = 0 . 0
Beispiel 4- Sei / eine auf der gesamten reellen Geraden ffi definierte Funktion mit der Periode T, d.h. fix + T) = fix) fiir alle x GM. Ist / auf jedem endliclien abgesclilossenen Intervall integrierbar, dann erhalten wir fiir jedes a € M die Gleichung T
a+T
fix) dx = a
fix) dx , 0
d.h., das Integral einer periodischen Funktion iiber einem Intervall, dessen Lange der Periode T der Funktion entspricht, ist von der Integrationsstelle auf der reellen Geraden unabhangig. 0
T
a+T
/ fix)dx+
/ /(a;)da;-|-
/ /(a;)da; =
a+T
fix)dx=
a
0 T
T 0
fix) dx+
I fix) dx+
0 T
a
I fit + T)-ldt 0
0
a
fix) dx+ I fix) dx+ I fit) dt= 0
=
a
0
T
I fix) dx . 0
Hierbei haben wir die Substitution x = t + T vorgenommen und die Periodizitat der Funktion fix) ausgenutzt.
388
6 Integralrechnung 1
Beispiel 5. Angenommen, wir miissten das Integral Jsin(a;^) da; mit einer Ge0
nauigkeit von 10~^ berechnen. Wir wissen, dass die Stammfunktion von Jsin(a;^)da; (das FresnelIntegral) sich nicht durch elementare Funktionen ausdriicken lasst, so dass wir den Fundanientalsatz hier nicht im traditionellen Sinne anwenden konnen. Wir woUen einen anderen Weg einschlagen. Bei der Untersuchung der Taylorschen Forniel in der Differentialrechnung haben wir erarbeitet (vgl. Beispiel 11 in Absclinitt 5.3), dass auf dem Intervall [—1,1] die Gleichung sin a; fv x — —x + —x =: P(x) 3! 5! mit einer Genauigkeit von 10~^ gilt. 1st aber auf dem Intervall [—1,1] |sina; — P{x)\ < 10~^, dann ist fiir 0 < a; < 1 auch | sin(a;2) - P(x^)\ < IQ-^. Folglich gilt 1
1
sin(a; ) dx — 0
1
1
P{x ) dx < / \sm{x^) - P{x^)\dx
< / 10"^ da; < 10"^
0 1
.2N Daher ist es ausreicliend, das Integral J P(a;^)da; zu bestimmen, um das
0 1
Integral /sin(a;^)da; mit der gewiinschten Genauigkeit zu berechnen. Es gilt 0
aber 1
1
Pix"^) dx=
(x^ - -x^ + 7ya;^°) da; 3! 5! 0
bl
3!7
^5!11
) 0
1 3
1 3!7
1 5!11
0,310 ± 1 0 "
und daher i
/ sin(a;2) dx = 0, 310 ± 2 • 10"^ = 0,31 ± 10"
Beispiel 6. Die Grofie // = j ^ J f{x) dx wird als Mittelwert der Funktion mit a
Gewicht 1 auf dem Intervall [a, b] bezeichnet. Sei / eine auf ffi definierte und auf jedem abgeschlossenen Intervall integrierbare Funktion. Wir benutzen / , um die neue Funktion x+5
Psix) = ^ I f{t)dt x—5
6.3 Das Integral und die Ableitung
389
zu konstruieren, deren Wert ini Punkt x deni Mittelwert von / in der 6Umgebung von x entspricht. Wir werden zeigen, dass sich Fs{x) (Durchschnitt von f genannt) im Vergleich zu / regularer verhalt. Genauer formuliert, so ist Fg{x) auf M stetig, wenn / auf jedem Intervall [a,b] integrierbar ist und ist / € C(ffi), dann ist Fs(x) eC(i)(M). Wir zeigen zunachst, dass Fg{x) stetig ist: x+d+h
\F,ix + h) - Fs{x)\ =
-
x—d
f{t)dt-
f{t) dt <
x+S
x — 5+h
<^^{C\h\
+ C\h\) =
^\h\,
fiir |/(t)| < C, wie beispielsweise in der 2(5-Umgebung von x mit \h\ < 5. Offensichtlich folgt aus dieser Abschatzung die Stetigkeit von Fi{x). Ist nun / £ C(ffi), dann gilt nacli der Regel zur Differentiation einer verketteten Funktion Ifi
LP{X)
SO dass sich aus x+5
x—S
ergibt, dass
Fiix)
fix+
d)-fix-6)
2(5 Nach Substitution von t = x + u im Integral konnen wir die Funktion Fgix) wie folgt schreiben: Fsix) = — I fix + u)du . Ist / e C(ffi), dann erhalten wir unter Anwendung des ersten Mittelwertsatzes, dass Fsix) = ^fix
+ T)-2d = fix + T),
mit \T\ < S. Daraus folgt ganz natiirlich, dass lmi^Fi6)ix)
= fix)
390
6 Integralrechnung
6.3.6 U b u n g e n u n d A u f g a b e n 1. Bestimmen Sie mit Hilfe des Integrals: a) lim [ r ^ n r + • • • + T^TV] • b) lim ^°+"°+-;-+"", fiir Q > 0. n—>oo
^
2.
a) Zeigen Sie, dass jede auf einem offenen Intervall stetige Punktion eine Stammfunktion auf diesem Intervall besitzt. b) Zeigen Sie, dass fiir / e C*'^-'[o,6] die Funktion / als Differenz zweier nicht absteigender Punktionen auf [o, 6] dargestellt werden kann (vgl. Aufgabe 4 in Abschnitt 6.1).
3. 1st die Punktion g glatt, dann lasst sich der zweite Mittelwertsatz (Satz 6 in Abschnitt 6.2) durch partielle Integration auf den ersten Mittelwertsatz zuriickfiihren. 4. Sei / e C(R). Dann lasst sich fiir jedes feste abgeschlossene Intervall [a, 6] zu gegebenem e > 0 ein 5 > 0 wahlen, so dass die Ungleichung \F^(x) — j(x)\ < e auf [a,h] gilt, wobei Fs das in Beispiel 6 untersuchte Mittel der Punktion ist. Zeigen Sie dies. 5. Zeigen Sie, dass X
J
e*
1
t
X-'
^2
— di ~ ^ r e ^
fiir x —>• +00
1
x+l
6.
a) Zeigen Sie, dass die Funktion f{x) = J sin(i^) di fiir a; —> 00 die folgende X
Darstellung besitzt: , , _ cos(£^
^^'''~ b) Bestimmen Sie lim xf{x)
cos(a: + 1)^ , ^f
2x ~ 2(x + \) und lim
^
+^U'
xf{x).
7. Sei / : R —>• R eine auf jedem abgeschlossenen Intervall [o, 6] C R periodische Funktion. Zeigen Sie, dass dann die Funktion X
F{x) = J fit) dt a
als Summe einer linearen Punktion und einer periodischen Funktion dargestellt werden kann. 8.
a) Beweisen Sie, dass fiir x > 1 und n G N die Funktion Pnix) = — / (x + V x^ — 1 COS (p 1 d(p 0
ein Polynom vom Grade n ist (das n-te Legendre
Polynom).
1.3 D a s Integral u n d die Ableitung
391
b) Zeigen Sie TT
dV-
Pn{x) J
Ix — \Jx^ — 1 COS'i/')
9. Sei / eine auf einem abgeschlossenen Intervall [o, 6] C R definierte F u n k t i o n m i t reellen Werteii u n d seien ^ i , . . . , $ m ausgezeichnete P u n k t e dieses Intervalls. Die W e r t e des Lagrangeschen Interpolationspolynoms voni G r a d e m — 1 X -ji
L„,-i(x):=^/te)n i=i
i^j
s t i m m e n m i t den W e r t e n der F u n k t i o n in den P u n k t e n $ i , . . . , ^m (den Interpolatio n s p u n k t e n ) iiberein. 1st / £ C*'"-'[o,6], d a n n gilt fix)
- L„,-,ix)
= ^ / C " ' (C(x))a;^(x) ,
ni
wobei uJmix) = Yii^
~ CO u n d C{x) G]a,h[ (vgl. Beispiel 11 in A b s c h n i t t 5.3).
i=l
Sei ^i = ^
+ ^Oi.
D a n n ist Oi G [ - 1 , 1 ] , i =
l,...,m.
a) Zeigen Sie, dass 0
i(x) dx :
E^^/(^^)
mit
-/(sa)
dt
Insbesondere ist (x) dx = {h — a)f I —;:;— ) , fiir m, = 1 , di = 0 a 6
£12)
/ Li{x)
dx -
b—a [/(a) 2
+ fib)] , fiir m = 2
a b
as)
/ L2{x) dx ••
62 = 0 h) Sei /
b—a
/(a)+4/(^)+/(6)
fiir m = 3 , 9i = —1 ,
1
G C ( ' " ' [ a , 6 ] u n d Mm
=
m a x |/<'"'(a;)|. Schatzen Sie den B e t r a g des
absoluten Fehlers Rm in der Formel 0
0
f{x)dx= j f{x)dx = jLm-iix)dx
ab u n d zeigen Sie, dass |-Rr«| < ^^
J \cOmix)\ dx.
+ Rn
(*)
392
6 Integralrechnung
c) In den Fallen a i ) , 02) und as) wird Gleichung (*) die Rechteckregel, die Trapezregel und Keplersche Fassregel genannt. Ini letzteren Fall wird meist der Name Simpson-Regel^ benutzt. Zeigen Sie, dass die folgenden Formeln in den Fallen Qi), 02) und as) gelten: ^1 =
^
(6-0)
,
i?2 =
Y2~^
' '
^ "
2880 ^ ~
' '
wobei $1,^2,^3 G [oj^] und die Funktion / gehort zur Klasse C**-'[a,6]. d) Sei / ein Polynom P. Welches ist der liochste Grad fiir Polynome P, fiir die die Recliteck-, die Trapez- oder die Simpson-Regel exakt ist? Sei h = ^ , Xk = a + hk, (k = 0,1,... ,n) und pk = f{xk)e) Zeigen Sie, dass bei der Rechteckregel 0
I
f{x) Ax = h{yo + yi -\
das Restglied die Form Ri = ^-^(b
h y-n-i) + Ri
— a)h besitzt, wobei ^ £ [a, 6].
f) Zeigen Sie, dass bei der Trapezregel b
J fix) dx = ^ [(yo + Vn) + 2(2/1 + 2/2 + • • • + Vn-i)] + R2 a
das Restglied die Form R2 = — ^^ (^ ~ '^)'*^ besitzt, wobei ^ G [0,6]. g) Zeigen Sie, dass bei der Simpson-Regel fiir gerades n b
/ fix) dx = - ^iyo + y-n) + 4(yi + ys-\
h y-n-i) +
+ 2(2/2 + 2/4 + • • • + 2^„-2] + Rs das Restglied die Form R. =
-^i'^-a)H^
besitzt, wobei ^ G [a,h]. li) Beginnen Sie mit der Gleichung 1
da; 0
und berechnen Sie TT mit einer Genauigkeit von 10~ mit Hilfe der Rechteck-, der Trapez- und der Simpson-Regel. Beachten Sie insbesondere die EfFektivitat der Simpson-Regel, die aus diesem Grund die am weitesten verbreitete Quadraturformel ist. (Dies ist die Bezeichnung fiir Formeln zur numerischen Integration im ein-dimensionalen Fall, in dem das Integral aus Teilflachen, die durch einfache geometrische Figuren oder einfache Funktionen angenahert werden, summiert wird.) T. Simpson (1710-1761) - britischer Mathematiker.
6.4 Einige Anwendungen der Integralrechnung
393
10. Beweisen Sie die folgenden Formeln fiir das Restglied in der Taylorschen Formel, indem Sie (6.46) umformen, wobei wir h = x — a gesetzt haben: 1
i!
[ An 0
un
b)
1 f'
^Jf^'^Hx-hVi) dt
11. Zeigen Sie, dass die wichtige Gleichung (6.48) zur Substitution in einem Integral auch ohne die Annahme giiltig bleibt, dass die Funktion in der Substitution monoton ist.
6.4 Einige Anwendungen der Integralrechnung Es gibt ein einfaches Muster, das oft zum Einsatz der Integralrechnung bei Anwendungen fiihrt. Aus diesem Grund woUen wir dieses Muster zunaclist im ersten Absatz dieses Absclinitts als solclies erlautern. 6.4.1 A d d i t i v e I n t e r v a l l f u n k t i o n e n u n d d a s I n t e g r a l Bei der Diskussion in Absclinitt 6.2 zur Additivitat von Integralen auf Intervallen haben wir das Konzept einer additiven (orientierten) Intervallfunktion eingefiihrt. Wir erinnern daran, dass dies eine Funktion (cc,/?) !->• I{a,P) ist, die jedem geordneten P a a r von P u n k t e n (a, /3) eines fest vorgegebenen abgeschlossenen IntervaUs [a,b] eine Zahl I{a,(]) zuweist. Diese Zuweisung erfolgt so, dass die folgende Gleichung fiir jedes Punktetripel a , / 3 , 7 € [a,b] gilt: / ( a , 7) = / ( a , / 3 ) + / ( / 3 , 7 ) .
(6.49)
Aus (6.49) folgt, dass I{a, a) = 0, falls a = /3 = 7 gilt, wohingegen wir I{a,(]) + / ( / 3 , a ) = 0, d.h., I{a,(]) = —I{(],a) erhalten, falls cc = 7 ist. Diese Gleichung zeigt uns den Einfluss der Anordnung der P u n k t e a und /3. Wenn wir !F{x) = I{a,x) setzen, erhalten wir aus der Additivitat der Funktion / , dass I{a,P)=J^{p)-J^{a),
(6.50)
wobei X H^ !F{x) eine Funktion von P u n k t e n in [a, b] ist. Es lasst sich einfach zeigen, dass die Umkehrung ebenfaUs wahr ist, d.h., dass jede auf [a, b] definierte Funktion x H^ J^{X) eine durch (6.50) definierte additive (orientierte) Intervallfunktion erzeugt.
394
6 Integralrechnung Wir woUen zwei typische Beispiele geben. X
Beispiel 1. Sei / € 7l[a,b]. Die Funktion T{x) = J f{t)dt
erzeugt entspre-
a
chend (6.50) die additive Funktion
I{a,P)=
I fit) At.
Wir merken an, dass die Funktion T{x) in diesem Fall auf dem abgeschlossenen Intervall [a, h] stetig ist. Beispiel 2. Angenommen, das Intervall [0,1] sei ein gewiclitslosser Faden, an den im Punkt x = 1/2 eine Perle mit Einheitsmasse befestigt ist. Sei T{x) die im abgesclilossenen Intervall [0, x\ lokalisierte Masse des Fadens. Dann ist nach unserer Annalime r 0 fiir a; < 1/2 ,
Hx) = { [ 1 fiir 1/2 < a; < 1 . Die physikalische Bedeutung der additiven Funktion
/(a,/3)
=T{P)-T{a)
entspricht fiir /3 > a der im halb offenen Intervall ]«,/?] lokalisierten Masse. Da die Funktion T{x) unstetig ist, kann die additive Funktion I{a,P) in diesem Fall nicht als Riemannsches Integral einer Funktion - einer Massendichte - dargestellt werden. (Diese Dichte, d.h. der Grenzwert des Verhaltnisses der Masse in einem Intervall zur Lange des Intervalls, ware in jedem Punkt des Intervalls [a, b] Null, aufier im Punkt x = 1/2, in dem sie Unendlich sein miisste.) Wir werden nun eine hinreichende Bedingung fiir die Erzeugung einer additiven Intervallfunktion durch ein Integral geben, die im Folgenden niitzlich sein wird. Satz 1. Angenommen, zu einer fur alle Punkte a, (3 eines ahgeschlossenen Intervalls [a,h] definierten additiven Funktion I{a,P) existiere eine Funktion f G TZ[a,b], so dass die Beziehung inf
f{x){l3 — a) < I{a,(]) < sup /(a;)(/3 — a)
xe[a,P]
xe[a,0]
fiir jedes ahgeschlossene Intervall [a,/?], mit a < a < (3
I{a, b) = I f{x) dx .
6.4 Einige Anwendungen der Integralrechnung
395
Beweis. Sei P eine beliebige Unterteilung a = XQ < • • • < Xn = b des abgeschlossenen Intervalls [a, b] und seien rrii = inf f{x) und Mj = sup
/(x).
Fiir jedes Intervall [a;j_i,a;j] der Unterteilung P gilt laut Annalime, dass rriiAxi < I{xi-i,Xi)
< MiAxi .
Wenn wir diese Ungleicliungen addieren und dabei die Additivitat der Funktion I{a, P) beriicksichtigen, erhalten wir n
n
'Y^miAxi
< I{a,b) < ^MiAxi
i=l
.
i=l
Die linken und rechten Ausdriicke dieser letzten Relation sind uns bekannt, da sie der oberen und unteren Darboux-Summe der Funktion / zur Unterteilung P des abgeschlossenen Intervalls [a, b] entspreclien. Auf dem abgeschlossenen IntervaU [a, b] besitzen beide fiir A(P) —>• 0 das Integral von / als Grenzwert. Daher erhalten wir beini Ubergang zum Grenzwert fiir A(P) —^ 0, dass b
I{a,b) = [ f{x)dx
.
a
Wir woUen nun die Anwendung von Satz 1 veranschaulichen. 6.4.2 Bogenlange Angenommen, ein Teilchen bewege sich ini Raum ffi^ und sein Bewegungsgesetz r{t) = (^x{t),y{t),z{t)) sei bekannt. Dabei sind x{t), y{t) und z{t) die rechtwinkligen kartesischen Koordinaten des Punktes zur Zeit t. Wir woUen die Lange l[a,b] des wahrend des ZeitintervaUs a < t < b zuriickgelegten Weges bestimmen. Wir woUen zunachst einige Konzepte prazisieren. Definition 1. Ein Weg in M^ ist eine Abbildung t H^ (^x{t),y{t),z{t)) eines Intervalls der reellen Geraden auf M^, die durch die Funktionen x{t), y{t) und z{t), die auf dem Intervall stetig sind, definiert ist. Definition 2. Sei t ^ (x{t),y{t),z{t)) ein Weg, fiir den der Bereich des Parameters t das abgeschlossene Intervall [a, b] ist. Dann werden die Punkte A = {x{a),y{a),z{a))
und B =
{x{b),y{b),z{b))
in ffi^ der Anfangspunkt bzw. der Endpunkt des Weges genannt.
396
6 Integralrechnung
Definition 3. Ein Weg ist geschlossen, falls er iiber einen Anfangs- und einen Endpunkt verfiigt und diese zusammenfallen. Definition 4. Sei T : / ^ K^ ^^^ ^gg^ Y>a.s Bild r{I) des Intervalls / in W wird die Spur des Weges genannt. Der Spur eines abstrakten Weges kann sich als etwas lierausstellen, was wir normalerweise nicht als Kurve bezeichnen wiirden. Es gibt Beispiele fiir Wege, deren Spur einen voUstandigen drei-dimensionalen Wiirfel bilden (die sogenannten „Peano-Kurven"). Sind die Funktionen x{t), y{t) und z{t) jedoch geniigend regular (wie etwa bei meclianischen Bewegungen, die differenzierbar sind), so konnen wir siclier sein, dass niclits auftritt, was gegen unsere Intuition spricht. Dies konnen wir streng zeigen. Definition 5. Ein Weg T : / ^> K^, fiir den die Abbildung / -)• r{I) eine bijektive Abbildung ist, wird einfacher Weg oder parametrisierte Kurve genannt und seine Spur wird Kurve in M^ genannt. Definition 6. Ein gesclilossener Weg F : [a, b] —>• ffi^ wird einfacher geschlossener Weg oder einfache geschlossene Kurve genannt, falls der Weg r : [a, b[-^ M^ einfach ist. Daher unterscheidet sich ein einfacher Weg von eineni beliebigen Weg darin, dass wir bei der Bewegung entlang seiner Spur nicht zu bereits erreichten Punkten zuriickkehren, d.h., wir schneiden unsere Trajektorie nirgendwo, au6er moglicherweise im Endpunkt, faUs der einfache Weg geschlossen ist. Definition 7. Der Weg F : I ^ M? wird als Weg mit vorgegebener Glattheit bezeichnet, wenn die Funktionen x{t), y{t) und z{t) diese Glattheit besitzen. (Beispielsweise die Glattheit C[a,b], C'^^^[a,b] oder C(*^)[a,6].) Definition 8. Ein Weg F : [a, b] -^ M^ ist stiickweise glatt, wenn das abgeschlossene Intervall [a, b] in eine endliche Anzahl abgeschlossener Intervalle unterteilt werden kann, und auf jedem dieser Intervalle die entsprechende Einschrankung der Abbildung F durch stetig differenzierbare Funktionen definiert ist. Wir beabsichtigen, glatte Wege, d.h. Wege der Klasse C^^^, und stiickweise glatte Wege zu untersuchen. Wir wollen nun zu unserem Ausgangsproblem zuriickkommen. Wir konnen es nun so formuheren, dass wir die Lange des glatten Weges F : [a, b] -^ M^ bestimmen wollen. Unsere anfanglichen Vorstellungen iiber die Lange l[a,b] des im Zeitintervall a < t < (] zuriickgelegten Weges waren die folgenden: Ist a < /3 < 7, dann ist l[a,-f] = l[a,p] + l[p,-/] .
6.4 Einige Anwendungen der Integralrechnung 1st zweitens v{t) = (^x{t),y{t),z{t)) t, dann ist inf
\^r(t)\{P-a)
397
die Geschwindigkeit des Punktes zur Zeit
=«G["./3]
sup
|v(t)|(^-a).
x€[a,P]
Sind also die Funktionen x{t), y{t) und z{t) in [a,b] stetig difFerenzierbar, dann gelangen wir mit Satz 1 auf deterministische Weise zur Formel b
b
l[a,b]= / " | v ( t ) | d t = / " V i ^ ( t ) + 2 / 2 ( t ) + i 2 ( t ) d t ,
(6.51)
die wir nun als Definition der Lange eines glatten Weges F : [a, b] —>• M^ betrachten. Ist z{t) = 0, dann fiegt die Spur in einer Ebene und Gleichung (6.51) nimmt folgende Gestalt an:
l[a,b]= / ^/i^{t)+y^{t)dt.
(6.52)
Beispiel 3. Wir woUen (6.52) auf ein bekanntes Beispiel anwenden. Angenommen, der Punkt bewege sich nach dem Gesetz X = i?cos27rt , (6.53) y = i? sin 27rt . Im Zeitintervall [0,1] wird der Punkt einen Kreis mit Radius R beschreiben, d.h., einen Weg der Lange 2'KR, falls die Lange des Kreises auf diese Weise berechenbar ist. Wir woUen die Berechnung nach (6.52) durchfiihren: 1
?[0,1] = / v/(-27ri?sin27rt)2 + (27ri?cos27rt)2 dt = 2TTR . 0
Die Ubereinstimmung der Ergebnisse ist zwar ermutigend, aber die gerade ausgefiilirten Uberlegungen entlialten einige logische Liicken, denen wir noch etwas Aufnierksanikeit widmen woUen. Die Funktionen coscc und since sind, wenn wir ilire Schuldefinition benutzen, die kartesisclien Koordinaten des Bildes p des Punktes po = (1,0) bei einer Drehung um den Winkel a. Bis auf das Vorzeichen wird der Wert a durch die Lange des Bogens des Kreises x^ + y"^ = 1 zwischen po und p gemessen. Daher baut die Definition der trigononietrischen Funktionen bei diesem Zugang auf dem Begriff der
398
6 Integralrechnung
Lange eines Bogens eines Kreises auf, weswegen wir bei der obigen Berechnung des Umfangs eines Kreises in gewisser Weise einen logischen Zirkelschluss begangen haben, indeni wir die Parametrisierung bereits in der Form (6.53) vorgenommen haben. Diese Schwierigkeit ist jedoch, wie wir nun sehen werden, nicht fundamental, da wir eine Parametrisierung des Kreises auch geben konnen, ohne dabei zu trigonometrischen Funktionen Zuflucht zu nehmen. Wir wollen untersuchen, wie die Lange eines Graphen einer auf einem abgeschlossenen Intervall [a,b] C ffi definierten Funktion y = f{x) zu berechnen ist. Wir denken dabei an die Berechnung der Lange des Weges F : [a, b] -^ M^ mit der speziellen Parametrisierung X 1-^ {x,f{x))
,
woraus wir folgern konnen, dass die Abbildung F : [a, b] -^ ffi^ eine bijektive Abbildung ist. Daher ist nach Definition 5 der Graph einer Funktion eine Kurve in M^. Fiir diesen Fah lasst sich (6.52) vereinfachen, denn wir erhalten, wenn wir X = t und y = f{t) setzen.
l[a,b]= / V^ + [f'it)?dt.
(6.54)
Insbesondere dann, wenn wir den Halbkreis y = V 1 — a;^,
—l
des Kreises x'^ + y"^ = 1 betrachten, erhalten wir so +1
I
1= / W l + I ^ ^ ^ l
1
da;= / T f ^ p -
(6.55)
Der Integrand in diesem letzten Integral ist aber eine unbeschrankte Funktion und daher existiert das Integral nicht in dem von uns untersuchten traditioneUen Sinne. Bedeutet dies, dass ein Halbkreis keine Lange besitzt? Zur gegenwartigen Zeit bedeutet es nur, dass diese Parametrisierung des Halbkreises nicht die Bedingung erfiillt, dass die Funktionen x und y stetig sein miissen. Und diese Bedingung war Voraussetzung fiir (6.52) und somit auch (6.54). Aus diesem Grund miissen wir entweder das Konzept eines Integrals erweitern oder zu einer Parametrisierung wechseln, die die Bedingungen erfiillt, unter denen (6.54) angewendet werden kann. Wenn wir diese Parametrisierung auf jedem abgeschlossenen Intervall der Form [—1 -I- (5,1 — (5] betrachten, wobei —1<—1-|-(5<1 — ( 5 < 1 , kann (6.54) auf dieses Intervall angewendet werden und wir erhalten die Lange
6.4 Einige Anwendungen der Integralrechnung
399
1-5
l[-l + d,l-d]=
Ax
I
Vl-a;2
-1+5
fiir den Kreisbogen oberhalb des abgeschlossenen Intervalls [— 1 + (5,1 — (5]. Es ist daher nur natiirlich, die Lange I des Halbkreises als Grenzwert lini l\—l-\-6,l — S\ zu betrachten. Wir konnen das Integral in (6.55) in der(5^+0
selben Weise interpretieren. Wir werden diese sich natiirlich anbietende Erweiterung des Konzepts des Riemannschen Integrals im naclisten Abschnitt diskutieren. Bei diesem von uns untersucliten besonderen Problem konnen wir, oline aucli nur die Parametrisierung zu andern, beispielsweise die Lange ?[ — 5-, 5-] einer Strecke auf dem Bogen des Einheitskreises berechnen. Dann ergibt sich (alleine aus geometrischen Betrachtungen), dass ? = 3 • I [ — | , | ] . Wir merken ferner an, dass dx f {1 — x'^ + x'^) dx V 1 — x'^ dx Vl-a;2 J Vl 1 f xd{l V 1 — x"^ dx — xyl
2J
VT
und daher 1-5
l[-l + 5,l-5]=2
/
^/Y^l^dx-{x^/T^^y^
^
1+5
1+5
Somit ist
1 lim l[-l + (5,1 - (51 = 2 / v^l - a;2 da; . 5^+0 J
Die Lange eines Halbkreises mit Radius 1 wird mit TT bezeichnet und wir gelangen so zu folgender Formel: V 1 — x"^ dx Dieses letzte Integral ist ein gewohnliches (nicht verallgemeinertes) Riemannsches Integral und lasst sich daher mit beliebiger Genauigkeit berechnen. Wenn wir fiir x € [—1,1] die Funktion arccosx als l[x, 1] definieren, dann ist mit den oben ausgefiihrten Berechnungen 1
dt
arccos x X
oder arccos x = x Vl-a;2+2
I
^/l-f^dt
400
6 Integralrechnung
Wenn wir die Bogenlange als Konzept fiir eine Stanimfunktion betrachten, dann miissen wir auch die eben eingefiihrte Funktion x i->- arccosx und die Funktion x i->- arcsina;, die auf ahnliche Weise eingefiihrt werden kann, als Stanimfunktionen betrachten. Dann konnen wir die Funktionen x — i ^ cos a; und X !->• sin X als die Inversen dieser Funktionen auf den entsprechenden Intervallen erhalten. Im Wesentliclien entspricht dies den Grundlagen der Geometrie. Das Beispiel zur Lange eine Halbkreises ist nicht nur deswegen lelirreich, well wir bei seiner Untersucliung eine Anmerkung zur Definition der trigononietrischen Funktionen geniacht haben, die fiir jemanden niitzlich sein kann, sondern auch deswegen, well sich dadurch ganz natiirlich die Frage stellt, ob die durch (6.51) definierte Zahl vom Koordinatensystem a;, y, z oder der Parametrisierung der Kurve abhangt. Wir iiberlassen dem Leser die Analyse der Rolle, die das drei-dimensionale kartesische Koordinatensystem spielt; wir werden hier die Rolle der Parametrisierung untersuchen. Wir miissen deutlich machen, dass wir mit einer Parametrisierung einer Kurve in M^ eine Definition eines einfachen Weges F : I ^ R^ meinen, dessen Spur diese Kurve ist. Der Punkt oder die Zahl t G I wird Parameter und das Intervall / der Bereich des Parameters genannt. Sind r : I ^ C und F : I ^ C zwei bijektive Abbildungenjnit derselben Wertemenge £, so treten ganz natiirlich bijektive Abbildungen F~^or -.1^1 und F~^ o F : I ^ I zwischen den Bereichen / und / dieser Abbildung auf. Gibt es insbesondere zwei derartige Parametrisierungen derselben Kurve, dann existiert ein natiirlicher Zusammenhang zwischen den Parametern t G I und T G P. t = t{T) oder r = T{t). Dadurch wird es moglich, bei Kenntnis des Parameters eines Punktes in einer Parametrisierung seinen Parameter in der anderen Parametrisierung zu finden. Seien F : [a,b] ^ C und F : [a,P] -^ C zwei Parametrisierungen derselben Kurve mit dem Zusammenhang F{a) = P{a) und P{b) = P{P) zwischen ihren Anfangs- und Endpunkten. Dann sind die Transformationen t = tir) und r = r(t) von einem Parameter zum anderen stetige und streng monotone Abbildungen des abgeschlossenen Intervalls a
-2
-2
i:^(t) 7^ 0 auf [a,b] und |V(T)|^ = X (T) + y (T) + z (r) ^ 0 auf [a,P], dann konnen wir zeigen, dass in diesem Fall die Transformationen t = ^(T) und T = T{t) glatte Funktionen sind, die auf den Intervallen, auf denen sie definiert sind, positive Ableitungen besitzen. Wir werden diese Behauptung hier nicht beweisen; wir werden sie schlieBlich als KoroUar des wichtigen Satzes zur impliziten Funktion erhalten. Im Augenblick ist diese Behauptung hauptsachlich als Motivation der folgenden Definition gedacht.
6.4 Einige Anwendungen der Integralrechnung
401
Definition 9. Der Weg F : [a,/3] —>• M^ wird aus F : [a,b] —>• M^ durch eine zuldssige Veranderung der Parameter erhalten, falls eine glatte Abbildung T : [a,P] -^ [a,b] existiert, so dass T(a) = a, F{P) = b, T'{T) > 0 auf [a,P] und F = F oF. Wir woUen nun einen allgenieinen Satz beweisen. Satz 2. Wird ein glatter Weg F : [a, P] —>• M^ durch eine zuldssige Veranderung der Parameter aus einem glatten Weg F : [a, b] -^ M^ erhalten, dann ist die Ldnge der beiden Wege gleich. Beweis. Seien F : [a,P] -^ M^ und F : [a,b] -^ M^ durch die Tripel glatter Funktionen r H^ [x{T),y{T),z{T)) und t i->- [x{t),y{t),z{t)) definiert und sei t = tir) die zulassige Veranderung der Parameter, unter der x(r) = x{tiT)) ,
y{T) = y{tiT)) ,
Z{T) = z(t(r)) .
Wenn wir die Definition (6.51) der Weglange, die Regel zur Ableitung einer verketteten Funktion und die Regel fiir die Substitution einer Variablen in einem Integral benutzen, dann erhalten wir h
^x^[i)^y^{t)^z^{t)At
=
fi
^x^[t[T))^y\t{T))^z\t{T))t\T)
^J[x{t{T))f{T)f
\l X (r) -\-y
(T)
+ [y{t{T))f{T)f
AT =
+
[z{t{r))t'{T)fdT
+ i (r) dr .
Dabei haben wir insbesondere gezeigt, dass die Lange einer Kurve von ihrer glatten Parametrisierung unabhangig ist. Die Lange eines stiickweise glatten Weges wird als die Summe der Langen der glatten Wege, in die er unterteilt werden kann, definiert. Aus diesem Grund ist es einfach zu beweisen, dass die Lange eines stiickweise glatten Weges sich unter einer zulassigen Veranderung seiner Parameter auch nicht verandert. Wir beenden die Diskussion des Konzepts der Lange eines Weges und der Lange einer Kurve (iiber die wir nun nach Satz 2 berechtigterweise sprechen konnen) mit einem weiteren Beispiel.
402
6 Integralrechnung
Beispiel 4- Wir suchen die Lange der Ellipse, die durch die kanonische Gleicliung 2
2
^ + |- = 1
(a > 6 > 0)
(6.56)
definiert wird. Mit der Parametrisierung x = asinz/;, y = bcosip, 0 < z/; < 27r erhalten wir 277
27r
I = / v^(a cos ip)"^ + (—bsinip)'^ dip = / ya^ — (a^ — b"^) sin^ ^ dz/; = 0
0
7r/2
77/2
a2-62
= 4a / \ / 1
5— sin^ ipdip = Aa / \/l - k'^ sin^ Z/J d^ ,
0
0
wobei fc^ = 1 — ^ das Quadrat der Exzentrizitat der Ellipse ist. Das Integral E{k, (p) = / Y 1 - fc^ sin^ ip dip lasst sicli mit elementaren Funktionen nicht ausdriicken. Es wird wegen seiner Verbindung zu der eben diskutierten Ellipse elliptisclies Integral genannt. Genauer gesagt ist E{k,(p) die Legendre-Form des elUptischen Integrals zweiter Art. Der Wert, den es fiir ip = 7r/2 anninimt, liangt nur von k ah. Er wird durch E{k) symbolisiert und das vollstandige elUptische Integral zweiter Art genannt. Dalier ist E{k) = E{k, Tr/2), so dass die Lange einer Ellipse in dieser Sclireibweise I = 4a_E(fc) betragt.
6.4.3 Die Flache eines krummlinigen Trapezes Wir betracliten die Figur aABb in Abb. 6.2, die krummliniges Trapez genannt wird. Diese Figur wird durch die vertikalen Liniensegmente aA und bB, dem abgeschlossenen IntervaU [a, b] auf der x-Achse und der Kurve AB, dem Graphen einer auf [a,b] integrierbaren Funktion y = f{x), begrenzt. Sei [a, P] ein in [a, b] enthaltenes abgeschlossenes IntervaU. Wir bezeichnen die zugehorige Flache des krummlinigen Trapezes af{a)f{P)P mit S{a,P). Wir haben folgende VorsteUungen zu Flachen: Ist a < a < /? < 7 < &, dann ist S{a,-f)=S(a,p)+S{P,-f) (Additivitat von Flachen) und es gilt inf
f{x)(P-a)
<S(a,P)
< sup
f{x){l3-a)
6.4 Einige Anwendungen der Integralrechnung
403
(die Flache einer unigebenden Figur ist nicht kleiner als die Flache der eingeschlossenen Figur). Daher ist laut Satz 1 die Flache dieser Figur nach der Formel
S{a, b) =
f{x) dx
3.57)
berechenbar. 5. Wir woUen Gleichung (6.57) fiir die Berechnung der Flache der durch die kanonische Gleichung (6.56) gegebenen Ellipse benutzen. Aufgrund der Symmetrie der Figur und der angenommenen Additivitat von Flachen geniigt es, nur die Flache der Ellipse im ersten Quadranten zu berechnen und das Ergebnis niit vier zu multiplizieren. Es folgt die Berechnung:
5 = 4 / Jb'^U-
^ ) d a ; = 4& / v^l - sin^ t a cos t dt =
0
0
7r/2
77/2
= 4a6 / cos^ tdt = 2ab / (1 - cos 2t) dt = nab . 0
0
Auf unserem Weg haben wir die Substitution x = asint, 0 < t < TT/2 benutzt. Daher ist S = nab. Ist insbesondere a = b = R, erhalten wir die Formel 7ri?^ fiir die Flache eines Kreises mit Radius R. Anmerkung. Wir woUen betonen, dass Formel (6.57) die Flache eines krummlinigen Trapezes unter der Bedingung hefert, dass f{x) > 0 auf [a, b]. Ist / eine behebige integrierbare Funktion, dann liefert das Integral (6.57) offensichthch die algebraische Sumnie der Flachen der entsprechenden krumnilinigen Trapeze, die oberhalb und unterhalb der x-Achse liegen. Wenn wir dies getan haben, werden die Flachen des Trapezes oberhalb der a;-Achse mit positivem Vorzeichen und die Flachen unterhalb mit negativem Vorzeichen summiert.
404
6 Integralrechnung
6.4.4 Volumen eines Drehkorpers Nun nehmen wir an, dass das krummlinige Trapez aus Abb. 6.2 um das abgeschlossene Intervall [a, b] auf der x-Achse gedreht wird. Wir wollen das Volumen des sich hieraus ergebenden Korpers bestimnien. Wir bezeichnen das Volumen des Korpers, der durcli Drehung des krummlinigen Trapezes af{a)f{(])l3 (vgl. Abb. 6.2) um das abgesclilossene Intervall [a,(]] C [a,b] entsteht, mit V{a,l3). Mit unseren Vorstellungen zu Volumina miissen die folgenden Bezieliungen gelten: 1st a < cc < /? < 7 < &, dann ist V{a,^)=V{a,P)
+ V{P,^)
und 7rf
inf
fix))
(P-a)
(/3 - a) .
In dieser letzten Ungleicliung haben wir das Volumen Y[a^ii) durcli die Volumina eingeschriebener und umschreibender Zylinder abgeschatzt und die Formel fiir das Volumen eines Zylinders benutzt (das nicht schwer zu bestimnien ist, wenn die Kreisflaclie bekannt ist). Dann gilt nach Satz 1: V{a,h) =TT
f{x)dx
.
(6.58)
Beispiel 6. Bei der Drehung des durch das abgesclilossene Intervall [—R, R] und durch den Bogen des Kreises y = \/R^ — x^, —R<x
^-KR^
In Teil 2 werden wir niehr Details zur Messung von Langen, Flachen und Volumina geben. Dabei werden wir auch das Problem der Invarianz der vorgestellten Definitionen losen. 6.4.5 Arbeit und Energie Der Energieverbrauch bei der Bewegung eines Korpers unter Einwirkung einer konstanten Kraft in Richtung der Kraftwirkung wird durch das Produkt F • S, d.h. der GroBe der Kraft und der GroBe der Verschiebung, gegeben. Diese GroBe wird als die Arbeit bezeichnet, die bei der Verschiebung durch
6.4 Einige Anwendungen der Integralrechnung
405
die Kraft verrichtet wird. Im AUgenieinen sind die Richtungen der Kraft und der Verschiebung nicht kollinear (beispielsweise, wenn wir einen Schlitten mit einem Seil ziehen) und dann wird die Arbeit als das innere Produkt (F, S) des Kraftvektors und des Verschiebungsvektors definiert. Wir woUen einige Beispiele zur Berechnung der Arbeit und zur Nutzung des verwandten Konzepts der Energie betrachten. Beispiel 7. Die Kraft, die zum vertikalen Anheben eines Korpers der Masse m von der Hohe hi iiber der Erdoberflache auf die Hohe /12 gegen die Schwerkraft aufgebracht werden muss, betragt nach der eben gegebenen Definition fng{h2 — hi). Wir nehmen an, dass das Ganze sich in Nahe der Erdoberflache abspielt, so dass die Veranderung der Gravitationskraft mg vernachlassigt werden kann. Der Allgemeinfall wird in Beispiel 10 untersucht. Beispiel 8. Wir gehen von einer ideal elastischen Feder aus, deren eines Ende im Punkt 0 an der reellen Geraden befestigt ist, wahrend das andere Ende im Punkt X ist. Es ist bekannt, dass die Kraft, die aufgebracht werden muss, um dieses Ende der Feder zu halten, gleich kx ist, wobei k die Federkonstante ist. Wir wollen die Arbeit berechnen, die aufgebracht werden muss, um das freie Ende der Feder vom Punkt x = a zum Punkt a; = & zu bewegen. Wir betrachten die Arbeit A{a,l3) als additive Funktion auf dem Intervall [a,P] und gehen dabei von den Abschatzungen inf {kx){l3 — a) < A{a,l3) < sup {kx){l3 — a) «e[a,/3]
x€[a,l3]
aus. Damit gelangen wir mit Satz 1 zur Folgerung, dass b
f kx^ b A{a,b) = kxdx = —— J 2 a a
Diese Arbeit ist gegen die Kraft aufzubringen. Die von der Feder unter derselben Verschiebung verrichtete Arbeit unterscheidet sich nur im Vorzeichen. Die Funktion U{x) = ^ | - , die wir so gefunden haben, versetzt uns in die Lage, die verrichtete Arbeit bei einer Zustandsanderung der Feder zu berechnen. Dies entspricht der Arbeit, die die Feder aufbringen muss, um wieder in den Ausgangszustand zu kommen. Eine derartige Funktion U{x), die nur von der Konfiguration des Systems abhangt, wird potentielle Energie des Systems genannt. Aus der Konstruktion wird klar, dass die Ableitung der potentiellen Energie die Kraft der Feder mit umgekehrtem Vorzeichen ergibt. Wenn sich eine Punktmasse m unter Einfluss der elastischen Kraft F = —kx entlang der x-Achse bewegt, dann erfiillen ihre Koordinaten x{t) als eine Funktion der Zeit die Gleichung mx = —kx .
(6.59)
406
6 Integralrechnung Wir haben bereits einmal nachgewiesen (vgl. Absatz 5.6.6), dass die Ener-
gie !!^
+ t^=Kit)
+ U{xit))=E,
(6.60)
die die Summe der kinetischen und (wie wir nun verstehen) der potentiellen Energien des Systems ist, wahrend der Bewegung konstant bleibt. Beispiel 9. Wir betrachten nun ein anderes Beispiel. In diesem Beispiel werden wir auf eine Anzahl von Konzepten trefFen, die wir bei der Differential- und Integralrechnung eingefiihrt haben und gut kennen gelernt haben. Wir beginnen niit der Anmerkung, dass wir durch Analogie zur Funktion (6.60), die fiir ein bestimmtes mechanisches System, das (6.59) geniigt, formuliert wurde, nachweisen konnen, dass fiir jede beliebige Gleichung der Form
m = f{m),
(6.61)
wobei /(s) eine vorgegebene Funktion ist, die Summe J + U{s) = E
(6.62)
sich mit der Zeit nicht verandert, wenn U'{s) = —f{s). Es ist namlich dE lds2 dU(s) -r = 7^-;- + —r-^ = ss + dt 2 dt dt Somit erhalten wir aus (6.62), wenn und nach zunachst
s=
dU ds , ^, ,. = sis - f{s)) = 0 . ds dt ^ •' ^ ^' wir E als Konstante betrachten, nach
±^2{E-U{s))
(wobei das Vorzeichen dem Vorzeichen der Ableitung ^ entsprechen muss), dann dt_ 1 d^" ^2{E - U{s)) und schlieBlich , , . ds t = ci± ^2{E-U{s))
•
Folghch ist es uns mit Hilfe des „Energieerhaltungsgesetzes" (6.62) theoretisch gelungen, diese Gleichung zu losen, indem wir nicht die Funktion s(t), sondern ihre Inverse t{s) gefunden haben. Die Gleichung (6.61) tritt beispielsweise bei der Beschreibung der Bewegung eines Punktes entlang einer gegebenen Kurve auf. Angenommen, ein Teilchen bewege sich unter dem Einfluss der Schwerkraft auf einer engen ideal glatten Bahn (vgl. Abb. 6.3). Sei s(t) der Abstand entlang der Bahn (d.h. die Weglange) von einem festen Punkt 0 - dem Ursprung der Messung - zum Punkt, an dem sich das Teilchen zur Zeit t aufhalt. Es ist
6.4 Einige Anwendungen der Integralrechnung
407
dann klar, dass s{t) dem Betrag der Geschwindigkeit des Teilchens entspricht und s{t) dem Betrag der tangentialen Komponente seiner Beschleunigung. Diese muss in jedem gegebenen P u n k t der Bahn dem Betrag der tangentialen
Komponente der Schwerkraft entsprechen. Es ist auBerdem klar, dass die tangentiale Komponente der Schwerkraft nur vom P u n k t auf der Balm abhangt, d.h., sie hangt nur von s ab, da s als P a r a m e t e r betrachtet werden kann, der die Kurve^, mit der wir die Bahn identifizieren, parametrisiert. Wenn wir diese Komponente der Schwerkraft mit / ( s ) bezeichnen, erhalten wir
ms = f{s) . Fiir diese Gleichung wird die folgende GroBe erhalten: -ms^
+ U{s) = E ,
mit U'{s) = -f(s). Da der Ausdruck ^ms'^ der kinetischen Energie des P u n k t e s entspricht und die Bewegung entlang der Bahn reibungslos ist, konnen wir unter Vermeidung von Berechnungen erraten, dass die Funktion U{s) bis auf einen konstanten Ausdruck die Form mgh{s) haben muss, wobei mgh{s) der potentiellen Energie eines P u n k t e s in der Hohe h{s) im Schwerkraftfeld sein muss. Gelten die Gleichungen s(0) = 0, s(0) = SQ und h{so) = ho zur Anfangszeit t = 0, dann erhalten wir mit den Gleichungen — = s^ + 2gh{s) = C , m dass C = 2gh{so) und daher s^ = 2g(^ho — h{s))
und
s
t = f , "^^ . J ^2g(ho - h(.s))
(6.63)
So
® Die Parametrisierung einer Kurve durch ihre eigene Bogenlange wird ihre naturliche Parametrisierung genannt und s wird als natiirlicher Parameter bezeichnet.
408
6 Integralrechnung
Insbesondere dann, wenn, wie im Fall eines Pendels, der P u n k t sicli entlang eines Kreises mit Radius R bewegt, wird die Lange s vom tiefsten P u n k t 0 des Kreises aus gemessen. Die Anfangsbedingungen lauten s(0) = 0 bei t = 0 bei eineni vorgegebenen anfanglichen Auslenkungswinkel —ipo (vgl. Abb. 6.4). Dann erhalten wir, wenn wir s und h{s) durcli den Auslenkungswinkel ausdriicken,
Rdi>
ds sj2g{ho - h{s))
J
So
sj2gR{cos^
- compo)
-Vo
oder
di) „
„ sm2 ^
•^0
V
3.64)
- sin2 I
2
2
Daher ergibt sicli fiir eine halbe Periode ^T der Scliwingung eines Pendels d^! i 2 i£o.
3.65) ,2 t.
Nacli der Substitution '^™, ',1 = sin6* ergibt sich daraus
de 9 J
V l - fc2 sin^ (
0
mit fc2 = sin^ ^ . Wir wiederholen, dass die Funktion
F{k,ip)--
de
V i -fc2sin^ e
3.66)
6.4 Einige Anwendungen der Integralrechnung
409
eUiptisches Integral erster Art in der Legendre-Form genannt wird. Fiir (p = TT/2 hangt es nur vonfc^ab, wird als K{k) bezeichnet und voUstdndiges elUptisches Integral erster Art genannt. Daher betragt die Schwingungsperiode des Pendels / ?? T = 4:J-K{k) . (6.67)
V^ 1st der anfangliche Auslenkungswinkel ipo klein, konnen wirfc= 0 setzen und gelangen dann zur Naherungsformel (6.68) Nun, da wir Gleichung (6.66) erhalten haben, miissen wir noch die Argumentationskette untersuchen. Dabei stellen wir fest, dass die Integrate (6.63)(6.65) auf dem Integrationsintervall unbeschrankte Funktionen sind. Wir trafen bei der Untersuchung der Lange einer Kurve auf eine ahnliche Schwierigkeit, so dass wir eine ungefahre Vorstellung davon haben, wie die Integrate (6.63)-(6.65) zu interpretieren sind. Wir sollten dieses Probtem jedoch nun, da es zum zweiten Mai aufgetreten ist, mathematisch exakt forniulieren. Wir hoten dies im nachsten Abschnitt nach. Beispiel 10. Ein Korper mit Masse m steige von der Erdoberflache aus entlang der Trajektorie t ^ {x{t),y{t),z{t)), wobei t die Zeit ist, a < t < b und x,y,z sind die kartesischen Koordinaten des Punktes im Raum. Wir wolten die Arbeit berechnen, die der Korper gegen die Schwerkraft im Zeitintervall [a, b] aufbringen muss. Die Arbeit A{a,(]) ist eine additive Funktion des Zeitintervalls [a,(]] C Eine konstante Kraft F, die auf einen sich mit einer konstanten Geschwindigkeit v bewegenden Korper einwirkt, verrichtet in der Zeit h die Arbeit (F,v/i) = {F,v)h und daher scheint die Abschatzung mi {F{p{t))Mt))W-a)
sup (F(p(t)), v(t))(/? - a) te[a,f3]
natiirhch, wobei v{t) die Geschwindigkeit des Korpers zur Zeit t ist, p{t) ist der Punkt im Raum, in dem der Korper sich zur Zeit t befindet und F{p{t)) ist die Kraft, die auf den Korper im Punkt p = p{t) einwirkt. Wenn die Funktion ^F(p(t)),v(t)) zufaUigerweise integrierbar ist, dann miissen wir nach Satz 1 folgern, dass
A{a,b)=
/ (F(p(t)),v(t))dt
410
6 Integralrechnung
Im gegenwartig betrachteten Fall ist v(t) = (^x{t),y{t),z{t)) und fiir r{t) = [x{t),y{t),z{t)) linden wir mit dem allgemeinen Gravitationsgesetz, dass ^, , ^, , ^^mM GmM F(p) =F{x,y,z) = G——r = . „ „
, . , (x,y,z) ,
wobei M die Masse der Erde ist. Ihr Zentrum wird als Ursprung des Koordinatensystenis angenonimen. Dann ist
{xHt)+yHt) + zHt)f^' und daher
/(F,v)(t)dt = -GmM / /
"
^'
GmM {xHt)+y^(t)
4i7?dt = ft
+ z^(t))
1/2
GmM |r(t)|
Daher ist
GmM GmM \r(b)\ \r{a)\ ' Wir haben herausgefunden, dass die gesuchte Arbeit nur von den Betragen |r(a)| und |r(&)| der Abstande des Korpers der Masse m vom Zentrum der Erde in seinem Anfangs- und Endzustand im Zeitintervall [a, b] abhangt. Wir setzen A{a,b)
U[r) = r und linden, dass die gegen die Schwerkraft verrichtete Arbeit zur Verschiebung der Masse m von jedem Punkt einer Sphare mit Radius ro in jeden Punkt einer Sphare mit Radius ri durch die Formel Ar„r•^ = m{U{ro) - U{ri)) berechnet werden kann. Die Funktion U{r) wird Newtonsches Potential genannt. Wenn wir den Radius der Erde mit R bezeichnen, dann konnen wir, da ^ = 5, fiir U{r) schreiben: U{r) = ^ - . Wenn wir dies beriicksichtigen, konnen wir den folgenden Ausdruck fiir die Arbeit erhalten, die wir benotigen, um dem Gravitationsfeld der Erde zu entkommen, genauer gesagt, um einen Korper mit Masse m von der Erdoberflache in einen unendlichen Abstand vom Zentrum der Erde zu bewegen. Es ist natiirlich, unter dieser GroBe den Grenzwert lim A^^ zu verstehen. 'i J- + 00
6.4 Einige Anwendungen der Integralrechnung
411
Diese Arbeit belauft sich zu A = Auoo =
lim
Aur =
1—J-+00
lim
m
1—J-+00
\
it
r
) = mgR
6.4.6 Ubungen und Aufgaben 1. In Abb. 6.5 ist der Graph der Abhangigkeit einer Kraft F = F{x) dargestellt, die entlang der x-Achse auf ein Probeteilchen im Punkt x auf der Achse einwirkt.
A b b . 6.5.
a) Skizzieren Sie das Potential dieser Kraft in denselben Koordinaten. b) Beschreiben Sie das Potential der negativen Kraft —F{x). c) Untersuchen Sie, welches dieser beiden Falle zu einer stabilen Gleichgewichtsposition des Teilchens fiihrt und welche Eigenschaft des Potentials mit der Stabilitat zusammenhangt. 2. Berechnen Sie, aufbauend auf dem Ergebnis in Beispiel 10, die Geschwindigkeit, die ein Korper besitzen muss, um dem Gravitationsfeld der Erde zu entkommen (die Fluchtgeschwindigkeit). 3. Fortsetzung von Beispiel 9: a) Leiten Sie die Gleichung Rip = g sin ip fiir die Schwingung eines mathematischen Pendels her. b) Angenommen, die Schwingungen seien gering. Bestimmen Sie eine Naherungslosung fiir diese Gleichung. c) Bestimmen Sie aus der Naherungslosung die Schwingungsperiode des Pendels und vergleichen Sie das Ergebniss mit Formel (6.68). 4. Ein Rad mit dem Radius r roUt, ohne zu rutschen, iiber eine horizontale Ebene mit konstanter Geschwindigkeit v. Angenommen, der hochste Punkt A des Rades besitze zur Zeit t = 0 die Koordinaten (0, 2r) in einem kartesischen Koordinatensystem, dessen x-Achse in der Ebene liegt und in Richtung des Geschwindigkeitsvektors zeigt. a) Formulieren Sie fiir den Punkt A das Bewegungsgesetz t i
-(<),y(<))-
412
6 Integralrechnung
b) Bestimmen Sie die Geschwindigkeit von A als Punktion der Zeit. c) Beschreiben Sie die Trajektorie von A graphisch. (Diese Kurve wird Zykloid genannt.) d) Bestimmen Sie die Lange eines Bogens des Zykloiden (die Lange einer Periode dieser periodischen Kurve). e) Der Zykloid besitzt eine Reihe interessanter Eigenschaften. Eine davon wurde von Huygens'^" entdeckt. Die Schwingungsperiode eines zykloiden Pendels (ein Ball roUt in einer zykloiden Bahn) ist unabliangig von der Hohe, die es im liochsten Bahnpunkt erreiclit. Versuclien Sie dies mit Hilfe von Beispiel 9 zu beweisen. (Vgl. aucli Aufgabe 6 im nachsten Absclinitt, der uneigentliclien Integralen gewidmet ist.) 5.
a) Erklaren Sie ausgeliend von Abb. 6.6, warum fiir das Paar zueinander inverser stetiger niclit negativer Funktionen y = f(x) und x = g(y), die 0 sind fiir x = 0 bzw. y = 0, die folgende Ungleicliung gilt X
y
xy < I f{t)At + j g{t)dt b) Beweisen Sie aus a) die Youngsclie Ungleichung xy < —X H — y P <1
m r x , y > 0 , p , g > 0 , ; + ^ = 1c) Welche geometrische Bedeutung kommt in den Ungleichungen in a) und b) der Gleichlieit zu.
6. Das Buffonsche^^ Nadelproblem. Die Zahl n kann auf folgende iiberrascliende Art berechnet werden. Wir nelimen ein grofies liniertes Blatt Papier mit parallelen Linien im Abstand h voneinander und wir werfen zufallig eine Nadel der Lange I < h auf das Papier. ^° Ch. Huygens (1629-1695) - niederlandischer Ingenieur, Physiker, Mathematiker und Astronom. 11 J. L. L. Buffon (1707-1788) - franzosischer Experimentalist.
6.5 Uneigentliche Integrale
413
Dies wiederholen wir A^-mal. Dabei sei die Nadel n-mal auf einer Linie gelandet. 1st N geniigend grofi, danii ist TT w | ^ , wobei p = ^ die genaherte Wahrscheinlichkeit dafiir ist, dass die Nadel auf einer Linie landet. Versuchen Sie, fiir diese Methode eine zufrieden stellende Erklarung zu finden. Verkniipfen Sie dabei geonietrische Betrachtungen niit der Berechnung von Flachen.
6.5 Uneigentliche Integrale Im vorigen Abschnitt mussten wir erkennen, dass wir ein etwas breiter angelegtes Konzept des Riemannschen Integrals benotigen. Wir haben uns dort bei der Untersuchung eines bestimmten Problems bereits eine Vorstellung davon gemaclit, in welche Riclitung dieses gelien soUte. Wir wollen diese Vorstellungen in diesem Abschnitt umsetzen. 6.5.1 D e f i n i t i o n , B e i s p i e l e u n d w i c h t i g e E i g e n s c h a f t e n uneigentlicher Integrale D e f i n i t i o n 1. Angenonimen, die Funktion x i->- f(x) sei auf dem Intervall [a, +00[ definiert und auf jedem darin entlialtenden abgeschlossenen Intervall [a, b] integrierbar. Existiert der rechte Grenzwert in b
+00
f{x) dx :=
lim
/ f{x) dx ,
()-> + O0 J a
dann wird die linke Seite uneigentUches Riemannsches Integral oder das uneigentliche Integral der Funktion f auf dem Intervall [a,+co[ genannt. + 00
J f{x) dx wird auch als solches uneigentliches Integral genannt und wir a
sagen dann, dass das Integral konvergiert, wenn der Grenzwert existiert und ansonsten divergiert. Daher ist die Frage nach der Konvergenz eines uneigentliclien Integrals aquivalent zur Frage, ob das uneigentliche Integral definiert ist oder nicht. Beispiel 1. Wir wollen die Werte des Parameters a untersuchen, fiir die das uneigentliche Integral + O0
^ 1
konvergiert oder, was dasselbe ist, definiert ist.
(6-69)
414
6 Integralrechnung
Da -r-^x^ "L
b
I —a
In XI
dx
, da; lim / — 6->+oo j X"
existiert der Grenzwert
fiir a ^ 1 , '
11
'
fiir a = 1 ,
a — 1
1
nur fiir a > 1. Daher ist dx X"
a —1
fiir cc > 1
und fiir andere Werte des Parameters a divergiert das Integral (6.69), d.h., ist es nicht definiert. Definition 2. Angenommen, die Funktion x i->- f{x) sei auf dem Intervall [a,B[ definiert und auf jedem abgeschlossenen Intervall [a, &] C [a,B[ integrierbar. Existiert der Grenzwert auf der recliten Seite, dann wird
f{x)Ax:=
lim
/ fix) Ax
das uneigentUche Integral von f auf dem Intervall [a,B[ genannt. Der Kern dieser Definition liegt darin, dass die Funktion / in jeder Umgebung von B unbesclirankt sein kann. Ist eine Funktion x i->- f{x) auf dem Intervall ]A, b] definiert und auf jedem abgeschlossenen Intervall [a, b] C]A, b] integrierbar, dann setzen wir analog zu oben per definitionem
f(x) dx := lim
/ f(x) dx
und ebenso per definitionem b
f{x)dx
lim
f{x)dx
6.5 Uneigentliche Integrale
415
Beispiel 2. Wir woUen die Werte des Parameters a untersuchen, fiir die das Integral da;
(6.70)
konvergiert. Da fiir a £]0,1] gilt, dass dx
fiir cc ^ 1
l — a"
fiir a = 1
In a; folgt, dass der Grenzwert
lim
[^
a^+O J x"
1
nur fiir a <1 existiert. Daher ist das Integral (6.70) nur fiir cc < 1 definiert. 3.
e^ dx
lim
e'^dx
lim (1 - e") = 1 .
lim (e* ^—> — o o
Da die Frage nach der Konvergenz eines uneigentlichen Integrals fiir Integrale auf einem unendlichen Intervall und Integrale auf endlichen Intervallen fiir Funktionen, die nahe eines Endpunkts unbesclirankt sind, auf dieselbe Art und Weise beantwortet wird, werden wir beide Falle von nun an zusammen untersuchen.Wir beginnen mit der folgenden wiclitigen Definition. Definition 3. Sei [a,a;[ ein endliches oder ein unendliclies Intervall und sei X H^ f{x) eine auf diesem Intervall definierte Funktion, die auf jedem abgeschlossenen Intervall [a,b] C [a,a;[ integrierbar ist. Dann ist per definitionem
/(a;)da; := lim /
f{x)dx
3.71)
6—>a)
falls dieser Grenzwert fiir b ^ u), b G [a,w[ existiert. Wenn nichts anderes gesagt wird, werden wir von nun an bei der Untersuchung des uneigentlichen Integrals (6.71) annehmen, dass der Integrand die Voraussetzungen von Definition 3 erfiillt.
416
6 Integralrechnung
AuBerdem werden wir der Klarheit halber annehmen, dass die Singularitat („Uneigentlichkeit") des Integrals am oberen Ende der Integration auftritt. Die Untersuchungen fiir den Fall, dass sie am unteren Ende liegt, sind Wort fiir Wort identiscli. Aus Definition 3, den Eigenscliaften des Integrals und den Eigenscliaften des Grenzwertes, konnen wir folgende Folgerungen zu Eigenscliaften eines uneigentlichen Integrals ziehen. Satz 1. Seien x H^ f{x) und x i->- g{x) auf einem Intervall [a,uj[ definierte Funktionen, die auf jedem abgeschlossenen Intervall [a,b] C [a,uj[ integrierbar sind. Seien die uneigentlichen Integrale f(x) dx ,
(6.72)
g{x) dx
(6.73)
a
definiert. Dann gilt: a) 1st u) G M. und f £ TZ[a,uj], dann sind die Werte des Integrals (6.72) unabhangig davon, ob es als eigentliches oder uneigentliches Integral interpretiert wird. b) Zu jedem Ai, A2 £ K ist die Funktion {Xif + X2g){x) auf[a,u![ uneigentlich integrierbar und es gilt: (Ai/ + X2g){x) da; = Ai / f{x) da; + A2 / g{x) dx . c) Ist c G [a,uj[, dann ist f{x)dx=
I f{x)dx+
I
f{x)dx
d) Ist (p : [a,7[—>• [a,uj[ eine glatte und streng monotone Abbildung mit (p{a) = a und (p{P) -^ to fur /? —>• 7, /? € [Q:,7[, dann existiert das uneigentliche Integral der Funktion 11->- (/ o (p){t)(p'{t) auf [a,j[ und es gilt: u>
7
/(a;)da;=
{f o ^)(ty (t) dt .
6.5 Uneigentliche Integrale
417
Beweis. Teil a) folgt aus der Stetigkeit der Funktion b
J=-{b) = I f{x) dx a
auf dem abgeschlossenen Intervall [a, to] auf dem / £ Tl[a,uj\. Teil b) folgt aus der Tatsache, dass fiir h £ [a,uj[ gilt: b
b
b
(Ai/ + X2g){x) dx = Ai / f{x) da; + A2 / g{x) dx . a
a
Teil c) folgt aus der Gleicliung b
c
f{x) dx =
b
f{x) dx +
f{x) dx ,
a
c
die fiir alle b,c G [a, uj[ gilt. Teil d) folgt aus den Formeln zur Substitution bei bestimmten Integralen:
f{x)dx = j{fo^){t)^'{t)dt.
U
Anmerkung 1. Wir soUten den in Satz 1 formulierten Eigenschaften des uneigentlichen Integrals die sehr niitzliclie Regel der partiellen Integration bei uneigentlichen Integralen hinzufiigen. Wir forniulieren dies folgenderniaBen: Seienf,g
£ C^^'[a,uj[ und es existiere der Grenzwert
lim {f-g){x).
Dann
sind die Funktionen f • g' und / ' • g entweder beide integrierbar oder beide sind als uneigentUches Integral auf [a,uj[ nicht integrierbar. Sind sie integrierbar, dann gilt die folgende Gleichung: if •g')ix)dx
= (/•3)(a;)|^ - / {f •g){x)dx
{f.g)(x)\^
= lim if . g)(x) - if • g)(a) .
a
wobei xE[a,u![
Beweis. Die Behauptung folgt aus der Formel b
if-g')ix)dx
= if-g)\l-
j{f'-g){x)dx a
fiir die partielle Integration eigentlicher Integrale.
,
418
6 Integralrechnung
Anmerkung 2. Nach Satz Ic) ist klar, dass die uneigentlichen Integrale UJ
f{x)dx
und /
f{x)dx
c
entweder beide konvergieren oder beide divergieren. Wie bei Reihen ist daher die Konvergenz bei uneigentlichen Integralen von einem anfanglichen Teil der Reihe oder des Integrals unabhangig. Aus diesem Grund lassen wir manclimal bei Konvergenzbetraclitungen zu uneigentlichen Integralen die Integrationsgrenzen, an denen das Integral keine Singularitat besitzt, vollstandig weg. Mit dieser Vereinbarung konnen wir die Ergebnisse aus den Beispielen 1 und 2 wie folgt neu formulieren: + 00
Das Integral J •% konvergiert nur fiir a > 1. Das Integral J ^
konvergiert nur fiir a < 1.
+ 0 •"
Das Symbol +0 im letzten Integral deutet an, dass der Integrationsbereich in a; > 0 enthalten ist. Durch Substitution erhalten wir aus diesem letzten Integral unmittelbar, dass das Integral f . _^'f ^ nur fiir cc < 1 konvergiert. ^
\X
XQI
6.5.2 Konvergenz eines uneigentlichen Integrals a. Das Cauchysche Kriterium Nach Definition 3 ist die Konvergenz des uneigentlichen Integrals (6.71) zur Existenz eines Grenzwertes der Funktion b
J=-{b) = I f{x) dx
(6.74)
a
fiir b ^ u), b G [a,u![ aquivalent. Auf Grund dieser Beziehung gilt der folgende Satz. Satz 2. (Cauchysches Konvergenzkriterium fiir ein uneigentliches Integral). Ist die Funktion x H^ f{x) auf dem Intervall [a,u![ definiert und auf jedem abgeschlossenen Intervall [a,b] C [a,a;[ integrierbar, dann konvergiert das Integral j f{x)dx
genau dann, wenn fiir jedes e > 0 ein B G [a,uj[ existiert, so
a
dass f{x)dx
<e
bi
fiir alle 61, 62 G [a, w[ mit B < bi und S < &2
6.5 Uneigentliche Integrale
419
Beweis. Wir erhalten nanilich 62
62
f{x) dx =
61
f{x) dx —
f{x) dx = J-'ib^) — ^{bi)
und daher ist die Behauptung einfach nur das Cauchysche Kriterium fiir die Existenz eines Grenzwertes fiir die Funktion J-'{b) fiir b ^ cu, b G [a,uj[. D b. Absolute Konvergenz eines uneigentlichen Integrals Definition 4. Das uneigentliche Integral J f{x) dx konvergiert absolut, wenn a
das Integral J \f\{x)dx
konvergiert.
a
Aus Satz 2 und der Ungleichung 62
f{x)dx
<
|/|(a;)da;
konnen wir folgern, dass ein Integral konvergiert, wenn es absolut konvergiert. Die Untersuchung der absoluten Konvergenz lasst sich auf die Untersucliung der Konvergenz von Integralen niclit negativer Funktionen zuriickfiihren. Fiir diesen Fall gilt aber der folgende Satz. Satz 3. ErfiiUt eine Funktion f die Voraussetzungen zu Definition 3 und ist f{x) > 0 auf [a,uj[, dann existiert das uneigentliche Integral (6.71) genau dann, wenn die Funktion (6.74) auf[a,u![ beschrankt ist. Beweis. Ist namlicli f{x) > 0 auf [a,a;[, dann ist die Funktion (6.74) auf [a,uj[ nicht absteigend und daher besitzt sie fiir b ^ u), b G [a,uj[ genau dann einen Grenzwert, wenn sie beschrankt ist. D Als Beispiel fiir die Niitzlichkeit dieses Satzes betrachten wir das folgende Korollar. KoroUar 1. (Konvergenztest fiir Reihen durch Integration). Ist die Funktion X !->• f{x) auf dem Intervall [l,+oo[ definiert, nicht negativ, nicht ansteigend und auf jedem abgeschlossenen Intervall [1,6] C [l,+oo[ integrierbar, dann konvergieren die Reihe
X]/(n)=/(l) + /(2) und das Integral
420
6 Integralrechnung +00
f{x)dx 1
entweder beide oder beide Beweis.
divergieren.
Laut den Voraussetzungen folgt, dass die Ungleichungen n+l .fin+l)<
f
.f{x)dx
fiir jedes n £ N gelten. Nach der Summation dieser Ungleichungen erhalten wir r-fc+l *: f{x)dx<J2f{r ' "(n) n=i
-
n=l
bzw. sfc+i-/(l)
b
mit Sfc = X] / ( n ) u n d !F{b) = j f{x)dx. n=l
+ l) <sk D a Sk u n d !F{b) nicht abnehmende
1
Funktionen ihrer Argumente sind, wird das Korollar durch die Ungleichungen bewiesen. D Insbesondere lasst sich sagen, dass das Ergebnis in Beispiel 1 zu der Beh a u p t u n g aquivalent ist, dass die Reihe 00
-,
n=l
nur fiir a > 1 konvergiert. Der folgende Satz ist die am haufigsten benutzte Folgerung aus Satz 3. S a t z 4 . (Vergleichssatz). Die Funktionen x i->- / ( x ) und x i->- ^(a;) seien auf dem Intervall [a,uj[ definiert und auf jedem abgeschlossenen Intervall [a, 6] C [a,Lo[ integrierbar. Gilt
0 < fix) < g{x) auf [a,Lo[, dann folgt aus der Konvergenz des Integrals (6.73) die Konvergenz von (6.72) und es gilt die Ungleichung f{x) dx <
g{x) dx . a
Aus der Divergenz
des Integrals (6.72) folgt die Divergenz
von (6.73).
6.5 Uneigentliche Integrale
421
Beweis. Aus den Voraussetzungen des Satzes und den Ungleichungen fiir eigentliche Riemannsche Integrale folgt, dass b
nb)
b
f{x) dx <
g{x) dx = Q{b)
fiir jedes b £ [a, a;[. Da beide Funktionen T und Q auf [a,uj[ nicht abnehmend sind, folgt der Satz aus dieser Ungleichung und Satz 3. D Anmerkung 3. Erfiillen die Funktionen / und g die Ungleichungen 0 < f{x) < g{x) nicht, sind aber nicht negativ und fiir a; —>• w, a; € [a,w[ von gleicher Ordnung, d.h., es gibt positive Konstanten ci und C2 derart, dass cil{x) < g{x) < C2f{x) , dann konnen wir mit der Linearitat des Integrals und dem eben bewiesenen Satz folgern, dass die Integrale (6.72) und (6.73) entweder beide konvergieren oder divergieren. Beispiel 4- Das Integral + 00
/xAx
yr
konvergiert, da
^/x V l + a;4
,3/2
fiir X -^ +00. Beispiel 5. Das Integral + O0
cosx da; konvergiert absolut, da cos a;
<
fiir a; > 1. Folglich ist cos a; da; < x^
+ 00
+ 00
f 1
COS a;
da; <
Beispiel 6. Das Integral + 00
dx
/ —r- da; x^
1.
422
6 Integralrechnung 2
konvergiert, d a e ~ ^
< e ~ ^ fiir x > 1 und + O0
+O0
e •"' dx < I e •" dx = 1
Beispiel
1
7. Das Integral + 00
da; In a; divergiert, da 1
1_
In a;
x
fiir geniigend grofie Werte x. Beispiel
8. Das Integral 7r/2
/insin.dx 0
konvergiert, da |lnsina;| ~ |lna;| < —i= \/ X
fiir X -^ + 0 . Beispiel
9. Das elliptische Integral 1
da; V(l-a;2)(l-Pa;2) 0
konvergiert fiir 0 < fc^ < 1, da
fiir a; ^ 1 — 0. Beispiel
10. Das Integral /• y
d6i VCOS ^ — cos (y9
0
konvergiert, da v/cos ^ -ini 9 ^
ip
-Q.
c o s (yP =
^2sin
2
sm
^
v/sin<^(<^ -
ef/'^
6.5 Uneigentliche Integrale
423
Beispiel 11. Das Integral ^^ sm^ ^ - sin^ I
(6.75)
konvergiert fiir 0 < ipQ < TT, ds. fiir ip ^ ipQ — 0 gilt, dass ^sin^ ^
- sin2 t ^ y ^ h r ^ ( ^ o - i^f'
•
(6.76)
Gleichung (6.75) bringt die Abliangigkeit der Schwingungsperiode eines Pendels der Lange L von seinem anfanglichen Auslenkungswinkel, gemessen vom tiefsten Punkt der Trajektorie, zum Ausdruck. Gleichung (6.75) ist eine wichtige Version von Gleichung (6.65) im vorigen Abschnitt. Wir konnen uns ein Pendel beispielsweise als eine gewichtslose Stange vorstellen, deren eines Ende an einem Gelenk befestigt ist, wahrend das andere Ende mit der Punktmasse frei beweglich ist. In diesem Fall konnen wir von beliebigen Anfangswinkeln cpo £ [0,7r] ausgehen. Fiir cpo = 0 und ipo = TT wird das Pendel gar nicht schwingen, da es sich im ersten Fall im stabilen Gleichgewichtszustand und im zweiten im instabilen Gleichgewichtszustand befindet. Interessant ist, dass aus (6.75) und (6.76) folgt, dass T ^ oo fiir ly^o —>• TT—0, d.h., die Schwingungsperiode eines Pendels wachst unbeschrankt an, wenn seine Anfangsposition sich dem oberen (instabilen) Gleichgewichtszustand nahert. c. Bedingte Konvergenz eines uneigentlichen Integrals Definition 5. Falls ein uneigentliches Integral zwar konvergiert, aber nicht absolut, dann sagen wir, dass es bedingt konvergiert. Beispiel 12. Mit Hilfe von Anmerkung 1 und der Formel fiir die partielle Integration eines uneigentlichen Integrals erhalten wir +00
+00
smx X
da; =
cos a; +°° 77/2
7r/2
+00
f cos a; , J 7r/2
x'^
• ax
f cos a; , = —
/
—TT- d x
7r/2
faUs dieses letzte Integral konvergiert. Wie wir in Beispiel 5 gesehen haben, konvergiert dieses Integral aber und daher konvergiert auch das Integral +00
sin a; , dx . X 77/2
,„ , (6.77)
424
6 Integralrechnung
Gleichzeitig ist das Integral (6.77) nicht absolut konvergent, denn wir erhalten fiir b £ [7r/2, +oo[ b
b
sina; , ^ dx> ixjl
b
/" sin a; , / —^dx=-
b
1 f dx If cos 2a; , / - " 2 / ^ d x .
1^12
ixjl
(6.78)
ixjl
Wie wir durch partielle Integration zeigen konnen, ist das Integral + O0
cos2x , da; X
konvergent, so dass die Differenz auf der rechten Seite der Relation (6.78) fiir h -^ +00 gegen +oo strebt. Dalier ist das Integral (6.77) auf Grand der Abschatzung (6.78) nicht absolut konvergent. Wir woUen nun einen besonderen Konvergenztest fiir uneigentliche Integrate anfiihren, der auf dem zweiten Mittelwertsatz berulit und dalier im Wesentlichen auf derselben Formel wie die partielle Integration. Satz 5. (Konvergenztest nach Abel-Dirichlet). Seien x H^ f{x) und x i->- g{x) auf einem Intervall [a,u![ definierte Funktionen, die beide auf jedem abgeschlossenen Intervall [a,b] C [a,uj[ integrierbar sind. Angenommen, g sei monoton. Dann ist es eine hinreichende Bedingung fiir die Konvergenz des uneigentlichen Integrals \f-g){x)dx,
(6.79)
dass eine der folgenden Bedingungspaare gilt: cci) Das Integral j f (x) dx konvergiert, a
Pi) Die Funktion g ist auf [a,u![ beschrankt, oder b
U'l) Die Funktion T{b) = J f{x) dx ist auf [a,uj[ beschrankt, a
P2) Die Funktion g{x) strebt fiir x ^ cu, x G [a,uj[ gegen Null. Beweis. Fiir jedes 61,62 G [a,uj[ erhalten wir nach dem zweiten Mittelwertsatz, dass (/ • 5)(a;) dx = g{bi) / f{x) dx + 5(62) / f(x) dx , bi
61
C
wobei ^ ein Punkt zwischen bi und 62 ist. Daher konnen wir nach dem Cauchyschen Konvergenzkriterium (Satz 2) folgern, dass das Integral (6.79) tatsachlich konvergiert, wenn eines der beiden Bedingungspaare giiltig ist. D
6.5 Uneigentliche Integrale
425
6.5.3 Uneigentliche Integrale mit mehr als einer Singularitat Bis jetzt haben wir nur iiber uneigentliche Integrale mit einer Singularitat gesproclien, die entweder von der Unbescliranktheit der Funktion in einem der Endpunkte des Integrationsintervalls herriihrt oder durch eine Integrationsgrenze ini Unendliclien. In dieseni Absatz werden wir zeigen, wie wir andere niogliche Varianten von uneigentliclien Integralen beliandeln konnen. Liegen in beiden Integrationsgrenzen Singularitaten einer dieser beiden Varianten vor, dann ist per definitionem C
U!2
UJ2
/ f{x)dx : = / f{x)dx-\a?i
/ f{x)dx
(6.80)
C
LOl
wobei c ein beliebiger Punkt im offenen Intervall ]ix'i,ix'2[ ist. Dabei nehmen wir an, dass jedes der uneigentliclien Integrale auf der rechten Seite von (6.80) konvergiert. Ansonsten sagen wir, dass das Integral auf der linken Seite von (6.80) divergiert. Nach Anmerkung 2 und der Additivitatseigenschaft des uneigentlichen Integrals ist die Definition (6.80) eindeutig in dem Sinne, dass sie von der Wahl des Punktes c e]a;i,a;2[ unabhangig ist. 13. dx Vl-a;2 1
0
1
f
f
dx J Vl-a;2
J VT
dx
-1
0 ,
|0
.
,1
.
,1
arcsina;|_ + arcsma;] = arcsina;|_ Beispiel 14- Das Integral +00
e "" da; -00
wird Gauss-Integral genannt. Es konvergiert offensichtlich im oben angegebenen Sinne. Wir werden spater zeigen, dass sein Wert gleich ^/TT ist. Beispiel 15. Das Integral +00
da; x" 0
divergiert, da fiir jedes a zumindest eines der beiden Integrale 1
+00
dx — x" 0
divergiert.
, Oder
[ dx / — J x" 1
426
6 Integralrechnung
Beispiel 16. Das Integral + O0
I" sin a;
da;
0
konvergiert, falls jedes der Integrale 1
+00
sin a; f sin a; ax und / ax x" J x" 0
1
konvergiert. Das erste dieser Integrale konvergiert fiir cc < 2, da sin a;
1
fiir X -^ +0. Das zweite Integral konvergiert fiir a > 0, wie sicli, alinlich wie in Beispiel 12, direkt durch partielle Integration oder unter Anwendung des Tests nacli Abel-Dirichlet zeigen lasst. Daher ist das Ausgangsintegral fiir 0 < a < 2 definiert. Ist einer der Integranden in einer Unigebung eines der inneren Punkte w des abgeschlossenen Integrationsintervalls [a, b] nicht besclirankt, dann setzen wir uj
b
b
fix) dx := I fix) dx+ I f{x) dx ,
(6.81)
UJ
a
wobei wir fordern, dass beide Integrale auf der rechten Seite existieren. Beispiel 11. Im Sinne der Vereinbarung (6.81) gilt 1
-1
da; -^= = 4 . '
1
Beispiel 18. Das Integral / ^ ist nicht definiert. -1
Neben (6.81) konnen wir eine zweite Vereinbarung zur Berechnung des Integrals einer Funktion treffen, die in einer Unigebung eines inneren Punktes UJ des abgeschlossenen Integrationsintervalls unbeschrankt ist. Um dies zu prazisieren, setzen wir b
HW I f{x)dx:= a
LC — 6
b
lim ( j /(a;) dx + j /(a;)da;j , a
(6.82)
ui+S
falls der Grenzwert auf der rechten Seite existiert. Dieser Grenzwert wird Cauchyscher Hauptwert des Integrals genannt. Wir haben zur Unterscheidung
6.5 Uneigentliche Integrale
427
dieser Definition von (6.81) die Buchstaben HW vor die Vereinbarung in (6.82) gesetzt, um anzudeuten, dass es der Hauptwert ist. In Ubereinstinimung niit dieser Vereinbarung erhalten wir: Beispiel 19. da;
HW
Wir treffen auch die folgende Vereinbarung: R
+00
HW / f{x) dx := lim / f{x) dx . J R->-+oo J
(6.83)
20. + 00
HW
/
xdx
0.
Gibt es schliefilich auf deni Integrationsintervall in inneren Punkten oder Endpunkten mehrere (endlich viele) Singularitaten der einen oder der anderen Art, dann unterteilen wir das Intervall entsprechend den Singularitaten in endlich viele Intervalle mit nur einer Singularitat und wir bereclinen das Integral als Summe iiber die abgeschlossenen Intervalle der Unterteilung. Wir konnen zeigen, dass das Ergebnis einer derartigen Berechnung nicht von der beliebig gewahlten Unterteilung abliangt. Beispiel 21. Wir konnen nun eine genaue Definition des Integrallogarithmus geben: dt hit
fiir 0 < a; < 1
lia; HW / —^ , fiir 1 < a; Int Im letzten Fall bezieht sicli das Symbol HW auf die einzige innere Singularitat auf dem Intervall ]0, x[ in 1. Wir merken an, dass dieses Integral im Sinne der Definition (6.81) nicht konvergent ist.
428
6 Integralrechnung
6.5.4 U b u n g e n u n d A u f g a b e n 1. Zeigeii Sie, dass die folgenden Punktionen die behaupteten Eigenschaften besitzeii. X
a) Si (x) = I ^iji fjt (der Integralsinus) ist auf ganz R definiert, er ist eine ungerade 0
Punktion und besitzt fiir x —>• +oo einen Grenzwert. oo
b) si (x) = — J ^^
dt ist auf ganz R definiert und unterscheidet sich von Si (x) nur
X
um eine Konstante. oo
c) Ci (x) = — J 2 ^ d i (der Integralcosinus) lasst sich fiir geniigend grofle x Werte durch die Naherungsformel Ci (x) K, ^^^^^ berechnen. Bestimmen Sie den Wertebereich, fiir den der absolute Fehler dieser Naherung kleiner als 10~ ist. 2. Zeigen Sie: + 00
a) Die Integrale /
+00
^ ^ Ax und /
1
^^- Ax konvergieren nur fiir a > 0. Sie kon-
1
vergieren nur fiir a > 1 absolut. b) Die Fresnel-Integrale ^/x
^/x
C{x) = —r= / cosi^di und S{x) = —^ / sint dt 0
0
sind auf deni Intervall ]0, +oo[ beliebig oft differenzierbare Punktionen und beide besitzen fiir x —>• +oo einen Grenzwert. 3. Zeigen Sie: a) Das elliptische Integral erster Art sin ^
F{k,cp)=
f
,
'^^
ist fiir 0 < f c < l , 0 < i y 3 < - |2 definiert und lasst sich umformen zu: F{k,^)
dV-
yT^^Psii^V' J0 ^/I
b) Das voUstandige elliptische Integral erster Art 7r/2
KC--
'
••"» = / •\/l 71-
wachst fiir fc —>• 1 — 0 ohne Grenzen an.
''* k'^ sin^ V>
6.5 Uneigentliche Integrale
429
4. Zeigeii Sie: ^
a) Das Integralexponential Ei (x) = /
t
^ di i^^ definiert und beliebig oft fiir x
— oo
difFerenzierbar. b) - E i ( - x ) = ^ ( l - i
+ | i - . . . + ( - l ) « i 4 + o ( ^ ) ) fiir X ^
+^.
oo
c) Die Reihe ^ ( —1)" jS- divergiert fiir jedes a; £ R. n=0
d) li {x) ~ j ^ fiir x —>• +0. (Zur Definition des Integrallogarithmus li(x) vgl. Beispiel 120 5. Zeigen Sie: a) Die Punktion #(a;) = - ^ / e~* dt wird Fehlerfunktion
genannt und oft als
—X
erf (x) bezeichnet. Sie ist definiert, gerade, auf R beliebig oft differenzierbar und besitzt fiir x —>• +oo einen Grenzwert. b) Ist der Grenzwert in a) gleich 1 (und das ist er), dann ist ^, , 2 f _t2 eri(x) = —= / e dt = 1 ^ ' ^/TT J
2 _^2 / 1 ^e 0r \2x
1 1-3 —-— + —-— 22^3 23x8
1-3-5 f 1 „, ^ +o{ ^ 2^x^ \x^
0
fiir X —> + 0 0 . 6. Beweisen Sie die folgenden Aussagen. a) Bin schweres Teilchen rutsche unter der Gravitationskraft entlang einer Kurve, die durch x = x{9), y = y(6) parametrisiert wird. Zur Zeit t = 0 habe es die Geschwindigkeit Null und befinde sicli ini Punkt XQ = x{9o), yo = 2/(^o). Dann gilt die folgende Gleichung zwischen dem Parameter 6, der einen Punkt auf der Kurve definiert, und der Zeit t, zu der das Teilchen diesen Punkt passiert (vgl. (6.63) in Abschnitt 6.4): , 2
f
(x'{e)) +(y'ie)y ^
'
^
'Ad.
Dabei konvergiert das uneigentliche Integral notwendigerweise fiir y'{9o) ^ 0. (Das wahlbare Vorzeichen wird entsprechend positiv oder negativ gesetzt, je nachdem ob t und 9 dieselbe Art von Monotonie oder unterschiedliches monotones Verhalten aufweisen, d.h., wenn ein anwachsendes 9 einem anwachsenden t entspricht, dann miissen wir offensichtlich das positive Vorzeichen wahlen.) b) Die Schwingungsperiode eines Teilchens in einer Bahn mit einem Durchschnitt in Form eines Zykloids X = R{e + ir + sm9) , \0\<7T,
y = -R{1 +cos9) , ist von der Hohe yo = —R{1 -l-cos^o), von der das Teilchen zu rutschen beginnt, unabhangig und ist gleich ATT^/R/g (vgl. Aufgabe 4 in Abschnitt 6.4).
Funktionen mehrerer Variabler: Ihre Grenzwerte und Stetigkeit
Bis jetzt haben wir fast ausschlieBlich numerische Funktionen x i->- f{x) betrachtet, in denen die Zahl f{x) alleine durch eine einzige Zahl x aus dem Definitionsbereich der Funktion bestinimt wurde. Viele interessante GroBen hangen jedoch nicht nur von einem, sondern von vielen Faktoren ab. Konnen die Grofie selbst und die sie bestimmenden Faktoren durch Zahlen charakterisiert werden, dann lasst sich diese Abhangigkeit darauf zuriickfiihren, dass ein Wert y = f{x^, • • •, x") der fraglichen GroBe mit einer geordneten Menge (x^,... ,a;") von Zahlen, die jeweils den Zustand des entsprechenden Faktors beschreiben, in Zusamnienhang gebracht wird. Die GroBe nimnit diesen Wert an, wenn die Faktoren, die diese GroBe bestimnien, sich in diesen Zustanden befinden. So ist beispielsweise die Flache eines Rechtecks das Produkt der Lange seiner Seiten. Das Volumen einer gegebenen Gasmenge wird durch die Formel
P bestimmt, wobei R eine Konstante ist, m die Masse, T die absolute Temperatur und p der Druck des Gases. Daher hangt der Wert von V von einem veranderlichen geordneten Zahlentripel {m,T,p) ab oder, wie wir sagen, V ist eine Funktion dreier Variabler m, T und p. Unser Ziel ist es zu lernen, wie Funktionen mehrerer Variabler zu untersuchen sind genauso, wie wir gelernt haben, mit Funktionen einer Variablen umzugehen. Wie im Falle von Funktionen einer Variablen, beginnen wir die Untersuchung von Funktionen mehrerer numerischer Variablen mit der Beschreibung ihrer Definitionsbereiche.
432
7 Funktionen mehrerer Variabler
7.1 Der R a u m R"* und die wichtigsten Klassen seiner Unterraume 7.1.1 D i e M e n g e W^ u n d d e r A b s t a n d in d i e s e r M e n g e Wir treflFen die Vereinbarung, dass ffi™ die Menge geordneter m-Tupel (a;^,...,a;™) reeller Zahlen a;* £ M, {i = 1,... ,m) bezeichnet. Jeder derartige m-Tupel wird durch einen einzigen Buchstaben x = (x^,... ,a;™) symbolisiert und in Ubereinstimniung mit der praktischen geonietrischen Terniinologie als ein Punkt in ffi™ bezeichnet. Die Zahl x^ in der Menge (a;^,... ,a;™) wird i-te Koordinate des P u n k t e s x = ( x ^ , . . . ,a;™) genannt. Die geometrischen Analogien konnen ausgebaut werden, indeni wir einen Abstand in M™ zwischen den P u n k t e n xi = (a;J,... ,a;™) und X2 = (xl,... ,a;™) gemai3 d(a;i,a;2)
J2i4-4y'
(7-1)
einfiihren. Die durch (7.1) definierte Funktion d : K™ X K™ ^ K besitzt oflFenbar die folgenden Eigenschaften: a) b) c) d)
d(a;i,a;2) > 0, (d(a;i,a;2) = O) <^ (xi = a;2), d(a;i,a;2) = (i(a;2,a;i), d(a;i,a;3) < (i(a;i,a;2) + (i(a;2,a;3).
Die letzte Ungleichung (wegen ihrer geometrischen Analogic Dreiecksungleichung genannt) ist ein Spezialfall der Minkowskischen Ungleichung (vgl. Absatz 5.4.2). Eine Funktion, die die Eigenschaften a), b), c) und d) besitzt und fiir ein P u n k t e p a a r (a;i,a;2) einer Menge X definiert ist, wird Metrik oder Abstand auf X genannt. Eine Menge X zusanimen mit einer festen Metrik wird metrischer Raum genannt. Somit haben wir M™ in einen metrischen R a u m verwandelt, indem wir ihn mit der in (7.1) definierten Metrik versehen haben. Der Leser kann sich in Kapitel 9 (Teil 2) iiber beliebige metrische R a u m e informieren. Hier woUen wir uns auf den bestimmten metrischen R a u m ffi™ konzentrieren, den wir im Augenblick brauchen. Da der R a u m M™ mit der Metrik (7.1) in diesem Kapitel unser einziger metrischer R a u m bleibt, verzichten wir im Augenblick auf die allgemeine Definition eines metrischen R a u m s . Wir haben den metrischen R a u m hier nur
7.1 Der Raum R"* und seine Unterraume
433
eingefiihrt, um den Ausdruck „Raum" in Verbindung mit ffi™ und den Ausdruck „Metrik" in Verbindung mit der Funktion (7.1) zu erklaren. Aus (7.1) folgt, dass fiir i e { 1 , . . . , m} gilt, dass \x{ - xl\
< Vm max \x{ - X2\ ,
(7.2)
l
d.h., der Abstand zwischen den Punkten a;i,a;2 £ K™ ist genau dann klein, wenn die entsprechenden Koordinaten dieser Punkte nahe beieinander liegen. Aus (7.2) und ebenso aus (7.1) wird deutlich, dass fiir m = 1 die Menge M^ mit der Menge der reellen Zahlen iibereinstimmt. Dort messen wir den Abstand in der iiblichen Weise durch den Absolutbetrag der DifFerenz der Zahlen. 7.1.2 OfFene und abgeschlossene Mengen in ffi™' Definition 1. Wir nennen fiir 6 > 0 die Menge K{a;6) = {x G W"\d{a,x)
< 6}
eine Kugel mit Zentruni a £ M™ und Radius 6 oder die d-Umgebung des Punktes a e M". Definition 2. Eine Menge G C M™ ist ojfen in M™, falls fiir jeden Punkt X G G eine Kugel K{x; S) existiert, so dass K{x; 6) C G. Beispiel 1. M™ ist eine offene Menge in ffi™. Beispiel 2. Die leere Menge 0 enthalt iiberhaupt keine Punkte und wir konnen daher diese Menge als offene Menge in ffi™ betrachten, da sie Definition 2 erfiillt. Beispiel 3. Eine Kugel K{a;r) ist eine offene Menge in K™. Ist namlich x £ K{a;r), d.h. d{a,x) < r, dann erhalten wir fiir 0 < 6 < r — d{a,x), dass K{x;S) C K{a;r), da {^GK{x;d))^{d{x,0<S)^ ^ (d(a, £,) < d{a, x) + d{x, ^) < d{a, x) + r — d{a, x) = r). Beispiel 4- Eine Menge G = {x G M™] d{a,x) > r}, d.h. die Menge der Punkte, deren Abstand von einem festen Punkt a £ ffi™ groBer als r ist, ist offen. Dies ist einfach zu beweisen, indem wir wie in Beispiel 3 die Dreiecksungleichung der Metrik benutzen. Definition 3. Die Menge F Cffi™ist in M*" abgeschlossen, falls ihr Komplement G = M™ \ F in K™ offen ist.
434
7 Funktionen mehrerer Variabler
Beispiel 5. Die Menge K{a; r) = {x £ M™ | d{a, x) < r } , r > 0, d.h. die Menge von Punkten, deren Abstand von einem festen Punkt a £ M™ hochstens r ist, ist abgeschlossen, wie aus Definition 3 und Beispiel 4 folgt. Die Menge K{a; r) wird abgeschlossene Kugel mit Zentrum a und Radius r genannt. Satz 1. a) Die Vereinigung |J Ga der Mengen jedes Systems {Ga, a G A} offener Mengen in M™ ist eine offene Menge in ffi™. n
b) Die Schnittmenge
f] Gi einer endlichen Anzahl offener Mengen in M™ ist i=l
eine offene Menge in M™. a') Die Schnittmenge f] Fa der Mengen jedes Systems {Fa, a G A} abgeaeA schlossener Mengen F^ in ffi™ ist eine abgeschlossene Menge in ffi™. n
b') Die Vereinigung [j Fi einer endlichen Anzahl abgeschlossener Mengen in i=l
ffi™ ist eine abgeschlossene Menge in ffi™. Beweis.
a) Ist a; £ |J Ga, dann existiert ein a^ € A, so dass x € Gao, und a€A
folglich gibt es eine (5-Umgebung K{x;6) von x, so dass K{x;6) C GaoDann ist aber K{x;6) C |J Gaa€A
n
b) Sei X G f] Gi. Dann ist x G Gi, (i = l,...,n).
Seien
di,...,dn
i=l
positive Zahlen, so dass K{x;di) C Gi, (i = l,...,n). Wenn wir S = mm{di,... ,dn} setzen, erhalten wir offensichtlich, dass (5 > 0 und n
K{x;d)c
n Gi. i=l
a') Wir wollen zeigen, dass die Menge C( f] Fa), das Komplement zu fl Fa in M™, eine oflFene Menge in M™ ist. a^A
Es gilt
^( n ^") = u (^^") = u ^"' aeA
aeA
aeA
wobei die Mengen Ga = CFa in K™ offen sind. Somit folgt Teil a') aus a). b') Ahnlich erhalten wir aus b), dass n
n
n
c[[JF,) = [\{CFi) = []Gi. i=l
i=l
U
i=l
Beispiel 6. Die Menge S{a;r) = {x G W^\d{a,x) = r}, r > 0 wird Kugelschale (oder Spliare) mit Radius r mit Zentrum in a G M™ genannt. Das Komplement zu S{a; r) in M™ ist nach den Beispielen 3 und 4 eine Vereinigung offener Mengen, die nach dem eben bewiesenen Satz ofFen ist und daher ist die Kugelschale S{a; r) in M™ abgeschlossen.
7.1 Der Raum R"* und seine Unterraume
435
Definition 4. Eine offene Menge in M™, die einen vorgegebenen Punkt enthalt, wird eine Umgebung des Punktes in M™ genannt. Insbesondere folgt aus Beispiel 3, dass eine (5-Umgebung eines Punktes eine Umgebung des Punktes ist. Definition 5. Wir sagen, dass ein Punkt x G ffi™ ein innerer Punkt einer Menge E Cffi™ist, falls er in E entlialten ist, ein aufierer Punkt einer Menge E Cffi™ist, falls er ini Koniplement von E in K™ entlialten ist und ein Randpunkt einer Menge E C ffi™ ist, falls er weder ein innerer, noch ein aufierer Punkt ist. Aus dieser Definition folgt, dass es eine charakteristische Eigenschaft von Randpunkten einer Menge ist, dass jede ihrer Umgebungen sowohl Punkte der Menge enthalt als auch Punkte, die nicht in der Menge enthalten sind. Beispiel 7. Die Kugelschale S{a;r), r > 0 ist die Menge aller Randpunkte sowohl der offenen Kugel K{a; r) als auch der abgeschlossenen Kugel K{a; r). Beispiel 8. Ein Punkt a €ffi™ist ein Randpunkt der Mengeffi™\ a, die keine aufieren Punkte besitzt. Beispiel 9. Die Kugelschale S{a;r) besteht nur aus Randpunkten. Als Teilmenge von M™ betrachtet, besitzt die Kugelschale S{a; r) keine inneren Punkte. Definition 6. Ein Punkt a G M™ ist ein Hdufungspunkt der Menge E C ffi™, falls fiir jede Umgebung U{a) von a die Schnittmenge EnU{a) eine unendliche Menge ist. Definition 7. Die Vereinigung einer Menge E mit all ihren Haufungspunkten inffi™wird Abschluss von E in ffi™ genannt. Der Abschluss der Menge E wird iiblicherweise mit E bezeichnet. Beispiel 10. Die Menge K{a] r) = K{a; r)U5(a; r) ist die Menge der Haufungspunkte der offenen Kugel. Daher wird K{a; r) im Unterschied zu K{a; r) eine abgeschlossene Kugel genannt. Beispiel 11. S{a;r) = S{a;r). Anstatt diese letzte Gleichung zu beweisen, werden wir den folgenden niitzlichen Satz beweisen. Satz 2. {F ist abgeschlossen m K™) <^ (F = F in M"). Anders formuliert, ist die Menge F genau dann abgeschlossen in K™, wenn sie alle ihre Haufungspunkte enthalt.
436
7 Funktionen mehrerer Variabler
Beweis. Sei F abgeschlossen in K™, x £ M™ und x ^ F. Dann ist die oflFene Menge G = M™ \ F eine Umgebung von x, die keine Punkte von F enthalt. Somit haben wir gezeigt, dass fiir x ^ F, x kein Haufungspunkt in F ist. Sei F = F. Wir wollen zeigen, dass die Menge G =ffi™\ F in K™ oflFen ist. Sei X G G, dann ist a; ^ F und daher ist x kein Haufungspunkt von F. Daher gibt es eine Umgebung von x, die nur endlich viele Punkte xi,... ,x„ von F enthalt. Da x ^ F, konnen wir etwa Kugeln um x, Ui{x),..., Unix) konstrun
ieren, so dass Xi ^ Ui{x). Dann ist U{x) = f] Ui{x) eine offene Umgebung i=l
von X, die iiberhaupt keine Punkte von F enthalt, d.h., U{x) Cffi™\ F und daher ist die Menge K™ \ F = K™ \ F oflFen. Daher ist F in K™ abgeschlossen. D
7.1.3 Kompakte Mengen in W^ Definition 8. Eine Menge K C M™ ist kompakt, falls wir aus jeder Uberdeckung von K durch offene Mengen inffi™eine endliche Uberdeckung herausgreifen kann. Beispiel 12. Ein abgeschlossenes Intervall [a, h] Cffi^ist nach dem Satz von Heine-Borel (Satz zur endlichen Uberdeckung) kompakt. Beispiel 13. Eine VeraUgemeinerung des Konzepts eines abgeschlossenen Intervalls auf M™ ist die Menge I={x&W^\a'
<x'
die ein m-dimensionales Intervall oder ein m-dimensionaler wird. Wir wollen zeigen, dass / in M™ kompakt ist.
, Quader genannt
Beweis. Wir wollen annehmen, dass wir aus einer offenen Uberdeckung von / nicht eine endliche Uberdeckung herausgreifen konnen. Wir halbieren nun jedes abgeschlossene IntervaU /* = {a;* e ffi : a* < x* < &*}, (i = 1 , . . . ,m), wodurch wir das Intervall / in 2™ Intervalle unterteilen. Zumindest eines von ihnen darf keine Uberdeckung durch endlich viele Mengen der urspriinglichen offenen Uberdeckung zulassen. Wir fahren nun mit diesem Intervall genauso fort wie mit dem Ausgangsintervall. Wenn wir diesen Teilungsprozess fortsetzen, gelangen wir zu einer Folge geschachtelter Intervalle I = h D L2 ^ • • • D In 3 • • •, von denen keines eine endliche Uberdeckung erlaubt. Ist In = {x Gffi™\a.n < x^ < bn, i,..., TTi}, dann bilden fiir jedes i £ {!,..., m} die abgeschlossenen IntervaUe a^^ < x^ < V^ [n = 1,2,...) nach Konstruktion ein System von geschachtelten abgeschlossenen Intervallen, deren Lange gegen Null strebt. Wir konnen nun fiir jedes i £ { ! , . . . , m } einen Punkt ^* £ [o^,&^] finden, der in alien diesen Intervallen liegt und erhalten so einen Punkt ^ = (^^,..., ^™), der in alien Intervallen / = / i , / 2 , . . . , / „ , . . . liegt. Da
7.1 Der Raum R"* und seine Unterraume
437
^ e /, gibt es eine offene Menge G im System der iiberdeckenden Mengen, so dass £, £ G. Damit gibt es ein (5 > 0, so dass auch K{^; S) C G. Nach Konstruktion und Ungleichung (7.2) existiert aber ein N, so dass /„ C K{£^; 6) C G fiir n > N. Wir erzeugen so einen Widerspruch zur Aussage, dass die Intervalle /„ keine endliche Uberdeckung durch Mengen des vorgegebenen Systems zulassen. D Satz 3. 1st K eine kompakte Menge in M™, dann ist a) K in M™ abgeschlossen und h) jede in K enthaltene abgeschlossene Teilmenge von M™ auch kompakt. Beweis. a) Wir woUen zeigen, dass jeder Punkt a £ ffi™, der ein Haufungspunkt von K ist, zu K gehoren muss. Angenommen, a ^ K. Zu jedem Punkt X G K konstruieren wir eine Umgebung G{x), so dass eine Umgebung von a existiert, die von G{x) disjunkt ist. Die Menge {G{x)}, x £ K, die aus alien derartigen Umgebungen bestelit, bildet eine offene Uberdeckung der kompakten Menge K. Daraus konnen wir eine endliche Uberdeckung G{xi),..., G{xn) herausgreifen. Ist nun Ui{a) eine Umgebung von a, so dass G{xi)riUi{a) = 0 , n
dann ist auch die Menge U{a) = f] Ui{a) eine Umgebung von a und offeni=l
sichthch ist K n U{a) = 0 . Somit kann a kein Haufungspunkt von K sein. b) Angenommen, F sei eine abgeschlossene Teilmenge von M™ und FcK. Sei {Ga}, a G A eine Uberdeckung von F durch offene Menge inffi™.Wenn wir dieser Ansammlung die offene Menge G =ffi™\F hinzufiigen, erhalten wir eine offene Uberdeckung von M™ und insbesondere auch eine offene Uberdeckung von K. Aus dieser konnen wir eine endliche Uberdeckung von K herausgreifen. Diese endhche Uberdeckung von K iiberdeckt auch die Menge F. Gehort namlich G zu dieser offenen Uberdeckung, dann konnen wir, da G fl -F = 0 , G daraus entfernen und behalten so eine endliche Uberdeckung von F durch das Ausgangssystem {Ga}, a G A. D Definition 9. Der Durchmesser einer Menge E Cffi™ist d{E) :=
sup
d{xi,X2) •
Definition 10. Eine Menge E C M™ ist beschrdnkt, wenn ihr Durchmesser endhch ist. Satz 4. Ist K eine kompakte Menge in M™, dann ist K eine beschrdnkte Teilmenge von M™. Beweis. Wir betrachten einen beliebigen Punkt a Gffi™und die Folge offener Kugeln {K{a; n)}, (n = 1, 2 , . . . , ) . Sie bilden eine offene Uberdeckung von K™ und folglich auch eine von K. Ware K nicht beschrankt, ware es unmoglich, aus dieser Folge eine endliche Uberdeckung von K herauszugreifen. D
438
7 Funktionen mehrerer Variabler
S a t z 5. Die Menge K C M™ ist genau dann kompakt, und beschrdnkt in M™ ist.
wenn K
abgeschlossen
Beweis. Die Notwendigkeit der Bedingungen wurde in den Satzen 3 und 4 bewiesen. Wir wollen beweisen, dass die Bedingungen auch hinreichend sind. Da K eine beschrankte Menge ist, existiert ein m-dimensionales Intervall / , das K enthalt. Wie wir in Beispiel 13 gezeigt haben, ist / in M™ kompakt. Ist aber K eine abgeschlossene Menge, die in einer kompakten Menge / enthalten ist, dann ist K nach Satz 3b) selbst kompakt. D
7.1.4 U b u n g e n u n d A u f g a b e n 1. Der Abstand d{Ei,E2)
zwischen den Mengen Ei,E2 C R™ ist d{Ei,E2) :=
inf xieEi,
d(xi,X2)
•
X2S-B2
Geben Sie ein Beispiel fiir abgeschlossene Mengen Ei und E2 in R™, die keinen gemeinsamen Punkt besitzen, fiir die aber dennoch d{Ei,E2) = 0 gilt. 2. Zeigen Sie: a) Der Abschluss E in R"* jeder Menge E C R"* ist eine abgeschlossene Menge in R™. b) Die Menge dE der Randpunkte einer Menge E C R"* ist eine abgeschlossene Menge. c) Ist G eine ofFene Menge in R™ und F abgeschlossen in R™, dann ist G\ F in R™ offen. 00
3. Zeigen Sie, dass f] Ki j^ 0, falls Ki D K2 D • • • D Kn D • • • eine Folge nicht i=l
leerer kompakter Mengen ist. 4.
a) Im Raum R* seien eine zwei-dimensionale Kugelschale S^ und ein Kreis S^ so platziert, dass der Abstand zwischen jedem Punkt der Kugelschale zu jedem Punkt des Kreises gleich ist. Ist dies moglich? b) Betrachten Sie Aufgabe a) fiir Kugelschalen S"'', S" beliebiger Dimension in R*. Welche Bedingungen miissen m, n und k erfiillen, daniit dies moglich ist?
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler 7.2.1 D e r G r e n z w e r t e i n e r F u n k t i o n In Kapitel 3 haben wir detailliert den Grenzwertiibergang einer Funktion mit reellen Werten / : X —^ M untersucht, die auf einer Menge definiert war, in der eine Basis B fest vorgegeben war.
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler
439
In den nachsten Abschnitten werden wir Funktionen f : X ^ M" betrachten, die auf einer Teilmenge von M™ definiert sind und die Werte in ffi = M^ oder allgemeiner in M", n € N annehmen. Wir woUen nun die Theorie der Grenzwerte um Besonderheiten beini Unigang niit dieser Klasse von Funktionen erganzen. Wir beginnen jedoch mit der zentralen allgemeinen Definition. D e f i n i t i o n 1. Ein P u n k t A € ffi" ist der Grenzwert der Abbildung f : X^M" auf einer Basis B in X, falls fiir jede Umgebung V{A) des P u n k t e s ein Element B £ B der Basis existiert, dessen Bild f{B) in V{A) enthalten ist. In Kurzform: (\imf{x)
= A ) := (yV{A)
3B G B {f{B)
C V{A)
Wir selien, dass die Definition des Grenzwertes einer Funktion f : X ^ M" der Definition des Grenzwertes einer Funktion f : X ^ M. entspricht, wenn wir dabei bedenken, was eine Umgebung V{A) eines P u n k t e s A e ffi" fiir jedes n e N bedeutet. D e f i n i t i o n 2. Eine Abbildung / : X ^ ffi" ist beschrdnkt, f{X) C M" beschrankt ist.
wenn die Menge
D e f i n i t i o n 3 . Sei B eine Basis in X. Eine Abbildung / : X —>• ffi" ist schliefilich beschrdnkt auf der Basis B, falls ein Element B in B existiert, auf dem / beschrankt ist. Mit Hilfe dieser Definitionen konnen wir olme Schwierigkeiten mit denselben Uberlegungen wie in Kapitel 3 zeigen, dass eine Funktion / : X —>• ffi" auf einer vorgegebenen Basis B in X hochstens einen Grenzwert haben kann, eine Funktion / : X —>• ffi", die einen Grenzwert auf einer Basis B besitzt, auf dieser Basis schliefilich beschrdnkt ist. Definition 1 kann unter explizitem Gebrauch der Metrik in ffi" umgeschrieben werden zu: D e f i n i t i o n 1'. (\imf{x)
=AGR"):=(ye>03BGBVxGB
{d{f{x),A)
oder D e f i n i t i o n 1". ( l i m / ( x ) = A e K " ) := ( l i m d ( / ( x ) , A) = o) .
< e
440
7 Funktionen mehrerer Variabler
Da ein Punkt y € ffi" ein geordnetes n-Tupel (y^,... ,y") reeller Zahlen ist, ist die besondere Eigenschaft einer Abbildung / : X —>• M" die, dass die Definition einer Funktion / : X —>• ffi" aquivalent zur Definition von n Funktionen /* : X ^ M , {i = 1 , . . . ,n) mit reellen Werten ist, wobei f^{x) = y^, (« = l , . . . , n ) . 1st A = (A^,..., A") und y = {y^,..., y"), dann gelten die Ungleichungen \y' - A'\ < d{y, A)<^/^
max \y' - A'\ ,
(7.3)
l
aus denen wir erkennen konnen, dass lim/(a;) = A ^ l i m / * ( a ; ) = A*,
(i = l , . . . , n ) ,
(7.4)
d.h., Konvergenz in M" bedeutet Konvergenz in jeder Koordinate. Nun sei X = N die Menge der natiirlichen Zahlen und B die Basis fc —>• oo, k £ N in X. Eine Funktion / : N ^ M" ist in diesem Fall eine Folge {yt}, fc e N von Punkten in M". Definition 4. Eine Folge {yk}, k G N von Punkten yj. £ MP heifit CauchyFolge {fundamentale Folge), falls fiir jedes e > 0 eine Zahl TV £ N existiert, so dass d{yki,yk2) < £ fur alle fci,fc2 > ^ • Aus den Ungleichungen (7.3) konnen wir folgern, dass eine Folge von Punkten yk = (yl,..., y^) £ K" genau dann eine Cauchy-Folge ist, wenn jede Folge von Koordinaten mit den gleichen Indizes {yl}, k £ N, i = l , . . . , n eine Cauchy-Folge ist. Wenn wir die Relation (7.4) und das Cauchysche Konvergenzkriterium fiir numerische Folgen beriicksichtigen, dann konnen wir zeigen, dass eine Folge von Punkten in ffi" genau dann konvergiert, wenn sie eine Cauchy-Folge ist. Anders formuliert, so ist das Cauchysche Konvergenzkriterium auch in M" giiltig. Wir werden spater metrische Raume, in denen jede Cauchy-Folge einen Grenzwert besitzt, voUstdndige metrische Raume nennen. Definition 5. Die Oszillation einer Funktion / : X —>• ffi" auf einer Menge E C X wird definiert als uj{f-E):=d{f{E)),
wobei d(^f{E)'j der Durchmesser von f{E) ist. Wir konnen erkennen, dass dies eine direkte Verallgemeinerung der Definition der Oszillation einer Funktion mit reellen Werten ist, in die Definition 5 fiir n = 1 iibergeht. Die Giiltigkeit des folgenden Cauchyschen Kriteriums zur Existenz eines Grenzwertes fiir Funktionen / : X —>• M" mit Werten in ffi" ergibt sich aus der Vollstandigkeit von MP.
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler
441
Satz 1. Sei X eine Menge und B eine Basis in X. Eine Funktion / : X ^ M" besitzt genau dann einen Grenzwert auf der Basis B, wenn fur jedes e > 0 ein Element B G B der Basis existiert, in dem die Oszillation der Funktion kleiner als e ist. Somit ist also: 31im/(a;) <^ Ve > 0 3B G B {uj(f;B) < s) . Der Beweis von Satz 1 ist, abgesehen von einer winzigen Veranderung, eine wortwortliche Wiederholung des Beweises des Cauchyschen Kriteriums fiir numerische Funktionen (Satz 6 in Abschnitt 3.2). Nur der Betrag |/(a;i) — f{x2)\ muss durch d[f{xi),f{x2)) ersetzt werden. Wir konnen Satz 1 auch auf eine andere Weise mit Hilfe von (7.4) und (7.3) zeigen, wenn wir das Cauchysche Kriterium fiir Funktionen mit reellen Werten als bekannt voraussetzen. Der wichtige Satz zum Grenzwert einer verketteten Funktion bleibt ebenso fiir Funktionen mit Werten in ffi" giiltig. Satz 2. Sei Y eine Menge, By eine Basis in Y und 5 : F —>• M" eine Abbildung mit einem Grenzwert auf der Basis By • Sei X eine Menge, Bx eine Basis in X und f : X ^ Y eine Abbildung auf Y, so dass fiir jedes By G By ein Bx £ Bx existiert, so dass das Bild f{Bx) in By enthalten ist. Unter diesen Voraussetzungen ist die Verkettung 5 o / : X —>• M" der Abbildungen f und g definiert und besitzt einen Grenzwert auf der Basis Bx mit lim(ff°/)(a;) =Vang{y) . lix
OY
Wir konnen den Beweis von Satz 2 entweder durch Wiederholung des Beweises von Satz 7 in Abschnitt 3.2 durchfiihren, indem wir ffi durch M" ersetzen, oder wir berufen uns auf jenen Satz in Zusammenhang mit (7.4). Bis jetzt haben wir die Funktion f : X ^ M" mit Werten in ffi" betrachtet ohne naher auf ihren Definitionsbereich X einzugehen. Von nun an werden wir uns in erster Linie fiir den Fall interessieren, dass X eine Teilmenge des M™ ist. Wie zuvor treffen wir die folgenden Vereinbarungen: U{a) ist eine Umgebung des Punktes a G ffi™. (/(a) ist eine punktierte Umgebung von a G M™, d.h. U{a) := U{a) \ a. UE{a) ist eine Umgebung von a in der Menge E C M™, d.h. UE{a) := Er\U{a). UE{a) ist eine punktierte Umgebung von a in E, d.h. fjE{OL) '•= Er\ U{a). a; —>• a ist die Basis punktierter Umgebungen von a in ffi™. a; —>• 00 ist die Basis von Umgebungen von Unendlich, d.h. die Basis, die aus den Mengen K™ \ K{a;r) besteht.
442
7 Funktionen mehrerer Variabler X ^ a, X G E oder (E B x ^ a) ist die Basis punktierter Umgebungen von a in E, falls a ein Haufungspunkt von E ist. X ^ CO, X G E oder (_E 9 a; —>• oo) ist die Basis von Umgebungen von Unendlicli in E, die aus den Mengen E \ K{a; r) besteht, falls E eine unbeschrankte Menge ist.
In Ubereinstinimung niit diesen Definitionen konnen wir Definition 1 zuni Grenzwert einer Funktion beispielsweise die folgende besondere Gestalt geben, wenn wir iiber eine Funktion f : E ^ W^ sprechen, die eine Menge E C ffi™ auf K" abbildet: (^lim
f{x) = A ) := {^e > 0 3UE{a) Vx e UE{a) {d{.f{x),A) < e)) .
Dies konnen wir aucli wie folgt formulieren:
( lim fix) = A] := = (Ve > 0 3(5 > 0 Va; e £; (0 < d{x,a)
d{f{x),A)
< e)] .
Hierbei setzen wir voraus, dass die Abstande d{x,a) und d{f{x),A) in den Raumen (K™ und M") gemessen werden, in denen die Punkte jeweils liegen. SchlieBlich gilt {^\im^f{x) = A) := (ye > 03K{a;r)Vx
G R"" \ K{a;r) {d{f{x), A) < e)) .
Wir wollen aufierdem vereinbaren, dass wir im Falle einer Abbildung / : X —>• K" unter dem Ausdruck „f{x) ^ oo in der Basis B" verstelien, dass fiir jede Kugel K{A; r) C ffi" ein B £ B der Basis B existiert, so dass
f(B)cW\K{A;r). Beispiel 1. Sei x i->- •K^{X) eine Abbildung TT* : M™ —>•ffi,bei der jedem x = (a;^,... ,a;™) in K™ seine i-te Koordinate a;* zugewiesen wird. Somit ist also Tr\x) = X* . 1st a = (a^,...,a™), dann ist offensiclitlich 7r*(a;) -^ a* fiir a; —>• a . Die Funktion x ^ TT^{X) strebt fiir a; ^ oo und m > 1 weder gegen einen endlichen Wert noch gegen Unendlicli. Andererseits gilt m
f{x) = y^ {'^\^))
~^ OO
fiir a; ^ oo .
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler
443
Wir sollten uns nicht vorstellen, dass wir den Grenzwert einer Funktion mehrerer Variabler finden konnen, indem wir nach und nach die Grenzwerte beziiglich jeder ihrer Koordinaten bestimmen. Das folgende Beispiel soil dies verdeutlichen. Beispiel 2. Die Funktion / : M^ ^ K sei fiir die P u n k t e (a;, y) G M^ folgendermaBen definiert: r ^ ^ ,
fiir x 2 + 2 / 2 ^ 0 ,
.fix,y) = < [
0 ,
fiir a;2 + 2/2 = 0 .
Dann ist f{0,y) = f{x,0) = 0, woliingegen f{x,x) = ^ fiir a; 7^ 0. Daher besitzt die Funktion fiir {x,y) -^ (0,0) keinen Grenzwert. Andererseits ist aber
Beispiel
lim ( \ i m f{x,y))
= lim(O) = 0 ,
lim ( l i m f{x,y))
= lim(O) = 0 .
3. Fiir die Funktion fiir X + y j^ 0
a: +1/
f{x,y)
••
0 ,
fiir a;2 + 2/2 = 0
erhalten wir 2
lim f lim f(x,y))
= lim ( —r | -- 1
t
lim ( lim f{x, y)) = lim (
-] = — 1
Beispiel 4- Fiir die Funktion
{
x + y sin ^ , fiir x ^ 0 , 0 ,
fiir a; = 0
fix.y)
= 0,
erhalten wir lim
lim ( l i m / ( a ; , 2/)) = 0 . X—>0
y—>0
Gleichzeitig existiert der wiederholte Grenzwert lim ( l i m / ( a ; , 2 / ) ) iiberhaupt nicht.
444
7 Funktionen mehrerer Variabler
Beispiel 5. Die Funktion fiir x'^ +y^ ^ 0
f{x,y) fiir x^ + 2/^ = 0 nimmt bei Annaherung an den Ursprung entlang jeden Strahls x = at und y = fit den Grenzwert Null an. Gleichzeitig ist die Funktion gleicli ^ in jedeni Punkt der Form (a, a?) mit a 7^ 0 und daher besitzt die Funktion fiir {x,y) -^ (0,0) keinen Grenzwert. 7.2.2 Stetigkeit einer Funktion mehrerer Variabler und Eigenschaften stetiger Funktionen Sei E eine Teilmenge vonffi™und f : E ^W^ mit Werten in M".
eine auf E definierte Funktion
Definition 6. Die Funktion / : _E —>• M" ist in a € i? stetig, falls fiir jede Umgebung l^(/(a)) des Wertes / ( a ) , den die Funktion in a annimmt, eine Umgebung UE{a) von a in _E existiert, deren Bild f{UE{a)) in l^(/(a)) enthalten ist. Somit gilt also (/ : £; ^ M" ist stetig in a e £;) := = (Vy(/(a)) 3UE{a) {f(UE{a)) C V{f{a))))
.
Wir konnen erkennen, dass Definition 6 dieselbe Form besitzt wie Definition 1 in Abschnitt 4.1 zur Stetigkeit von Funktionen mit reellen Werten, die wir bereits kennen. Wie dort konnen wir auch hier die folgende, alternative Formulierung fiir diese Definition benutzen: (/ : £; ^ M" ist stetig in a e £;) := = (Ve > 0 3 (5 > 0 Va; e £; {d{x, a) < d ^ d{f{x)J{a))
<e
oder, falls a ein Haufungspunkt von E ist, {f : E ^M"
ist stetig in a £ £ ; ) : = ( lim f{x) = /(a)) .
Wie in Kapitel 4 bemerkt, ist das Konzept der Stetigkeit genau dann im Punkt a £ -E, in dem die Funktion / definiert ist, von Interesse, wenn er ein Haufungspunkt der Menge E ist. Aus Definition 6 und (7.4) folgt, dass die durch die Relation (x\...,x"')
= x^y={y\...,y")
= = (/i(xi,...,a;™),...,/"(a;i,...,a;™))
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler
445
definierte Abbildung / : i? —>• ffi" in einem P u n k t genau dann stetig ist, wenn jede der Funktionen y^ = /*(a;^,... ,a;™) in diesem P u n k t stetig ist. Insbesondere woUen wir d a r a n erinnern, dass wir einen Weg in ffi" als Abbildung f : I ^ MP eines Intervalls / C M definiert haben, die durch stetige Funktionen / ^ ( x ) , . . . , / " ( x ) der Form x^y={y\...,y")
=
{fHx),...,nx))
definiert ist. Daher konnen wir sagen, dass ein Weg in ffi" erne stetige Abbildung eines Intervalls der reellen Geraden / C M auf MP ist. In Analogie zur Definition der Oszillation in einem P u n k t fiir eine Funktion mit reellen Werten fiihren wir den BegrifF der Oszillation in einem P u n k t fiir eine Funktion mit Werten in ffi" ein. Sei E eine Teilmenge des K™, a e -B und Ksia; r) = E Ci K{a; r). D e f i n i t i o n 7. Die Oszillation uj{f;a)
der Funktion
f : E ^ MP im P u n k t a G E ist
:= \im uj{f;KE{a;r))
.
Aus Definition 6 zur Stetigkeit einer Funktion erhalten wir, wenn wir die Eigenscliaften eines Grenzwertes und das Cauchysche Kriterium beriicksichtigen, eine Anzalil haufig benutzter lokaler Eigenscliaften stetiger Funktionen. Wir fiihren diese nun hier an. Lokale E i g e n s c h a f t e n s t e t i g e r F u n k t i o n e n a) Eine Abbildung f : E ^ M" einer Menge E C ffi™ ist im Punkt genau dann stetig, wenn uj{f;a) = 0. b) Eine in a G E stetige Abbildung / : _E ^ M" ist in einer Umgebung dieses Punktes beschrankt. c) Ist die Abbildung g : Y ^ M'^ der Menge F C ffi" in einem Punkt stetig und die Abbildung f : X ^ Y der Menge X C M™ in einem xo € AT stetig und ist / ( X Q ) = yo, dann ist die Abbildung g o / : X definiert und in XQ £ X stetig.
a G E UE{a) yo G Y Punkt —>• ffi*
Funktionen mit reellen Werten besitzen zusatzlich die folgenden Eigenschaften. d) Ist die Funktion f : E ^ M im Punkt a G E stetig und ist f{a) > 0 (oder f{a) < 0), dann existiert eine Umgebung UE{a) von a in E, so dass fix) > 0 (bzw. f{x) < 0) fiir alle x G UE{a). e) Sind die Funktionen f : E ^ M und g : E ^ M in a G E stetig, dann ist jede ihrer Linearkombinationen (af + fig) : E ^ M mit a,P GM, ihr Produkt if • g) : E ^ M und, falls g{x) ^ 0 auf E, auch ihr Quotient (|-) : E ^ M auf E definiert und stetig in a. Wir wollen vereinbaren, eine Funktion / : _B —^ ffi" als stetig auf der Menge E zu bezeichnen, wenn sie in jedem P u n k t der Menge stetig ist.
446
7 Funktionen mehrerer Variabler
Wir bezeichnen die Menge der auf E stetigen Funktionen f : E ^ M" mit C(-E;M") oder einfach nur mit C{E), falls der Wertebereich aus dem Zusammenhang deutlich hervorgelit. In der Regel werden wir diese Abkiirzung fiir M» = M benutzen. Beispiel 6. Die Funktionen (a;^,... ,a;™) i—> a;*, (i = l , . . . , m ) , durcli die M™ auf ffi abgebildet (projiziert) wird, sind offensiclitlich in jedem Punkt a = (fli,... ,a™) e K™ stetig, da lim 7r*(a;) = a' = n^a). Beispiel 7. Jede auf M definierte Funktion x i->- f{x), wie etwa x H^ sinx, kann als Funktion (x,y) i—> f{x) betrachtet werden, die beispielsweise auf M^ definiert ist. Falls / eine stetige Funktion auf ffi ist, ist in diesem Fall die neue Funktion {x,y) i—> f{x), eine in K^ stetige Funktion. Dies lasst sicli entweder direkt aus der Definition der Stetigkeit zeigen oder durch die Anmerkung, dass die Funktion F die verkettete Funktion {foTr^)(x, y) stetiger Funktionen ist. Wenn wir c) und e) beriicksiclitigen, folgt daraus insbesondere, dass beispielsweise die Funktionen /(a;,2/) = sina; + e*^
und
/(a;,2/) = arctan (ln(|a;| + lyj + 1))
in K^ stetig sind. Wir merken an, dass die gerade angewandten Uberlegungen auf rein lokalen Eigenscliaften beruliten und dass die Tatsaclie, dass die in Beispiel 7 untersuchten Funktionen / und F auf der ganzen reellen Geraden ffi bzw. der Ebene ffi^ definiert waren, rein zufallig war. Beispiel 8. Die Funktion /(a;, y) in Beispiel 2 ist aufier in (0,0) in jedem Punkt des Raumes ffi^ stetig. Wir merken an, dass die Funktion, trotz ilirer Unstetigkeit in diesem Punkt, in beiden Variablen fiir jeden festen Wert der anderen Variablen stetig ist. Beispiel 9. Ist eine Funktion / : _E —>• K" auf der Menge E stetig und ist E eine Teilmenge von E, dann ist die Einschrankung / | ?; von / auf diese Teilmenge stetig auf E, wie unmittelbar aus der Definition der Stetigkeit einer Funktion in einem Punkt folgt. Wir wenden uns nun den globalen Eigenschaften stetiger Funktionen zu. Damit wir sie fiir Funktionen / : _E —>• ffi" formulieren konnen, formulieren wir zunaclist zwei Definitionen. Definition 8. Eine Abbildung f : E ^ W einer Menge E CW^ auf W ist gleichmdfiig stetig auf E, falls zu jedem e > 0 eine Zalil 6 > 0 existiert, so dass d[f{xi),f{x2)) < s fiir alle Punkte a;i,a;2 € E mit d(a;i,a;2) < 6.
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler
447
Wie zuvor gehen wir davon aus, dass die Abstande d[f{xi),f{x2)) und d{xi,X2) in ffi" bzw.ffi™gemessen werden. 1st m = n = 1, dann entspricht diese Definition der gleichmai3igen Stetigkeit von Funktionen mit reellen Werten, wie wir sie bereits kennen. Definition 9. Eine Menge E C ffi™ heiBt wegweise zusammenhangend, falls es zu jedem Paar ilirer Punkte XQ, xi einen Weg F : I ^ E mit Spur in E gibt, der in diesen Punkten endet. Anders formuliert, so kann man von einem Punkt XQ G E ZU jedem anderen Punkt xi £ E gelangen, olme die Menge E zu verlassen. Da wir im Augenblick keine andere Art des Zusammenhangs von Mengen, aufier dem wegweisen Zusammenhang betrachten, werden wir zwisclienzeitlich der Kiirze wegen wegweise zusammenhangende Menge als zusammenhangend bezeiclmen. Definition 10. Ein Gebiet inffi™ist eine offene zusammenhangende Menge. Beispiel 10. Eine offene Kugel K{a; r), r > 0 ist ein Gebiet in M™. Wir wissen bereits, dass K{a] r) in M™ offen ist. Wir wollen zeigen, dass die Kugel zusammenhangend ist. Seien XQ = {x\ . . . , x™) und xi = (a;J,..., x™) zwei Punkte der Kugel. Der durch die Funktionen x^{t) = tx\ -I- (1 — t)xQ, {i = 1 , . . . ,m) fiir das IntervaU 0 < t < 1 definierte Weg besitzt XQ und xi als Endpunkte. Aufierdem liegt seine Spur in der Kugel K{a;r), da nach der Minkowskischen Ungleichung fiir jedes t G [0,1] gilt, dass
d[x{t),a)
<
t-
')? f2(4 - a'r + a-t)
')? f2(4 - o')'
r .
Beispiel 11. Der Kreis (die ein-dimensionale Kugelschale) vom Radius r > 0 ist die Teilmenge in M^, die durch die Gleichung {x^Y + {x^)'^ = ^^ gegeben wird. Wenn wir r cos t und • sin t setzen, konnen wir erkennen. dass je zwei Punkte des Kreises durch einen Weg verbunden werden konnen, der entlang des Kreises verlauft. Daher ist ein Kreis eine zusammenhangende Menge. Diese Menge ist jedoch kein Gebiet in ffi^, da sie in ffi^ nicht offen ist. Wir wollen nun die zentralen globalen Eigenschaften stetiger Funktion formulieren.
448
7 Funktionen mehrerer Variabler
Globale Eigenschaften stetiger Funktionen a) 1st eine Ahhildung f : K ^ WP auf einer kompakten Menge K C ffi™ stetig, dann ist sie auf K gleichmdfiig stetig. b) Ist eine Ahhildung f : K ^ WP auf einer kompakten Menge K C ffi™ stetig, dann ist sie auf K heschrdnkt. c) Ist eine Funktion f : K ^ W auf einer kompakten Menge K C ffi™ stetig, dann nimmt sie in Punkten von K ihre Maximal- und Minimalwerte an. d) Ist eine Funktion f : E ^ W auf einer zusammenhdngenden Menge E stetig und nimmt sie in den Punkten a,b G E die Werte f{a) = A und f{b) = B an, dann gibt es zu jedem C zwischen A und B einen Punkt c G E, in dem f{c) = C. Bei der Untersuchung der lokalen und der globalen Eigenschaften von Funktionen einer Variablen in Abschnitt 4.2 haben wir diese Eigenschaften, die sich auf den hier betrachteten aUgemeineren Fah iibertragen lassen, bewiesen. Die einzige Veranderung, die in den friiheren Beweisen notig ist, ist das Ersetzen von Ausdriicken wie \xi — X2\ oder |/(a;i) — f{x2)\ durch d{xi,X2) und d(^f{xi),f{x2)), wobei d die Metrik des Raumes ist, in dem sich die fraghchen P u n k t e befinden. Dies gilt vollstandig fiir alle Aussagen mit Ausnahme der letzten d), die wir nun beweisen wollen. Beweis. d) Sei P : I ^ E ein Weg, der eine stetige Abbildung eines IntervaUs [a,(]] = / c ffi ist, so dass P{a) = a, P{P) = b. Da E zusammenhangend ist, existiert ein derartiger Weg. Die Funktion / o r : / ^ M, die der Verkettung stetiger Funktionen entspricht, ist stetig, und daher gibt es einen P u n k t 7 e [a,l3] im abgeschlossenen Intervall [a,(]], in dem foP['y) = C. Wir setzen c = r ( 7 ) . Dann ist c £ £; und / ( c ) = C. U Beispiel
12. Die in M™ durch die Gleichung (a;i)2 + . - . + (a;™)2=r2
definierte Kugelschale 5(0; r) ist eine kompakte Menge. Tatsachhch folgt aus der Stetigkeit der Funktion
(a;\...,a;")H^ {x^f + • • • + {x^'f , dass die Kugelschale abgeschlossen ist und aus der Tatsache, dass auf der Schale \x^\ < r, (« = 1 , . . . , m ) gilt, dass sie beschrankt ist. Die Funktion (a;S . . . ,a;™) ^
{x^f
+ • • • + {x'^f
- {x''+^f
(x")^
ist in ganz M™ stetig, so dass seine Einschrankung auf die Kugelschale ebenfaUs stetig ist. Nach der globalen Eigenschaft c) fiir stetige Funktionen nimmt sie auf der Kugelschale ihren Minimal- und Maximalwert an. In den P u n k t e n ( 1 , 0 , . . . , 0) und ( 0 , . . . , 0,1) nimmt die Funktion die Werte 1 bzw. —1 an. Da
7.2 Grenzwerte und Stetigkeit von Funktionen mehrerer Variabler
449
die Kugelschale zusammenhangend ist (vgl. Aufgabe 3 am Ende dieses Abschnitts), setzt uns die globale Eigenschaft d) fiir stetige Funktionen in die Lage, zu zeigen, dass es auf der Kugelschale einen P u n k t gibt, in dem die Funktion den Wert 0 annimnit. Beispiel 13. Die offene Menge M™ \ 5(0; r) fiir r > 0 ist kein Gebiet, da sie nicht zusammenhangend ist. Ist namhch F : / —>• K™ ein Weg, dessen eines Ende der P u n k t XQ = ( 0 , . . . , 0 ) ist und dessen anderes der P u n k t xi = ( x j , . . . ,a;™), fiir den (a;J)^ + • • • + (a;™)^ > r^ gilt, dann ist die Verkettung der stetigen Funktionen T : / - ; • K™ und / : M™ ^ M, wobei
eine stetige Funktion auf / ist, die in einem E n d p u n k t Werte kleiner als r^ annimmt und groi^ere als r^ im anderen. Daher gibt es einen P u n k t 7 in / , in dem ( / o r){'-^) = r^, wobei der P u n k t x^ = 1^(7) in der Spur des Weges auf der Kugelschale 5(0; r) liegt. Wir haben somit gezeigt, dass es unmoghch ist, aus einer Kugel K{Q; r) C M™ herauszukommen, ohne ihre umgrenzende Kugelschale 5(0; r) zu durchqueren.
7.2.3 U b u n g e n u n d A u f g a b e n 1. Sei / G C(R'";R). Zeigen Sie: a) Die Menge Ei = {x &W\ f(x) < c} ist in R™ offen. b) Die Menge E2 = {x £M^\ f{x) < c} ist in R™ abgeschlossen. c) Die Menge E3 = {x £M^\ f{x) = c} ist in R™ abgeschlossen. d) Strebt f{x) —> +00 fiir a; —>• 00, dann sind E2 und E3 in R"* kompakt. e) Fiir jedes / : R™ ->• R ist die Menge S4 = {x G R™ | iu{f; x) > e} abgeschlossen inR™. 2. Zeigen Sie, dass die Abbildung / : R"* —> R" genau dann stetig ist, wenn das Urbild jeder offenen Menge in R" eine offene Menge in R™ ist. 3. Zeigen Sie: a) Das Bild f{E) einer zusammenhangenden Menge E C R"* ist unter einer stetigen Abbildung / : _B —>• R" eine zusammenhangende Menge. b) Die Vereinigung zusammenhangender Mengen, die einen Punkt gemeinsam haben, ist eine zusammenhangende Menge. c) Die Halbschale (Hemisphare) (x^f + h (x™)^ = 1, x'" > 0 ist eme zusammenhangende Menge. d) Die Kugelschale (x^)"^ -I- • • • -I- {x"')'^ = 1 ist eine zusammenhangende Menge. e) Ist -B C R und ist E zusammenhangend, dann ist E ein Intervall in R (d.h., ein abgeschlossenes Intervall, ein halb ofFenes Intervall, ein offenes Intervall oder die gesamte reelle Gerade). f) Ist xo ein innerer Punkt und xi ein auflerer Punkt der Menge M C R™, dann durchschneidet die Spur jedes Weges mit den Endpunkten xo und xi die Umgrenzung der Menge M.
8
DifFerentialrechnung mit Funktionen mehrerer Variabler
8.1 Die lineare S t r u k t u r auf W^ 8.1.1 W^ als Vektorraum Der BegrifF des Vektorraums ist Ihnen bereits aus Ihrem Studium der Algebra bekannt. Wenn wir die Addition von Elementen xi = {x\,... ,x'i^) und X2 = (xl,..., a;™) inffi™durch die Formel xi+X2
= ixl+xl,...,x'^+
x^)
(8.1)
einfiihren und Multiplikation eines Elements x = (x^,... ,a;™) mit einer Zalil A e M durch Xx = (Xx\ ..., Xx"") (8.2) definieren, wird ffi™ zum Vektorraum iiber dem Korper der reellen Zalilen. Seine Punkte konnen nun Vektoren genannt werden. Die Vektoren Cj = ( 0 , . . . , 0 , 1 , 0 , . . . , 0 ) ,
(i = l , . . . , m )
(8.3)
(wobei die 1 nur in der i-ten Position steht) bilden eine maximale linear unabhangige Menge von Vektoren in diesem Raum. Als Folge davon erweist sich M™ als m-dimensionaler Vektorraum. Jeder Vektor x £ M™ kann in der Basis (8.3) entwickelt werden, d.h. in der Form x = x^ei-\ ha;™em (8.4) dargestellt werden. Wenn wir Vektoren indizieren, schreiben wir den Index unten, wohingegen wir seine Koordinaten wie bisher oben indizieren. Dies ist aus mehreren
452
8 Differentialrechnung mit Punktionen mehrerer Variabler
Griinden bequem. Einer der Griinde ist nach Einstein^, dass wir vereinbaren konnen, Ausdriicke wie in (8.4) in der Kurzforni X = x^Ci
(8.5)
zu schreiben. Dabei verwenden wir das gleichzeitige Auftreten desselben hochund tiefgestellten Index dazu, um eine Summation iiber diesen Buchstaben iiber dessen Variationsbereich anzudeuten. 8.1.2 L i n e a r e T r a n s f o r m a t i o n e n L : W^ —> W"" Wir wiederholen, dass eine Abbildung L : X ^ Y von einem Vektorraum X in einen Vektorraum Y linear genannt wird, falls L(Aia;i + X2X2) = XiL{xi)
+
\2L{x2)
fiir jedes x i , a;2 £ AT und Ai, A2 € M. Wir interessieren uns fiir lineare Abbildungen L : M™ ^ M". Seien { e i , . . . , e m } und { e i , . . . , e „ } feste Basen von K™ bzw. ffi". Wenn wir die Entwicklungen L{ei) = a\eiA
|-a"e„ = a ^ e j ,
(« = l , . . . , m )
(8.6)
der Bilder der Basisvektoren unter der linearen Abbildung L : M™ -^ M" kennen, dann konnen wir die Linearitat von L ausnutzen, um das Bild L{h) jedes beliebigen Vektors h = /i^eiH h/i^e™ = /i*ej in der Basis { e i , . . . , e„} zu entwickeln. Um es auf den P u n k t zu bringen, so ist L{h) = L{h'ei)
= h'L{ei)
= h'^e,
= ajh'ij
.
(8.7)
Somit ist in Koordinatensclireibweise L{h) = {h'al,...,h'a1)
.
(8.8)
Zu einer festen Basis in M" konnen wir dalier die Abbildung L : M™ -^ M" als eine Menge L = {L\...,L") (8.9) aus n (koordinatenweisen) Abbildungen U : M™ -^ M betracliten. Wenn wir (8.8) beriicksichtigen, konnen wir einfach folgern, dass eine Abbildung L : M™ —>• K" genau dann linear ist, wenn jede Abbildung U in der Menge (8.9) linear ist. Wenn wir (8.9) spaltenweise schreiben, gelangen wir mit (8.8) zu ^ A. Einstein (1879-1955) - grofiter Physiker des zwanzigsten Jahrhunderts. Seine Arbeit in der Quantentheorie und insbesondere in der Relativitatstheorie iibten einen revolutionaren Einfluss auf die gesamte moderne Physik aus.
8.1 Die lineare Struktur auf R*"
LHh)\ L{h)=
I
•••
L-{h))
(a\
---alX
=
(h^\ •••
\a^ •••a^J
453
•
(810)
\h"^J
Daher ermoglicht uns die Festlegung von Basen inffi™und ffi", einen einszu-eins Zusanimenhang zwischen linearen Transforniationen L : W" —^ M" und m X n-Matrizen (aj), (i = l,...,m,j = l,...,n) herzustellen. Dabei entspricht die i-te Spalte der Matrix (aj) der Transformation L den Koordinaten L{ei), d.h. dem Bild des Vektors e^ £ {ei,... ,em}- Die Koordinaten des Bildes eines beliebigen Vektors h = h^Ci Gffi™konnen wir aus (8.10) erhalten, indem wir die Matrix der linearen Transformation mit der Spalte der Koordinaten von h multiplizieren. Da ffi" Vektorraumstruktur besitzt, konnen wir von Linearkonibinationen Ai/i + A2/2 von Abbildungen fiiX^M" und /2 : X ^> M" sprechen und (Ai/i + A2/2)(a;) := Xifi(x)
+ X^hix)
(8.11)
setzen. Insbesondere ist eine Linearkonibination von linearen Transforniationen Li : K™ ^ K" und L2 : K™ ^ K" entsprechend ihrer Definition (8.11) eine Abbildung h^XiLi{h)+X2L2{h) =L{h) , die offensichtlich linear ist. Die Matrix dieser Transformation ist die entsprechende Linearkonibination der Matrizen der Transforniationen Li und L2. Die Verkettung C = B o A linearer Transformationen A : M™ —>• M" und S : M" -!• K* ist offensichtlich ebenfalls eine lineare Transformation, deren Matrix dem Produkt der Matrix A mit der Matrix B (die von links multipliziert wird) entspricht, wie aus (8.10) folgt. In der Tat wurde die Multiplikation von Matrizen genau in der Ihnen bekannten Weise definiert, daniit das Produkt von Matrizen der Verkettung der Transformationen entspricht. 8.1.3 Die Norm in W^ Wir bezeichnen mit ||x|| = V(a;i)2 + --- + (a;™)2
(8.12)
die Norm des Vektors x = {x^,..., x™) € ffi™. Aus dieser Definition folgt unter Beriicksichtigung der Minkowskischen Ungleichung, dass 1°. ||a;|| > 0 , 2°. (||a;|| = 0 ) ^ ( a ; = 0), 3°. IIAxll = |A| •||a;||,mit A £ K, 4 ° . ilxi +X2\\ < \\xi\\ + \\X2\\.
454
8 Differentialrechnung mit Punktionen mehrerer Variabler
Ganz allgemein wird jede auf einem Vektorraum X definierte Funktion II II : X ^ M, die die Bedingungen l°-4° erfiillt, eine Norm auf diesem Vektorraum genannt. Manchmal wird zur Unterscheidung von Normen ein Symbol als Index angehangt, um den Raum zu kennzeichnen, auf dem die Norm betrachtet wird. So konnen wir etwa ||a;||Rm oder ||2/||R" schreiben. In der Regel werden wir dies nicht tun, da immer aus dem Zusammenhang ersichtlich ist, welcher Raum und welche Norm gemeint ist. Wir merken an, dass nach (8.12) gilt, dass \\x2 — xi\\ = d{xi,X2) ,
(8.13)
wobei d{xi,X2) der Abstand in M™ zwischen den Vektoren xi und X2 ist, wenn wir sie als Punkte im M™ betrachten. Aus (8.13) wird deutlich, dass die folgenden Bedingungen aquivalent sind: X ^ XQ ,
d{x,xo)^0,
||a; — xoll ^ 0 .
In Anbetraclit von (8.13) gilt insbesondere, dass ||a;|| = d{0,x) . Die Eigenscliaft 4*^ der Norm wird Dreiecksungleichung genannt und wir verstehen jetzt, weswegen. Die Dreiecksungleichung lasst sich durcli Induktion auf jede endliche Summe verallgemeinern. Um es auf den Punkt zu bringen, so gilt: llxi H
hXfcll < ||a;i|| H
h ||a;fc|| .
Nun, da wir die Norm eines Vektors bilden konnen, konnen wir auch die Werte von Funktionen f : X ^ M™ und 5 : AT —>•ffi"miteinander vergleiclien. Wir woUen vereinbaren, f{x) = o{g{x)) oder / = o{g) auf einer Basis B in X zu schreiben, falls ||/(a;)||K'" = o(||(7(a;)||K") auf der Basis B. Ist f{x) = ( / ^ ( x ) , . . . , /"(a;)) die KoordinatendarsteUung der Abbildung / : AT —^ffi™,dann konnen wir aufgrund der Ungleichungen m
\r{x)\<\\!{x)\\
(8.14)
i=l
die folgende Beobachtung machen, die sich unten als niitzlich erweisen wird: (/ = o{g) auf der Basis B) <=> (/* = o{g) auf der Basis B; i = 1 , . . . , m) . (8.15) Wir treffen auBerdem die Vereinbarung, dass die Aussage / = 0{g) auf der Basis B bedeutet, dass ||/(a;)||K'" = 0(||g(a;)||R«) auf der Basis B. Wir erhalten damit aus (8.14), dass (/ = 0{g) auf der Basis B) <=> (/* = 0{g) auf der Basis B; i = 1 , . . . , m) . (8.16)
8.1 Die lineare Struktur auf R*"
455
Beispiel. Wir betrachten eine lineare Transformation L : M™ —>• M". Sei Bm sin beliebiger Vektor in M™. Wir woUen ||_L(/i)||Rn abschatzen: \\Lih)\\
Y.^'L{e,)
1=1
(8-17)
^ i=l
Daher konnen wir sicherstellen, dass L{h) = 0{h) fiir /i ^ 0 .
(8.18)
Insbesondere folgt daraus, dass L{x — xo) = L{x) — L{XQ) —>• 0 fiir x ^ XQ, d.h., eine lineare Transformation L :ffi™—>•ffi"ist in jedem Punkt XQ £ ffi™ stetig. Aus der Abschatzung (8.17) folgt sogar, dass eine lineare Transformation gleiclimafiig stetig ist. 8.1.4 Die euklidische Struktur auf W^ Das Konzept des inneren Produkts in einem reellen Vektorraum ist aus der Algebra als numerische Funktion {x,y) bekannt, die fiir Paare von Vektoren definiert ist und die folgenden Eigenschaften besitzt: {x,x) > 0 , (a;,a;) = 0 <^ a; = 0 , (a;i,a;2) = {x2,xi) , (Aa;i,a;2) = A(a;i,a;2),
mit A €ffi,
{Xi + X2,X3) = {xi,X'i)
+ {x2,X'i) •
Aus diesen Eigenschaften folgt insbesondere, dass sich bei fest vorgegebener Basis { e i , . . . ,6™} das innere Produkt {x,y) zweier Vektoren x und y durch ilire Koordinaten {x^,... ,x"^) und (y^, • • • ,2/™) ausdriicken lasst. Wir erhalten die bilineare Form {x,y)=gijxy
(8.19)
(worunter wir Summation iiber i und j verstehen), mit gij = {ei,ej). Vektoren werden orthogonal genannt, falls ihr inneres Produkt gleich 0 ist. Eine Basis { e i , . . . ,6™} ist orthonormal, falls gij = dij mit 0 , fiir i i^ j , Sij
1 , fiir i = j • In einer orthonormalen Basis nimmt das innere Produkt (8.19) die selir einfache Gestalt
456
8 Differentialrechnung mit Punktionen mehrerer Variabler {x,y) = SijX^y'
an, oder {x,y)=x^
-y^ + --- + X"' -y"" .
(8.20)
Wir nennen dann die Koordinaten auch kartesische Koordinaten. Wir erinnern daran, dass der Rauni ffi™ mit eineni darauf definierten inneren P r o d u k t euklidischer Raum genannt wird. Zwischen dem inneren P r o d u k t (8.20) und der Norm eines Vektors (8.12) besteht der ofFensichtliche Zusammenhang: {x,x)
= \\x\\'^ .
Die folgende Ungleichung ist aus der Algebra bekannt: {x,yf
< {x,x){y,y)
.
Wir sehen daran insbesondere, dass es zu jedem P a a r von Vektoren einen Winkel ip G [0,7r] gibt, so dass {x,y)
= \\x\\ \\y\\ cosip .
Dieser Winkel wird der Winkel zwischen den Vektoren x und y genannt. Dies ist der Grund dafiir, warum wir Vektoren, deren inneres P r o d u k t gleich Null ist, als orthogonal bezeichnen. Auch die folgende einfache, aber sehr wichtige Tatsache, die aus der Algebra bekannt ist, wird sich als niitzlich erweisen: Jede lineare Funktion
L : M™ -^ M. besitzt im euklidischen L{x) =
wohei ^ £ ffi™ ein fester stimmt wird.
Raum die Form
{^,x),
Vektor ist, der eindeutig
durch die Funktion
L be-
8.2 Das Differential einer Funktion mehrerer Variabler 8.2.1 DifFerenzierbarkeit u n d d a s Differential e i n e r F u n k t i o n i n eineni Punkt D e f i n i t i o n 1 . Eine auf einer Menge E C M™ definierte Funktion f : E ^ R" ist in einem Punkt x G E, der ein Haufungspunkt von E ist, differenzierbar, falls f{x + h)-f{x)=L{x)h + a{x;h), (8.21) wobei L{x) : M™ -^ MP eine in h hneare Funktion^ ist und a{x; h) = o{h) fiir h^Q,x + hG E. ^ In Analogie zum ein-dimensionalen Fall eriauben wir uns, L{x)h anstelle von L{x){h) zu schreiben. Wir merken auflerdem an, dass wir bei der Definition annehmen, dass R"* und R" mit der Norm aus Abschnitt 8.1 versehen sind.
1.2 Das Differential einer Punktion mehrerer Variabler
457
Die Vektoren Ax{h) := (x + h) — X = h und
Afix;h) := fix+
h)-fix)
werden das Inkrement im Argument bzw. das Inkrement der Funktion (abhangig vom Inkrement im Argument) genannt. Diese Vektoren werden iiblicherweise durch die Symbole der Funktionen selbst (ohne h) bezeichnet, also Ax und Af{x). Die lineare Funktion L{x) : M™ ^ M" in (8.21) wird das Differential, Tangentialabbildung oder Ableitung der Funktion / : _E ^ M" im Punkt X G E genannt. Das Differential einer Funktion / : _E —>• M" im Punkt x G E wird durch df{x), Df{x) oder f'{x) symbolisiert. In Ubereinstimmung mit der eben eingefiihrten Sclireibweise konnen wir (8.21) wie folgt umschreiben: f{x + h) — f{x) = f'{x)h
+ a{x; h)
oder Af{x; h) = df{x)h + a{x; h) . Wir merken an, dass das Differential fiir Verschiebungen h vom Punkt x €ffi™definiert ist. Um dies zu betonen, befestigen wir gedanklich eine Kopie des Vektorraums M" im Punkt a; e K™, die wir mit T^K™, TK™ (x), oder TIR™ bezeichnen. Wir konnen den Raum Tffi™ als eine Menge von Vektoren interpretieren, die im Punkt X £ M™ angeheftet sind. Der Vektorraum TM,™ wird Tangentialraum zu M™ in X G ffi™ genannt. Der Grund fiir diese Schreibweise wird unten deutlich. Der Wert des Differentials zu einem Vektor h G TM™ ist der Vektor f'{x)h G TK,., der im Punkt f{x) angeheftet ist und das Inkrement f{x + h) — f{x) der Funktion annahert, das durch das Inkrement h im Argument x verursacht wird. Daher ist d/(a;) bzw. f'{x) eine lineare Transformation/'(a;) :TM™ ^TM^(^). Eine vektorwertige Funktion mehrerer Variabler ist in einem Punkt differenzierbar, wenn ihr Inkrement Af(x; h) in diesem Punkt bis auf einen Korrekturausdruck a(x;h), der fiir /i —>• 0 verglichen zum Inkrement im Argument infinitesimal ist, eine lineare Funktion von h ist. Dies ist, wie wir erkennen, in voUstandiger Ubereinstimmung mit dem bereits untersuchten ein-dimensionalen Fall. 8.2.2 Das Differential und partielle Ableitungen einer Funktion mit reellen Werten Wenn wir die Vektoren f{x + h), f{x), L{x)h und a{x;h) in ffi" in ihren Koordinaten schreiben, wird (8.21) zu den n aquivalenten Gleichungen
458
8 Differentialrechnung mit Punktionen mehrerer Variabler f{x + h)-f{x)=L'{x)h
+ a\x;h),
{i = l,...,n)
(8.22)
zwischen Funktionen mit reellen Werten. Dabei sind, wie aus den Relationen (8.9) und (8.15) in Abschnitt 8.1 folgt, L^(x) : K™ -;• K lineare Funktionen und a*(a;; h) = o{h) fiir h^O, x + hGE fiir jedes i = 1,... ,n. Wir gelangen so zu folgendem Satz. Satz 1. Eine Abbildung / : _E —>•ffi"einer Menge E C ffi™ ist genau dann in einem Punkt x G E, der ein Hdufungspunkt von E ist, dijferenzierbar, wenn die Funktionen /* : i? —>•ffi,(i = l,...,n), die die Koordinatendarstellung der Abbildung wiedergeben, in diesem Punkt dijferenzierbar sind. Da die Gleichungen (8.21) und (8.22) aquivalent sind, geniigt es, zur Bestimmung des Differentials L{x) einer Abbildung f : E ^ M" die Differentiale L^{x) ihrer Koordinatenfunktionen /* : _E —>• M zu bestimmen. Wir woUen nun eine Funktion / : _E —>• M mit reellen Werten betrachten, die auf einer Menge E Cffi™definiert ist und die in einem inneren Punkt X G E dieser Menge differenzierbar ist. Wir merken an, dass wir in Zukunft hauptsachlich den Fall betrachten werden, dass E ein Gebiet in K™ ist. Ist x ein innerer Punkt von E, dann gehort fiir jede hinreichend kleine Verschiebung h von X auch der Punkt x + h zu E, so dass wir folglich auch im Definitionsbereich der Funktion / : i? —>•ffibleiben. Wir gehen zur koordinatenweisen Beschreibung fiir den Punkt x = (a;^,..., a;™), den Vektor h = (/i^,..., /i™) und die lineare Funktion L{x)h = ai{x)h^ + • • • + am{x)h"^ iiber. Damit kann die Bedingung f{x + h)-fix)
=L(x)h
+ o{h) f i i r / i ^ O
(8.23)
als fix^ +h\...,x"'
+ /i")-/(a;\...,a;™) = = ai{x)h^ + • • • + a.rr,{x)h"'+ o{h) fiir/i ^ 0 (8.24)
geschrieben werden, wobei ai{x),..., am{x) reelle Zahlen sind, die vom Punkt X abhangig sind. Wir woUen diese Zahlen bestimmen. Dazu fiihren wir nicht beliebige Verschiebungen h aus, sondern die besondere Verschiebung hi = h^Ci = 0 • ei + • • • + 0 • Cj-i + h^Ci + 0 • Cj+i + • • • + 0 • e™ um einen Vektor /ij, der zum Vektor Cj der Basis { e i , . . . , Cm} inffi™kollinear ist. Fiir h = hi ist offensichtlich \\h\\ = |/i*|, und somit erhalten wir aus (8.24) fix\
. . . , x'-^, x' + h\ x'+^, • • • , a;™) - f{x\ . . . , a;',..., x " ) = = ai{x)h' + o{h') fiir /i* ^ 0 . (8.25)
Dies bedeutet, dass wir, wenn wir mit Ausnahme der i-ten Variablen alle Variablen in der Funktion f{x^, • • • ,x"^) festhalten, zu einer Funktion in der «-ten Variablen gelangen, die im Punkt a;* differenzierbar ist.
8.2 Das Differential einer Punktion mehrerer Variabler
459
Auf diese Weise erhalten wir aus (8.25), dass ai{x) =
(8.26) I
=
y tAj
» •
•
•
• *A^
«
IAJ
I
i t
• *A^
•
lim
•
•
•
• *A^
J
I
\ *A^
« •
:
•
•
«
IAJ
» •
•
•
»
IAJ
j
.
Definition 2. Der Grenzwert (8.26) wird partielle Ableitung der Funktion f{x) im Punkt x = (x^,... jX™) nach der Variablen a;* genannt. Wir bezeichnen sie mit eineni der folgenden Symbole: ^{x),
dj(x),
Dif{x),
f'Ax).
iel 1. 1st f{u,v) = u'^ + V sinu, dann ist gf dif(u,v)
=
d'lfiu^v)
= 7—(MJW) = 2i'sinu . av
au
—-{u,v)=3u'^+v'^cosu,
df
2. Ist / ( x , y, z) = arctan(x2/^) + e^, dann ist dif{x,y,z)
df = •—{x,y,z) i9x ' '
-
2/2
02j(x,y,z)
= -—(x,y,z) dy ' '
-
2„,4 1 + x'^y
1 + x'^y'^
df
dsfix, y, z) = — ( x , y, z) = e"" . Wir haben somit den folgenden Satz bewiesen. Satz 2. Ist eine Funktion / : _E ^ M" auf einer Menge E C ffi™ in einem inneren Punkt x G E dieser Menge differenzierbar, dann besitzt die Funktion in diesem Punkt eine partielle Ableitung nach jeder der Variablen und das Differential dieser Funktion ist durch diese partiellen Ableitungen eindeutig bestimmt: dmh
= §^{x)h'
+••• + ^ ( ^ ) / i ™ •
(8-27)
Wenn wir die Vereinbarung der Summation iiber den Index, der sowohl tiefgestellt als auch hochgestellt auftritt, benutzen, konnen wir (8.27) kurz und biindig sclireiben: df(x)h = dif(x)h' . (8.28) Beispiel 3. Wenn wir gewusst batten (wie wir gleicli wissen werden), dass die Funktion f{x,y,z) aus Beispiel 2 im Punkt (0,1,0) differenzierbar ist, batten wir sofort
460
8 Differentialrechnung mit Punktionen mehrerer Variabler d/(0,1,0)/i = 1 • fti + 0 • /i^ + 1 •ftS= /ji + /j3
schreiben konnen und entsprechend /(/iS 1 + h\h^)
- /(0,1,0) = d/(0,1,0)h + o{h)
oder arctan (/i^ {I + h^f)
+ e^'' = I + h^ + h'' + o{h) fiir /i ^ 0 .
Beispiel 4- Fiir die Funktion x = (x^,... ,a;™) i—> a;*, bei der dem Punkt X Gffi™die i-te Koordinate zugewiesen wird, erhalten wir ATT\x;h) = {x' + h')-x'
= h' ,
d.h., das Inkrenient dieser Funktion ist selbst wieder eine lineare Funktion in h: h H ^ /i*. Somit ist Z\7r*(x; h) = d7r*(x)/i, und die Abbildung d7r*(a;) = d7r* stellt sich als unabhangig von x £ffi™heraus in dem Sinne, dass dTr^{x)h = /i* in jedem Punkt x £ffi™.Wenn wir x^{x) anstelle von 7r*(x) schreiben, gelangen wir zu dx'^{x)h = dx^h = h^. Wenn wir dies und Gleichung (8.28) beriicksichtigen, konnen wir nun das Differential jeder Funktion als eine Linearkombination der Differentiale der Koordinaten ihres Arguments x £ ffi™ forniulieren. Urn es auf den Punkt zu bringen: df{x)=dif{x)dx'--
dx^ dx^
5.29)
da fiir jeden Vektor h e TM™ gilt: df{x)h = dif(x)h'
=
dif{x)dx'h
8.2.3 Koordinatenweise Darstellung des Differentials einer Abbildung: Die Jacobimatrix Wir sind also zu (8.27) fiir das Differential einer Funktion mit reellen Werten / : _E —>• M gelangt. Dann konnen wir aber aufgrund der Aquivalenz der Gleichungen (8.21) und (8.22) fiir jede Abbildung f : E ^ W einer Menge E C M™, die in einem inneren Punkt x £ E differenzierbar ist, die koordinatenweise Darstellung des Differentials d/(a;) wie folgt schreiben:
^dfHx)h^
^difHx)h'^
fl^ix)
...
§il,(^)^^h'^
df{x)h =
\dr(x)hJ \dirixwJ V|^(x)
(8.30)
8.2 Das Differential einer Punktion mehrerer Variabler
461
D e f i n i t i o n 3 . Die Matrix (dif^{x)^, (i = 1,... ,m, j = 1,... ,n) der partiellen Ableitungen der Koordinatenfunktionen einer gegebenen Abbildung im P u n k t X G E wird Jacobimatrix^ der Abbildung in diesem P u n k t genannt. Fiir den Fall n = 1 fiihrt uns das einfach zu Gleicliung (8.27) zuriick und fiir n = 1 und m = 1 gelangen wir zuni Differential einer Funktion mit reellen Werten in einer reellen Variablen. Aus der Aquivalenz der Gleichungen (8.21) und (8.22) und der Eindeutigkeit des Differentials (8.27) einer Funktion mit reellen Werten ergibt sich das folgende Ergebnis: S a t z 3 . 1st eine Abbildung / : _E —>• ffi" einer Menge E C M™ in einem inneren Punkt x G E differenzierbar, dann besitzt sie in diesem Punkt ein eindeutiges Differential df{x), und die koordinatenweise Darstellung der Abbildung df{x) : TM™ -^ TW^ix) entspricht Gleichung (8.30).
8 . 2 . 4 S t e t i g k e i t , p a r t i e l l e A b l e i t u n g e n u n d DifFerenzierbarkeit einer Funktion in e i n e m P u n k t Wir beenden unsere Untersuchung der Differenzierbarkeit einer Funktion in einem P u n k t , indeni wir auf einige Zusamnienhange zwischen der Stetigkeit einer Funktion in einem P u n k t , der Existenz partieller Ableitungen der Funktion in diesem P u n k t und der Differenzierbarkeit in diesem P u n k t hinweisen. In Abschnitt 8.1 ((8.17) und (8.18)) haben wir den Beweis erbracht, dass fiir eine lineare Transformation L : M™ —>• M" gilt, dass Lh —>• 0 fiir h ^ 0. Daher konnen wir aus (8.21) schliefien, dass eine Funktion, die in einem P u n k t differenzierbar ist, in diesem P u n k t stetig ist, da fix + h)-
fix)
= L{x)h + oih) fiir /i ^ 0, a; + /i e -B .
Der Umkehrschluss ist natiirlich nicht wahr, da dieser, wie wir wissen, nicht einmal fiir den ein-dimensionalen Fall gilt. Daher ist die Beziehung zwischen der Stetigkeit und der Differenzierbarkeit einer Funktion in einem P u n k t im mehr-dimensionalen Fall gleich der im eindimensionalen Fall. Die Lage ist jedoch vollstandig anders beim Verhaltnis zwischen partieller Ableitung und dem Differential. Im ein-dimensionalen Fall, d.h. im Fall einer Funktion mit reellem Wert in einer Variablen, sind die Existenz des Differentials und die Existenz der Ableitung einer Funktion in einem P u n k t aquivalente Bedingungen. Bei Funktionen mehrerer Variabler haben wir gezeigt (Satz 2), dass Differenzierbarkeit einer Funktion in einem inneren P u n k t ihres Definitionsbereichs die Existenz der partiellen Ableitungen nach jeder Variablen in diesem P u n k t garantiert. Der Umkehrschluss ist jedoch nicht wahr. ^ C. G. J. Jacobi (1804-1851) - beriihmter deutscher Mathematiker. Der Ausdruck Jacobian wird im Englischen meist fiir die Determinante dieser Matrix (falls sie quadratisch ist) benutzt.
462
8 Differentialrechnung mit Punktionen mehrerer Variabler
Beispiel 5. Die Funktion
1 , fiir x^x'^ ^ 0 ist auf den Koordinatenachsen gleich 0 und besitzt daher beide partiellen Ableitungen im Punkt (0,0):
a,/(o,o)=iin.M4pW))^,^o_o^o,
Gleichzeitig ist diese Funktion nicht in (0, 0) difFerenzierbar, da sie offensichtlich in diesem Punkt unstetig ist. Die in Beispiel 5 vorgestellte Funktion besitzt in anderen Punkten auf den Koordinatenachsen aui3er in (0, 0) keine partiellen Ableitungen. Die Funktion r ^ # ^ , fiir x 2 + 2 / 2 ^ 0 ,
.fix,y) = < [
0,
fiir x^ + 2/2 = 0
(vgl. Beispiel 2 in Absclinitt 7.2) besitzt jedocli in alien Punkten der Ebene partielle Ableitungen. Sie ist allerdings aucli im Ursprung unstetig und daher dort nicht differenzierbar. Konnen wir also die rechte Seite in (8.27) und (8.28) aufstellen, so garantiert uns dies nicht, dass dieser Ausdruck eine Darstellung des Differentials der betrachteten Funktion ist, da die Funktion nicht differenzierbar sein kann. Dieser Umstand hatte zu einer ernsten Behinderung der gesamten Differentialrechnung von Funktionen mehrerer Variablen werden konnen, wenn nicht sichergestellt worden ware (wie wir unten zeigen werden), dass die Stetigkeit der partiellen Ableitungen in eineni Punkt eine hinreichende Bedingung fiir die Differenzierbarkeit der Funktion in diesem Punkt ist.
8.3 Die wichtigsten Gesetze der Differentiation 8.3.1 Linearitat der Ableitung Satz 1. Sind die auf einer Menge E C M™ definierten Abbildungen / i : _E ^ M" und /2 : -B ^ ffi" in einem Punkt x G E differenzierbar, dann ist auch jede Linearkombination (Ai/i + A2/2) : i? ^ ffi" in diesem Punkt differenzierbar und es gilt die folgende Gleichung: (Ai/i + A2/2)'(a;) = {Xif[ + \2f^){x)
.
(8.31)
8.3 Die wichtigsten Gesetze der Differentiation
463
Gleichung (8.31) zeigt uns, dass die Ableitung, d.h. die Bildung des Differentials einer Abbildung in eineni Punkt, auf deni Vektorraum der in einem Punkt der Menge E differenzierbaren Abbildungen / : _E —>• M" eine lineare Transformation ist. Die linke Seite von (8.31) enthalt per definitionem die lineare Transformation (Ai/i + \2f2)'{x), wohingegen die rechte Seite die Linearkombination {\if[ + A2/2)(a;) der linearen Transformationen f[{x) : K™ ^ K" und fl^{x) : K™ ^ K" enthalt, die, wie wir aus Abschnitt 8.1 wissen, ebenfalls eine lineare Transformation ist. Satz 1 stellt sicher, dass diese Abbildungen identisch sind. Beweis. (Ai/i + \2f2){x + h)- (Ai/2 + A2/2)(a;) = = (Ai/i(a; + h) + \2h{x + h)) - [Xifiix) = Ai(/i(x + h)-
+ X^hix))
h{x)) + A2(/2(x + h)-
= Ai {f[{x)h + o{h)) + X2{mx)h = {X^f[{x)+X2nix))h
h{x))
= =
+ 0(h)) =
+ o{h).
a
Besitzen die untersuchten Funktionen reelle Werte, dann konnen wir sie auch multiplizieren und dividieren (falls der Nenner ungleich Null ist). Dies fiihrt uns zu folgendem Satz. Satz 2. Sind die auf einer Menge E C M™ definierten Funktionen f : E ^ M. und g : E ^W in einem Punkt x G E differenzierbar, dann ist auch a) ihr Produkt in x differenzierbar, mit {f-g)'{x)=g{x)f{x)+f{x)g'{x)
und
(8.32)
h) fiir g{x) 7^ 0 ist ihr Quotient in x differenzierbar, mit ( - ) ' ( ^ ) = ^ ( 5 ( a ; ) / ' ( a ; ) - f{x)g'{x)) . (8.33) \gJ 5 (a;) Der Beweis dieses Satzes ist identisch zum Beweis entsprechender Telle von Satz 1 in Abschnitt 5.2, so dass wir auf die Details verzichten. Wir konnen die Gleichungen (8.31), (8.32) und (8.33) auch in der anderen Schreibweise fiir die Ableitung formulieren: d(Ai/i(a;) + A2/2(x)) = (Aid/i + A2d/2)(x) , d ( / • 9){x) = g{x)df{x)
+ f{x)dg{x) ,
d ( - ) ( a ; ) = -jTriai^Wi^:) \gJ r(a;) '
- .fix)dg{x))
.
Was bedeuten diese Gleichungen in der koordinatenweisen Darstellung der Abbildungen? Wird eine in einem inneren Punkt x einer Menge E C ffi™ differenzierbare Abbildung (f : E ^ W" in ihrer Koordinatenform
464
8 Differentialrechnung mit Punktionen mehrerer Variabler
<^(a;) =
\(^"(xi,...,x™) geschrieben, dann entspricht, wie wir wissen, die Jacobimatrix I dup^ ••• dmV'^ \ V='{x)=
{x) =
{di^i){x)
ihrem Differential A(p(x) : M™ -^ M" in diesem Punkt. Fiir feste Basen in ffi™ und ffi" ist der Zusammenhang zwischen linearen Transformationen L :ffi™—^ffi"und mxn Matrizen bijektiv, und daher kann die lineare Transformation L mit der sie definierenden Matrix identifiziert werden. Trotzdem werden wir in der Regel das Symbol ,f'{x) statt df{x) benutzen, um die Jacobimatrix zu bezeiclmen, da dies besser zur iibliclien Untersclieidung zwischen den Begriffen der Ableitung und dem Differential passt, die im ein-dimensionalen Fall gilt. Aus der Eindeutigkeit des Differentials in einem inneren Punkt x von E erhalten wir somit die folgenden Koordinatenschreibweisen fiir (8.31), (8.32) und (8.33), mit der wir die Gleicliheit der entspreclienden Jacobimatrizen zum Ausdruck bringen:
{diiXifi + \2fi)){x) = [Xidifi + [di{f-g)){x)=g{x)dif{x) {di(^^^{x)
\2difi){x),
(i = l , . . . , m , J = l , . . . , n ) , + f{x)dig{x), (i = l , . . . , m ) ,
= -^[g{x)dif{x)-f{x)dig{x)),
(i = l , . . . , m ) .
(8.31') (8.32') (8.33')
Aus der elementweisen Gleichheit dieser Matrizen folgt beispielsweise, dass die partielle Ableitung nach der Variablen x* des Produktes von Funktionen f{x^,..., x™) und g{x^,..., a;™) mit reellen Werten folgendermafien gebildet werden soUte:
^^^•'\x\...,xn dx^
g{x\...
= , x ™ ) ^ ( x i , . . . ,x™) + f{x\
... , x ™ ) 0 ( x i , . . . ,x™) .
Wir betonen, dass sowohl diese Gleichung als auch die Matrizengleichungen (8.31'), (8.32') und (8.33') offensichtliche Folgerungen der Definition einer partiellen Ableitung und den iiblichen Regeln fiir die Ableitung von Funktionen mit reellen Werten einer reellen Variablen sind. Wir wissen jedoch, dass sich die Existenz von partiellen Ableitungen als unzureichendes Kriterium fiir die Differenzierbarkeit einer Funktion mehrerer Variabler erweisen kann. Aus
8.3 Die wichtigsten Gesetze der Differentiation
465
diesem Grund verdienen die Behauptungen zur Existenz eines Differentials der entsprechenden Abbildung in Satz 1 und Satz 2 zusammen mit den wichtigen und vollig offensichtlichen Gleichungen (8.31'), (8.32') und (8.33') besondere Aufmerksamkeit. Abschliefiend merken wir an, dass wir mit Hilfe von (8.32) durch Induktion zur Gleichung d{h,...Jk){x)
= ih
• • • fk){x)dh{x)
+ • • • + (/!• ••
fk-l)dfk{x)
fiir das Differential eines Produkts (fi • • • fk) differenzierbarer Funktionen mit reellen Werten gelangen. 8.3.2 Ableitung verketteter Abbildungen (Kettenregel) a. Der Hauptsatz Satz 3. Die Abbildung f : X ^ Y einer Menge X C ffi™ auf eine Menge Y C W^ sei im Punkt x G X dijferenzierbar, ebenso wie die Abbildung g : Y ^ M!' im Punkt y = f{x) G Y . Dann ist ihre Verkettung g o f : X —>• ffi* in X dijferenzierbar und das Differential d{g o f) : TM™ —>• TM.K,,^~.~. der Verkettung ist gleich der Verkettung dg{y) o df{x) der Differentiale df{x) : TR™ ^ TW}(,)=y ,
dg{y) : Tffi^ ^ TK*(^) .
Der Beweis dieses Satzes wiederholt fast voUstandig den Beweis von Satz 2 in Abschnitt 5.2. Um Ihre Aufmerksamkeit auf ein neues Detail zu lenken, das in diesem Fall auftritt, werden wir niclitsdestotrotz den Beweis wiederholen, ohne jedocli teclmische Details auszufiihren, die bereits dargestellt wurden. Beweis. Mit Hilfe der Differenzierbarkeit der Abbildungen / und g in den Punkten x und y = f{x) und der Linearitat der Ableitung g'{x) konnen wir schreiben: (g o f){x + h)-igo = g'ifix))
f){x) = g{f{x + h)) - g{f{x)) {fix + h)-
=
fix)) + o{f{x + h)-
fix))
=
= g'{y) {fix)h + o{h)) + o{f{x + h)- fix)) = = g'iy) {f{x)h)
+ g'iy) {o{h)) + o{f{x + h) - /(x)) = = {g'{y)of'{x))h
+
a{x;h).
Dabei ist g'{y) o f'{x) eine lineare Abbildung (als Verkettung linearer Abbildungen) und a{x; h) = g'iy) {o{h)) + o{f{x + h) - f{x)) . Wie wir aus (8.17) und (8.18) in Abschnitt 8.1 wissen, gilt
466
8 Differentialrechnung mit Punktionen mehrerer Variabler
f{x + h)-
9'(y){o(h)) =o{h) f i i r / i ^ O , f(x) = f'{x)h + o{h) = 0(h) + o{h) = 0{h) fiir /i ^ 0
und o{f(x + h)-
f{x)) = o{0{h)) = o{h) fiir /i ^ 0 .
Folglich ist a{x; h) = o{h) + o{h) = o{h) fiir h ^ 0 , D
womit der Satz bewiesen ist.
Wenn wir ihn in Koordinatenform schreiben, besagt Satz 3, dass fiir einen inneren Punkt x in der Menge X mit
fd^fix)
•••
d^f\x)\ {dir)ix)
/'(^)
\di.r{x) ••• dm.r{x)j und fiir einen inneren Punkt y = f{x) der Menge Y mit fdigHy)
•••d„gHy)\
g'iv)
{dj9'')iy) \d19Hy)
•••dngHy)/
nit, dass (d,{gofY{x)
•••d^{gofY{x)\
(gofyix)
{di{g-fy)ix) \di{gof)>^(x)
(d^g\y)
••• dr.g\y)\
•••dm{goff{x)J
( d.fHx)
•••
d„J\x)\ {djg'{y)-difHx)).
\digHy)
•••dngHy)/
\dir{x) ••• d^r{x)j
In der Gleichung {di{g o f)')ix)
= {djgHfix))
•
difix))
5.34)
verstehen wir die Summation auf der rechten Seite bzgl. j iiber dessen Veranderungsbereich von 1 bis n. Im Gegensatz zu den Gleichungen (8.31'), (8.32') und (8.33') ist (8.34) selbst im Sinne einer elementweisen Gleichheit der darin vorkommenden Matrizen nicht trivial. Wir woUen einige wichtige Falle des eben bewiesenen Satzes betrachten.
8.3 Die wichtigsten Gesetze der Differentiation
467
b . D a s Differential u n d p a r t i e l l e A b l e i t u n g e n e i n e r v e r k e t t e t e n Funktion mit reellen Werten Sei z = g{y^,... ,y") eine Funktion mit reellen Werten der reellen Variay", wovon jede selbst wieder eine Funktion y^ = /•'{x^, • • •, a;™), blen y^,..., (j = 1 , . . . , n) der Variablen a;^,..., x™ ist. Wenn wir davon ausgelien, dass die Funktionen g und /•*, ( j = 1 , . . . , n ) differenzierbar sind, konnen wir die partielle Ableitung -g§i (x) der Verkettung der Abbildungen f : X ^ Y und g : Y ^ R bestimmen. Nach (8.34), wobei in diesem Fall I = 1 gilt, erhalten wir di{gof)(x)=djg{f{x))-dif{x)
(8.35)
oder in einer Schreibweise, die niehr Details offenbart: ^U) dx}
= ^^^°.^\x\...,x'^)=^^ dx^ '''''
^^\ \ dy^ dx}
I ^^ ^^" = dy" dx^
= dwifix)) • difix) + ••• + dng{f{x)) • dirix). c. D i e A b l e i t u n g n a c h e i n e m V e k t o r u n d d e r G r a d i e n t e i n e r Funktion in e i n e m P u n k t Wir betrachten den stationaren Fluss einer Fliissigkeit oder eines Gases in einem Gebiet G in M^. Der Ausdruck „stationar" bedeutet dabei, dass sich die Geschwindigkeit des Flusses in jedem P u n k t von G niclit mit der Zeit verandert, obwohl sie natiirlich in verscliiedenen P u n k t e n von G unterscliiedlicli sein kann. Nehmen wir etwa an, f{x) = f{x^,x'^,x^) sei der Druck im Fluss im P u n k t x = (x^, x"^, x^) £ G. Wenn wir uns im Fluss entsprecliend der Vorschrift x = x{t), wobei t die Zeit ist, fortbewegen, werden wir mit der Zeit den Druck ( / o x){t) = /(a;(t)) aufzeiclinen. Die Veranderung des Drucks mit der Zeit entlang unserer Trajektorie entspricht offensiclitlich der Ableitung ^;^™' (t) der Funktion ( / o x){t) nach der Zeit. Wir wollen diese Ableitung berechnen und dabei davon ausgelien, dass f{x^,x'^,x^) eine differenzierbare Funktion im Gebiet G ist. Nach der Regel zur Ableitung verketteter Funktionen erhalten wir
^ ^ W = §^{mi'it)
+ §^{mi'it)
+ §^{miHt) , (8.36)
mitx^t) = ^ ( t ) , (« = 1,2,3). Da der Vektor (x^,x^,x^) = v{t) der Geschwindigkeit unserer Bewegung der koordinatenweisen Formuliezur Zeit t entspricht und {dif,d2f,d3f){x) rung des Differentials df{x) der Funktion / im P u n k t x, konnen wir (8.36) auch wie folgt schreiben:
^ii£^(t)=df{x{t))v{t).
(8.37)
468
8 Differentialrechnung mit Punktionen mehrerer Variabler
Somit ergibt sich die gesuchte GroBe aus dem Wert des Differentials d/(a;(t)) der Funktion f{x) im P u n k t x{t) multipliziert mit dem Geschwindigkeitsvektor v{t) der Bewegung. W a r e n wir zur Zeit t = 0 im P u n k t XQ = x(0), dann erhielten wir ^ ^ ^ ( 0 ) = df{xo)v
,
(8.38)
wobei V = 11(0) der Geschwindigkeitsvektor zur Zeit t = 0 ist. Die rechte Seite von (8.38) hangt nur vom P u n k t XQ G G und dem Geschwindigkeitsvektor V in diesem P u n k t ab. Er ist, unter der Voraussetzung, dass x{0) = V gilt, von der besonderen Form der Trajektorie x = x{t) unabhangig. Dies bedeutet, dass der Wert der linken Seite von (8.38) auf jeder Trajektorie der Form x{t) =xo+vt + a{t) , (8.39) wobei a{t) = o{t) fiir t —>• 0, gleich ist. Denn dieser Wert wird durch den vorgegebenen P u n k t XQ und den Vektor v £ TW^,^ in diesem P u n k t voUstandig bestimmt. Insbesondere b a t t e n wir die Bewegungsgleicliung x{t) =xo+vt
(8.40)
wahlen konnen, um den Wert der linken Seite von (8.38) direkt (und somit aucli die rechte Seite) zu berechnen. Dabei ist (8.40) die Bewegungsgleichung fiir eine gleichformige Bewegung mit der Geschwindigkeit w, wie sie im P u n k t x{0) = XQ zur Zeit t = 0 herrscht. Wir geben nun die folgende D e f i n i t i o n 1. Ist die Funktion f{x) in einer Umgebung des P u n k t e s XQ £ ffi™ definiert und wird der Vektor v G TW^^ dem P u n k t XQ zugeschrieben, dann nennen wir Dvfixo)
(8.41)
:= lim
(falls der formulierte Grenzwert existiert) die Ableitung von f im Punkt XQ nach dem Vektor v oder die Ableitung im Punkt XQ entlang dem Vektor v. Aus diesen Uberlegungen folgt, dass die folgende Gleichung fiir jede Funktion x{t) der Form (8.39) gilt, wenn die Funktion / im P u n k t XQ differenzierbar ist: D.fixo)
= ^ ^ ^ ( 0 ) = df{xo)v
.
(8.42)
Sie gilt insbesondere auch fiir jede Funktion der Form (8.40). In Koordinatenschreibweise lautet diese Gleichung Dvfixo)
= ^ ( ^ o ) « ' + • • •+ ^ M v " "
.
(8.43)
8.3 Die wichtigsten Gesetze der Differentiation
469
Fiir die Basisvektoren ei = ( 1 , 0 , . . . , 0), . . . , e^ = ( 0 , . . . , 0,1) folgt aus dieser Formel insbesondere, dass
df Deifixo)
= -g-^{xo) ,
(« = l , . . . , m ) .
Sind i'i,i'2 £ K^ beliebige Vektoren und Ai,A2 £ K beliebige Zahlen, dann konnen wir aus (8.42) fiir eine im Punkt XQ differenzierbare Funktion / aufgrund der Linearitat des Differentials df{xo) schliefien, dass die Funktion im Punkt XQ eine Ableitung nach dem Vektor (AiWi + A2W2) £ ^R™ besitzt und dass f{xo) = XiD.Jixo) + X2D,J{xo) . (8.44) Wenn wir M™ als euklidischen Raum betrachten, d.h. als einen Vektorraum mit einem inneren Produkt, dann ist es nioglich (vgl. Abschnitt 8.1), jedes lineare Funktional L{v) als das innere Produkt {^,v) eines vorgegebenen Vektors ^ = £,(L) mit dem variablen Vektor v zu schreiben. Insbesondere existiert ein Vektor ^, so dass df{xo)v={^,v).
(8.45)
Definition 2. Der Vektor ^ G TM,™ , der im Sinne von (8.45) zum Differential df{xo) der Funktion / im Punkt XQ gehort, wird Gradient der Funktion in diesem Punkt genannt und mit grad/(a;o) bezeichnet. Somit gilt per definitionem df{xo)v = {gmdf{xo),v).
(8.46)
Wenn wir fiir M™ ein kartesisclies Koordinatensystem gewalilt liaben, dann konnen wir, wenn wir (8.42) und (8.43) mit (8.46) vergleichen, folgern, dass der Gradient in einem derartigen Koordinatensystem die folgende Darstellung besitzt: grad/(xo)=(^,...,^)(.o). (8.47) Wir woUen nun die geometrische Bedeutung des Vektors grad /(XQ) erklaren. Sei e e TIK.™ ein Einheitsvektor. Dann ist nach (8.46) Defixo) = |grad f{xo)\cosip
,
(8.48)
wobei (p der Winkel zwischen den Vektoren e und grad /(XQ) ist. Ist also grad /(XQ) 7^ 0 und e = ||grad /(a;o)||~^grad / ( X Q ) , dann nimmt die Ableitung Dgf{xo) einen Maximalwert an. D.h., das Anwachsen der Funktion / (ausgedriickt in Einheiten von / relativ zu einer Einheitslange in M™) ist exakt dann im Punkt XQ maximal und gleich ||grad /(a;o)||, falls die Bewegung in Richtung des Vektors grad /(XQ) stattfindet. Der Wert der Funktion nimmt bei einer Verschiebung in die entgegengesetzte Richtung am starksten ab, und die Funktion / andert sich nicht, wenn die Bewegungsrichtung senkrecht zum Vektor grad /(XQ) verlauft.
470
8 Differentialrechnung mit Punktionen mehrerer Variabler
Die Ableitung nach eineni Einheitsvektor einer vorgegebenen Richtung wird iiblicherweise Richtungsahleitung genannt. Da ein Einheitsvektor im euklidischen Raum durch die Richtungscosinus e = (cos « ! , . . . , cos am) bestimmt wird, wobei ccj den Winkel zwischen dem Vektor e und dem Basisvektor Cj in einem kartesischen Koordinatensystem beschreibt, folgt, dass
df Def{xo) = (grad/(a;o),e) = —Y(a;o)cosai H
df h -^-^{xo) cosam •
Wir treflFen sehr oft auf den Vektor grad f{xo) und er besitzt viele Anwendungen. Beispielsweise beruhen die sogenannten Gradientenmethoden zur numerischen Bestimmung von Extrema von Funktionen mehrerer Variabler (mit Hilfe eines Computers) auf der geometrischen Eigenschaft des gerade eingefiihrten Gradienten. (Beachten Sie in diesem Zusammenhang Aufgabe 2 am Ende des Abschnitts.) Viele wichtige Vektorfelder, wie beispielsweise ein Newtonsches Gravitationsfeld oder das durch eine Ladung erzeugte elektrische Feld, sind Gradientenfelder skalarer Funktionen, die als Potentiale dieser Felder bekannt sind (vgl. Aufgabe 3). Viele physikalischen Gesetze beinhalten den Vektor grad / in ihren Formulierungen. So lautet beispielsweise das Aquivalent zum Newtonschen Kraftgesetz ma = F in der Mechanik kontinuierlicher Materialien: pa = —grad p. Dadurch wird die Beschleunigung a = a{x, t) im Punkt x zur Zeit t im Fluss einer idealen Fliissigkeit oder eines Gases ohne die Einwirkung auBerer Krafte mit der Dichte des Materials p = p{x,t) und dem Gradienten des Drucks p = p{x, t) im selben Punkt und zur selben Zeit (vgl. Aufgabe 4) in Verbindung gebracht. Wir werden den Vektor grad / spater beim Studium der Vektoranalysis und den Elementen der Feldtheorie noch weiter untersuchen. 8.3.3 Ableitung einer inversen Abbildung Satz 4. Sei f : U{x) —>• V{y) eine Abbildung einer Umgebung U{x) C ffi™ des Punktes x auf eine Umgebung V{y) C M™ des Punktes y = f{x). Angenommen, f ist im Punkt x stetig und besitzt eine inverse Abbildung f~^ : V{y) -^ U{x), die im Punkt y stetig ist. Ist die Abbildung f im Punkt x differenzierbar und besitzt die Tangentialabbildung f'{x) : TM™ —>• TW^^ an f im Punkt x eine Inverse [f'{x)] : TW^ —>• TR™, dann ist mit diesen Annahmen auch die Abbildung f~^ : V{y) -^ U{x) im Punkt y = f{x) differenzierbar und es gilt:
(/-^)'(2/)=[/'(^)]"'-
8.3 Die wichtigsten Gesetze der Differentiation
471
Somit besitzen zueinander inverse differenzierbare Abbildungen in den entsprechenden P u n k t e n zueinander inverse Tangentialabbildungen. W i r benutzen die folgenden Schreibweisen:
Beweis.
f{x)=y,
f{x + h)=y
+ t,
t = f{x +
h)-f{x),
so dass
f-\y)=x, y+
f-\y + t)=x + h, h = r\y + t)-r\y)-
Wir nehmen an, dass h so klein ist, dass x + h £ U{x) u n d daher auch t&V{y). Aus der Stetigkeit von / in a; u n d f~^ in y folgt, dass t = f{x + h)-
fix) -^0
iiir
h^O
(8.49)
und
h = .r\y + t)-.rHy)^o
fiir t ^ o
(8.50)
Aus der Differenzierbarkeit von / in a; folgt, dass (8.51) t = f'{x)h + o{h) fiir /i ^ 0 , d.h., wir konnen sogar davon ausgehen, dass t = 0(h) fiir /i ^ 0 (vgl. (8.17) u n d (8.18) in Abschnitt 8.1). Wir wollen zeigen, dass fiir eine invertierbare lineare Abbildung f'{x) gilt, dass h = 0{t) fiir t ^ 0. Tatsachlich ergibt sich nach u n d nach aus (8.51), dass [f'{x)]
h = h+ [f'{x)]-^o{h)
[fix)] ~^t = h + o{h)
[r{x)]~'t >\\h\ - \\o{h)\\
[n^)V't
> hWhW
fiir
h^O,
(8.52)
fiir /i ^ 0 , fiir h^O
,
fiir ||/i|| < (5
wobei die Zahl (5 > 0 so gewahlt wird, dass ||o(/i)|| < ^\\h\\ fiir \\h\\ < S. Wenn wir d a n n (8.50) beriicksichtigen, d.h., dass /i —>• 0 fiir t —>• 0, ergibt sich < 2
[f'i^)r't
0(\\t\\)
fiir t ^ O ,
was aquivalent ist zu h = 0{t)
fiir t ^ 0 .
Daraus folgt insbesondere, dass o{h) = o{t) fiir t ^ 0 .
472
8 Differentialrechnung mit Punktionen mehrerer Variabler Wenn wir dies beriicksichtigen, ergibt sich aus (8.50) und (8.52), dass h=
[f{x)\~h
+ o{t) fiir
t^O
oder
r\y + t)-r\y)
= [nx)]-'t + o{t) mrt^o.
Entspricht eine Matrix A einer linearen Transformation L : M™ -^ ffi™, dann ist aus der Algebra bekannt, dass die zu A inverse Matrix A~^ einer linearen Transformation L~^ : ffi™ -^ M™ entspricht, die zu L invers ist. Die Konstruktion der Elemente der inversen Matrix ist ebenfalls aus der Algebra bekannt. Folglich liefert der eben bewiesene Satz eine direkte Vorschrift fiir die Konstruktion der Abbildung (/~^) (y)Ist m = 1, d.li., ist M™ = ffi, dann lasst sich die Jacobimatrix der Abbildung f : U{x) ^ V{y) im P u n k t x auf die einfache Zahl f'{x) zuriickfiihren - die Ableitung der Funktion / in a; - und die lineare Transformation f'{x) : TRx -^ TRy entpuppt sich als Multiplikation mit der Zahl h iH> f'{x)h. Diese lineare Transformation ist genau dann invertierbar, wenn f'{x) ^ 0. Die Matrix der inversen Abbildung [/'(x)] : TRy —>• TRx besteht ebenfalls aus nur einer einzigen Zahl - [/'(a;)] - dem Kehrwert von f'{x). Daher beinhaltet Satz 4 ebenfaUs die Regel fiir das Auffinden der Ableitung einer inversen Funktion, die wir bereits friiher vorgestellt h a t t e n . 8.3.4 U b u n g e n u n d A u f g a b e n 1. Wir sagen, dass zwei Wege t i->- xi{t) und t i-> x-zit) im Punkt xo G R™ aquivalent sind, wenn a;i(0) = X2(0) = xo und d{xi{t),X2(t)) = o(i) fiir t —> 0. a) Beweisen Sie, dass diese Beziehung eine Aquivalenzrelation ist, d.h., dass sie reflexiv, symmetrisch und transitiv ist. b) Beweisen Sie, dass zwischen Vektoren v £ TR™ und den Aquivalenzklassen glatter Wege im Punkt xo eine eins-zu-eins Abhangigkeit besteht. c) Identifizieren Sie den Tangentialraum TR™ mit der Menge der Aquivalenzklassen glatter Wege durch den Punkt xo G R"*, und fiihren Sie die Addition und Multiplikation mit einem Skalar fiir die Aquivalenzklasse von Wegen ein. d) Uberpriifen Sie, ob die eingefiihrten Operationen vom Koordinatensystem in R™ abhangen oder niclit. 2.
a) Zeichnen Sie den Graphen der Funktion z = x'^ + 4y^, wobei {x,y,z) die kartesischen Koordinaten in R^ sind. b) Sei / : C —> R eine Funktion mit numerischen Werten, die auf einem Gebiet G C R definiert ist. Ein Niveaumenge (c-Niveau) der Funktion ist eine Menge E C G, auf der die Funktion nur einen Wert {f{E) = c) annimmt. Genauer gesagt, ist E = f~^{c). Zeichnen Sie die Niveaumengen in R^ fiir die Funktion aus Teil a).
D
8.3 Die wichtigsten Gesetze der Differentiation
473
c) Bestimnien Sie den Gradienten der Punktion f{x,y) = x^ +4^/^ und zeigen Sie, dass der Vektor grad / in jedem Punkt {x, y) zur Niveaukurve der Punktion / , die durch diesen Punkt verlauft, orthogonal ist. d) Skizzieren Sie mit Hilfe der Ergebnisse aus o), h) und c) den kiirzesten Weg fiir den Abstieg aus Punkt (2,1,8) zum tiefsten Punkt der Flache in (0,0,0) auf der Flache z = x'^ + 4y^ . e) Welchen fiir die Implementation auf einem Computer geeigneten Algorithmus wiirden Sie vorschlagen, um das Minimum der Punktion f{x,y) = x'^ + 4y^ zu bestimmen? 3. Wir sagen, dass ein Vektorfeld auf einem Gebiet G C R"* definiert ist, wenn jedem Punkt X £ G ein Vektor v(a;) £ TR™ zugeordnet wird. Ein Vektorfeld v(x) in G wird Potentialfeld genannt, falls es eine Punktion mit numerischen Werten t/ : G —>• R gibt, so dass v(a;) = grad U{x). Die Punktion U{x) wird Potential des Peldes v(a;) genannt. (In der Physik wird iiblicherweise die Punktion —U(x) Potential genannt und, wenn ein Kraftfeld untersucht wird, die Punktion U{x) Kraftfunktion.) a) Zeichnen Sie fiir eine Ebene mit kartesischen Koordinaten {x,y) das Peld grad f{x,y) fiir jede der folgenden Punktionen: fi{x,y) = x'^ + y^; f2{x,y) = -{x^ + y^); f3{x,y) = arctan(a;/2/) fiir y > 0 und f4{x,y) = xy. b) Ein Korper der Masse m im Punkt 0 £ R"' zieht nach dem Newtonschen Gesetz einen Korper der Masse 1 im Punkt x £V? {x ^ Q) mit der Kraft F = —TO|r|~^r an (wir haben die Gravitationskonstante Go weggelassen). Dabei ist r der Vektor Ox. Zeigen Sie, dass das Vektorfeld F(a;) in R^ \ 0 ein Potentialfeld ist. c) Zeigen Sie, dass in den Punkten (Cj,r/j,Cj) (i = 1 , . . . ,n) platzierte Massen rm (i = 1,.. ., n) aufler in diesen Punkten ein Newtonsches Kraftfeld erzeugen und dass folgende Punktion das Potential wiedergibt:
U(x,y,z) = Y^
rrii
d) Bestimmen Sie das Potential des elektrischen Peldes, das durch Punktladungen Qi (i = l , . . . , n ) erzeugt wird, die in den Punkten ( C J , ^ J ) 0 ) ) (« = l , . . . , w ) platziert sind. 4. Wir betrachten die Bewegung einer idealen inkompressiblen Fliissigkeit in einem Raum, der frei ist von aufleren Kraften (insbesondere frei von Gravitationskraften). Seien v = v(x, y,z,t), a = a{x, y,z,t), p = p(x, y, z, t) und p = p{x, y, z, t) die Geschwindigkeit, die Beschleunigung, die Dichte und der Druck der Fliissigkeit im Punkt {x, y, z) zur Zeit t. Eine ideale Fliissigkeit ist eine Fliissigkeit, in der der Druck in jedem Punkt in alle Richtungen gleich ist. a) Wir greifen ein Volumen der Fliissigkeit in Form eines kleinen Parallelogramms heraus. Seine Ecken seien parallel zum Vektor grad p{x, y, z, t) (wobei grad p hinsichtlich den Raumkoordinaten gebildet wird). Schatzen Sie die Kraft ab, die auf dieses Volumen aufgrund des Druckabfalls einwirkt, und formulieren Sie eine Naherungsformel fiir die Beschleunigung dieses Volumens unter der Annahme, dass die Fliissigkeit inkompressibel ist.
474
8 Differentialrechnung mit Punktionen mehrerer Variabler
b) Bestimmen Sie, ob das von Ihnen in o) erhaltene Ergebnis zur Eulerschen Gleichung pa = — grad p konsistent ist. c) Bine Kurve, deren Tangente in jedem Punkt in Richtung des Geschwindigkeitsvektors in diesem Punkt zeigt, wird Stromlinie genannt. Eine Bewegung wird stationar genannt, wenn die Punktionen v, a, p, und p unabhangig von t sind. Zeigen Sie mit Hilfe von h), dass bei stationarem PIuss einer inkompressiblen Pliissigkeit |||v||^ +p/p entlang einer Stromlinie konstant ist {Bernoullisches Gesetz ). d) Wie verandern sich die Pormeln in o) und 6), wenn die Bewegung in einem Gravitationsfeld nahe der Erdoberflache stattfindet? Zeigen Sie, dass in diesem Pall pa = - g r a d {gz + p) gilt, so dass nun |||v|p+p2;+p//5 entlang jeder Stromlinie bei stationarem Pluss einer inkompressiblen Pliissigkeit konstant ist. Dabei ist g die Gravitationsbeschleunigung und z die Holie der Stromlinie oberhalb der Erdoberflache. e) Erklaren Sie aufgrund des vorigen Ergebnisses, warum ein belasteter Pliigel ein charakteristisches konvexes Aufwartsprofil besitzt. f) Eine inkompressible ideale Pliissigkeit der Diclite p wird benutzt, um ein zylindrisches Glas mit kreisformigem Boden mit Radius R auf die Hohe h anzufiillen. Das Glas wird dann mit der Winkelgeschwindigkeit u) um seine Aclise gedreht. Bestimmen Sie fiir die inkompressible Pliissigkeit die Gleicliung z = f{x, y) ilirer Oberflache im stationaren Zustand (vgl. Aufgabe 3 in Absclinitt 5.1). g) Sclireiben Sie basierend auf der in / ) gefundenen Pormel fiir die Oberflache y = f(x,y) eine Pormel fiir den Druck p = p(x,y,z) in jedem Punkt (x,y,z) fiir das von der rotierenden Pliissigkeit eingenommenen Volumen. Priifen Sie, ob die Gleichung pa = —grad (gz + p) aus Teil d) fiir die von Ihnen gefundene Pormel gilt. h) Konnen Sie nun erklaren, warum Teeblatter sinken (wenn auch nicht sehr schnell!) und warum sie sich in der Mitte der Tasse und nicht am Rand ansammeln, wenn der Tee geriihrt wird? 5. Abschatzung des Fehlers bei der Berechnung einer Funktion. a) Nutzen Sie die Deflnition einer differenzierbaren Punktion und die Naherungsgleichung Af{x; h) w df{x)h und zeigen Sie, dass der relative Pehler S = Slf{x);h] im Wert des Produkts f{x) = x^ • • • x"^ aus m Paktoren ungleich Null durch S ^ '^ Si bestimmt werden kann. Dabei sind die Paktoren x' aus i= l
Messungen mit den relativen Pehlern Si behaftet. b) Erzielen Sie wiederum das Ergebnis aus Teil a) mit Hilfe der Gleichung dln/(a;) = -TTJT df{x) und zeigen Sie, dass der relative Pehler in einem Bruch fl-
• • fn
f
N
\X\, . . . , Xm)
im Allgmeinen aus der Summe der relativen Pehler der Werte der Punktionen fi,..., f„,gi,... ,gk bestimmt werden kann. 4
Daniel Bernoulli (1700-1782) - schweizerischer Gelehrter, einer der hervorragenden Physikern und Mathematikern seiner Zeit.
8.3 Die wichtigsten Gesetze der Differentiation
475
6. Homogene Funktionen. Eine auf einem Gebiet G C R"* definierte Punktion / : G —>• R wird homogen (bzw. positiv homogen n-ten Grades) genannt, falls fiXx) = rfix)
(bzw. f{\x)
=
\\rf{x))
fiir jedes a; £ R"*, und A £ R gilt mit a; £ G und Xx € G. Eine Punktion ist lokal homogen n-ten Grades ini Gebiet G, wenn sie in einer Umgebung jeden Punktes von G eine homogene Punktion vom Grad n ist. a) Zeigen Sie, dass jede lokal homogene Punktion in einem konvexen Gebiet auch homogen ist. b) Sei G die Ebene R^ ohne den Strahl L = Ux,y) GR^ \x = 2 Ay > o\. Zeigen Sie, dass die Punktion
{
y*/x,
fiir X > 2 Ay > 0,
y^,
sonst
in G lokal homogen ist, aber nicht homogen auf dem Gebiet. c) Bestimmen Sie den Grad der Homogenitat oder positiven Homogenitat der folgenden Punktionen auf ihrem natiirlichen Definitionsbereich: p / l /Iv'*' J . / 1 j2\X
m\ *****^ 2
, X
3 , X
^ X
_ }
^
1 2 _ | _ 2 3 _ | _ fX' I lA-' lA-' I
4 \ )
X X -\- X X -^ - g 2 3 lA-'
f3[X
,...,X
) =
• • •
lA-'
\X
lA-'
•••X
I
lA-'
lA-'
I I
rn—l ^
X
m
4" ' lA-'
I .
d) Leiten Sie die Gleichung f{tx) = t"'f{x) nach t ab und zeigen Sie, dass sie fiir eine differenzierbare Punktion / : G —> R, die in einem Gebiet G C R™ lokal homogen vom Grad n ist, die folgende Gleichung fiir homogene Funktionen erfiiUt:
df
I df , 1 "^ ft
iV"^ , . . . , a ^
) -r ' ' ' -r X
^
ra^'^
,...,X
) ^
nj
\^X J . . . ^X
) .
e) Zeigen Sie: Gilt obige Gleichung fiir eine differenzierbare Punktion / : G —> R in einem Gebiet G, dann ist diese Punktion lokal homogen n-ten Grades in G. H i n w e i s : Zeigen Sie, dass die Punktion (p{t) = t~"'f{tx) ist und in einer Umgebung von 1 konstant ist.
fiir jedes x £ G definiert
7. Homogene Funktionen und die Dimensionsanalyse. 1°. Die Dimension einer physikalischen Grofie und die Eigenschaften funktionaler Beziehungen zwischen physikalischen Grofien. Physikalische Gesetze beschreiben Zusammenhange zwischen physikalischen Grofien. Werden gewisse Mafieinheiten fiir einige dieser Grofien vereinbart, dann lassen sich die Einheiten der mit ihnen zusammenhangenden Grofien auf bestimmte Weise durch die Einheiten der vorgegebenen Grofien bestimmen. Auf diese Art gelangen wir zu verschiedenen Basiseinheiten und abgeleiteten Einheiten. Beim internationalen Einheitensystem, auch einfach SI genannt, sind die mechanischen Basisdimensionen (mit ihren Einheiten) die Lange (der Meter, mit m
476
8 Differentialrechnung mit Punktionen mehrerer Variabler
bezeichnet), die Masse (das Kilogramm, mit kg bezeichnet) und die Zeit (die Sekuiide, mit s bezeichnet). Bei der Formulierung von abgeleiteten Groflen erhalt man deren Dimension durch algebraische Kombination der Dimensionen der Basisgroflen. Die Dimension jeder mechanischen Grofie wird symbolisch als Formel geschrieben, wobei wir die Symbole L, M und T benutzen, die von Maxwell^ als Dimensionen der oben genannten Basiseinheiten vorgeschlagen wurden. So erhalten beispielsweise die Geschwindigkeit, die Beschleunigung und die Kraft die folgenden Dimensionen: [F] =
MLT
-1
Sollen physikalische Gesetze unabhangig von der Wahl des Einheitensystems sein, so sollten als ein Zeichen dieser Invarianz gewisse Eigenschaften der funktionalen Relation xo = / ( x i , . . . ,Xfc,a;;i+i,... ,a;„)
(*)
zwischen den numerischen Charakteristika der physikalischen Grofien gelten. Wir betrachten beispielsweise die Relation c = / ( o , 6) = \/a? + 6^ zwischen der Lange der Seiten und der Lange der Hypothenuse eines rechtwinkligen Dreiecks. AUe skalierenden Veranderungen sollten alle Langen gleichermafien verandern, so dass fiir alle zulassigen Werte von a und 6 die Relation f{aa,ab) = ip{a)f{a,b) gelten sollte, wobei im gegenwartigen Beispiel (p{a) = a ist. Eine grundlegende (und auf den ersten Blick offensichtliche) Voraussetzung der Dimensionsanalyse ist, dass eine Relation (*) mit physikalischer Bedeutung so beschaffen sein muss, dass bei einer Veranderung der Skalen der grundlegenden Mafieinheiten die numerischen Werte aller Ausdriicke vom selben Typus, die in der Formel auftreten, mit demselben Faktor multipliziert werden miissen. Sind xi,a;2,a;3 grundlegende physikalische Groflen und bringt die Relation (a;i,a;2,a;3) — i > f(xi,X2,X3) zum Ausdruck, wie eine vierte physikalische Grofie von ihnen abhangt, dann muss nach dem eben formulierten Prinzip fiir jeden zulassigen Wert von xi,a;2,a;3 gelten, dass f{aiXi,a2X2,a3Xs)
= (p{ai,a2,a3)f{xi,X2,xs),
(**)
wobei ip eine bestimmte Punktion ist. Die Punktion cp in (**) charakterisiert die Abhangigkeit des numerischen Wertes der fraglichen physikalischen Grofie bei einer Veranderung der Skalierung der festen physikalischen Basisgroflen voUstandig. Daher sollte diese Punktion als die Dimension dieser physikalischen Grofie relativ zu den festen Mafieinheiten betrachtet werden. Wir woUen nun die Form der Dimensionsfunktion prazisieren. a) Sei X i->- f{x) eine Punktion einer Variablen, die die Bedingung f(ax) ip(a)f(x) erfiillt, wobei / und ip differenzierbare Punktionen sind. Zeigen Sie, dass ^{a) = a"*.
=
^ J. C. Maxwell (1831-1879) - herausragender britischer Physiker. Er formulierte die mathematische Theorie des elektromagnetischen Peldes und er ist fiir seine Porschungen auf den Gebieten der kinetischen Gastheorie, Optik und Mechanik beriihmt.
8.3 Die wichtigsten Gesetze der Differentiation
477
b) Zeigen Sie, dass die Dimensionsfunktion ip in Gleichung (**) imnier die Form Qj^ • ci2^ ' Oii' besitzt, wobei die Exponenten diyd-Zjds bestimmte reelle Zahlen sind. Sind etwa die Basiseinheiten von L, M und T fest vorgegeben, dann kann die Menge (di,d2,d3) der Exponenten in der Potenzdarstellung L'^iM'^'^T'^^ auch als die Dimension der betrachteten physikalischen Grofie angesehen werden. c) In Teil 6) haben wir herausgefunden, dass die Dimensionsfunktion immer eine Potenzfunktion ist, d.h., eine homogene Funktion mit einem bestimmten Grad beziiglich jeder Basiseinheit. Was bedeutet es, wenn der Grad der Homogenitat der Dimensionsfunktion einer bestimmten physikalischen Grofle relativ zu einer der Basiseinheiten gleich Null ist? 2° Das Buckinghamsche U-Theorem und die Dimensionsanalyse. Seien [xi] = Xi, (i = 0,1,... ,n) die Dimensionen der physikalischen Groflen, die im Gesetz (*) auftreten. Wir gehen davon aus, dass die Dimensionen von xo,Xk+i, • • • ,Xn durch Ausdriicke der Dimensionen von xi,... ,Xk formuliert werden konnen, d.h., [a;o] = Xo = xf»---xf [xk+i] = Xk+i
= Xl'
,
•••Xl'
,
{i = l,...,n-k)
.
d) Zeigen Sie, dass die folgende Gleichung zusammen mit (*) gelten muss: Po
Pn
xf
aj^" • • • a^yxo
Pi
= j\aixi,...
,akXk,aj^-•
pf
Pi-k
•a^,^ Xk+1,-• • ,a;^
Pn-k
• • • df.
\
x„\. (* * *)
e) Sind xi,...,Xk unabhangig, setzen wir ai = x^ ,... ,ak = x'^ Beweisen Sie, dass damit (* * *) zur Gleichung
PQ
PQ
/ f l , . . . , !' ,P• i '"''
' \
Pi '
'
pi-fc
in (* * *).
pJ-
wird, was der Gleichung 77 = / ( ! , . . . , ! , i l l , . . . , i7„_fc) entspricht, in der die dimensionslosen Grofien 77, TTi,..., Iln-k Dadurch erhalten wir das folgende
(****) auftreten.
JT-Theorem der Dimensionsanalyse. Sind die Grofien Xi, . . . ,Xk in Gleichung (*) unabhangig, dann Idsst sich diese Gleichung zur Funktion (****) mit n — k dimensionslosen Parametern zuriickfiihren. f) Zeigen Sie, dass die Funktion / in (*) fiir k = n nach dem 77-Theorem bis auf ein numerisches Vielfaches bestimmt werden kann. Benutzen Sie diese Methode, um den Ausdruck c{(po)-\/l/g fiir die Schwingungsperiode eines Pendels (d.h., einer Masse m, die an einem Faden der Lange / aufgehangt ist und in der Nahe der Erdoberflache schwingt, wobei (po der anfangliche Auslenkungswinkel ist) zu bestimmen. g) Finden Sie eine Formel P = c^/mr/F fiir die Umdrehung eines Korpers der Masse m, der durch eine zentrale Kraft der Grofle F auf einer Kreisbahn gehalten wird.
478
8 Differentialrechnung mit Punktionen mehrerer Variabler
h) Benutzen Sie das Keplersche Gesetz {Pi/P2)'^ = (ri/r2)^, das fiir kreisformige Bahnen einen Zusammenhang zwischen dem Verhaltnis der Umdrehungsperiodeii der Planeten (oder Satelliten) und dem Verhaltnis der Radien ihrer Bahnen postuliert, urn, wie schon Newton, den Exponenten a im aUgemeinen Gravitationsgesetz F = G'^'l'^a'^ zu bestimmen.
8.4 G r u n d l a g e n der Differentialrechnung v o n reellen F u n k t i o n e n mit m e h r e r e n Variablen 8.4.1 D e r M i t t e l w e r t s a t z S a t z 1. Sei f : G ^ M. eine auf einem Gebiet G C M™ definierte Funktion mit reellen Werten, wobei das abgeschlossene Intervall [x,x + h] mit den Endpunkten x und x + h in G enthalten ist. 1st die Funktion f in den Punkten des abgeschlossenen Intervalls [x, x + h] stetig und in Punkten des ojfenen Intervalls ]x,x + h[ differenzierbar, dann existiert ein Punkt ^ G]X,X + h[, so dass gilt:
.f{x + h)-f{x)=f'{Oh. Beweis.
(8.53)
Wir betrachten die Hilfsfunktion F{t)=f{x
+
th),
die auf dem abgeschlossenen Intervall 0 < t < 1 definiert ist. Diese Funktion erfiillt alle Voraussetzungen des Mittelwertsatzes in Absatz 5.3.2: Sie ist auf [0,1] stetig, da sie die Verkettung von stetigen Abbildungen ist und auf dem offenen Intervall ]0,1[ differenzierbar, da sie die Verkettung von differenzierbaren Abbildungen ist. Folglich existiert ein P u n k t 9 e]0,1[, so dass F{1)-F{0)
= F'{0)-1
.
Aber F ( l ) = f(x + h), F ( 0 ) = f{x) und F'((9) = f'{x + eh)h und daher stimmt die eben entwickelte Gleichung mit der Behauptung des Satzes iiberein. D Wir formulieren nun (8.53) in Koordinatenschreibweise. Ist a ; = ( a ; ! , . . . , a;™), /i = (/i^,...,/i™) und C = (a;i + 6l/ii,... ,a;™ + 6l/i™), dann bedeutet Gleichung (8.53), dass fix+
h)-fix)
= f{x^+h\...,x"'
\dx^
+ h"')-f{x\...,x"')
'
' dx''-
difiS.)h' + --- + dmf{Oh"' m
Y^ difix^ +Oh\...,x"'
+ 0h"')h'
=
8.4 Reelle Funktionen mehrerer Variabler
479
Wenn wir die Vereinbarung benutzen, dass das Auftreten eines tief- und hochgestellten Indexes der Sunime iiber diesen Index entspricht, konnen wir schlieBlich f{x^+h\...,x"'
+ h"') - f{x\...,x"')
=
= dif{x^+9h\...,x'''
+ 9h"')h}
(8.54)
schreiben, mit 0 < ^ < 1, wobei 9 sowohl von x als auch h abhangt. Anmerkung. Satz 1 wird Mittelwertsatz genannt, da ein gewisser „Durchschnittspunkt" ^ G]X,X + h[ existiert, in dem (8.53) gilt. Wir haben bereits bei unserer Untersuchung des Mittelwertsatzes in Absatz 5.3.1 betont, dass der Mittelwertsatz speziell fiir Funktionen mit reellen Werten gilt. Ein allgemeiner Mittelwertsatz fiir Abbildungen wird in Kapitel 10 (Teil 2) bewiesen. Das folgende KoroUar ist eine hilfreiche Folgerung aus Satz 1. KoroUar. Ist die Funktion f : G ^W im Gebiet G Cffi™dijferenzierbar und ist ihr Differential in jedem Punkt x G G gleich Null, dann ist f im Gebiet G konstant. Beweis. Das Verschwinden einer linearen Transformation ist aquivalent zum Verschwinden aller Elemente ihrer zugehorigen Matrix. In diesem Fall ist df{x)h=
{dif,...,dmf)ix)h
,
und daher ist dif{x) = • • • = dmf{x) = 0 in jedem Punkt x G G. Laut Definition ist ein Gebiet eine offene zusammenhangende Menge. Wir werden diese Eigenschaft ausnutzen. Zunachst zeigen wir, dass die Funktion / fiir x G G in einer Kugel K{x;r) C G konstant ist. Ist namlich (x + h) £ K{x;r), dann ist [x,x + h] C K{x;r) C G. Wenn wir (8.53) oder (8.54) anwenden, erhalten wir
fix + h)-fix)=f'{Oh
= 0-h = 0,
d.h., f{x + h) = f{x) und die Werte von / in der Kugel K{x;r) sind alle gleich dem Wert von / im Zentrum der Kugel. Seien nun a;o,a;i £ G beliebige Werte im Gebiet G. Da G zusammenhangend ist, existiert ein Weg t H^ x{t) £ G, so dass a;(0) = XQ und x{l) = xi. Angenommen, die stetige Abbildung t i->- x{t) ist auf dem abgeschlossenen Intervall 0 < t < 1 definiert. Sei K{XQ; r) eine Kugel um XQ, die in G enthalten ist. Da a;(0) = XQ und die Abbildung 11->- x{t) stetig ist, existiert eine positive Zahl (5, so dass x{t) G K{xo;r) C G iiir 0
480
8 Differentialrechnung mit Punktionen mehrerer Variabler
der f{x) = f[x{l)) = f{xo) und dann wegen der Stetigkeit der Abbildung t !->• x{t) ein A > 0 finden, so dass x{t) G K(^x{l);r) iiiT I < t < I + A. Dann ware aber ( / o x){t) = f{x{l)) = f{xo) fiir 0 < t < ? + Z\ und somit I ^ sup(5. Somit haben wir gezeigt, dass ( / o x){t) = f{xo) fiir jedes t £ [0,1]. Insbesondere gilt ( / o x){l) = f{xi) = f{xo) und wir haben bewiesen, dass die Werte der Funktion / : G —>• ffi in je zwei P u n k t e n XQ, xi G G gleich sind. D 8.4.2 E i n e h i n r e i c h e n d e B e d i n g u n g fur d i e DifFerenzierbarkeit einer Funktion mehrerer Variablen S a t z 2. Sei f : U{x) —>• ffi eine in einer Umgebung U{x) C ffi™ des Punktes X = (x^,..., a;™) definierte Funktion. Besitzt die Funktion f in jedem Punkt der Umgebung U{x) partielle Ahleitungen g p - , . . . , ^ ^ und sind diese in x stetig, dann ist / in x differenzierbar. Beweis. Ohne Verlust der Allgemeinheit nehmen wir an, dass U(x) eine Kugel K{x;r) ist. Dann miissen neben den P u n k t e n x = {x^,...,x"^) und X + h = (x^ + h^,...,x"' + /i™) auch die P u n k t e {x^,x'^ + / i ^ , . . . ,a;™ + /i™),... ,{x^,x'^,... ,x"^~^,x"^ + h"^) und die sie verbindenden Strecken ebenfalls zur Umgebung U{x) gehoren. Wir werden dies ausnutzen und den Mittelwertsatz fiir Funktionen einer Variabler in der folgenden Berechnung anwenden: fix + h)= fix^
fix)
= fix^
+ / i \ . . . , a;™ + / i " ) - fix\
+ / i \ . . . , x " + /i™) - fix^,
..., x") =
x^ + / i 2 , . . . , x " + /i™) +
+ / ( x S x ^ +/i2,... , x " + / i ™ ) - / ( x \ x 2 , x 3 +/^^ ... , x " +/i™)+• • • + + fix^, = difix^
x ^ , . . . , x " - S x " + /i™) - fix^,..., +0^h^,x^
+ d'ifix^,
+ h\...,x"'
x") =
+ hJ^)h^ +
x^ + 0'^h^,x^ + /^^ . . . , x " + h"')h'^ + ••• +
+ (9™/(xSx2,...,x™-\x™+6l™/i")/i™ . Soweit haben wir nur die Tatsache ausgenutzt, dass die Funktion / partielle Ableitungen nach jeder ihrer Variablen im Gebiet C/(x) besitzt. Wir werden nun ausnutzen, dass diese partiellen Ableitungen in x stetig sind. Wir setzen die obige Berechnung fort und erhalten fix + h)-
fix)
= difix^,...,x"')h^+a^h^ +d2fix^,...,
+
x")/i2 + a2/j2 +
...+
+ a ™ / ( x \ . . . , x " ) / i " + a™/i™ , wobei die a i , . . . , « „ aufgrund der Stetigkeit der partiellen Ableitungen im Punkt X iiiT h ^ 0 gegen Null streben.
8.4 Reelle Funktionen mehrerer Variabler
481
Dies bedeutet aber, dass f(x + h)wobei L{x)h = dif{x\...,
f(x) = L{x)h + o{h) fiir /i ^ 0 , x"'')h^ + ••• + dmfix\...,
a;")/i™ .
D
Aus Satz 2 folgt, dass eine Funktion / : G —>• ffi mit stetigen partiellen Ableitungen im Gebiet G C ffi™ in jedem Punkt des Gebiets differenzierbar ist. Wir woUen von nun an vereinbaren, das Symbol C^^' (G; M) zu benutzen oder einfacher C^^'{G), um die Menge von Funktionen zu bezeichnen, die im Gebiet G stetige partielle Ableitungen besitzen. 8.4.3 Partielle Ableitungen hoherer Ordnung Besitzt eine auf einem Gebiet G C M™ definierte Funktion / : G —>• M eine partielle Ableitung -g^ (x) nach einer der Variablen x^,..., x™, dann ist diese partielle Ableitung eine Funktion dif : G ^ R, die ihrerseits eine partielle Ableitung dj(dif^{x) nach einer Variablen x^ besitzen kann. Die Funktion dj{dif) : G ^ ffi wird die zweite partielle Ableitung von f nach den Variablen a;* und x^ genannt und mit einem der folgenden Symbole bezeiclmet:
Die Reihenfolge der Indizes deutet die Reilienfolge an, in der die Ableitungen nach den entsprechenden Variablen ausgefiihrt werden. Damit haben wir partielle Ableitungen zweiter Ordnung definiert. Wurde eine partielle Ableitung der Ordnung k du •••%,, f i x ) = -r—.
::-^(a;)
definiert, konnen wir durch Induktion eine partielle Ableitung der Ordnung fc + 1 definieren: da,...i,,.fix) := di{di^...ij){x) . An dieser Stelle drangt sich eine Frage auf, die spezifisch ist fiir Funktionen mehrerer Variabler: Hangt die partielle Ableitung von der Reihenfolge der berechneten Ableitungen ab? Satz 3. Besitzt die Funktion f : G ^ W partielle Ableitungen — (x)
dx^dxJ
und ——7-—^{x) dx^dx^
in einem Gebiet G, dann sind in jedem Punkt x G G, in dem beide partielle Ableitungen stetig sind, ihre Werte identisch.
482
8 Differentialrechnung mit Punktionen mehrerer Variabler
Beweis. Sei x G G ein Punkt, in dem beide Funktionen dijf : G ^ M. und djif : G ^ M. stetig sind. Von nun an werden alle unsere Argumente im Kontext einer Kugel K{x; r) C G, r > 0 ausgefiihrt, die eine konvexe Umgebung des Punktes x ist. Wir wollen zeigen, dass -{X,...,X
dx^dxi
'
'
) = -———-T{X
dx^dx^
, . . . ,X
) .
Da sich nur die Variablen x^ und x^ in den folgenden Berechnungen verandern werden, werden wir der Kiirze halber annehmen, dass / eine Funktion zweier Variabler f{x^,x'^) ist, so dass wir zeigen miissen, dass d'f
, 1 2.
dx^dx^^""'"^'
gy
( 1 2.
dx-^dxA"^'"^ ^'
falls beide Funktionen im Punkt (a;^,a;^) stetig sind. Wir betrachten die Hilfsfunktion F(/ii,/i2) = / ( x i + / i i , a ; 2 + / i 2 ) _ / ( x i + / i i , a ; 2 ) - / ( x \ a ; 2 + /i2) + /(xi,x2) , wobei angenonimen wird, dass die Entfernung h = {h^^h?) hinreicliend klein ist, und zwar so klein, dass x + h £ K{x; r). Wenn wir F{h^,h'^) als die Differenz F{h\h')=ip{l)-ip{0) betrachten, wobei ip{t) = f{x^ +th^,x'^ + h'^) — f{x^ +th^,x'^), dann erhalten wir nach dem Mittelwertsatz, dass F{h^,h'^) =(^'((9i)= {dif{x^+0ih\x^+h^)-dif{x^+Oih^,x^))h^
.
Wenn wir wiederum den Mittelwertsatz in dieser letzten Differenz anwenden, erhalten wir F{h\h'^)
=d2if{x^
+Oih^,x^ +02h^)h'^h^ •
(8.55)
Wenn wir nun F{h^,h'^) als die Differenz F{h\h')=^{l)-^{0) schreiben, wobei ip{t) = f{x^ -\-h^.x"^ + th?) — f{x^,x'^ + th?), dann erhalten wir auf ahnliche Weise, dass F{h\h^)
= di2f{x^ +Oih\x^
+02h^)h^h^ .
(8.56)
Wenn wir (8.55) und (8.56) vergleichen, konnen wir folgern, dass 92i/(a;^ + eih\x^
+ 02h^) = dnfix^
+ Oih\x^
+ O^K^) ,
(8.57)
wobei 61,62,01,62 £]0,1[. Mit Hilfe der Stetigkeit der partiellen Ableitungen im Punkt (a;^, a;^) fiir /i ^ 0 erhalten wir die gesuchte Gleichung als Folge von (8.57):
d2if{x\x'')=dr2f{x\x').
U
8.4 Reelle Funktionen mehrerer Variabler
483
Wir nierken an, dass wir ini Allgemeinen nicht ohne zusatzliche Annahmen sagen konnen, dass dijf{x) = djif{x), wenn beide partielle Ableitungen im Punkt X definiert sind (vgl. Aufgabe 2 am Ende des Abschnitts). Wir vereinbaren, die Menge der Funktionen / : G —^ ffi, deren partielle Ableitungen bis inklusive fc-ter Ordnung im Gebiet G C M™ definiert und stetig sind, mit C(*)(G;M) Oder C'-''^{G) zu symbolisieren. Als Folge von Satz 3 erhalten wir den folgenden Satz. Satz 4. Sei f £ G ( * ) ( G ; M ) . Dann ist der Wert di^,,,i^f{x) der partiellen Ableitung unabhdngig von der Reihenfolge ii,... ,ik der Ableitungen, d.h., er ist fiir jede Permutation der Indizes ii,... ,ik gleich. Beweis. Fiir den Fall fc = 2 ist dieser Satz in Satz 3 enthalten. Angenommen, der Satz gelte bis inklusive n-ter Ordnung. Wir wollen zeigen, dass er dann auch fiir die Ordnung n + 1 gilt. Nun ist aber di^i^...i^^^f{x) = di^ [di^...i^^^f){x). Nach der Induktionsvoraussetzung konnen 12, • • • ,*n+i permutiert werden, ohne dass sich die Funktion di2---inj^if{x) andert und daher auch, ohne i9ii...j„+i/(a;) zu verandern. Aus diesem Grund geniigt es zu zeigen, dass wir etwa auch die Indizes «i und «2 permutieren konnen, ohne den Wert der Ableitung i9iii2-«n+i/(2^) ^u verandern. Da folgt die Richtigkeit dieser Permutation unmittelbar aus Satz 3. Nach dem Induktionsprinzip ist Satz 4 damit bewiesen. D Beispiel 1. Sei f{x) = f(x^,x'^) eine Funktion der Klasse G ( ^ ) ( G ; K ) . Sei h = {h^ ,h?) so, dass das abgeschlossene Intervall [x,x + h] im Gebiet G enthalten ist. Wir woUen zeigen, dass die Funktion ^{t) = f{x + th), die auf dem abgeschlossenen IntervaU [0,1] definiert ist, zur Klasse G(*) [0,1] gehort und ihre Ableitung der Ordnung k nach t bestimmen. Es gilt ^'(t) = dif{x^ + th^,x^ + t/i2)/i^ + d2f{x^ + th^.x^ + th^)h^ , if"{t) = diifix + th)h^h^ + 821 fix + th)h'^h^ + = dnfix
+ th)ih^f
+ di2 fix + th)h^h^ + ^22/(3; + th)h^h^ = + 2ai2/(a; + th)h^h:^ + ^22/(3; + th)iK^f .
Diese Gleichungen lassen sich als Einwirkung des Operators (/i^9i + h?d2) schreiben: ifi'it) = ih^di + h^d2)fix + th) = h'difix + th) , (p"it) = ih^di + h^d2)^fix + th) = h'^h'^di.iJix + th) .
484
8 Differentialrechnung mit Punktionen mehrerer Variabler
Mit Induktion erhalten wir ^(*)(t) = (h^di + h^ 82)''fix + th) = h}'--- h}''di,...ij{x (Summation iiber alle Mengen ii,...
+ th)
,ik der k Indizes von jeweils 1 bis 2).
2. Sei f{x) = f{x\...,x"'') und / £ C(*)(G;M), dann erhalten wir unter der Annahme, dass [x, x + h] C G, fiir die auf dem abgeschlossenen Intervall [0,1] definierte Funktion (p{t) = f{x + th), dass ip^''Ht) = h''---h'''di,...ijix
+ th)
(8.58)
wobei rechts Summation iiber alle Mengen von Indizes ii,.. .,ik gemeint ist, von denen jeder alle Werte zwisclien 1 und m inklusive annimmt. Wir konnen Gleichung (8.58) auch wie folgt schreiben: (^(fc) (t) = (h^di + ••• + h'^d-mffix
+ th)
(8.59)
8.4.4 Die Taylorsche Formel Satz 5. Ist die Funktion f : U{x) -^ M. in einer Umgebung U{x) C M™ des Punktes x £ M™ definiert und zugehorig zur Klasse C(") {U{x);M) und ist das abgeschlossene Intervall [x,x + h] vollstdndig in U{x) enthalten, dann gilt die folgende Gleichung: f{x^ +/ii,...,a;™ + /i™)-/(a;i,...,a;™) " 1 /.I Y, ^ T^ih'di
+ ••• + h^d^)^f{x)
+ rn-i{x; h)
(8.60)
k=i
mit ^'-rrih'di [n- 1)!
+••• + h^dmTfix
+ th) At
.61)
Gleichung (8.60) wird zusammen mit (8.61) Taylorsche Formel mit integralem Restglied genannt. Beweis. Die Taylorsche Formel folgt unmittelbar aus der entsprechenden Taylorschen Formel fiir eine Funktion mit einer Variablen. Dazu betrachten wir die Hilfsfunktion if{t) = f{x + th), die nach den Voraussetzungen zu Satz 5 auf dem abgeschlossenen Intervall 0 < t < 1 definiert ist und (wie wir oben bewiesen haben) zur Klasse C(") [0,1] gehort.
8.4 Reelle Funktionen mehrerer Variabler
485
Daher konnen wir fiir T € [0,1] die Taylorsche Forniel fiir Funktionen einer Variablen schreiben: ^(r) = ^(0) + ^ ^ ' ( 0 ) r + • • • + ^ - l ^ ^ ( » - i ) ( 0 ) r " - i + 1 n-l
(n-l)! 0
Wenn wir dabei r = 1 setzen, erhalten wir
^(1) = ^(0) + ^^'(0) + • • • + ^ ; ^ ^ < " - ' H o ) + 1 n-l i^^^-i^^(")Wdt.
(8.62)
0
Das Einsetzen der Werte ^(*) (0) = (/ji^i + • • • + h^'d^ffix)
,
(fc = 0 , . . . , n - 1) und
<^(») (t) = (/jig^ + . . . + /i™a™)"/(x + t/i) in diese Gleichung liefert uns in Ubereinstimmung mit (8.59) den Beweis von Satz 5. D Anmerkung. Wenn wir das Restglied in (8.62) nach Lagrange statt in der integralen Form schreiben, erhalten wir aus der Gleichung
^(1) = ^(0) + ^^'(0) + • • • + j^^v>^''-'Ho)
+ ^v^"Ho)
mit 0 < 6* < 1 die Taylorsche Formel (8.60) mit dem Restglied r„_i(a;; h) = ^{h'di +••• + K^dmTfix + Oh) . (8.63) n! Diese Form des Restglieds wird wie im Fall einer Funktion mit einer Variablen das Restglied nach Lagrange in der Taylorschen Formel genannt. Da / e C(") (t/(x); K), folgt aus (8.63), dass rn-i{x- h) = ^{h^di
+••• + K^dmTfix)
+ o(||/i|r) fiir ft ^ 0 ,
woraus wir die Gleichung f{x^ + / i \ . . . , x " + / i ™ ) - / ( a ; \ . . . , x " ) = n
-.
= Y. fc! ('^'^i + • • • + /i"5™)'/(^) + o(||/i|r) fiir /i ^ 0 , (8.64) fc=i
erhalten, die Taylorsche Formel mit Restglied nach Peano genannt wird.
486
8 Differentialrechnung mit Punktionen mehrerer Variabler
8.4.5 E x t r e m a v o n F u n k t i o n e n m e h r e r e r V a r i a b l e r Eine der wichtigsten Anwendungen der Differentialrechnung ist ihr Einsatz auf der Suche nach E x t r e m a von Funktionen. D e f i n i t i o n 1 . Eine auf einer Menge E C M™ definierte Funktion / : _E —>• M besitzt ein lokales Maximum (bzw. lokales Minimum) in einem inneren P u n k t XQ e E, falls eine Umgebung U{xo) C E des P u n k t e s XQ existiert, so dass f{x) < f{xo) (bzw. f{x) > fixoj) fiir alle x £ U{xo). Gilt strenge Ungleichheit f{x) < f{xo) fiir x G U{xo) \ XQ (bzw. f{x) > f{xo)), dann besitzt die Funktion ein isoliertes lokales Maximum (bzw. ein isoliertes lokales Minimum) in XQ. D e f i n i t i o n 2. Die lokalen Minima oder Maxima einer Funktion werden ihre lokalen Extrema genannt. S a t z 6. Angenommen, eine in einer Umgebung U{xo) C ffi™ des Punktes xo = {XQ, ... ,a;™) definierte Funktion f : U{xo) —>• ffi besitze partielle Ableitungen nach jeder ihrer Variablen x^,..., x™ im Punkt XQ. Dann ist es eine notwendige Bedingung dafiir, dass die Funktion in XQ ein lokales Extremum besitzt, dass die folgenden Gleichungen in diesem Punkt gelten: ^
M
= 0,...,^(a.o)=0.
(8.65)
Beweis. Wir betrachten die Funktion
Qf '-P \^o)
—
A T T ' ^ O ' ^ O I • • • TXQ
) ,
folgt, dass ^ ( a ; o ) = 0. Die anderen Gleichungen in (8.65) werden ahnlich bewiesen.
D
Wir mochten betonen, dass (8.65) nur eine notwendige, aber keine hinreichende Bedingungen fiir die Existenz eines E x t r e m u m s einer Funktion mehrerer Variablen ist. Ein Beispiel dafiir ist jedes zu diesem Zweck konstruierte Beispiel einer Funktion einer Variablen. Demnach konnen wir nun, anstelle der Funktion a; i->- a;^, deren Ableitung in Null gleich Null ist, die aber dort keinen Extremwert annimmt, die Funktion
f{x\...,xn = {x'f betrachten, deren partielle Ableitungen in XQ = ( 0 , . . . , 0) alle Null sind, obwohl die Funktion offensichtlich in diesem P u n k t kein E x t r e m u m besitzt.
8.4 Reelle Funktionen mehrerer Variabler
487
1st die Funktion / : G —>•ffiauf einer ofFenen Menge G C M™ definiert, so sagt uns Satz 6, dass ihre lokalen Extrema entweder unter den Punkten gefunden warden, in denen / nicht differenzierbar ist, oder in den Punkten, in denen das Differential d/(a;o) oder, was identisch ist, die Tangentialabbildung f'{xo) verschwindet. Ist eine in einer Umgebung U{xo) Cffi™des Punktes XQ Gffi™definierte Abbildung / : U{xo) —>•ffi"in XQ differenzierbar, dann besitzt, wie wir wissen, die Matrix der Tangentialabbildung / ' ( X Q ) : M™ -^ M" die Form fdif\xo)
•••
dmf\xo)\
(8.66)
\di.r{xo) ••• dm.r{xo)) Definition 3. Der Punkt XQ heiBt dann kritischer Punkt der Abbildung f : U{xo) —>•ffi",falls der Rang der Jacobimatrix (8.66) der Abbildung in dieseni Punkt kleiner als min{m,n} ist, d.h., kleiner als der maximal mogliche Wert, den er haben kann. So ist fiir n = 1 der Punkt XQ ein kritischer Punkt, wenn Bedingung (8.65) gilt, d.h., aUe partiellen Ableitungen der Funktion / : U{xo) —>• M verschwinden. Die kritischen Punkte einer Funktion mit reellen Werten werden auch stationdre Punkte oder singuldre Punkte dieser Funktion genannt. Nachdem die stationaren Punkte einer Funktion durch Losung des Systems (8.65) aufgefunden wurden, kann die sich anschliefiende Analyse zur Klarung dariiber, welche davon Extrema sind, oft mit Hilfe der Taylorschen Formel in Verbindung mit den folgenden hinreichenden Bedingungen fiir die Gegenwart oder das Fehlen eines durch diese Formel enthiillten Extremums durchgefiihrt werden. Satz 7. Sei / : U{xo) -^ M eine Funktion der Klasse C'^'([/(XQ); M), die in einer Umgebung U{xo) C M™ des Punktes XQ = (XQ, ... ,a;™) € M™ definiert ist, und sei XQ ein stationarer Punkt der Funktion f. Ist bei der Taylor-Entwicklung der Funktion im Punkt XQ
f{xl + h\ ... ,x^ + /i™) 1
8-^ f
= /(4,...,a;™) + 2! ^ ^E^ 7^(^oWh^ dx'dxi
+ oi\\hr) (8.67)
die quadratische Form
E
^ jixoWh^ =dijf(xoWh^
dx^dxJ
(8.68)
488
8 Differentialrechnung mit Punktionen mehrerer Variabler
a) positiv definit oder negativ definit, dann besitzt die Funktion f im Punkt XQ ein lokales Extremum, das ein isoliertes Minimum ist, wenn die quadratische Form (8.68) positiv definit ist, und ein isoliertes Maximum, wenn sie negativ definit ist; b) indefinit, d.h., nimmt sie sowohl positive wie negative Werte an, dann besitzt die Funktion in XQ kein Extremum. Beweis. Sei h ^ 0 und f{xo + h)-f{xo)
XQ -\-
=
h£
j^\\h\\'
U{XQ).
Wir wollen (8.67) in der Form
2^ /^:;:7^(^oW^ + ''W
im)
hj=i
schreiben, wobei o(l) fiir h ^ 0 infinitesimal ist. Aus Gleichung (8.69) ist offensichtlich, dass das Vorzeichen der Differenz f{xo + h) — f{xo) vollstandig durch das Vorzeichen des Ausdrucks in den eckigen Klammern bestimmt wird. Wir wollen diesen Ausdruck nun untersuchen. Der Vektor e = [h^l\\h\\,... ,h'^l\\h\\) besitzt offensichtlich die Norm 1. Die quadratische Form (8.68) ist eine stetige Funktion von h Gffi™,und daher ist ihre Einschrankung auf die Einheitskugelschale 5(0; 1) = {a; £ffi™| ||a;|| = 1} ebenfaUs in 5(0; 1) stetig. Nun ist aber die Kugelschale S eine abgeschlossene beschrankte Teilmenge von M™, d.h., sie ist kompakt. Folghch besitzt (8.68) sowohl ein Minimum als auch ein Maximum in S, in denen sie die Werte m bzw. M annimmt. Ist die Form (8.68) positiv definit, dann ist 0 < m < M, und es existiert eine Zahl S > 0, so dass |o(l)| < m fiir \\h\\ < 6. Dann ist fiir \\h\\ < S der Klammerausdruck auf der rechten Seite von (8.69) positiv und folglich auch f{xo +h) — f{xo) > 0 fiir 0 < \\h\\ < 6. Daher ist in diesem FaU der Punkt XQ ein isoliertes lokales Minimum der Funktion. Wir konnen auf ahnliche Weise beweisen, dass die Funktion ein isohertes Maximum im Punkt XQ besitzt, falls die Form (8.68) negativ definit ist. Somit ist a) nun bewiesen. Seien e™ und CM Punkte der Einheitskugelschale, in denen die Form (8.68) die Werte m bzw. M annimmt, und sei m < 0 < M. Wenn wir h = tCm setzen, wobei t eine geniigend kleine positive Zahl ist (so klein, dass XQ + te„i £ U{xo)), dann erhalten wir aus (8.69), dass f{xQ + tern) - f{xo) = -^t^im + o(l)) , wobei o(l) —^ 0 fiir t —>• 0. Wenn wir beginnen (d.h. fiir alle kleinen Werte von t), besitzt m + o(l) auf der rechten Seite dieser Gleichung das Vorzeichen von m, d.h., ist negativ. Folglich ist auch die linke Seite negativ. Wenn wir ganz ahnlich h = tcM setzen, erhalten wir fixo + ten) - fixo) = ^t\M
+ o(l))
8.4 Reelle Funktionen mehrerer Variabler
489
und folglich ist die Differenz f{xo + ICM) — f{xo) fiir alle geniigend kleinen Werte t positiv. Nimmt daher die quadratische Form (8.68) sowohl positive als auch negative Werte auf der Einheitskugelschale oder, was dazu offensichtlich aquivalent ist, in K™ an, dann gibt es in jeder Umgebung des P u n k t e s XQ sowohl P u n k t e , in denen der Wert der Funktion groBer als / ( X Q ) ist und P u n k t e , in denen ilir Wert kleiner als f{xo) ist. Daher ist XQ in diesem Fall kein lokales E x t r e m u m der Funktion. D Wir woUen nun einige Anmerkungen zu diesem Satz machen. Anmerkung 1. Satz 7 sagt nichts iiber den Fall aus, dass die Form (8.68) semidefinit ist, d.h. nicht positiv bzw. nicht negativ definit. Tatsachlich zeigt sich, dass der P u n k t dann ein E x t r e m u m sein kann oder auch nicht. Dies lasst sich an folgendem Beispiel erkennen. Beispiel 3. Wir suchen die E x t r e m a der Funktion f{x,y) = x* +y* — 2x'^, die in ffi^ definiert ist. Um die notwendigen Bedingungen (8.65) zu erfiillen, betrachten wir das folgende Gleichungssystem
( df
TT" (x, w) = 4:X^ - 4a; = 0 , ox
^{x,y) I dy
=
V = o ,
aus dem wir die stationaren P u n k t e (—1,0), (0,0) und (1,0) erhalten. Da —Sx.y)
= 12^2 - 4 ,
^^(x,2/) ^ 0 ,
—^{x^y) = W
,
lautet die quadratische Form (8.68) jeweils in den drei stationaren P u n k t e n &{h^f
,
-A{h^f
bzw.
^{h^f
.
Somit ist sie in alien drei P u n k t e n entweder positiv semi-definit oder negativ semi-definit. Satz 7 ist daher nicht anwendbar. Da aber f{x,y) = (a;^ — 1)^ + y^ — 1, ist offensichthch, dass die Funktion f{x, y) einen isoherten Minimalwert — 1 (sogar ein globales Minimum) in den P u n k t e n (—1,0), und (1,0) besitzt. Dagegen liegt in (0, 0) kein E x t r e m u m vor, da fiir a; = 0 und y ^ 0 gilt, dass f{0,y) = y^ > 0 und fiir y = 0 und geniigend kleines a; ^ 0, dass /(a;,0) = a;4-2a;2 < 0. Anmerkung 2. Nachdem wir die quadratische Form (8.68) erhalten haben, konnen wir sie mit den Formeln von Sylvester^ auf ihre Definitheit untersuchen. Wir wiederholen, dass nach Sylvester eine quadratische Form ^ J. J. Sylvester (1814-1897) - britischer Mathematiker, dessen bekanntesten Arbeiten in der Algebra vorliegen.
490
8 Differentialrechnung mit Punktionen mehrerer Variabler
m
^
aijX^x^ mit symnietrischer Matrix \
/ Oil
• • • aim
\ ^ral
' ' ' ^ram /
genau dann positiv definit ist, wenn alle ihre Hauptminoren positiv sind. Die Form ist genau dann negativ definit, wenn an < 0, und sich das Vorzeichen des Hauptminors bei jeder Vergr6i3erung der Ordnung um eins andert. Beispiel 4- Wir suchen die Extrema der Funktion fix,y)
=xy\n{x^
+ y'^) ,
die iiberall, aui3er im Ursprung, in der Ebene M^ definiert ist. Wenn wir das Gleichungssystem ' df 2x^v / ( x , 2 / ) =yln(a;2+2/2) + ^ ^ = 0, ox x/ + y^
-J-{x,y) = xHx^+y^)+x/ +l""^ =0 y^
^ oy
losen, dann erhalten wir die stationaren Punkte der Funktion:
,o,±:,;
,±1,0);
(±j^.^^): 2e V2e/
{±4:.T;i)V2e V2e
v
Da die Funktion in beiden Argumenten ungerade ist, sind die Punkte (0,±1) und (±1,0) ofFensichtlich keine Extrema der Funktion. Es ist auch klar, dass diese Funktion ihren Wert beibehalt, wenn sich die Vorzeichen beider Variablen x und y verandern. Daher konnen wir aus der Untersuchung eines der verbleibenden stationaren Punktes, beispielsweise (—«=i ~7^)^ Folgerungen iiber die Eigenschaften der anderen Punkte ziehen. Da d"^ f, . :{x,y) dx^ '
-
&xy x^ + y^
Ax'^y (x^ + y^y^
-ix,y) =\n{x^ + h^)+2^ ' (x^ + y^Y' d"^ f, . &xy Axy^ -7r^{x,y) dy'^ ' a;2 + 2/2 {x^ + y"^)'^
dxdy
besitzt die quadratische Form dijf{xo)h^h^
im Punkt ( - ^ , - ^ ) die Matrix
8.4 Reelle Funktionen mehrerer Variabler
491
2 0 0 2
Diese Matrix ist positiv definit und folglich besitzt die Funktion in diesem Punkt ein lokales Minimum
f(——)=--
vy2iV2i^
2e
Aus den oben angestellten Betrachtungen zu den Eigenschaften dieser Funktion konnen wir unmittelbar folgern, dass f(-— V y2i'
- — ) = - V2i/ 2e
ebenfalls ein lokales Minimum ist und dass
lokale Maxima der Funktion sind. Dies batten wir direkt zeigen konnen, indem wir die Definitbeit der zugeborigen quadratischen Formen gepriift batten. So ist beispielsweise die Matrix der quadratiscben Form (8.68) im Punkt -2 0
0 -2
woraus wir sofort ablesen konnen, dass sie negativ definit ist. Anmerkung 3. Wir sollten daran denken, dass die notwendigen (Satz 6) und binreicbenden (Satz 7) Bedingungen fiir ein Extremum einer Funktion nur in den inneren Punkten ibres Definitionsbereicb gelten. Daber ist es stets notwendig, auf der Sucbe nacb dem absoluten Maximum oder Minimum einer Funktion neben den stationaren inneren Punkten aucb die Randpunkte des Definitionsbereicbs zu untersucben, da die Funktion ibren Maximal- oder Minimalwert in einem der Randpunkte annebmen kann. AUgemeine Metboden zur Sucbe von Extrema in nicbt inneren Punkten werden wir spater detailbert untersucben (s. Absatz 8.7.3). Sie sollten sicb merken, dass bei der Sucbe nacb Minima und Maxima einfacbe Betracbtungen des konkreten Problems bilfreicb sein konnen, erganzt um formale Tecbniken und mancbmal sogar obne diese. Wird beispielsweise eine differenzierbare Funktion, die aufgrund der Problemstellung ein Minimum besitzen muss, in M™ untersucbt und zeigt es sicb, dass diese Funktion von oben unbescbrankt ist, dann kann man, falls die Funktion nur einen stationaren Punkt besitzt, obne weitere Untersucbungen davon ausgeben, dass dieser Punkt das Minimum ist.
492
8 Differentialrechnung mit Punktionen mehrerer Variabler
Beispiel 5. Problem von Huygens. Aufbauend auf den Gesetzen der Energieund Impulserhaltung eines abgeschlossenen mechanischen Systems, konnen wir durch eine einfache Berechnung zeigen, dass zwei perfekt elastische Balle mit den Massen mi und m2 und den Anfangsgeschwindigkeiten vi und V2 nach einem zentralen Stofi (wenn die Geschwindigkeiten entlang der Strecke gerichtet sind, die die Massen verbindet) folgende Geschwindigkeiten besitzen werden: (mi - m2)wi + 2m2i'2
vi = —
nil + 1TI2
(m2 - mi)w2 + 2miVi
V2
nil + 1TI2
Insbesondere lasst sich daraus die Geschwindigkeit eines bewegungslosen Balls der Masse m nach dem StoB mit einem Ball der Masse M mit der Geschwindigkeit V berechnen: 2 ^ :V .
(8.70)
m+M
Wir erkennen daraus, dass F < w < 2 y fiir 0 < m < M. Wie kann ein signifikanter Teil der kinetischen Energie einer grofien Masse auf einen Korper mit kleiner Masse iibergehen? Um dies zu analysieren, konnen wir uns beispielsweise Massen denken, die zwischen der kleinen und der grofien Masse liegen: m < mi < m2 < • • • < m„ < M. Wir woUen (nach Huygens) berechnen, wie die Massen mi, m 2 , . . . , m„ gewahlt werden sollten, damit der Korper m die maximal mogliche Geschwindigkeit nach aufeinander folgenden zentralen Stofien besitzt. In Ubereinstimmung mit (8.70) erhalten wir den folgenden Ausdruck fiir die angenommene Geschwindigkeit als eine Funktion der Variablen mi, m2, . . . , m„: mi m + mi
m2 mi + m2
m„ nin-i + nin
M ^^-^ • 2"+^y . iTin + M
(8.71)
Somit lasst das Problem von Huygens auf die Suche nach dem Maximum der Funktion mi m„ M J (nil,
• • •, mn)
=
•
m + mi
w„_i + m„
m„ + M zuriickfiihren. Das Gleichungssystem (8.65), aus dem wir die notwendigen Bedingungen fiir ein inneres Extremum erhalten, lasst sich in diesem Fall in das folgende System umformen: m • m2 -ml
=0
m i • m-j, - m ^
= 0
m„_i • M
-ml
=0
8.4 Reelle Funktionen mehrerer Variabler
493
Daraus ergibt sich, dass die Zahlen m, m i , . . . , m „ , M im E x t r e m u m eine geometrische Progression mit dem Verhaltnis q = ^^^/M/m bilden. Die Geschwindigkeit (8.71), die sich aus dieser Massenwahl ergibt, lautet /
2a
\"+i
was fiir n = 0 mit (8.70) iibereinstimmt. Aus physikalischer Sicht ist klar, dass wir mit (8.72) den Maximalwert der Funktion (8.71) erhalten. Dies lasst sich jedoch auch formal zeigen (ohne die miihsame Bildung der zweiten Ableitungen, vgL Aufgabe 9 am Ende dieses Abschnitts). Wir merken an, dass aus (8.72) klar ist, dass fiir m —>• 0 die Geschwindigkeit V gegen 2 " + ^ y strebt. Somit erhohen die dazwischen liegenden Massen tatsachlich den Anteil der kinetischen Energie der Masse M , der auf die kleine Masse m iibergeht.
8.4.6 E i n i g e g e o m e t r i s c h e D a r s t e l l u n g e n z u F u n k t i o n e n m e h r e r e r Variabler a. D e r G r a p h e i n e r F u n k t i o n u n d k r u m m h n i g e K o o r d i n a t e n Seien x, y und z kartesische Koordinaten eines P u n k t e s in M^ und sei z = f{x,y) eine stetige Funktion, die auf einem Gebiet in der Ebene M^ der Variablen x und y definiert ist. Nach der allgemeinen Definition des Graphen einer Funktion entspricht der G r a p h der Funktion / : G ^ M in unserem Fall der Menge S = {{x,y,z) G'M?\{x,y) GG, z = f{x,y)} im R a u m K^. Offensichtlich ist die Abbildung G —> S, die durch die Relation {x,y) i->(a;, y, f{x, y)) definiert wird, eine stetige eins-zu-eins Abbildung von G auf S. Daher lasst sich jeder P u n k t von S bestimmen, wenn wir den zugehorigen P u n k t von G angeben oder, was dasselbe ist, wenn wir die Koordinaten des P u n k t e s von G angeben. Daher konnen Koordinatenpaare {x,y) G G als Koordinaten fiir P u n k t e einer Menge S - dem Graphen der Funktion z = f{x, y) - betrachtet werden. Da die P u n k t e von S durch ein Zahlenpaar definiert werden konnen, werden wir daher vereinbaren, S eine zwei-dimensionale Flache in M^ zu nennen. (Die allgemeine Definition einer Flache werden wir spater geben.) Wenn wir einen Weg F : I ^ G in G definieren, dann erscheint automatisch ein Weg F o F : I ^ S auf der Flache. Ist x = x{t) und y = y{t) eine Parametrisierung des Weges F, dann wird der Weg F o F auf S durch die drei Funktionen x = x{t), y = y{i)^ z = z{t) = f{x{t),y{t)) beschrieben. Setzen wir insbesondere x = XQ +t und y = yo, dann erhalten wir eine Kurve X = XQ +1, y = yo, z = ,f{xo + t, yo) auf der Flache S, wobei sich die Koordinaten y = yo der P u n k t e in S nicht verandern. Auf ahnliche Weise konnen wir
494
8 Differentialrechnung mit Punktionen mehrerer Variabler
uns eine Kurve x = XQ, y = yo + t, z = f{xo,yo + t) konstruieren, bei denen sich die erste Koordinate XQ der P u n k t e in S nicht verandert. In Analogie zum planaren Fall werden diese Kurven in S die Koordinatenachsen auf der Flaclie S genannt. Im Unterscliied zu den Koordinatenachsen in G C M^, die Telle von Geraden sind, sind die Koordinatenachsen in S jedoch im Allgemeinen Kurven in M^. Aus diesem Grund werden die Koordinaten {x,y) der P u n k t e der Flache S auch oft als krummlinige Koordinaten auf S bezeichnet. Daher ist der G r a p h einer stetigen Funktion z = f{x, y), die auf einem Gebiet G C M^ definiert ist, eine zwei-dimensionale Flache 5 in ffi^, deren P u n k t e durch die krunimlinigen Koordinaten {x, y) £ G definiert werden konnen. An diesem P u n k t werden wir nicht noch ausfiihrlicher werden und die allgemeine Definition einer Flache geben, da wir nur an einer besonderen Art von Flache interessiert sind - dem Graphen einer Funktion. Wir nehnien jedoch an, dass der Leser aus Kursen der analytischen Geometric mit einigen besonderen wichtigen Flachen in ffi^ vertraut ist (wie einer Ebene, einem Ellipsoid, Paraboloiden und Hyperboloiden). b. Die Tangentialebene an den Graphen einer Funktion Differenzierbarkeit einer Funktion z = f{x, y) im P u n k t (a;o, yo) £ G bedeutet, dass I{x, y) = f{xo,yo) +o{^y{x
+ A{x - XQ) + B{y - yo) + - xo)^ + iy - yoY)
fiir (a;,2/)-!• (a;o,2/o) ,
(8.73)
wobei A und B Konstanten sind. Wir woUen in W die Ebene z = zo + A{x-
xo) + B{y - yo)
(8.74)
fiir zo = f{xo,yo) betrachten. Wenn wir (8.73) und (8.74) vergleichen, konnen wir erkennen, dass der Graph der Funktion in einer Umgebung des Punktes {xo,yo,zo) durch die Ebene (8.74) gut angenahert wird. Genauer gesagt, so unterscheidet sich bei einer Veranderung der Koordinaten {xo,yo) zu den krummlinigen Koordinaten {x,y) der P u n k t {x,y, f{x,y)) der Ebene (8.74) verglichen zum Wert \/{x — XQ)^ + {y — Vo)'^ im P u n k t {xo,yo,zo) um einen infinitesimalen Betrag. Auf Grund der Eindeutigkeit des Differentials einer Funktion ist die Ebene (8.74) mit dieser Eigenschaft eindeutig bestimmt und lautet
df df z = f{xo,yo) + •g-{xo,yo){x-xo) + -g-{xo,yo){y-yo) •
(8.75)
Diese Ebene wird Tangentialebene an den Graphen der Funktion z = f{x,y) im Punkt {xo,yo, f{xo,yo)) genannt. Daher sind die Differenzierbarkeit einer Funktion z = f{x,y) im P u n k t (a;o,2/o) und die Existenz einer Tangentialebene an den Graphen dieser Funktion im P u n k t {xo,yoT f{xo,yo)) aquivalente Bedingungen.
8.4 Reelle Funktionen mehrerer Variabler
495
c. Der Normalenvektor Wenn wir Gleichung (8.75) fiir die Tangentialebene in der kanonischen Form
df 9/ dx {xo,yo){x - xo) + -Q-{xo,yo){y -yo) - {z - ,f{xo,yo))
=0
schreiben, konnen wir daraus ablesen, dass der Vektor 9.f, (^-l<-(a;o,2/o),^(a;o,2/o),-lj yg
5.76)
der Normalenvektor an die Tangentialebene ist. Seine Richtung zeigt normal oder orthogonal zur Flache S (dem Graphen der Funktion) im Punkt {xo,yo,f{xo,yo))-
Ist insbesondere {xo,yo) ein stationarer Punkt der Funktion f{x,y), dann lautet der Normalenvektor an den Graphen im Punkt {xo,yo, f{xo,yo)) (0,0,-1) und folglich ist die Tangentialebene an den Graphen der Funktion in solch einem Punkt horizontal (parallel zur xy-Ebene).
z=—X
—y
Abb. 8.1. Die drei Graphen in Abb. 8.1 veranschaulichen das eben Gesagte. Die Abbildungen 8.1a und c zeigen den Graphen einer Funktion und die Tangentialebene in einer Umgebung eines lokalen Extremums (Minimum bzw. Maximum), wohingegen Abb. 8.1b den Graphen in der Umgebung eines sogenannten Sattelpunktes dartellt. d. Tangentialebenen und Tangential vektor en Wird ein Weg F : / —>•ffi^in M^ durch differenzierbare Funktionen x = x{t), y = y{t), z = z{t) beschrieben, dann ist der Vektor (i;(0),2/(0),i(0)), wie wir wissen, der Geschwindigkeitsvektor zur Zeit t = 0. Er ist im Punkt XQ = x{0), 2/0 = 2/(0), ZQ = z{0) ein Vektor in Richtung der Tangente an die Spur des Weges r in K^.
496
8 Differentialrechnung mit Punktionen mehrerer Variabler
Wir wollen nun einen Weg -T : / —^ S* an den Graphen einer Funktion z = f{x,y) der Form x = x{t), y = y{t), z = f{x{t),y{t)) betrachten. In dieseni besonderen Fall erhalten wir (x(0),2)(0),i(0)) = (x(0),2)(0),|^(a;o,2/o)i(0) + |^(xo,2/o)2)(0)) ,
woraus wir erkennen konnen, dass dieser Vektor zum Vektor (8.76) orthogonal ist, der zum Graphen S der Funktion im Punkt {xo,yo, f{xo,yo)) normal ist. Somit haben wir gezeigt, dass ein Vektor {^,r],(), der zu einer Kurve auf der Flache S im Punkt {xo,yo, f{xo,yo)) tangential verlauft, zum Vektor (8.76) orthogonal ist und (in diesem Sinne) im betrachteten Punkt in der Tangentialebene (8.75) an die Flache S hegt. Genauer gesagt, so konnten wir sagen, dass die gesamte Gerade x = XQ + ^t, y = yo + rjt, z = /(XQ, yo) + (t in der Tangentialebene (8.75) hegt. Wir wollen nun zeigen, dass die Umkehrung auch wahr ist, d.h., dass dann, wenn eine Gerade x = xo+^t, y = yo+rjt, z = f{xo,yo)+(t oder, was gleich ist, der Vektor (^, 77, () in der Ebene (8.75) liegt, ein Weg auf S existiert, zu dem der Vektor {^,r],() im Punkt {xo,yo, f{xo,yo)) der Geschwindigkeitsvektor ist. Wir konnen beispielsweise den Weg X = Xo+^t
,
y = yo+T]t
,
Z = f {XQ + S,t, yo + rjt)
wahlen. Tatsachlich gilt fiir diesen Weg
df i ( 0 ) = C,
2/(0) =?7,
df
z{^) =-Q^{xo,yo)i+T^{xQ,yQ)-q
.
In Anbetracht der Gleichung
df
df
— {xo,yo)x{0) + -Q-{xo,yo)y{0) - z{0) = 0 und der Annahme, dass -Q-{xo,yo)^+
-Q-{xo,yo)ri-
C= 0 ,
erhalten wir, dass (x(0),2/(0),i(0))=(C,r?,C).
Daher wird die Tangentialebene an die Flache S im Punkt {xo,yo,zo) durch die Vektoren gebildet, die im Punkt {xo,yo,zo) Tangenten an Kurven auf der Flache S sind, die durch diesen Punkt verlaufen (vgl. Abb. 8.2). Dies ist eine eher geometrische Beschreibung der Tangentialebene. Wie auch immer, so konnen wir daraus erkennen, dass dann, wenn die Tangente an eine Kurve (bzgl. der Wahl der Koordinaten) invariant definiert ist, auch die Tangentialebene invariant definiert ist.
8.4 Reelle Funktionen mehrerer Variabler
497
Abb. 8.2. Wir haben Funktionen zweier Variabler betrachtet, u m sie graphisch darstellen zu konnen, aber alles Gesagte lasst sich offensichtlich auf den AUgenieinfall einer Funktion
y = f{x\...,xn
(8.77)
fiir m £ N mit m Variablen iibertragen. Im Punkt (a;J,..., x™, / ( x j , . . . , a;™)) kann die Tangentialebene an den Graphen einer derartigen Funktion in der Form y = J [^0 y • • • T^O J + 2^ i=l
Jf^ {^0 T • • • y^O ){^
dx^
~ ^o)
5.78)
geschrieben werden, wobei der Vektor
_dl_
(a;o),-l)
der Normalenvektor an die Ebene (8.78) ist. Diese Ebene besitzt, wie der G r a p h der Funktion (8.77), die Dimension m , d.h., jeder P u n k t wird nun durch eine Menge (x^,... ,x"^) von m Koordinaten beschrieben. Daher definiert (8.78) eine Hyperebene in ffi™+^. Wenn wir die obigen Uberlegungen in Worten wiederholen, so lasst sich sagen, dass die Tangentialebene (8.78) aus Vektoren besteht, die Tangenten an Kurven sind, die durch den P u n k t ( a ; J , . . . , x™, / ( x j , . . . , x™)) verlaufen und auf der m-dimensionalen Flache S - dem Graphen der Funktion (8.77) liegen. 8.4.7 U b u n g e n u n d A u f g a b e n 1. Sei z = f{x,y)
eine Funktion der Klasse
C'^^\G\
a) Lasst sich fiir ^{x,y) = 0 in G behaupten, dass / in G von y unabhangig ist ? b) Unter welchen Bedingungen an das Gebiet G besitzt die obige Frage eine bejahende Antwort?
498 2.
8 Differentialrechnung mit Punktionen mehrerer Variabler a) Zeigen Sie, dass fiir die folgende Punktion
f{x,y)
_ a ^ y f ^ , fiir i " + y V 0 '_ 0, fiir x^ + y^ = 0
gilt:
^^-(0,0) = M - 1 = 1 ^ ( 0 , 0 )
dxdy ' dydx b) Die Funktion f{x,y) besitze die partiellen Ableitungen ^^ und -g^ in einer Umgebung U des Punktes {xo, yo) und die gemischte Ableitung -g^g- (oder g-g^) existiere in U und sei stetig in (xo,yo). Zeigen Sie, dass dann die gemischte Ableitung -§-^ (bzw. g,^J ) in diesem Punkt auch existiert und dass die folgende Gleichung gilt:
3. Seien x ^ , . . . , x"* kartesische Koordinaten in R"*. Der Differentialoperator
der auf Punktionen / G C*-^'(G;R) entsprecliend der Regel
einwirkt, wird Laplace-Operator genannt. Piir die Funktion / im Gebiet G C R™ wird die Gleichung Af = 0 Laplacesche Gleichung genannt und ihre Losungen werden als harmonische Punktionen im Gebiet G bezeichnet. a) Zeigen Sie, dass fiir x = {x^,...
jx"^) und
i=i
\
die Punktion f{x) =
\\x\\-"-^
fiir m > 2 auf dem Gebiet W^ \ 0 mit 0 = ( 0 , . . . , 0) harmonisch ist. b) Zeigen Sie, dass die Funktion 1
/
II 11^ \
die fiir t > 0 und x = {x^,. .., x"^) G R™ definiert ist, die Wdrmegleichung -:r- = a At dt •' erfiillt, d.h., zeigen Sie, dass in jedem Punkt des Definitionsbereichs der Funk-
tion fat = a^ E 0
gilt
8.4 Reelle Funktionen mehrerer Variabler
499
4. Taylorsche Formel in Multiindex Schreibweise. Das Symbol a := ( a i , . . . , a m ) mit nicht negativen Zahlen ai, i = 1,... ,m wird Multiindex a genannt. Die folgende Schreibweise ist iiblich: \a\ := a i + • • • + am ,
Ist schliefilich o = ( a i , . . . , Om), danii ist a l
ai am .— d^ ' ' ' ^rn
a) Zeigen Sie, dass fiir fc G N gilt, dass (ai H
\-am)^=
y^ — /—'^ a\
oder (Ol H
h Om)* = y ^ —j-o" , •^—' a\ \o.\=k
wobei die Summe iiber alle Mengeii a = (ai,...,am)
niclit negativer ganzeii
m
Zalilen lauft, fiir die ^ QJ = fc. i= l
b) Sei
Zeigen Sie, dass fiir / e C(*'(G;R) die Gleichung
^iH
\-im=k
\o.\=k
fiir jeden Punkt x £G mit ft = (/i\ . . . , ft*") gilt. c) Zeigen Sie, dass die Taylorsche Formel mit dem Restglied nach Lagrange in Multiindex Schreibweise beispielsweise wie folgt geschrieben werden kann: n-l
f[x + h:)= J2 ^Dyix)h"+ Y. ^—' a! |a|=0
Dy{x + eh)h".
^—' Q! |a|=n
d) Schreiben Sie die Taylorsche Formel mit integralem Restglied (Satz 5) in Multiindex Schreibweise. 5. Sei I"^ = {x = {x^,... ,a;'") G R"* |x'| < c \ i = 1,.. . ,m} ein m-dimensionales abgeschlossenes Intervall und / das alageschlossene Intervall [a, b] C R. a) Die Funktion f{x,y) = f{x^,...,x"'',y) sei auf der Menge I'" x I definiert und stetig. Zeigen Sie, dass dann zu jeder positiven Zahl e > 0 eine Zahl 6 > 0 existiert, so dass \fix,yi) — f{x,y2)\ < £ fiir x £ I"^, yi,y2 £ I und \yi—y2\ < S.
500
8 Differentialrechnung mit Punktionen mehrerer Variabler
b) Zeigen Sie, dass die Funktion b
F{x) = j fix,y)dy a
auf dem abgeschlossenen Intervall /"^ definiert und stetig ist. c) Sei / G C ( / ' " ; R ) . Zeigen Sie, dass dann die Funktion :F{x,t) = f{tx) auf I"" X I^ definiert und stetig ist, wobei /^ = {t G R I |t| < 1}. d) Beweisen Sie das Lemma von Hadamard: Set f € C'-'\l"' ;R) und /(O) = 0. Dann existieren Funktionen gi,... C ( / ' " ; R ) , so dass
fix\...
, X
;
—
2_^x gi[x ,...,x
,gm G
)
in /"^ und zusatzlich P i ( 0 ) •^
^<»)
6. Beweisen Sie die folgende Verallgemeinerung des Satzes von Rolle fiir Funktionen mehrerer Variabler. Ist die Funktion f auf einer abgeschlossenen Kugel -R'(0; r) stetig, gleich Null auf dem Rand der Kugel und differenzierbar in der offenen Kugel K(Q;r), dann ist zumindestens einer der Punkte der offenen Kugel ein stationarer Punkt der Funktion. 7. Beweisen Sie, dass die Funktion
fix,y) =
iy-x^){y-3x^)
kein Extremum ini Ursprung besitzt, obwohl jede Einschrankung auf jede Gerade durch den Ursprung in diesem Punkt ein lokales Minimum besitzt. 8. Die Methode der kleinsten Quadrate. Dies ist eine der verbreitetsten Methoden zur Verarbeitung von Beobachtungsergebnissen. Sie funktioniert folgendermaflen: Angenommen, wir wissen, dass die physikalischen Groflen x und y linear voneinander abhangen: y = ax + b. (8.79) Oder angenommen, ein empirisches Gesetz dieser Art sei auf Grund von experimentellen Daten aufgestellt worden. Wir wollen annehmen, dass n Beobachtungen gemacht wurden, wobei jedesmal X und y gemessen wurden. Dies fiihrt uns zu n Wertepaaren xi,yi;. .. ;Xn,yn. Da die Messungen fehlerbehaftet sind, werden einige der Gleichungen fiir k G { ! , . . . , « } yk = axk + b , nicht gelten, selbst dann, wenn (8.79) stimmt, und zwar unabhangig von der Wahl der KoefRzienten o und 6.
8.4 Reelle Funktionen mehrerer Variabler
501
Unsere Aufgabe besteht nun darin, die unbekannten KoefRzienten a und h aus diesen Beobachtungsergebnissen sinnvoll zu bestimmen. Aufbauend auf der Analysis der Wahrscheinlichkeitsverteilung der Grofie der beobachteten Fehler stellte Gauss fest, dass die am besten geeigneten Werte fiir die KoefRzienten o und 6 fiir eine Menge von Beobachtungsergebnissen mit der Methode der kleinsten Quadrate bestimmt werden sollten: Sei Sk = (axk + b) — yk die Abweichung bei der k-ten Beobachtung. Die Zahlen a und b sollten dann so gewdhlt werden, dass die Grofie n
k= l
d.h. die Summe der Quadrate der Abweichungen, minimal ist. a) Zeigen Sie, dass uns die Metliode der kleinsten Quadrate fiir (8.79) zu folgendem linearen Gleicliungssystem
{
[xk,Xk]a + [xk, l]b = [xk,yk],
[l,Xk]a+[l,l]b = [l,yk] zur Bestimmung der Koeffizienten o und 6 fiilirt. Hierbei schreiben wir, wie Gauss, [xk,Xk] ••= x\x\ + • • • + x„x„, \x],,\\ := xi • 1 + • • • + a;„ • 1, \x],,y],\ := xiyi + • • • + Xnyn und so weiter. b) Formulieren Sie das Gleicliungssystem fiir die Zahlen a i , . . . , Om, b, die wir nach der Methode der kleinsten Quadrate erhalten, wenn (8.79) durch die Gleichung y
y Uix' + h
zwischen x^,..., x^ und y ersetzt wird (in Kurzform y = Uix' + h). c) Wie kann die Methode der kleinsten Quadrate eingesetzt werden, um die empirischen Formeln der Form ai
y — cx-^
an
• '' Xji
zu bestimmen, um so einen Zusammenhang zwischen den physikalische Groflen xi,...,Xm und y herzustellen? d) (M. Germain.) Die Frequenz R der Herzkontraktionen wurde bei verschiedenen Temperaturen T bei verschiedenen Spezies Nereis diversicolor gemessen. Die Frequenzen sind relativ zur Kontraktionsfrequenz bei 15° C in Prozenten formuliert. Temperatur, ° C
Frequenz, %
Temperatur, ° C
Frequenz, %
0 5 10 15
39 54 74 100
20 25 30
136 182 254
Die Abhangigkeit der Frequenz R von T scheint exponentiell zu sein. Finden Sie die Werte fiir die Konstanten A und b unter der Annahme, dass R = Ae*"^, so dass diese Konstanten am besten zu den experimentellen Ergebnissen passen.
502
8 Differentialrechnung mit Punktionen mehrerer Variabler
9.
a) Zeigen Sie, dass im Huygensschen Problem, das wir in Beispiel 5 untersucht haben, die Funktion (8.71) gegen Null strebt, wenn zumindest einer der Variablen mi,..., rrin gegen Unendlich gelit. b) Zeigen Sie, dass die Funktion (8.71) einen Maximalwert in R" besitzt, und dass daher der eindeutige stationare Punkt dieser Funktion in R" ein Maximum sein muss. c) Zeigen Sie, dass die durch (8.72) definierte Grofie v mit n monoton anwachst und bestimmen Sie den Grenzwert fiir n —> oo.
10. Wahrend dem sogenannten aufieren Schleifen einer Scheibe wird das Schleifwerkzeug - eine schnell rotierende Schleifscheibe (mit einer scharfen Kante), die als Feile wirkt - mit der Plache eines runden Maschinenteils in Kontakt gebracht, das sich im Vergleich zur Scheibe langsam dreht (vgl. Abb. 8.3).
K
Die Scheibe K wird allmahlich gegen den Maschinenteil D gepresst, wodurch eine Metallschicht H entfernt wird. Dadurch wird das Werkstiick auf die notwendige Grofie reduziert und eine glatte Arbeitsflache erzeugt. In der Maschine, in der es eingebaut wird, ist diese Plache iiblicherweise eine Arbeitsflache. Um ihre Lebensdauer zu erhohen, wird das Werkstiick vorbereitend ausgegliiht, um den Stahl zu harten. Wegen der hohen Temperatur in der Kontaktzone zwischen dem Werkstiick und der Schleifscheibe konnen jedoch (und werden haufig) strukturelle Veranderungen im Metall des Werkstiicks bis zu einer Schichtdicke A auftreten, was zu einer geringeren Harte des Stahls in dieser Schicht fiihrt. Die Grofie A ist eine monotone Funktion der Starke s, mit der die Scheibe an das Werkstiick gepresst wird, d.h., A = (p{s). Es ist bekannt, dass es eine gewisse kritische Starke so > 0 gibt, bei der noch die Gleichung A = 0 gilt, wohingegen A > 0 fiir s > so ist. Piir die folgende Diskussion fiihren wir der Bequemlichkeit halber die Relation s = 'iP{A) ein, die zu der gerade formulierten invers ist. Diese neue Gleichung ist fiir A > 0 definiert. Hierbei ist ^ eine monoton anwachsende Funktion, die experimentell bekannt ist, mit V'(O) = So > 0.
8.4 Reelle Funktionen mehrerer Variabler
503
Der Schleifvorgang muss so ausgefiihrt werdeii, dass keine zufalligen strukturellen Veranderungen im Metall an der Oberflache erzeugt werdeii. a) Fiir die Geschwindigkeit des Herstellungsprozesses ware unter diesen Bedingungen der optimale Schleifmodus eine Anzahl von Veranderungen der Anpressstarke s der Schleifscheibe, fiir die s = ^(5) ,
wobei S = S{t) die Starke der Metallschicht ist, die bis zur Zeit t noch nicht entfernt wurde oder, was dasselbe ist, der Abstand zwischen der Kante der Scheibe zur Zeit t und der Endflache des Werkstiicks. Erklaren Sie dies. b) Bestimmen Sie die Zeit, die notig ist, urn eine Schicht der Starke H zu entfernen, wenn die Anpressstarke der Scheibe optimal angepasst wird. c) Bestimmen Sie die Abhangigkeit s = s{t) der Anpressstarke mit der Zeit bei lb
optimaler Bedienung, unter der Voraussetzung, dass die Funktion A i—>• s linear ist: s = So + A/i. Auf Grund der strukturellen Eigenscliaften gewisser Sclileifmaschinen kann die Anpressstarke s nur diskret verandert werden. Dies stellt uns vor das Problem, die Prozessproduktivitat unter der zusatzlichen Bedingung, dass nur eine feste Anzahl n von Einstellung fiir die Anpressstarke s zulassig ist, zu optimieren. Die Antworten auf die folgenden Fragen ergeben ein Bild fiir die optimale Bedienung. H
d) Welche geometrische Interpretation lasst sich fiir die Schleifzeit t{H) = f J ^ , die Sie in Teil b) fiir die optimale kontinuierliche Veranderung der Anpressstarke s gefunden haben, geben? e) Welche geometrische Interpretation lasst sich fiir die Zeit, die bei einer Anderung von der optimalen kontinuierlichen Veranderung von s zur optimalen Bedienung bei schrittweiser Veranderung von s verloren wird, geben? f) Zeigen Sie, dass die Punkte 0 = x„+i < x„ < • • • < xi < xo = H des abgeschlossenen Intervalls [0, -ff], in denen der Anpressdruck verandert werden soUte, die Bedingungen
1 ip{xi+i)
ip{xi)
fl\' — ] {xi){xi - Xi-i) VV"
{i =
l,...,n)
erfiillen muss, und dass folglich zwischen Xi und Xi+i der Anpressdruck der Scheibe die Form s = tl)(xi+i), (i = 0,... ,n) besitzt. g) Zeigen Sie, dass im linearen Fall, wenn ip{A) = so + XA, die Punkte Xi (aus Teil f)) auf dem abgeschlossenen Intervall [0, H] so verteilt sind, dass die Zahlen So ^ So
^ So
^ So
eine geometrische Progression bilden. 11.
a) Zeigen Sie, dass die Tangente an die Kurve F : I ^ R"* invariant von der Wahl des Koordinatensystems in R™ definiert ist. b) Zeigen Sie, dass die Tangentialebene an den Graphen S einer Funktion y = f{x^,..., x"^) invariant von der Wahl des Koordinatensystems in R™ definiert ist.
504
Differentialrechnung mit Punktionen mehrerer Variabler
^^ sei der Graph einer Punktion y c) Angenommen, die Menge S C l^. Zeigen Sie, dass in den Koordinaten (x ,i"',y) in fix' die Tangentialebene an S gegen eine lineare Veranderung der Koordinaten in invariant ist. d) Zeigen Sie, dass der Laplace-Operator Af = ^ -^-fiix) gegen orthogonale Ko ordinatentransformationen in
invariant definiert ist.
8.5 Der Satz zur impliziten Funktion 8.5.1 P r o b l e m s t e l l u n g u n d vorlaufige B e t r a c h t u n g e n In diesem Abschnitt werden wir den Satz zur impliziten Funktion beweisen, der sowohl intrinsisch als auch wegen seiner zahlreichen Anwendungen wichtig ist. Wir wollen zunachst das Problem erklaren. Angenommen, uns liegt z.B. die Bezieliung a;2 + 2/2 _ 1 = 0 (8.80) zwischen den Koordinaten x, y von P u n k t e n in der Ebene M^ vor. Die Menge der P u n k t e in M^, die diese Bedingung erfiillt, bildet den Einheitskreis (s. Abb. 8.4).
A b b . 8.4. Am Beispiel der Gleicliung (8.80) konnen wir selien, dass wir nach Fixierung einer der Koordinaten, z.B. x, die zweite Koordinate nicht langer frei wahlen konnen. Daher wird durcli (8.80) eine Abhangigkeit zwischen y und X vorgegeben. Uns interessiert die Frage nach den Bedingungen, unter denen die implizite Gleichung (8.80) zu einer expliziten funktionalen Abhangigkeit y = y{x) aufgelost werden kann. Wenn wir (8.80) nach y auflosen, erhalten wir y
±VT
5.81)
8.5 Der Satz zur impliziten Punktion
505
d.h., zu jedem Wert von x mit |a;| < 1 gibt es zwei zulassige Werte von y. Bei der Bildung einer funktionalen Relation y = y{x), die (8.80) erfiillt, konnen wir ohne zusatzliche Anforderungen nicht einen der moglichen Werte (8.81) bevorzugen. So erfiillt beispielsweise die Funktion y{x), die den Wert + V l — x^ in rationalen Punkten des abgesclilossenen Intervalls [—1,1] annimmt und den Wert —Vl — x^ in irrationalen Punkten, die Gleichung (8.80). Es ist klar, dass wir durch kleine Veranderungen unendlich viele funktionale Relationen, die (8.80) erfiillen, aufstellen konnen. Die Frage, ob die in W" durch (8.80) definierte Menge dem Graphen einer Funktion y = y{x) entspricht, besitzt ofFensichtlich eine verneinende Antwort, da sie aus geometrischer Sicht aquivalent ware zur Frage, ob es eine direkte eins-zu-eins Projektion eines Kreises auf eine Strecke gabe. Aber Beobachtungen (vgl. Abb. 8.4) legen nichtsdestotrotz nahe, dass es moglich ist, in einer Umgebung eines bestimmten Punktes {xo,yo) eine Art eins-zu-eins Beziehung zwischen dem Kreisbogen und der x-Achse aufzustellen und dass diese eindeutig als y = y{x) formuliert werden kann, wobei x H^ y{x) eine in einer Umgebung des Punktes XQ stetige Funktion ist, die in XQ den Wert 2/0 annimmt. In dieser Hinsicht sind nur (—1,0) und (1,0) problematische Punkte, da sich kein Kreisbogen, in dem diese Punkte innere Punkte sind, einszu-eins auf die a;-Achse projizieren lasst. Trotzdem sind Umgebungen dieser Punkte auf dem Kreis relativ zur y-Achse wohl angeordnet und lassen sich als Graph einer Funktion x = x{y), die in einer Umgebung des Punktes 0 stetig ist und die Werte —1 bis 1 annimmt, darstellen, wenn der fragliche Bogen den Punkt (-1,0) bzw. (1,0) enthalt. Wie konnen wir analytisch herausfinden, ob eine geometrische Anordnung von Punkten, die durch eine Relation wie (8.80) definiert ist, in einer Umgebung eines Punktes {xo,yo) in der Form einer expliziten Funktion y = y{x) oder X = y{x) dargestellt werden kann? Wir werden diese Frage mit Hilfe der folgenden, nun bereits bekannten, Methode untersuchen. Ausgangspunkt ist eine Funktion F{x, y) = x"^ +y'^ — 1. Das lokale Verhalten dieser Funktion in einer Umgebung eines Punktes {xo,yo) wird durch ihr Differential Ki^o,yo)ix
-xo) + Fy{xo,yo){y - Vo)
wohl definiert, da F{x,y) = F{xo,yo) + F^{xo,yo)ix - XQ) + + Fy{xo,yo){y - yo) + o{\x - xo\ + \y - yo\) fiir {x,y) -^ {xo,yo). Ist F{xo,yo) = 0 und sind wir am Verhalten der Niveaukurve F{x,y)=0
der Funktion in einer Umgebung des Punktes {xo,yo) interessiert, konnen wir dieses Verhalten aus der Lage der (Tangente) Geraden
506
8 Differentialrechnung mit Punktionen mehrerer Variabler Ki^o,yo)ix
-xo) + Fy{xo,yo){y - yo) = 0
(8.82)
beurteilen. Da die Kurve F{x,y) = 0 sich in einer Umgebung des Punktes (a;o,2/o) nur sehr wenig von dieser Geraden unterscheidet, kann auch F in einer Umgebung des Punktes (a;o,2/o) in der Gestalt y = y{x) geschrieben werden, falls die Gleichung der Geraden (8.82) nach y aufgelost werden kann. Dieselben Uberlegungen mit der lokalen Losbarkeit von F{x,y) = 0 lassen sich auch fiir x anstellen. Wenn wir (8.82) fiir den Spezialfall (8.80) schreiben, gelangen wir zu folgender Gleichung fiir die Tangente: xo{x - xo) + yo{y - y^) = 0 .
Diese Gleichung lasst sich stets nach y auflosen, wenn yo ^ 0, d.h. in aUen Punkten des Kreises (8.80), aui3er in (—1,0) und (1,0). Sie ist in aUen Punkten des Kreises, aui3er in (0, —1) und (0,1), nach x auflosbar. 8.5.2 Eine einfache Version des Satzes zur impliziten Funktion In dieseni Abschnitt werden wir den Satz zur impliziten Funktion auf eine sehr intuitive, aber nicht sehr konstruktive Methode erhalten, die sich nur fiir Funktionen mit reellen Werten iibernehmen lasst. Der Leser findet eine weitere Methode zur Herleitung dieses Satzes, die in mehrfacher Hinsicht vorzuziehen ist, zusammen mit einer detaillierteren Analyse seiner Struktur in Kapitel 10 (Teil 2), sowie in Aufgabe 4 am Ende dieses Abschnitts. Der folgende Satz ist eine einfache Version des Satzes zur impliziten Funktion. Satz 1. Sei F : U{xo,yo) —>• M eine in einer Umgebung U{xo,yo) des Punktes {xo,yo) € M^ definierte Funktion, mit 1° F e C(P)(C/;M) furp> 1, 2^^ F{xo,yo) = 0, 3°F;(a;o,2/o)y^O. Dann existiert ein zwei-dimensionales Intervall I = Ix x ly mit Ix = {xGR\\x-xo\
und
ly = {y &'&{ \y - yo\ < P} ,
das eine Umgebung des Punktes {xo,yo) ist, die in U{xo,yo) enthalten ist. Ferner existiert eine Funktion f £ C^^'(Ix', ly), so dass F{x,y)=0^y
= f{x)
(8.83)
fiir jeden Punkt {x,y) G Ix x ly, und die Ableitung der Funktion y = f{x) in den Punkten x G Ix lasst sich wie folgt berechnen: f'(x)=-[F^{xJ(x))]-'[F:,{xJ{x))]
.
(8.84)
8.5 Der Satz zur impliziten Punktion
507
Bevor wir zum Beweis iibergehen, werden wir niehrere mogliche Umformulierungen der Folgerung (8.83) geben, wodurch die Bedeutung der Relation verstandlicher wird. Satz 1 besagt, dass unter den Voraussetzungen 1°, 2° und 3° der durch die Gleichung F{x, y) = 0 definierte Teil der Menge, der zur Umgebung 1^ x ly des Punktes {xo,yo) gehort, dem Graphen einer Funktion f : Ix ^ ly der Klasse C''P^Ix;Iy) entspricht. Anders formuliert, so konnen wir sagen, dass innerhalb der Umgebung / des Punktes (a;o,2/o) die Gleichung F{x,y) = 0 eine eindeutige Losung fiir y besitzt und dass die Funktion y = f{x) diese Losung ist, d.h., F{x, f{x)) = 0 auf Ix • Ist y = f{x) eine auf Ix definierte Funktion, von der wir wissen, dass sie die Gleichung F{x,f{x)) = 0 auf Ix erfiillt, dass /(XQ) = yo und dass diese Funktion im Punkt XQ € Ix stetig ist, dann folgt daraus wiederum, dass eine Umgebung A C Ix von XQ existiert, so dass f{A) C ly und dass dann f{x) = f{x) fiir X & A. Ohne die Annahme, dass die Funktion / im Punkt XQ stetig ist und der Bedingung, dass f{xo) = yo, konnte diese letzte Folgerung falsch sein, wie wir am bereits untersuchten Beispiel des Kreises erkennen konnen. Wir woUen nun Satz 1 beweisen. Beweis. Der Klarheit halber nehmen wir an, dass Fy{xo,yo) > 0. Da F £ C(^'(C/;ffi), folgt, dass auch in einer Umgebung von {xo,yo) gilt, dass Fy{x,y) > 0. Um keine neue Schreibweise einfiihren zu miissen, konnen wir ohne Verlust der Allgemeinheit annehmen, dass in jedem Punkt der urspriinglichen Umgebung U{xo,yo) gilt, dass Fy{x,y) > 0. AuBerdem konnen wir annehmen, wenn wir die Umgebung C/(a;o,2/o) falls notwendig einschranken, dass sie eine Scheibe vom Radius r = 2(] > 0 mit Zentrum in {xo,yo) ist. Da Fy{x,y) > 0 in [/, ist die Funktion F{xo,y) definiert und als Funktion von y auf dem abgeschlossenen Intervall yo—P
F{xo,yo) = 0 < F{xo,yo + P) .
Auf Grund der Stetigkeit der Funktion F in U existiert eine positive Zahl a < P, so dass die Ungleichungen F{x,yo-p)<0
und
ly = {y e^ly
- yo)\ < P} ,
das gesuchte zwei-dimensionale Intervall ist, in dem (8.83) gilt.
508
8 Differentialrechnung mit Punktionen mehrerer Variabler
Zu jedem x G Ix halten wir das vertikale abgeschlossene Intervall mit den E n d p u n k t e n {x,yo — /3), {x,yo + /3) fest. Wenn wir F{x,y) als Funktion von y auf diesem abgeschlossenen Intervall betracliten, erhalten wir eine streng anwaclisende stetige Funktion, die in den E n d p u n k t e n des Intervalls verschiedene Vorzeichen besitzt. Folglicli existiert fiir jedes x G Ix ein eindeutiger P u n k t y{x) £ ly, so dass F(^x,y{x)) = 0. Wenn wir darin y{x) = f{x) setzen, gelangen wir zu (8.83). Wir woUen nun zeigen, dass / £ C''P\lx;Iy)Wir beginnen mit dem Nachweis, dass die Funktion / in XQ stetig ist und dass / ( X Q ) = yo- Diese Gleicliung folgt offensiclitlich daraus, dass fiir X = XQ ein eindeutiger P u n k t y{xQ) £ ly existiert, so dass F{xQ,y{xQ)) = 0. Gleiclizeitig ist F(a;o,2/o) = 0 und somit ist / ( X Q ) = yoSei 0 < e < /3 gegeben. Nun konnen wir den Existenzbeweis der Funktion f{x) wiederholen und eine Zalil (5 > 0 finden mit 0 < (5 < a, so dass im zwei-dimensionalen Intervall I = Ix x ly, rnit IX = {XGR\\X-XO\<S}
und
iy =
{yGR\\y-yo\<s},
die Relation {F(x, y) = Om l) ^
{y = f{x), x G Ix)
(8.85)
fiir eine neue Funktion f : Ix ^ ly gilt. Da aber Ix C Ix, ly C ly und / C / , folgt aus (8.83) u n d (8.85), dass f{x) = f{x) fiir x G Ix C Ix- Wir liaben somit bewiesen, dass \f{x) — f{xo)\ = \f{x) - 2/01 < e fiir |a; - a;o| < 6. Wir haben nun gezeigt, dass die Funktion / im P u n k t XQ stetig ist. Aber jeder P u n k t (x, y) G / , in dem F{x, y) = 0 gilt, konnte als Ausgangspunkt der Konstruktion dienen, da die Bedingungen 2*^ u n d 3*^ in diesem P u n k t gelten. Wenn wir diese Konstruktion innerhalb des Intervalls / ausfiiliren, wiirden wir wiederum iiber (8.83) zum entsprechenden Teil der Funktion / gelangen, die in einer Umgebung von x betraclitet wird. Daher ist die Funktion / in a; stetig. Somit haben wir gezeigt, dass / G C{Ix;Iy)Wir werden nun nachweisen, dass / G C^^\lx;Iy) und dass Gleichung (8.84) gilt. Die Zalil Ax sei so gewahlt, dass x + Ax G Ix- Sei y = f{x) u n d y + Ay = f{x + Ax)- Wenn wir den Mittelwertsatz fiir die Funktion F{x,y) innerhalb des Intervalls / anwenden, erhalten wir 0 = F{x + Ax, fix + Ax)) - F{x, f{x))
=
= F{x + Ax, y + Ay) - F{x, y) = = F'^{x + eAx,y
+ eAy)Ax
+ F'y{x + eAx,y
woraus wir unter Beriicksichtigung von F'{x,y)
+ eAy)Ay
(0 < 6* < 1) ,
7^ 0 in / erhalten, dass
Ay _
F^{x + 9Ax,y
Ax
F^ (x + OAx, y + 9 Ay)
+ 9Ay)
(8.86)
8.5 Der Satz zur impliziten Punktion
509
Da / £ C{Ix]Iy), folgt, dass Ay -^ 0 fiir Ax —>• 0 und wir erhalten unter Beriicksichtigung von F £ C^^HU;W) fiir Ax ^ 0 in (8.86), dass
^^'~
F;^ix,y)'
wobei y = f{x) gilt. Somit ist (8.84) bewiesen. Nach dem Satz zur Stetigkeit einer verketteten Funktion folgt aus (8.84), dass/eCW(4;/j,). Ist F e C(^)(C/;ffi), dann kann die reclite Seite in (8.84) nach x abgeleitet werden, und wir erhalten, dass t"(q.\
—
K
+ K'y - ^ KlKy + K'v xy •J .f'i^)]K y-^Ji-^y xl-^ xy ^-^ yy •J f'i^)] V-^/J
i XX ^-^
/^
c,n\
wobei F^, Fy, F^'^, F^'y und F^'y alle im Punkt (x,/(x)) berechnet werden. Somit ist / e C^'^Hl^-Jy), falls F £ C(2)([/;M). Da der Grad der Ableitungen von / auf der rechten Seite von (8.84), (8.84') und so weiter um eins geringer ist als der Grad auf der linken Seite der Gleichung, erhalten wir durch Induktion, dass / e C ( P ) ( 4 ; J^^), falls F £ C(P)(C/; K ) . D Beispiel 1. Wir woUen zur oben untersuchten Gleichung (8.80), die einen Kreis in K^ beschreibt, zuriickkehren und Satz 1 fiir dieses Beispiel beweisen. In diesem Fall ist F(x,2/)=a;2 + y 2 _ i
und es ist offensichthch, dass F G (7^°°'(ffi^; ffi). Als Nachstes erhalten wir F^{x,y) = 2x und F'{x,y) = 2y , so dass Fy{x,y) ^ 0 fiir y ^ 0. Daher gibt es nach Satz 1 fiir jeden Punkt {xo,yo) des Kreises, aui3er fiir die Punkte (—1,0) und (1,0), eine Umgebung, so dass der in dieser Umgebung enthaltene Kreisbogen in der Form y = f{x) geschrieben werden kann. Direkte Berechnung bestatigt, dass f{x) = V l — x^ oder f{x) = — \ / l — x^. Als Nachstes gilt nach Satz 1, dass Xo
Fli(xo,yo)
(8.87)
2/0 '
Direkte Berechnung fiihrt uns zu
fix) = <
r, ^ , fur f{x) = V l - a;2 V l — x'' = -^/l
^ yl — x/ was sich als einfacher Ausdruck
-
a;2
510
8 Differentialrechnung mit Punktionen mehrerer Variabler
n^)
y
fix)
schreiben lasst. Die direkte Berechnung fiihrt uns daher auf dasselbe Ergebnis
f'M = -^ 2/0
wie in (8.87), das wir aus Satz 1 erhalten haben. Wir woUen betonen, dass uns (8.84) und (8.87) ermoglichen, f'{x) zu berechnen, ohne auch nur einen expliziten Ausdruck fiir y = f(x) zu kennen, solange wir wissen, dass / ( X Q ) = yo- Die Bedingung yo = f{xo) muss jedoch erfiillt sein, um auch tatsachlich den gewiinschten Teil der Niveaukurve F{x,y) = 0 in der Form y = f{x) zu beschreiben. Aus dem Beispiel des Kreises ist klar, dass die alleinige Vorgabe der Koordinate XQ nicht einen der Kreisbogen bestimmt, sondern nur die gemeinsame Vorgabe von XQ und yo erlaubt es, zwischen einem der beiden moglichen Bogen klar zu unterschieden. 8 . 5 . 3 U b e r g a n g zur G l e i c h u n g F{x^,...,
a;"*, y ) = 0
Der folgende Satz ist eine einfache Verallgemeinerung von Satz 1 fiir den Fall einer Gleichung F{x^,... ,x"^,y) = 0 . S a t z 2 . Gilt fiir eine Funktion des Punktes
F :[/—>• ffi, die in einer Umgebung U C M™"'"^
{xo,yo) = (XQ, ... ,a;™,2/o) £ K™^^ definiert
1° F e C(P)(C/;M), 2^^ F{xo,yo) ?P
ist, dass
p>l,
=
F{xl...,x^,yo)=0, Fl{xo,yo)=Fl{xl...,x^,yo)i^Q,
dann existieren
ein (m + l)-dimensionales
Intervall
I = I^
x ly
mit
7™ = {a; = ( a ; \ . . . , a ; ™ ) e M" | |a;* - 4 | < a ' i = 1 , . . . , m }
und
II = { 2 / G K | | 2 / - 2 / o | < / 3 } , das eine Umgebung des Punktes {xo,yo) hildet und in U enthalten ist, und eine Funktion f G C^P'{I^;Iy), so dass fiir jeden Punkt {x,y) £ I^ x ly gilt: F{x\...,x"',y)
= 0<^y
Die partiellen Ableitungen der Funktion von Ix lassen sich wie folgt herechnen: ^^i;,)
= f(x\...,x"').
(8.88)
y G f{x^,...,x"^)
= -[F'y{x,f{x))]-'[Fl.{x,f{x))]
in den
.
Punkten
(8.89)
8.5 Der Satz zur impliziten Punktion
511
Beweis. Der Beweis der Existenz des Intervalls /™+i = I^ x ly und der Existenz der in 7™ stetigen Funktion y = f{x) = / ( x ^ , . . . ,a;™) ist eine wortwortliche Wiederholung des entsprechenden Teils des Beweises von Satz 1. Dabei andert sich nur eine Kleinigkeit, namlich dass das Symbol x nun als ( a ; ^ , . . . , a;™) zu interpretieren ist und a als ( a ^ , . . . , a™). Wenn wir nun alle Variablen in den Funktionen F(x^,... ,x"^,y) und / ( a ; ^ , . . . jX™) auBer a;* und y festhalten, erfiillen wir die Voraussetzungen von Satz 1, wobei nun die Variable a;* die Rolle von x spielt. Daraus folgt (8.89). Aus dieser Gleicliung ist klar, dass g ^ £ C(I^;Iy), (i = l , . . . , m ) , d.h., / e C ( i ) ( / ™ ; / i ) . Durch liberie gungen wie im Beweis von Satz 1 konnen wir durch Induktion zeigen, dass / e C^P'> ( / ^ ; 4 ) fiir F £ C^P) (U; K ) . D Beispiel 2. Angenomnien, die Funktion _F : G —^ M sei in eineni Gebiet G C M™ definiert und gehore zur Klasse C^^^ (G; M) und fiir XQ = (a;J,... ,a;™) € G gelte F{xo) = F ( a ; J , . . . ,a;™) = 0. Ist XQ kein stationarer P u n k t von _F, dann ist zuniindestens einer der partiellen Ableitungen von F ^ 0. in XQ ungleicli Null. Sei etwa £^{xo) Dann lasst sich nach Satz 2 in einer Umgebung von XQ die durch die Gleichung F{x^,... ,x™) = 0 definierte Teilmenge von M™ als Graph einer Funktion a;™ = f{x^, • • • ,a;™~^) verstehen, die in einer Umgebung des Punktes (a;J,... ,a;™~^) € K™~^ definiert und stetig differenzierbar ist und fiir die /(a;J,...,x™-i)=a;^gilt._ Daher definiert die Gleichung F{x\...,x"')
=0
in einer Umgebung eines nicht stationaren P u n k t e s XQ von F eine (m — 1)dimensionale Flache. Insbesondere definiert fiir ffi^ die Gleichung F{x,y,z)=i) in einer Umgebung eines nicht stationaren P u n k t e s {xQ,yQ,ZQ), der diese Gleichung erfiillt, eine zwei-dimensionale Flache, die, wenn die Bedingung ^{xo,yo,zo) ^ 0 erfiillt ist, lokal als
z = fix.y) geschrieben werden kann. Wie wir wissen, lautet die Gleichung fiir die Tangentialebene an den Graphen dieser Funktion im P u n k t {xQ,yQ,ZQ): z - ZQ = —{xo,yo){x Nun ist aber nach (8.89)
- XO) + •^{xo,yo){y
- yo) .
512
8 Differentialrechnung mit Punktionen mehrerer Variabler
ox
F!,(xo,yo,zo)
ay
F!,(xo,yo,zo)
und daher konnen wir die Gleichung der Tangentialebene neu schreiben: Kixo,yo,zo)ix
-xo)
+ Fy{xo,yo,zo){y
- yo) + F!,{xo,yo,zo){z
- ZQ) = 0 .
Diese Gleichung ist in den Variablen x,y,z symmetrisch. Fiir den Allgemeinfall erhalten wir auf ahnliche Weise die Gleichung m
j2K'M{x'-xi,) = o i=l
der Hyperebene in M™, die im P u n k t XQ = ( a ; J , . . . , x ™ ) die Tangente an die Flache ist, die durch die Gleichung F{x^,... ,a;™) = 0 beschrieben wird (natiirlich unter den Annahmen, dass F{xo) = 0 und dass XQ ein nicht stationarer P u n k t von F ist). Aus diesen Gleichungen konnen wir erkennen, dass wir in der euklidischen Struktur des ffi™ sichersteUen konnen, dass der Vektor /• dF
dF \
gradFM=(^,...,^jM zur r-Niveauflache F{x) = r der Funktion F in einem entsprechenden P u n k t XQ orthogonal ist. So ist beispielsweise fiir die in M^ definierte Funktion 9
*?
9
^, . X y z F{x,y,z) = — + 75" + — a^ 0^ c^ die r-Niveauflache fiir r < 0 gleich der leeren Menge, fiir r = 0 ein einzelner P u n k t und das Elhpsoid 9
fiir r > 0. Ist {xo,yo,zo) Bewiesenen der Vektor
9
9
X y z _ d^ b'^ c^ ein P u n k t auf diesem Ellipsoid, dann ist nach dem
gradF(xo,2/o,^o) = ( ^ ^ - ,
&2'
'
c2 y
im P u n k t {xQ,yQ, ZQ) ZU diesem Ellipsoid orthogonal u n d die Gleichung fiir die Tangentialebene in diesem P u n k t lautet XQ{X-XQ) a^
yojy -yo) IP-
zpjz - zp) ^ ^ c^
Wenn wir beriicksichtigen, dass der P u n k t {xQ,yQ,zo) auf dem Ellipsoid liegt, kann die Gleichung neu geschrieben werden als XQX
a?
yoy IP-
ZQZ
c?
_
8.5 Der Satz zur impliziten Punktion
513
8.5.4 Der Satz zur impliziten Funktion Wir wenden uns nun dem Allgemeinfall eines Gleichungssystems ' Fl(a;^...,a;™,2/^...2/") = 0 , <
(8.90)
^F"{x\...,x"',y\...,y")
= 0
zu, das wir nach y^,... ,y" auflosen werden, d.h., wir finden folgendes System von funktionalen Gleichungen ryi
fHx' 5.91)
rix^
{y"
das lokal zum System (8.90) aquivalent ist. Der Kiirze halber, zur Ubersichtlichkeit beim Schreiben und zur Klarheit bei der Aussage wollen wir vereinbaren, dass x = (x^,... ,a;™) und Wir werden die linke Seite des Systems (8.90) als F{x,y) y = {y^,...,y"). schreiben, das Gleichungssystem (8.90) als F{x,y) = 0 und das System (8.91) als y = fix). Ist xo = {xl,...,xl^)
,
«=(«!,...,a™),
yo = {yl,...,yS)
,
/?=(/?!,...,r),
dann bedeutet die Schreibweise |a; —XQ] < « oder \y — yo\
fi^)
(x) ,
5.92)
ix,y)
5.93)
\dx^
f dF^ dx^
dF^ \ i9x™
KX^.y) Qpn
\ dx^
dF" i9x™ /
514
Differentialrechnung mit Punktionen mehrerer Variabler Qyl
QyT.
Ki^,y)
ix,y) OF'-
5.94)
OF"
'dr J Wir merken an, dass die Matrix F'y{x,y) quadratisch ist und daher genau dann invertierbar, wenn ihre Deterniinante ungleich Null ist. Fiir n = 1 lasst sie sich auf ein Element reduzieren, und dann ist die Invertierbarkeit von F'y{x,y) aquivalent zur Bedingung, dass dieses einzelne Element ungleich Null ist. Wie iiblicli bezeichnen wir die Inverse zur Matrix F^(a;, y) mit [F^(a;, y)\ Wir formulieren nun das Hauptergebnis dieses Abschnitts. Satz 3. (Satz zur impliziten Funktion). Gilt fur die in einer Umgebung U des Punktes {xo,yo) £ K™+" definierte Abbildung F : [ / - ) • K", dass 1° F e C(P)(C/;M"),p> 1, 2*^ F{xo,yo) = 0 und dass 3*^ F'{xo,yo) eine invertierbare Matrix ist, dann existiert ein (m + n)-dimensionales Intervall I = /™ x I^ dU, / " = {a; e M" I |a; - xo\ < a}
und
r
mit
{2/eK"||2/-2/o|?}
y
und eine Abbildung f £
C'-P\I^;I^),
SO
F{x,y) =0^y
dass = fix)
(8.95)
fiir jeden Punkt {x,y) £ I™ x ly, und es ist: f'(x)=-[Fl{xJ(x))]-'[F^{x,f{x))]
5.96)
Beweis. Der Beweis dieses Satzes baut auf Satz 2 und den grundlegenden Eigenscliaften von Determinanten auf. Wir werden ilin in Scliritte einteilen und mit Induktion argumentieren. Fiir n = 1 stimmt der Satz mit Satz 2 iiberein und ist daher wahr. Angenommen, der Satz gelte fiir die Dimension n — 1. Wir werden zeigen, dass er dann auch fiir die Dimension n gilt. a) Nach Voraussetzung 3° ist die Determinante der Matrix (8.94) im Punkt {xo,yo) G M'"+" ungleich Null und daher auch in einer Umgebung des Punktes {xo,yo)- Folglich ist zumindest eines der Elemente der letzten Reihe dieser Matrix ungleich Null. Wir konnen ohne Einschrankung annehmen, dass das dF" Element —— ungleich Null ist. ay"
8.5 Der Satz zur impliziten Punktion
515
b) Wenn wir nun Satz 2 auf die Gleichung F"(a;\...,a;™,2/S...,2/") = 0 anwenden, erhalten wir ein Intervall /™+" = (/™ x Iy~^) x ll dU und eine Funktion / £ C^^)(/™ x ly'^-Jl) , so dass ( F " ( a ; \ . . . , X™, y\...,y") ^
= 0 in/"+")
^
(2/" = / V , . . . , x ™ , 2 / i , . . . , 2 / " - i ) , (a;i,..., a;™) e 4™, (2/S . . . , 2/""^) £ 4""') • (8-97)
c) Wenn wir den sich ergebenden Ausdruck y" = f{x, y^,..., y""^) fiir die Variable y" in die ersten n — 1 Gleichungen von (8.90) einsetzen, erhalten wir n — 1 Gleichungen ''
= F^{x\...,x"',y\...,y"-\
f{x^,...
,x"^,y\
... ,y"-^))
=0,
<
= F " - i {x\...,x"^,y\..., Dabei ist klar, dass
:=
y"-\
f{x^,...
C ( P ) ( / ™ X I^-^;R)
,x"^,y\
..., y"'^))
= 0. (8.98)
, (« = 1 , . . . ,n - 1) und
^=a7+a^-a^'
(^'^ = i ' - ' - i ) -
(8-99)
Wenn wir ferner $"{x\...,x"',y\...,y"-'):= =
F-{x\...,x"',y\...,y^-\!{x\...,x^,y\...,y^-^))
setzen, erhalten wir mit (8.97), dass ^ " = 0 in ihrem Definitionsbereich und daher Q^n
Qpn
Qpn
Qf
Wenn wir die Gleichungen (8.99) und (8.100) zusammen mit den Eigenschaften von Determinanten beriicksichtigen, konnen wir nun beobachten, dass die Determinante der Matrix (8.94) zur Determinante der Matrix
Differentialrechnung mit Punktionen mehrerer Variabler
516
'
\
ai?l
df
Qyl
+ Qytl
Qpn
Qpn
Qj
Qpn
dy^
Qyn-l
dy^
Qyl
dy"
dy
ai?l
df
Qyti
Qyn-l
Qpn
+'
Qyn
ai?l N^ Qyti
df
Qpn
Qyn-l
QyU J
a
Q^n
dy^ 0
V gleich ist. Nach unserer Annahnie ist
Qyn-l
dF^ Qy%
d$ n — 1 OF n — 1 Qyn-l
0
dy" Qpn
dy"
I
Qpn
^ 0 und daher ist die Determidy" nante der Matrix (8.94) ungleich Null. Folglicli ist in einer Umgebung von Determii ( a ; J , . . . , a;™, 2/o,... 2/Q ^) die Determinante der Matrix
( df_ Qyn-l
dy^
,a;™,2/\
d$,n —1 V
Q(l>n-1
dy"-^ J
dy^
ungleich Null. Dann existieren nach der Induktionsannahme ein Intervall / ™ + " - i = I™ X Iy~^ C /™ X iy~^, das eine Umgebung von ( a ; J , . . . , x™, ^ g , . . . , y j ~^) i^i M " - i ist und eine Abbildung / e C ( P ) ( / ™ ; / ^ " i ) , so dass das System (8.98) auf dem Intervall / ™ + " - i = /™ x Iy~^ zu folgenden Gleichungen aquivalent ist: ^y^=fix\...x"') (8.101)
U
n-l
n-l(^l f"-\x
d) Da I" ^ C ly ^ und /™ C /™, erhalten wir nach Substitution von / ^ , . . . , / " ~ aus (8.101) fiir die entsprechenden Variablen in der Funktion y" =
fix'
.,x™,2/i,
,y
n — l\
aus (8.97) folgende Gleichung y" = zwischen y" und (x^,...,
a;™).
f"(x'
,x™)
(8.102)
8.5 Der Satz zur impliziten Punktion
517
e) Wir wollen nun zeigen, dass das System
<
a;e/f
(8.103)
_y» = /»(a;l,...,x™) in der Umgebung /™+" = I^ x ly zum Gleichungssystem (8.90) aquivalent ist. Das System (8.103) definiert eine Abbildung / e C^P\I^;II^), mit I^ = Wir begannen innerhalb von /™+" = (/™ x / " ^) x ly mit dem Ersetzen der letzten Gleichung des Ausgangssystems (8.90) durch die Gleichung 2/" = f{x,y^,... ,2/"~^), die auf Grund von (8.97) zu ihr aquivalent ist. Aus dem zweiten so erhaltenen System gingen wir zu einem dritten, dazu aquivalenten, System iiber, indem wir die Variable y" in den ersten n — 1 Gleichungen durch f{x,y^,... ,y"~^) ersetzten. Wir ersetzten dann die ersten n — 1 Gleichungen (8.98) des dritten Systems innerhalb /™ x Iy~^ C I™ x Iy~^ durch die Gleichungen (8.101), die dazu aquivalent sind. Auf diese Weise gelangten wir zu einem vierten System, von dem wir in das abschlieBende System (8.103), das innerhalb von I™ x Iy~^ ^ ^y = 7™+" dazu aquivalent ist, wechselten, indem wir die Variablen y^,... ,y"~^ durch die Ausdriicke (8.101) in der letzten Gleichung y" = f{x^,...,x"^,y^,...,y"-~^) des vierten System ersetzt haben, was uns zu (8.102) als letzte Gleichung fiihrte. f) Um den Beweis des Satzes abzuschhei3en, verbleibt nur noch der Beweis von Gleichung (8.96). Da die Systeme (8.90) und (8.91) in der Umgebung I™ x ly des Punktes {xo,yo) aquivalent sind, folgt, dass F{xJ(x))
= 0 , fiirx e l ™ .
In Koordinaten bedeutet dies, dass im Gebiet 7™ gilt, dass
F'' {x\ ... ,x"', fix\
... ,x"'),...
J"ix\
... ,a;")) = 0 , (fc = l , . . . , n ) . (8.104)
Da / e C'^PHI^]!];) und F £ C ( P ) ( C / ; K " ) mit p > I, folgt, dass F(-,/(-)) e C(P)(/™;K") und wir erhalten durch Ableiten der Gleichung (8.104), dass
fJ +Ef--|^=«.
»=1
«;i = l..^.™)^
(8.105)
Die Gleichungen (8.105) sind offensichthch aquivalent zur Matrixgleichung Fl{x,y) + mit y = f{x).
F'y{x,y)-f{x)=Q
518
8 Differentialrechnung mit Punktionen mehrerer Variabler
Wenn wir die Invertierbarkeit der Matrix F'{x,y) in einer Umgebung des P u n k t e s (a;o,2/o) beriicksichtigen, gelangen wir aus dieser Gleichung zu
f{x)=-[F^{x,!{x))]-\F',{xJ{x))], und der Satz ist damit voUstandig bewiesen.
D
8.5.5 U b u n g e n u n d A u f g a b e n 1. Auf der Ebene R^ mit den Koordinaten x und y ist eine Kurve durch die Gleichung F{x,y) = 0 definiert, wobei F £ C*^-'(R^,R). Sei {xo,yo) ein nicht stationarer Punkt der Funktion F{x, y) auf der Kurve. a) Formulieren Sie die Gleichung fiir die Tangente an die Kurve im Punkt {xo,yo). b) Zeigen Sie, dass dann, wenn {xo, yo) ein Wendepunkt der Kurve ist, die folgende Gleichung gilt: f[-^xx-'^y P" P ' ^ _ 9^-^xy-^x-^y P" P ' P ' -1" P ' ^ VJ -V-^O, r ' P ^yy-^x yOJ,,)—() —u .
c) Bestimmen Sie eine Forniel fiir die Kriimmung der Kurve im Punkt
(xo,yo).
2. Die Legendre-Transformation in m Variablen. Die Legendre-Transformation von x^,...,!"^ und der Funktion f{x^,...,x'") ist die Transformation zu den neuen Variablen ^ i , . . . ,$m und der Funktion f*{^i, • • • ,(,m), die durch die folgenden Gleichungen definiert sind: - ^, = §L(x\...,x"^)
{i =
r(ii,---,im) =
i=l
l,...,m),
j:iix'-f(x\...,xn-
(8.106)
a) Geben Sie eine geometrische Interpretation fiir die Legendre-Transformation (8.106), indem Sie sie als Ubergang von den Koordinaten {x^,...,x'", f{x^, • • • TX"^)) eines Punktes auf dem Graphen der Funktion f{x) zu den Parametern (^i,.. . ,£,m, f*(£,i, • • • ,Cm)), die die Gleichung der Tangentialebene an den Graphen in diesem Punkt definieren, interpretieren. b) Zeigen Sie, dass die Legendre-Transformation lokal moglich ist, wenn / £ C*^' und det fTT^frl 7^ 0. c) Wenn wir dieselbe Definition wie im ein-dimensionalen Fall fiir die Konvexitat einer Funktion f(x) = f{x^,...,x^) benutzen (indem wir x als den Vektor {x^,... ,a;'") e R"* betrachten), ist die Legendre-Transformation einer konvexen Funktion wieder eine konvexe Funktion. Zeigen Sie dies. d) Zeigen Sie, dass m
d/* =^x'dii i=l
m
m
+^
iidx' - d / = ^
i=l
x'Aii
i= l
und leiten Sie aus dieser Gleichung ab, dass die Legendre-Transformation involutiv ist, d.h., beweisen Sie die Gleichung
{rnx) = f{x).
8.5 Der Satz zur impliziten Punktion
519
e) Schreiben Sie unter Beriicksichtigung von d) die Transformation (8.106) in die folgende Form, die in den Variablen symmetrisch ist:
r(Ci,...,e,n) + /(x\
i= l
(8.107)
dr oder in Kurzform
x = vr(e)
e= v/w wobei V/(x)
Of
df
dx^'
dx"
(x)
dr
df aCi' • • •' d^„ (?)
v/*(e)
^x = ^ix' = y ^ g j x ' f) Die Matrix, die aus den zweiten partiellen Ableitungen einer Funktion gebildet wird (und manchmal auch die Determinante dieser Matrix), wird Hessesche Matrix der Punktion in einem Punkt genannt. Seien da und d*, die Kofaktoren der Elemente a , A ,- und a, L der Hesseschen Matrizen
( dx^dx^
{x)
und
(6 d'r
d'f dx'^dx^
d'r
dx^dx"^'
d'r
dx'^dx'^ '
der Funktionen f{x) und f*{£,) und seien d und d* die Determinanten dieser Matrizen. Angenommen, d ^ 0. Zeigen Sie, dass d • d* = 1 und dass
g) Bin Seifenfilm auf einem Rahmen bildet eine sogenannte minimale Flache mit der minimalsten Ausdehnung unter alien Flachen, die diesen Rahmen ausfiillen. Wird die Plache lokal als Graph einer Funktion z = f{x, y) definiert, dann zeigt sich, dass die Funktion / die folgende Gleichung fiir minimale Flachen erfiillen muss: \ ^ ' J y
j Jxx
^JxJyJxy'y^'Jx
j Jyy
— '-' •
Zeigen Sie, dass eine Legendre-Transformation dieser Gleichung zu folgender Gestalt fiihrt:
(1 + n')f;," + ^infiv" + (1 + f)fii"
0
520
8 Differentialrechnung mit Punktionen mehrerer Variabler
3. Kanonische
Variablen und die Hamilton-Gleichungen
.
a) In der Variationsrechnung und den fundamentalen Prinzipien der klassischen Mechanik spielt das folgende Gleichungssystem, das auf Euler und Lagrange zuriickgeht, eine wichtige RoUe: dL dx
d
dL\ Atdv'^'''
(8.108)
• xit) Dabei ist L(t,x,v) eine gegebene Funktion der Variablen t, x und v, wobei t iiblicherweise die Zeit ist, x die Koordinate und v die Geschwindigkeit. Das System (8.108) besteht aus zwei Gleichungen mit drei Unbekannten. Ublicherweise wollen wir x = x(t) und v = v(t) aus (8.108) bestimmen, was sich im Wesentlichen auf die Bestimmung der Gleichung x = x{t) reduzieren lasst, da V "
=
— dt •
Schreiben Sie die erste Gleichung in (8.108) ausfiihrlicher, indem Sie die Ableitung ^ expandieren und dabei beriicksichtigen, dass x = x{t) und v = v{t). b) Wenn wir von den Koordinaten t, x, v und L auf die sogenannten kanonischen Koordinaten t, x, p und H wechseln und dabei die Legendre-Transformation (vgl. Aufgabe 2) dL H = pv — L nach den Variablen v und L ausfiihren und sie dabei durch p und H ersetzen, dann nimmt das Euler-Lagrange System (8.108) die symmetrische Gestalt
an. Beweisen Sie dieses sogenannte System von Im multi-dimensionalen Fall, wenn L = L{t, Euler-Lagrange System die Form
dL
d
Hamilton-Gleichungen. "*), besitzt das
dL\, (8.110)
= x'it)
(i = l,...
wobei wir der Kiirze halber x = {x^,... ,a;'"), v = (f'^,..., w™) gesetzt haben. Wenn wir eine Legendre-Transformation der Variablen t f"*, L zu den kanonischen Variablen t,x^,..., x"^,pi,... ,Pm, H nach den Variablen w^,..., ii"*, L durchfiihren, dann wird in den neuen Variablen das System (8.110) zu folgendem System von Hamilton-Gleichungen: 7
W. R. Hamilton (1805-1865) - beriihmter irischer Mathematiker und Fachmann der Mechanik. Er stellte ein Variationsprinzip (das Hamiltonsche Prinzip) auf, konstruierte eine phanomenologische Theorie optischer Phanomene und war der Begriinder der Quaternionen und der Vektoranalysis (der Ausdruck „ Vektor" geht auf ihn zuriick).
8.5 Der Satz zur impliziten Punktion
Pi = - | 4 '
*' = l ^ '
(i = l,---,m).
521
(8.111)
Opi
0X'
Zeigen Sie dies. 4. Der Satz zur impliziten Funktion. Die Losung dieser Aufgabe ergibt einen weiteren Beweis des zentralen Satzes dieses Abschnitts, vielleicht etwas weniger intuitiv und konstruktiv als der oben gegebene, aber dafiir kiirzer. a) Angenommen, die Voraussetzungen des Satzes zur impliziten Punktion seien erfiillt und sei
die i-te Zeile der Matrix Fy{x,y). Zeigen Sie, dass die Determinante der Matrix, die aus den Vektoren Fy{xi,yi) gebildet wird, ungleich Null ist, wenn alle Punkte {xi, yi) (i = 1,... ,n) in einer hinreichend kleinen Umgebung U = I™ x ly von (xo,yo) liegen. b) Zu X e I™ gebe es Punkte yi,y2 G ly, so dass F{x,yi) = 0 und F{x,y2) = 0. Zeigen Sie, dass dann zu jedeni i £ { 1 , . .. ,n} ein Punkt {x, yi) existiert, der auf dem abgeschlossenen Intervall mit den Endpunkten (x,yi) und {x,y2) liegt, so dass 'F^(a^,2/i)(2/2-2/i) = 0, (i = l , . . . , n ) . Zeigen Sie, dass daraus folgt, dass yi = 2/2, d.h., dass dann, wenn die implizite Punktion f : I^ ^ ly existiert, sie eindeutig ist. c) Die offene Kugel K{yo;r) sei in ly enthalten. Zeigen Sie, dass dann F{xo,y)^0
fiir \\y - yolk" = r > 0. d) Die Punktion ||F(a;o,2/)||Rn ist stetig und besitzt einen positiven Minimalwert /i auf der Kugelschale Hy — yo||E"=?'. e) Es gibt ein 5 > 0, so dass fiir \\x — XO||E™ < S gilt, dass ll-f(a;,2/)||E" > 2/^ '
f^'' ll2/-yo|k" = r ,
\\F{x,y)\\l,^
iiiTy = yo.
< -/I ,
f) Zu jedeni festen x mit ||a; — a;o|| < S nimmt die Funktion ||F(a;,2/)||Rn in einem inneren Punkt y = f{x) der offenen Kugel \\y — 2/0||E" < r ein Minimum an. Da die Matrix Fy Ix, f{x) 1 invertierbar ist, folgt daraus, dass Fix, f{x) 1=0. Damit ist die Existenz der impliziten Funktion / : K(xo;S) —>• K(yo;r) sichergestellt. g) Gilt Ay = f{x + Ax) — f{x), dann ist Ay =-[F;]''
• [F:,]AX
wobei Fy die Matrix ist, deren Zeilen den Vektoren Fy{xi,yi), (i = l,...,n) entsprechen. Dabei ist (xi, yi) ein Punkt auf dem abgeschlossenen Intervall mit den Endpunkten (x, y) und {x+Ax, y+Ay). Das Symbol F^ besitzt eine ahnliche Bedeutung. Zeigen Sie, dass aus dieser Gleichung folgt, dass die Funktion y = fix) stetig ist.
522
8 Differentialrechnung mit Punktionen mehrerer Variabler
h) Zeigen Sie, dass fix) 5. „Gilt fix,y,z)
= - [F; (X, f{x))Y'
•p
[x, fix))]
.
= 0, dann ist f| • | f • ff = - 1 . "
a) Gebeii Sie dieser Aussage eine klare Bedeutung. b) Zeigen Sie, dass sie beispielsweise fiir die ideale Gasgleichung nach Clapeyron ——— = konst. T gilt, wie auch fiir den Allgemeinfall einer Punktion mit drei Variablen. c) Schreiben Sie eine ahnliche Aussage fiir die Gleichung f{x^,... ,a;'") = 0 mit m Variablen. Beweisen Sie, dass die Aussage stimmt. 6. Zeigen Sie, dass die Nullstellen von n
Z
,
+ ClZ
n—1
I
I
+ • • • + Cn
glatte Punktionen der KoefRzienten sind, zumindest dann, wenn die KoefRzienten alle verschieden sind.
8.6 Einige Korollare zum Satz zur impliziten Funktion 8.6.1 D e r S a t z zur i n v e r s e n F u n k t i o n D e f i n i t i o n 1. Eine Abbildung / : [ / — > • F , wobei U und V ofFene Teilmengen in M™ sind, ist ein C^^'-Diffeomorphismus oder ein DifFeomorphismus mit Glattheit p (p = 0,1,...), wenn
i)/ecW(t/;y), 2) / bijektiv ist und 3) / - I e c ( p ) ( y ; C / ) . Ein C'*^'-DifFeomorphismus wird Homoomorphismus
genannt.
In der Regel werden wir in diesem Buch nur den glatten Fall, d.h. p £ N oder p = oo, betracliten. Die zugrunde liegende Idee des Folgenden liaufig benutzten Satzes ist, dass eine Abbildung, deren Differential in einem P u n k t invertierbar ist, selbst in einer Umgebung des P u n k t e s invertierbar ist. S a t z 1. (Satz zur inversen Funktion). Fiir die Abbildung Gebiets G C K™ gelte: 1° / e C ( p ) ( G ; M ™ ) , p > 1, 2*^ 2/0 = f{xo)
in
3*^ .f'{xo) ist
invertierbar.
XQ
G G und
f : G ^ ffi™ eines
8.6 Einige Korollare zum Satz zur impliziten Punktion
523
Dann existiert eine Umgebung U{xo) C G von XQ und eine Umgebung V{yo) von yo, so dass / : U{xo) —>• V{yo) ein C^^'-Diffeomorphismus ist. 1st aufierdem x € U{XQ) und y = f{x) £ V{yQ), dann ist
Beweis. Wir schreiben die Gleichung y = f(x) in der Form F{x,y)=f{x)-y
= 0.
(8.112)
Die Funktion F{x,y) = f{x) — y ist fiir a; £ G und y G M™ definiert, d.h., sie ist in der Umgebung G x M™ des Punktes {xo,yo) £ M™ x K™ definiert. Wir woUen (8.112) in einer Umgebung von {xo,yo) nach x auflosen. Nach den Voraussetzungen 1°, 2° und 3° des Satzes besitzt die Abbildung F{x,y) die Eigenschaft, dass F e C(P)(G X K™;K™) , p > l , F{xo,yo) = 0 und dass F.^{xo,yo) = f'{xo) invertierbar ist. Nach dem Satz zur impliziten Funktion existiert eine Umgebung I^ x ly von {xo,yo) und eine Abbildung g £ C''P\ly;Ix), so dass f{x)-y
= G^x = g{y)
(8.113)
in jedem Punkt (a;, y) € Ix x ly und dass
g'{y) = -[Kl{x,y)]-'[F;^{x,y)]. In unserem Fall ist K(3:,y) = nx) und F'y{x,y) = -E, wobei E die Einheitsmatrix ist. Daher ist 9\y)={I\x))-\
(8.114)
Wenn wir V = ly und U = giV) setzen, erkennen wir an (8.113), dass die Abbildungen f : U ^ V und g :V ^ U zueinander invers sind, d.h. g = f~^ auf U. Da V = ly, folgt, dass V eine Umgebung von yo ist. Dies bedeutet, dass das Bild yo = f{xo) von xo £ G, der ein innerer Punkt von G ist, unter den Voraussetzungen 1°, 2° und 3° ein innerer Punkt des Bildes /(G) von G ist. Nach (8.114) ist die Matrix g{yo) invertierbar. Daher besitzt die Abbildung g : V ^ U die Eigenschaften 1°, 2° und 3° bzgl. des Gebiets V und des Punktes yo GV. Daher ist nach dem schon Bewiesenen xo = g{yo) ein innerer Punkt von U = giV).
524
Differentialrechnung mit Punktionen mehrerer Variabler
Da nach (8.114) die Annahmen 1°, 2° und 3° ofFensichtlich in jedem Punkt y € V gelten, ist jeder Punkt x = g{y) ein innerer Punkt von U. Daher ist U eine ofFene (und offensichtlich auch zusammenhangende) Umgebung von a;o e K". Wir haben somit bewiesen, dass die Abbildung f : U ^ V alle Bedingungen von Definition 1 und die Voraussetzungen zu Satz 1 erfiillt. D Wir woUen nun niehrere Beispiele anfiihren, die Satz 1 veranschaulichen. Der Satz zur inversen Funktion wird oft benutzt, urn von eineni Koordinatensystem in ein anderes iiberzugehen. Die einfachste Variante eines Koordinatenwechsels wurde in der analytischen Geometrie und der linearen Algebra untersucht und besitzt die Form y
,2/
oder, in kompakter Schreibweise, y^ • x*. Diese lineare Transformation A :ffi™^ M™ besitzt eine Inverse A"! " —>• M™, die genau dann auf dem definiert ist, wenn die Matrix (aj) invertierbar ist, d.h. ganzen Raum . det(a^') ^ 0. Der Satz zur inversen Funktion ist eine lokale Version dieser Aussage, die auf der Tatsache beruht, dass sich eine glatte Abbildung in einer Umgebung eines Punktes ungefahr wie ihr Differential in diesem Punkt verhalt. Beispiel 1. Polarkoordinaten. Die Abbildung / der Halbebene -^ {(p, (yp) e ffi^ p > 0} auf die Ebene ffi^, die durch die Gleichungen
^l
X = pcosip und y = psmcp
(8.115)
gegeben wird, ist in Abb. 8.5 dargestellt.
•n
2 1
fo 0
P
0
Abb. 8.5. Die dazugehorige Jacobimatrix ist p, wie leicht berechnet werden kann, d.h., sie ist in einer Umgebung jedes Punktes {p,(p), fiir den p > 0, ungleich
8.6 Einige Korollare zum Satz zur impliziten Punktion
525
Null. Daher sind die Formeln (8.115) lokal invertierbar und daher konnen wir lokal die Zalilen p und ip als neue Koordinaten des Punktes, der vorlier durch die kartesisclien Koordinaten x und y beschrieben wurde, wahlen. Die Koordinaten (p, ip) sind ein wolil bekanntes System krumniliniger Koordinaten in der Ebene - die Polarkoordinaten. Ilire geometrische Interpretation ist in Abb. 8.5 wiedergegeben. Wir betonen, dass auf Grund der Periodizitat der Funktionen cosip und sixiLp die Abbildung (8.115) fiir p > 0 nur lokal ein Diffeomorphismus ist. Sie ist auf der gesamten Ebene nicht bijektiv. Dies ist der Grund dafiir, weswegen der Wechsel von kartesischen zu Polarkoordinaten immer auch eine Wahl des Zweiges des Arguments Lp (d.h. eine Angabe seines Veranderungsbereichs) erfordert. Polarkoordinaten (p, tjj, (p) im drei-dimensionalen Raum ffi^ werden sphdrische Koordinaten genannt. Sie hangen mit den kartesischen Koordinaten durch die Gleichungen z = pcosip , y = psin^sin(y9 und
(8.116)
X = p sin lp cos (p
zusammen. Die geometrische Bedeutung der Parameter p, ip und (p ist in Abb. 8.6 wiedergegeben.
Abb. 8.6. Die Jacobimatrix der Abbildung (8.116) lautet p^ sinz/; und die Abbildung ist somit nach Satz 1 in einer Umgebung jedes Punktes (p, ip, ip), fiir den p > 0 und sinz/) ^ 0 gilt, invertierbar. Die Mengen, in denen jeweils p = konstant, ip = konstant, bzw. tp = konstant gilt, entsprechen im {x,y,z)-KdMTa offensichtlich einer spharischen Flache (eine Kugelschale mit Radius p), einer Halbebene, die durch die zAchse verlauft, bzw. der Flache eines Zylinders um die 2;-Achse. Daher werden beim Ubergang von den Koordinaten {x,y,z) zu den Koordinaten {p,ip,(p) beispielsweise die spharische Flache und die zylindrische Flache zu Ebenen; sie entsprechen Ausschnitten der Ebenen p = konstant bzw. Ip = konstant. Wir beobachteten im zwei-dimensionalen Fall ein ahnliches Phanomen, bei dem ein Kreisbogen in der (a;, 2/)-Ebene einer Strecke
526
8 Differentialrechnung mit Punktionen mehrerer Variabler
in der Ebene mit den Koordinaten (p, (yp) entsprach (vgl. Abb. 8.5). Bitte beachten Sie, dass dies einer lokalen Begradigung gleichkommt. Im m-dimensionalen Fall konnen wir Polarkoordinaten durch die Gleichungen x^ = pcoscpi , x'^ = psirnpi cos(y92 .117) X
= pSlTHpiSl'n(p2
• • •Sl'n(pm-2C0S(pm-l
,
x™ = p sin (fix sin (p2 • • • sin (pm-2 sin (pm-i einfiihren. Die Jacobimatrix dieser Transformation lautet pm-l
gij^m-2 ^ ^ gjj^m-3 ^ ^ . . . smif^_.2
,
(8.118)
und die Abbildung ist nach Satz 1 ebenfalls iiberall dort invertierbar, wo die Jacobimatrix ungleich Null ist. Beispiel 2. Verallgemeinerte lokale Rektifizierung einer Kurve. Neue Koordinaten werde iiblicherweise eingefiihrt, um analytische Ausdriicke fiir Objekte, die in einem Problem auftreten, zu vereinfachen und sie in der neuen Schreibweise leicher veranschaulichen zu konnen. Angenommen, eine Kurve in der Ebene M^ sei beispielsweise durch die Gleichung Fix,y)=0 definiert, wobei F eine glatte Funktion ist. Der Punkt {xo,yo) liege auf der Kurve, d.h. F{xo,yo) = 0, und dieser Punkt sei kein kritischer Punkt von F. Wir nehmen beispielsweise an, dass Fy{x,y) ^ 0. Wir wollen versuchen, Koordinaten ^, rj so zu wahlen, dass in diesen Koordinaten ein abgeschlossenes Intervall einer Koordinatengeraden, etwa der Geraden 77 = 0, einem Bogen dieser Kurve entspricht. Wir setzen dazu ^ = X—
XQ
und
T] = F{x, y) .
Die Jacobimatrix pi
pi
I (2;, y)
dieser Transformation besitzt als Determinante die Zahl Fy{x,y), die nach unserer Annahme in {xo,yo) ungleich Null ist. Dann ist diese Abbildung nach Satz 1 ein Diffeomorphismus einer Umgebung von {xo,yo) auf eine Umgebung des Punktes (^,77) = (0,0). Daher konnen wir die Zahlen ^ und rj innerhalb dieser Umgebung als neue Koordinaten fiir Punkte wahlen, die in einer Umgebung von {xo,yo) liegen. In diesen neuen Koordinaten besitzt die Kurve offensichtlich die Gleichung 77 = 0, und in dem Sinne haben wir sie tatsachlich lokal rektifiziert (vgl. Abb. 8.7).
Einige Korollare zum Satz zur impliziten Punktion
527
F{x,y)=0
Abb.
8.7.
8.6.2 Lokale R e d u k t i o n e i n e r g l a t t e n A b b i l d u n g in k a n o n i s c h e Form In dieseni Absatz werden wir nur ein Problem dieser Art betrachten. Urn genau zu sein, so werden wir eine kanonische Form vorstellen, auf die wir mit Hilfe einer geeigneten Koordinatenwahl jede glatte Abbildung mit konstantem Rang lokal reduzieren konnen. Wir wiederholen, dass der Rang einer Abbildung / : [/ ^ ffi" eines Gebiets U C M™ in einem P u n k t x £ U dem Rang der linearen Transformation entspriclit, die zu ilir in diesem P u n k t tangential ist, d.li. dem Rang der Matrix f'{x). Der Rang einer Abbildung in einem P u n k t wird iibliclierweise mit R a n g / ( a ; ) bezeichnet. S a t z 2 . (Der Rang-Satz.) Sei f : U ^ M." eine in einer Umgehung U C ffi™ eines Punktes XQ G K™ definierte Abbildung. Sei f £ C^P'>(U;R"), p > 1 und besitze die Abbildung f in jedem Punkt x G U denselben Rang k. Dann existieren Umgebungen 0{xo) von XQ und 0{yo) von yo = f{xo) und Dijfeomorphismen u = f{x) und v = tp{y) dieser Umgebungen der Klasse C^^', so dass die Abbildung v = ip o f o (f~^(u) in der Umgebung 0{uo) = (p[0{xo)) Koordinatendarstellung von UQ = (p{xo) die
{u\..
.,u
.,M")
U t-^ V
iv\
') = ( M ^ . . . , M ^ o , . . . , o )
(8.119)
besitzt. Anders formuliert, so stellt der Satz sicher (vgl. Abb. 8.8), dass wir Koordinaten {u^,..., M™) anstelle von ( a ; ^ , . . . , x™) und ( w ^ , . . . , w") anstelle von (y^,... ,y") so wahlen konnen, dass die Abbildung in den neuen Koordinaten lokal die Form (8.119) besitzt, d.h. die kanonische Form fiir eine lineare Transformation mit Rang k.
528
Beweis.
Differentialrechnung mit Punktionen mehrerer Variabler
Wir schreiben die Koordinatendarstellung 2/1 = / i ( x i , . . . , x ™ ) ,
.120)
2/» = / » ( x i , . . . , x ™ ) der Abbildung / : [ / — > • MJJ^, die in einer Umgebung des P u n k t e s XQ £ K™ definiert ist. Um eine neue Indizierung der Koordinaten und der Umgebung U zu vermeiden, werden wir annehmen, dass in jedem P u n k t x G U der Hauptminor der Ordnung k in der oberen linken Ecke der Matrix f'(x) ungleich Null ist. Wir betracliten die Abbildung, die in einer Umgebung U von XQ durcli die Gleicliungen u^ = if\x\...,x"') = f\x\...,x"') ,
l'' = (f'^ (x^ , . . . , X™-) = / * (x^ , ,fc+l
<^*+na;i,...,a;™) ip"^{x ,... ,a;™) = x'''
definiert ist.
^fc+i
,x™)
.121)
8.6 Einige Korollare zum Satz zur impliziten Punktion
529
Die Jacobimatrix dieser Abbildung lautet
und nach unseren Annahmen ist ihre Determinante in U ungleich Null. Nach dem Satz zur inversen Funktion ist die Abbildung u = (p{x) ein Diffeomorphismus der Glattheit p einer Umgebung 0{xo) C U von XQ auf eine Umgebung 0{uo) = (p[0{xo)) von UQ = f{xo). Wenn wir die Gleichungen (8.120) u n d (8.121) miteinander vergleichen, konnen wir erkennen, dass die verkettete Funktion g = f ° (p~^ : 0{uo) -^ W^ die folgende Koordinatendarstellung besitzt: yi =
/io(^-i(ui,...,u™)
= u^ ,
/*0(^-l(ul,...,U™)
Jk+1 ^
Jk+l^^-l(^^l^
/»
0^-1(^1,
.122) 5 k+l(,,l *+1(M
») =
g"{u\
..,u"
Da die Abbildung ip ^ : 0{UQ) —>• 0{XQ) in jedem P u n k t u £ 0{UQ) den maximalen Rang m besitzt, u n d die Abbildung / : 0{XQ) ^ M ? in jedem P u n k t X £ 0{XQ) den Rang k h a t , folgt, wie aus der linearen Algebra bekannt ist, dass die M a t r i x g'{u) = f {LP~^{U))
den Rang k besitzt.
{}P~^)
(U) in jedem P u n k t u G
0{uo)
530
8 Differentialrechnung mit Punktionen mehrerer Variabler Die direkte Berechnung der Jacobimatrix der Abbildung (8.122) ergibt /
\
\
1
0
dg fc+i
dg"fc+i
du^
du*^
9(7"
dg"
dv}
du*^
dg fc+i Qyk + l
•
dg"fc+i (9u"
dg"
dg"
du^+^
i9u™ / dg^ dass j—^{u)
Daher erhalten wir in jedem P u n k t u £ 0{UQ),
= 0 fiir i =
fc + 1 , . . . , m; j = fc + 1 , . . . , n. Wenn wir annehmen, dass die Umgebung 0{UQ) konvex ist (was wir beispielsweise durch Verkleinerung von 0{UQ) auf eine Kugel mit Zentrum in ug erreichen konnen), konnen wir daraus folgern, dass die Funktionen g^,j = k + l,...,n wirklich von den Variablen M*^+^, . . . , u™ unabhangig sind. Nach dieser ausschlaggebenden Beobachtung konnen wir die Abbildung (8.122) zu ui, y
u" , ,fc+i
.123)
gk+l(^^l^ . . . ,M*')
umschreiben. An dieser Stelle konnen wir die Abbildung z/; formulieren. Wir setzen «! =2/1 = : ^ i ( y ) ,
V" — yk —. ^^(jy) ^ yk+1 _ yk+1 _ gk+^(^y^^ . . . ^yfc) = : ll)'^+'^{y) ,
t^" = 2 / " - 5 " ( 2 / \ • • • , / )
- r i y ) -
.124)
8.6 Einige Korollare zum Satz zur impliziten Punktion
531
Aus der Konstruktion der Funktionen g^, (j = fc+1,..., n) ist klar, dass die Abbildung ip in einer Umgebung von yo definiert ist und in dieser Umgebung zur Klasse C'^^ gehort. Die Jacobimatrix der Abbildung (8.124) lautet /
\
1
0
dg fc+i dy^
dg fc+i
V ~3^
dy'^
dy'^
0
1
Ihre Determinante ist gleich 1 und daher ist die Abbildung tjj nach Satz 1 in einer Umgebung 0(2/o) von y^ £ M" ein Diffeomorphismus der Glattlieit p auf eine Umgebung 0{vo) = tp{0{yo)) von VQ ^W^. Wenn wir die Gleicliungen (8.123) und (8.124) vergleichen, konnen wir sehen, dass in einer Umgebung 0{uo) C 0{uo) von UQ, die so klein ist, dass g{0{uo)) C 0(2/0), die Abbildung tp o f o ip-'^ : 0{uo) -)• W^ eine Abbildung mit Glattheit p dieser Umgebung auf eine Umgebung 0{vo) C 0{vo) von VQ GW^ ist, und dass sie die kanonische Form
V
.,k+i
u 0,
.125)
0 besitzt. Wenn wir Lp~^ {^0{uo)) = 0{xo) und ^~^(0(wo)) = 0{yo) setzen, erhalten wir die Umgebungen von XQ und yo, deren Existenz im Satz behauptet wurden. Damit ist der Beweis vollstandig. D Wie schon Satz 1 ist Satz 2 offensichtlich eine lokale Version des entsprechenden Satzes aus der linearen Algebra.
532
8 Differentialrechnung mit Punktionen mehrerer Variabler
Wir woUen zuni Beweis von Satz 2 die folgenden Anmerkungen niachen, die sich im Folgenden als niitzlich erweisen werden. Anmerkung 1. 1st der Rang der Abbildung / : [ / — > • M" in jedem P u n k t der urspriinglichen Umgebung U C M™ gleich n, dann ist der P u n k t yo = / ( X Q ) fiir XQ £ U ein innerer P u n k t von f{U), d.h., f{U) enthalt eine Umgebung dieses Punktes. Beweis. Nach dem eben Bewiesenen besitzt die Abbildung ip o f o (p~^ : 0{uo) -^ 0{vo) in diesem Fall die Gestalt (M\
...,
M",
. . . , u™) = u H^ f = (f S . . . , w") =
(M\
. . . , u")
und dalier enthalt das Bild einer Umgebung von UQ = (p{xo) eine Umgebung von VQ = ip o f o (p~^(uo). Die Abbildungen (p : 0{xo) —>• 0{uo) und ^ : 0{yo) -^ 0{vo) sind aber Diffeomorphismen, die daher innere P u n k t e in innere P u n k t e abbilden. Wenn wir die urspriingliche Abbildung / als / = ^~^ o (z/i o / o (p~^) o cp sclireiben, konnen wir folgern, dass yo = f{xo) ein innerer P u n k t des Bildes einer Umgebung von XQ ist. D Anmerkung 2. Ist der Rang der Abbildung / : [ / — > • M" in jedem P u n k t einer Umgebung U gleich k und ist k < n, dann gilt in einer Umgebung von a;o e [/ C K™ aufgrund der Gleichungen (8.120), (8.124) und (8.125), dass f(x\...,x"')=g'{f(x\...,x"'),...,
f
(a;!,...,a;™)), (i = k + l,...,n)
. (8.126)
Diese Gleichungen gelten unter der getroffenen Voraussetzung, dass der Hauptminor der Ordnung k der Matrix ,f'{xo) ungleich Null ist, d.h., dass der Rang k von der Menge der Funktionen / ^ , . . . , / * ^ angenommen wird. Ansonsten kann m a n die Funktionen / ^ , . . . , / " umnummerieren und auf das eben Betrachtete zuriickfiihren. 8.6.3 Funktionale Abhangigkeit D e f i n i t i o n 2. Ein System stetiger Funktionen /*(a;) = / * ( a ; ^ , . . . ,a;'"), {i = 1 , . . . , n) ist in einer Umgebung eines P u n k t e s XQ = (XQ, . . . , x™) funktional unabhdngig, falls zu jeder stetigen Funktion F{y) = F{y^,..., y"), die in einer Umgebung von 2/0 = (J/Q, • • • ,2/o) = (/Ha^o), • • • , / " ( ^ o ) ) = / ( X Q ) definiert ist, in alien P u n k t e n einer Umgebung von XQ die Gleichung F{f{x\...,x"'),...,nx\...,xn)=0 nur dann gilt, wenn F{y^,...,
y") = 0 in einer Umgebung von yo.
Einige Korollare zum Satz zur impliziten Punktion
533
1st ein System nicht funktional unabhangig, dann wird es funktional abhdngig genannt. Die in der Algebra untersuchte lineare Unabhangigkeit behandelt lineare Gleichungen F(2/i,...,2/") = Ai2/i+--- + A„2/". Sind Vektoren linear abhangig, dann ist offensiclitlich einer von ilinen eine Linearkombination der anderen. Bei der funktionalen Abhangigkeit eines Systems glatter Funktionen gilt etwas Ahnliclies. Satz 3. Sei f^{x^, • • •, x™), (i = 1,..., n) ein System glatter Funktionen, die in einer Umgebung U{xo) des Punktes XQ Gffi™definiert sind. Ist der Rang der Matrix
(df_
df^\ dx"^
dx^
(x)
V a?"
(9a;"
J
in jedem Punkt x G U gleich k, dann gilt: a) Ist k = n, dann ist das System in einer Umgebung von XQ funktional unabhangig. b) Ist k < n, dann existiert eine Umgebung von XQ und k Funktionen im System, etwa / ^ , . . . , f'', so dass die anderen n — k Funktionen in dieser Umgebung in der Form f{x\
...,x^)=
g'{f\x\
.. .,x^),
...,f\x\...
,x™))
dargestellt werden konnen. Dabei sind g^{y^,.. ,y^), (i = fc + 1 , . . . , n ) glatte Funktionen, die in einer Umgebung von yo = (/^(a;o),... ,f"ixo)) definiert sind und nur von k Koordinaten der Variablen y = (y^,... ,2/") abhangen. Beweis. 1st k = n dann gilt nacli Anmerkung 1 liinter dem Rang-Satz, dass das Bild einer Umgebung des Punktes XQ unter der Abbildung
fHx'
y
(8.127) yn ^
f"{x\...,x"')
eine Umgebung von yo = f{xo) entlialt. Aber dann kann die Gleichung F{fix\...,x"'),...J"{x\...,
a;™)) = 0
in einer Umgebung von XQ nur dann gelten, wenn in einer Umgebung von yo F{y\...,y")=0
534
8 Differentialrechnung mit Punktionen mehrerer Variabler
gilt. Damit ist Behauptung a) bewiesen. Sei k < n. Wir nehmen an, dass der Rang k der Abbildung (8.127) durch die Funktionen f^,...,f angenommen wird. Dann existiert nach Anmerkung 2 hinter dem Rang-Satz eine Umgebung von yo = f{xo) und n — k Funktionen g^{y) = g^{y^, • • •, y''), (i = k + 1,..., n), die in dieser Umgebung definiert sind, denselben Glattheitsgrad wie die Funktionen des urspriinglichen Systems besitzen und so beschaffen sind, dass (8.126) in einer Umgebung von XQ gilt. Damit ist b) bewiesen. D Wir haben nun gezeigt, dass n — k Funktionen F^{y) = y* — g^{y^, • • •, y''), (« = fc + 1 , . . . , n) mit k < n existieren, fiir die in einer Umgebung des P u n k t e s XQ die Relationen F'{f\x),...,f{x),f{x))=0,
{i = k +
l,...,n)
zwischen den Funktionen des Systems / ^ , . . . , / * ^ , . . . , / " gelten. 8 . 6 . 4 Lokale Z e r l e g u n g e i n e s D i f F e o m o r p h i s m u s i n e i n e V e r k e t t u n g einfacher D i f F e o m o r p h i s m e n In diesem Abschnitt werden wir zeigen, wie eine diffeomorphe Abbildung mit Hilfe des Satzes zur inversen Funktion lokal als Verkettung von Diffeomorphismen geschrieben werden kann, von denen jeder nur eine Koordinate verandert. D e f i n i t i o n 3 . Ein DifFeomorphismus g : U ^ ffi™ einer offenen Menge U C M™ wird einfach genannt, falls seine Koordinatendarstellung y* = a;' , yj =
i G {1,...
,m} ,
i^
j ,
gi{x\...,x"')
lautet, d.h., unter dem Diffeomorphismus g : U ^ W" verandert sich nur eine Koordinate des abgebildeten Punktes. S a t z 4 . Sei f : G ^ ffi™ ein Diffeomorphismus einer offenen Menge G Cffi™. Dann gibt es zu jedem Punkt XQ G G eine Umgebung des Punktes, in der die Darstellung f = gi ° • • • °gn gM, wobei gi,... ,gn einfache Diffeomorphismen sind. Beweis. Wir werden dies durch Induktion beweisen. Ist die urspriingliche Abbildung / selbst einfach, dann gilt der Satz trivialerweise. Angenommen, der Satz gelte fiir DifFeomorphismen, die hochstens (fc — 1) Koordinaten verandern, wobei k — 1 < n. Wir betrachten einen Diffeomorphismus f : G ^ ffi™, der k Koordinaten verandert:
Einige Korollare zum Satz zur impliziten Punktion 2/1
=
fk
=
/i(xi,...,x™),
/fc(a;i,...,a;™) .128)
„fc+i
,fc+i
535
Wir haben dabei angenommen, dass es die ersten k Koordinaten sind, die verandert warden. Dies kann durch lineare Veranderungen von Variablen stets erreicht werden. Daher bedeutet diese Annahme keinen Verlust der Allgemeinheit. Da / ein DifFeomorphismus ist, ist die Deterniinante seiner Jacobiniatrix in jedeni P u n k t ungleich Null, niit
Wir woUen XQ £ G festlialten und die Determinante von / ' ( X Q ) berechnen:
dx''
gjk
gjk
dx^
dx''
.
a/1
df
dx^^^
dx/'
gjk
Qjk
i9x*^+i
i9x™
1
0
0
1
dx^ (Xo) y^ 0
(a;o)
dx^
0 Daher muss einer der Minoren der Ordnung fc — 1 dieser letzten Determinante ungleich Null sein. Wir nehmen wiederum zur Vereinfachung der Schreibweise an, dass der Hauptminor der Ordnung fc — 1 ungleich Null ist. Nun betrachten wir die Hilfsabbildung g : G ^ ffi™, die durch die Gleichungen
fHx\...,x"'),
g
gk-1
definiert ist.
^
/fc-i(a;i,...,x"
.129)
536
8 Differentialrechnung mit Punktionen mehrerer Variabler Da die Jacobimatrix 3/1
Of dx''
Qfkk-l
dx^
Qjk-l dx^
. Qjk-l
Qjkk-l
dx^
(9x"
1
dx^ (xo)
(a;o)y^O
gjk
dx^
0
dx^~^ Qfkk-l
dx^
1
der Abbildung g : G ^ M™ in XQ G G ungleich Null ist, ist die Abbildung g in einer Unigebung von XQ ein Diffeomorphismus. Dann ist in einer Umgebung von UQ = g{xo) die zu g inverse Abbildung X = g~^{u) definiert, wodurch in einer Umgebung von XQ neue Koordinaten (u^,..., M™) eingefiihrt werden konnen. Sei h = f o g~^. Genauer betrachtet, entspriclit die Abbildung y = h{u) der Abbildung (8.128) y = f{x) in u-Koordinaten. Da die Abbildung h eine Verkettung von Diffeomorphismen ist, ist sie ein Diffeomorphismus einer Umgebung von UQ. Sie lautet in Koordinatenschreibweise offensiclitlich y
-1 =
h\u)
/ I 0 5 1(M)
/I*-1(M)
f''
=U^
^ o g ^(u) = u'^
hHu) ,k+l
y
/I*+1(M) =
u fc+1
h-^iu)
d.li., h ist ein einfacher Diffeomorphismus. Nun ist aber / = hog, und nach Induktionsannahme kann die durch (8.129) definierte Abbildung g als Verkettung einfacher Diffeomorphismen zerlegt werden. Daher kann auch der Diffeomorphismus / , durch den k Koordinaten verandert werden, in einer Umgebung von XQ voUstandig in eine Verkettung einfacher Diffeomorphismen zerlegt werden. Damit ist der Induktionsbeweis abgeschlossen. D
8.6 Einige Korollare zum Satz zur impliziten Punktion
537
8.6.5 D a s M o r s e - L e m m a In Verbindung mit diesen mathematischen Vorstellungen woUen wir ein intrinsisch schones Lemma von Morse* zur lokalen Reduktion glatter Funktionen mit reellen Werten in ihre kanonische Form in einer Umgebung eines nicht entarteten kritischen P u n k t e s anfiihren. Dieses Lemma ist auch fiir Anwendungen wichtig. D e f i n i t i o n 4. Sei XQ ein kritscher P u n k t der Funktion / G C'^'^\U; ffi), die in einer Umgebung U dieses P u n k t e s definiert ist. Der singulare P u n k t XQ ist ein nicht entarteter kritischer Punkt von / , falls die Hessesche Matrix der Funktion in diesem P u n k t (d.h. die Matrix —^(a^o)) die aus den zweiten partiellen Ableitungen gebildet wird) eine ox^ox^ von Null verscliiedene Determinante besitzt. Ist XQ ein kritischer P u n k t der Funktion, d.h., ist f'{xo) der Taylorschen Formel
fix)-fixo)
= l^_J2^£l('^o)ix'-xi){x^-xi)+o{\\x-xo\\').
= 0, dann ist nach
(8.130)
Das Morse-Lemma stellt sicher, dass wir lokal zu Koordinaten x = g{y) wechseln konnen, in denen die Funktion in y-Koordinaten lautet: ( / o g){y) - fM
( / ) ' + ( / + ' ) ' + • • • + (2/™)' •
= -{y'f
Ohne das Restglied o(||a; — xo\\'^) auf der rechten Seite von (8.130) ware die Differenz f{x) — f{xo) eine einfache quadratische Form, die, wie aus der Algebra bekannt ist, durch lineare Transformationen in die angedeutete kanonische Form gebracht werden konnte. Daher ist die Behauptung, die wir beweisen wollen, eine lokale Version des Satzes zur Reduktion einer quadratischen Form in kanonische Form. Der Beweis wird die Uberlegungen des Beweises dieses algebraischen Satzes benutzen wie auch den Satz zur inversen Funktion und das folgende Lemma. L e m m a v o n H a d a m a r d Sei / : C/ —^ ffi eine Funktion der Klasse C(P)(C/;M), p > 1, die in einer konvexen Umgebung U des Punktes 0 = ( 0 , . . . , 0 ) € ffi™ mit /(O) = 0 definiert ist. Dann existieren Funktionen gi £ C(^~^-'(C/; M), (« = 1 , . . . , m ) , so dass die Gleichung f{x\
. . . ,a;™) = Y^x'gi{x\...
,x™)
(8.131)
1=1
in U gilt, mitgiiO)
=
§^{0).
* H. C. M. Morse (1892-1977) - amerikanischer Mathematiker. Seine Hauptarbeiten beschaftigten sicli mit topologischen Methoden in verschiedenen Gebieten der Analysis.
538
8 Differentialrechnung mit Punktionen mehrerer Variabler
Beweis. Gleichung (8.131) ist ini Grunde genonimen eine neuerliche Forniulierung der Taylorschen Formel mit integralem Restglied. Sie folgt aus den Gleichungen
fix'
jdfitx^.. . ,te™Ut J dt
,...,x™)
m
J dx^
(te^ , . . . , t e " ) d t ,
0
0
wenn wir gi{x'^,...
'
'
J dxi
{tx\. . . , t e " ) d t ,
(* = 1, . . . , m )
0
setzen. Dabei ist ofFensichtlich g i(0) =
•(o),(i == 1 , . . . , m), und es ist auch
nicht schwer zu zeigen, dass gi G C(^~^)(C/; ffi). Wir werden diesen Beweis jedoch jetzt nicht erbringen, da wir spater eine allgemeine Regel fiir die Ableitung eines Integrals, das von einem P a r a m e t e r abhangt, geben werden, aus der die fiir die Funktionen gi benotigte Eigenschaft unmittelbar folgt. Daher ist bis auf dieses Beweisstiick das Lemma von H a d a m a r d (8.131) bewiesen. D M o r s e - L e m m a . Sei / : G —>• ffi eine auf einer offenen Menge G G W nierte Funktion der Klasse C^^> (G; ffi) und sei XQ & G ein nicht entarteter kritischer Punkt der Funktion. Dann existiert ein Diffeomorphismus g :V ^ U einer Umgebung des Ursprungs 0 in M™ auf eine Umgebung U von XQ, SO dass
if o g)iy) = fixo) - [{y'f + • • • + (/)'] + [iv'+'f + • • • + (2/™)'] fiir alle y G V. Beweis. Durch lineare Veranderungen der Variablen konnen wir das Problem auf den Fall a;o = 0 und / ( X Q ) = 0 zuriickfiihren. Wir gehen von nun an davon aus, dass diese Bedingungen gelten. Da XQ = 0 ein kritischer P u n k t von / ist, gilt gi{0) = 0 in (8.131), (i = 1 , . . . , m ) . Nach dem Lemma von H a d a m a r d gilt dann auch, dass m
giix\...,x"')
=Y,x^hijix\...,x"')
,
i=i wobei die hij in einer Umgebung von 0 glatte Funktionen sind. Folglich gilt: m
f{x\...,x"')=
^x'x^hijix^,...,x"'')
.
(8.132)
Falls notig fiihren wir die Substitution hij = \ihij + hji) durch, so dass wir annehmen konnen, dass hij = hji. Wir merken auch an, dass aufgrund
Einige Korollare zum Satz zur impliziten Punktion
539
der Eindeutigkeit der Taylor-Entwicklung aus der Stetigkeit der Funktionen 92 / hij folgt, dass hij{0) = —r(0) und daher ist die Determinante der Matrix (/iy(0)) ungleich Null. Die Funktion / wurde nun in eine Form gebraclit, die einer quadratischen Form entspricht, und wir wollen sie gewissermafien auf Diagonalform reduzieren. Wie im klassisclien Fall arbeiten wir mit Induktion. Angenommen, es existieren in einer Umgebung Ui von 0 £ ffi™ Koordinaten u^,..., M™ und somit ein Diffeomorphismus x = (p{u), so dass m
{foip){u)
= ±{u^f
± • • • ± {u'-^f
+ Y^ u'u^Hij{u\...,u"')
,
(8.133)
i,j=r
wobei r > 1 und Hij = Hji. Wir lialten fest, dass (8.133) fiir r = 1 gilt, wie sich aus (8.132) fiir Hij = hij erkennen lasst. Nach den Voraussetzungen zum Morse-Lemma ist die quadratische Form m
J2 x^x^hij{0) nicht entartet, d.h. det (/ijj(O)) ^ 0. Den Koordinatenwechsel von X in u fiihren wir mit dem Diffeomorphismus x = if(u) durch, fiir den det If'(0) ^ 0 gilt. Dann ist aber die Determinante der Matrix der quadratim
schen Form ±{u^y^ ± • • • ±
(M''"^)^
+ ^
u^u^Hij{0), die wir erhalten, indem
i,j=r
wir die Matrix (/ijj(O)) von rechts mit der Matrix (f'{0) und von links mit der Transponierten von (f'(0) multiplizieren, ebenfalls ungleich Null. Folglich ist zumindestens eine der Zahlen Hjj(O) {i,j = r,... ,m) ungleich Null. Wir m
konnen die Form ^
u^u^ Hij(0) mit einer linearen Transformation in Diago-
i,j=r
nalform bringen und daher konnen wir annehmen, dass Hrr{0) ^ 0 in (8.133). Aufgrund der Stetigkeit der Funktion Hij (u) gilt die Ungleichung Hrr (u) ^ 0 ebenfalls in einer Umgebung von u = 0. Wir wollen ip{u^,..., u™) = ^/\Hrr•(u)\ setzen. Dann gehort die Funktion ip in einer Umgebung U2 C Ui von u = 0 zur Klasse C(i)(C/2; M). Wir wechseln nun mit Hilfe der Formeln w* = u* , ^^
i i^ r , ^V
^ ^ Hrr(u^,---,U"') i>r
"V
'
J '
/
zu den Koordinaten (v^,... ,11™). Die Jacobimatrix der Transformation (8.134) ist in M = 0 offensichtlich gleich mit ^(0), d.h., sie ist ungleich Null. Dann konnen wir nach dem Satz zur inversen Funktion sicher sein, dass die Abbildung v = tp{u), die durch (8.134) definiert wird, in einer Umgebung C/3 C C/2 von u = 0 ein Diffeomorphismus
540
8 Differentialrechnung mit Punktionen mehrerer Variabler
der Klasse C(^)(C/3; ffi™) ist, und daher konnen die Variablen tatsachlich als Koordinaten fiir P u n k t e in Uz eingesetzt werden. Wir trennen nun in (8.133) alle Ausdriicke
{v^,...,v"^)
m
u''u''H„{u^,...,vJ^)
+ 2 Y^
u''u^Hrj{u^,...,u"'')
,
(8.135)
j=r+l
die u^ enthalten, ab. Dabei haben wir in (8.135) bei der Summation dieser Ausdriicke ausgenutzt, dass Hij = Hji. Wenn wir (8.134) und (8.135) vergleichen, konnen wir erkennen, dass wir (8.135) zu '"'
i>r
umformulieren konnen. Das zweideutige Vorzeichen ± tritt vor «'"«'' auf, da Hrr = ±(V')^i wobei das positive Vorzeichen fiir !!„ > 0 gilt und das negative Vorzeichen fiir Hrr < 0. Daher wird nach der Substitution v = i^{u) der Ausdruck (8.133) zur Gleichung r i=l
ij>r
wobei Hij neue glatte Funktionen sind, die bzgl. der Indizes i und j symmetrisch sind. Die Abbildung ip o ^ " ^ ist ein Diffeomorphismus. Damit ist der Induktionsschritt von r — 1 auf r vollstandig und das Morse-Lemma ist daher bewiesen. D 8.6.6 U b u n g e n u n d A u f g a b e n 1. Berechnen Sie die Jacobimatrix fiir den Koordinatenwechsel (8.118) von Polarkoordinaten zu kartesischen Koordinaten in R"*. 2.
a) Sei xo ein nicht kritischer Punkt einer glatten Funktion F : [/ —> R, die in einer Umgebung U von xo = (a;J,.. ., X'Q) G R™ definiert ist. Zeigen Sie, dass in einer Umgebung U C U von xo krummlinige Koordinaten (^^,. .. j^™) eingefiihrt werden konnen, so dass die Menge der Punkte, die durch die Bedingung F{x) = F{xo) definiert ist, in diesen neuen Koordinaten lautet: ^"^ = 0. b) Seien (p,'4> £ C<*'(i3;R) mit ((p{x) = 0\ ^ (tp{x) = o) im Gebiet D. Zeigen Sie, dass dann, wenn grades ^ 0 gilt, eine Zerlegung tp = 9 o ip in D existiert, mit e G C(*-^'(i3;R).
3. Sei / : R^ —>• R^ eine glatte Abbildung, die die Cauchy-Riemann Gleichungen
dfl^df. dx^
erfiillt.
dx'^
und
^
dx'^
= - ^ dx^
8.6 Einige Korollare zum Satz zur impliziten Punktion
541
a) Zeigen Sie, dass die Jacobimatrix einer derartigen Abbildung genau danii in einem Punkt Null ist, wenii f'{x) in diesem Punkt der NuUniatrix entspriclit. b) Zeigen Sie, dass fiir f'{x) ^ 0 die Inverse f~^ der Abbildung / in einer Umgebung von x definiert ist und ebenfalls die Cauchy-Riemann Gleichungen erfiillt. 4. Funktionale Abhangigkeit (direkter Beweis). a) Zeigen Sie, dass die Punktionen TT'{X) = X' , (i = 1 , . . . ,m), wenn wir sie als Punktionen des Punktes x = {x^,..., x^) G R™ betracliten, in einer Umgebung jeden Punktes von R™ ein unabliangiges System von Punktionen bilden. b) Zeigen Sie, dass das System TT\...,TT"', f fiir jede Punktion / G C(R'";R) funktional abhangig ist. c) Ist der Rang der Abbildung / = (/^, . . . , / * ) fiir das System von glatten Punktionen Z ' ^ , . . . , / * , fc < m in einem Punkt xo = {xl,.. . ,X'Q') € R"* gleich k, dann kann es in einer Umgebung dieses Punktes zu einem unabhangigen System / ^ , . . . , Z™ aus m glatten Punktionen erganzt werden. d) Ist der Rang der Abbildung / = {f^, . . . , / " * ) fiir das System von glatten Punktionen
C = fix^,---,x"^)
,
{i =
l,...,m)
im Punkt xo = (XQ, . . . , XQ^) gleich m, dann konnen die Variablen (S,^, • • • ,S,"^) in einer Umgebung U{xo) von xo als krummlinige Koordinaten benutzt werden und jede Punktion ip : U{xo) —> R kann als (p{x) = Flf^{x),..., /""(x) 1 geschrieben werden, wobei F = (p o f~^. e) Der Rang der Abbildung, die durch ein System glatter Punktionen erzeugt wird, wird auch der Rang des Systems genannt. Zeigen Sie, dass dann, wenn in einem Punkt Xo G R"* der Rang eines Systems glatter Punktionen / ' ( x ^ , . . . ,a;'"), {i = 1,... ,k) gleich k ist und auch der Rang des Systems f^,..., f" ,(p gleich k ist, in einer Umgebung des Punktes gilt, dass (p{x) = F (f^ (x),..., f'' (x)). H i n w e i s : Benutzen Sie c) und d), um zu zeigen, dass F(/\...,r) = F(/\...,/) 5. Zeigen Sie, dass der Rang einer glatten Abbildung / : R"* —>• R" eine unterhalbstetige Punktion ist, d.h. Rang/(a;) > Rang/(xo) in einer Umgebung eines Punktes xo G R*". 6. a) Beweisen Sie das Morse-Lemma fiir Punktionen / : R —>• R direkt. b) Bestimmen Sie, ob das Morse-Lemma im Ursprung auf folgende Punktionen anwendbar ist: f{x) = X ;
f{x) = a; sin — ;
f{x) = e~
X
f{x,y)
= x^ -Sxy^
sin — ; X
;
f{x,y)=x^.
c) Zeigen Sie, dass nicht entartete kritische Punkte einer Punktion/ G C(3'(R'";R) isoliert sind: Jeder Punkt besitzt eine Umgebung, in der er der einzige kritische Punkt von / ist. d) Zeigen Sie, dass die Zahl k negativer Quadrate in der kanonischen Darstellung einer Punktion in der Umgebung eines nicht entarteten kritischen Punktes von der Reduktionsmethode unabhangig ist, d.h. unabhangig vom Koordinatensystem, in dem die Punktion kanonische Porm besitzt. Diese Zahl wird der Index des kritischen Punktes genannt.
542
8 Differentialrechnung mit Punktionen mehrerer Variabler
8.7 Flachen in MP- und die Theorie zu E x t r e m a mit Nebenbedingungen Elementare Kenntnisse zu Flachen (Mannigfaltigkeiten) in M" sind hilfreich, urn ein infornielles Verstandnis der Theorie von Extrema mit Nebenbedingungen, die fiir Anwendungen wichtig ist, zu erhalten. 8.7.1 fe-dimensionale Flachen in WT' Bei der Verahgemeinerung des Bewegungsgesetzes x = x{t) einer Punktmasse haben wir friiher das Konzept eines Weges in MP als eine stetige Abbildung r : I ^ MP eines Intervalls / C M eingefiihrt. Die Glattheit des Weges wurde als Glattheit dieser Abbildung definiert. Die Spur r{T) C M" eines Weges kann eine sehr seltsame Menge in M" bilden, so dass wir dazu manchmal den Begriff des Weges auBerst weit fassen miissen. So kann die Spur eines Weges beispielsweise ein einziger Punkt sein. Ganz ahnlich kann eine stetige oder glatte Abbildung / : 7*^ ^ M" eines fc-dimensionalen Intervalls l'' C ffi", das auch fc-dimensionaler Quader in M" genannt wird, ein Bild / ( / * ) besitzen, das iiblicherweise wirklich nicht als kdimensionale Flache in K" bezeichnet wird. So kann sie beispielsweise wieder nur ein einziger Punkt sein. Damit eine glatte Abbildung / : G —>• K" eines Gebiets G C ffi* eine fc-dimensionale geometrische Figur in ffi" definiert, deren Punkte durch k unabhangige Parameter (t^,..., t*^) £ G beschrieben werden, geniigt, wie wir aus dem vorigen Abschnitt wissen, die Forderung, dass der Rang der Abbildung / : G —>•ffi"in jedem Punkt t G G gleich k ist (natiirlich ist fc < n). In diesem Fall ist die Abbildung f : G ^ f{G) lokal bijektiv (d.h. in einer Umgebung jedes Punktes t G G). Wir nehmen an, dass Rang/(to) = k, und dass dieser Rang von den ersten k der n Funktionen (8.136)
angenommen wird, die die Abbildung / : G ^ ffi" in Koordinatenschreibweise definieren. Dann konnen nach dem Satz zur inversen Funktion die Variablen f},... ,t^ in einer Umgebung U{t{)) von to mit Hilfe von a;^,...,a;* ausgedriickt werden. Daraus folgt, dass sich die Menge f(U{to)) als j.k+1 = / + i ( a ; i , . . . , a ; f c ) , . . . ,a;"=<^"(a;S...,a;*) schreiben lasst (d.h., sie lasst sich eins-zu-eins auf die Koordinatenebene von a;^,...,a;*^ projizieren), und daher ist die Abbildung / : U{to) —>• /([/(to)) tatsachlich bijektiv.
8.7 Flachen in R" und bedingte Extrema
543
Aber selbst das einfache Beispiel eines glatten ein-dimensionalen Weges (vgl. Abb. 8.9) macht deutlich, dass die lokale Injektivitat der Abbildung f : G ^ M." des Parametergebiets G auf ffi" nicht im Geringsten globale Injektivitat bedeuten muss. Die Trajektorie kann sich niehrfach selbst schneiden. Wenn wir daher eine glatte fc-dimensionale Flache in ffi" definieren und sie als eine Menge darstellen wollen, die in der Nahe jedes ihrer Punkte die Struktur eines etwas deformierten Stiicks einer fc-dimensionalen Ebene (ein fc-dimensionaler Unterraum von ffi") besitzt, dann ist es daher nicht genug, einfach einen kanonischen Teil G C M*^ einer fc-dimensionalen Ebene auf regulare Weise auf ffi" abzubilden. Es muss auch sichergestellt sein, dass sie auch global in diesen Raum eingebettet ist.
Abb. 8.9.
Definition 1. Wir bezeichnen eine Menge 5 C M" als eine k-dimensionale glatte Flache in ffi" (oder als eine k-dimensionale Teilmannigfaltigkeit), falls fiir jeden Punkt XQ G S eine Umgebung U{xo) in M" und ein Diffeomorphismus (p : U{xo) -^ I" dieser Umgebung auf den n-dimensionalen Einheitswiirfel / " = {t £ M" I \f\ < 1, i = l , . . . , n } des Raums MP existiert, unter dem das Bild der Menge S fl U{xo) dem Teil der fc-dimensionalen Ebene in MP entspricht, die durch die Gleichungen t*^+^ = 0 , . . . , t " = 0 definiert ist und innerhalb von / " liegt (vgl. Abb. 8.10). Wir werden die Glattheit der Flache S mit der Glattheit des Diffeomorphismus (p gleichsetzen. Wenn wir die Variablen t^,.. .,t" in einer Umgebung von U{xo) als neue Koordinaten betrachten, kann Definition 1 wie folgt kurz wiedergeben werden: Die Menge S C M" ist eine fc-dimensionale Flache (fc-dimensionale Teilmannigfaltigkeit) in M", faUs es zu jedem Punkt XQ & S eine Umgebung U{xo) und Koordinaten t^,... ,t" in U{xo) gibt, so dass in diesen Koordinaten die Menge S r\U{xo) durch die Gleichungen t*=+i = •. • = r = 0 definiert wird.
544
Differentialrechnung mit Punktionen mehrerer Variabler U{xo)
r /" 1
-1
0
1 t^
-1
A b b . 8.10. Die Rolle des n-dimensionalen Einheitswiirfels in Definition 1 ist sehr kiinstlich und ungefahr dieselbe, wie die Rolle der EinheitsgroBe oder der Form einer Seite in einem geographisclien Atlas. Die kanonische Platzierung des Intervalls im Koordinatensystem t^,... ,t" ist auch eine Konvention und nicht melir, da jeder Wiirfel in M" durcli einen weiteren linearen Diffeoniorphisnius inimer in den n-diniensionalen Einheitswiirfel transformiert werden kann. Wir werden auf diese Anmerkung oft zuriickgreifen, um den Beweis zu verkiirzen, dass eine Menge 5 C ffi" eine Flaclie in M" ist. Wir woUen einige Beispiele betracliten. Beispiel 1. Der R a u m M" ist selbst eine n-dimensionale Flaclie der Klasse (^(oo). Als Abbildung (yp : M" ^ / " kann beispielsweise die Abbildung
f
• arctana;
(» = 1,
gewahlt werden. Beispiel 2. Die in Beispiel 1 konstruierte Abbildung stellt auch sicher, dass der Unterraum des Vektorraums ffi", der durch die Bedingungen a;*"*"^ = . -. = a;" = 0 definiert wird, eine fc-dimensionale Flache in ffi" ist (oder eine kdimensionale Teilmannigfaltigkeit von ffi"). Beispiel
3. Die durch das Gleichungssystem a\x^ + • • • + aix'^ + a} a;fc+i + . . . + aia;n fc+i -,n—kl
x^ A—
n—k^
+ G:
+ flfc^f a;*+^ + • • • + a^-'^x''
= 0
8.7 Flachen in R" und bedingte Extrema
545
definierte Menge in K" ist, falls das System den Rang n — k besitzt, eine fc-dimensionale Teilmannigfaltigkeit des ffi". Wenn wir namlicli davon ausgehen, dass die Determinante ^fc+i
n—k
-,n — k
ungleich Null ist, dann ist die lineare Transformation
fk+i
(J/-] tij
I
' *'
I
(Ji^tij
-,n — k^l
offensichtlicli niclit entartet. In den Koordinaten t ^ , . . . , t" ist die Menge durch die Bedingungen t*^+i = • • • = r = 0 definiert, die wir bereits in Beispiel 2 betraclitet liaben. Beispiel 4- Der Graph einer glatten Funktion x" = /(a;^,... ,a;"~^), der in einem Gebiet G C M"~^ definiert ist, ist eine glatte (n — l)-dimensionale Flache in K". Setzen wir namlich (« = l , . . . , n - l )
V
f{x\...,x"-^)
f"
dann erhalten wir ein Koordinatensystem, in dem der Graph der Funktion die Gleichung t" = 0 erfiillt. 5. Der Kreis a;^ + y^ = 1 in M^ ist eine ein-dimensionale Teilmannigfaltigkeit des M^, wie wir mit der lokal invertierbaren Umformung zu Polarkoordinaten (p, (f) im letzten Abschnitt gezeigt haben. In diesen Koordinaten besitzt der Kreis die Gleichung p = 1. Beispiel 6. Dieses Beispiel ist eine Verallgemeinerung von Beispiel 3 und liefert, wie wir aus Definition 1 erkennen konnen, gleichzeitig einen allgemeinen Ausdruck fiir die Koordinaten von Teilmannigfaltigkeiten in M". Sei F*(a;^,...,x"), {i = 1,... ,n — k) ein System glatter Funktionen mit Rang n — k. Wir werden zeigen, dass die Gleichungen
r
F\x\.
rpK
™/C + i
.,X"
0
.137) fc+1
. ,a;") = 0
eine fc-dimensionale Teilmannigfaltigkeit S in M" definieren.
546
8 Differentialrechnung mit Punktionen mehrerer Variabler Angenonimen, die Bedingung
i9x"
(xo) + 0 Qpn-k
.138)
Qpn-k
9a;*+i gilt in eineni Punkt XQ £ iS. Dann ist nach deni Satz zur inversen Funktion die Transformation (i = l , . . . , f c )
t = a;'
t
F^-''{x\...,x"),
{i =
k+l,...,n)
ein DifFeomorphismus einer Umgebung dieses Punktes. In den neuen Koordinaten t ^ , . . . , t" besitzt das Ausgangssystem die Form t*^+^ = • • • = t" = 0. Daher ist S eine fc-dimensionale glatte Flache in ffi". Beispiel 7. Die Menge E, die in der Ebene ffi^ aus Punkten besteht, die die Gleichung x"^ —y'^ = 0 erfiillen, entspricht zwei Geraden, die sich im Ursprung schneiden. Diese Menge ist keine ein-dimensionale Teilmannigfaltigkeit des M^ (zeigen Sie dies!) und zwar genau wegen dieses Schnittpunktes. Wird der Ursprung 0 £ ffi^ aus E entfernt, dann wird die Menge E \0 ofFensichtlich Definition 1 erfiillen. Wir merken dann, dass die Menge E \0 nicht zusammenhangend ist. Sie besteht aus 4 paarweise disjunkten Strahlen. Daher kann eine fc-diniensionale Flache in M", die Definition 1 erfiillt, eine nicht zusamnienhangende Teilnienge sein, die aus mehreren zusamnienhangenden Komponenten besteht (und diese Komponenten sind fc-dimensionale Flachen). Eine Flache in M" wird oft als fc-dimensionale zusammenhangende Flache verstanden. Hier sind wir daran interessiert, Extrema von Funktionen zu finden, die auf Flachen definiert sind. Dies ist eine lokale Fragestellung und daher wird sich der Zusammenhang von Flachen darauf nicht auswirken. . Wenn eine in der Koordinatenform (8.136) definierte Abbildung / : G ^ K" des Gebiets G C M" im Punkt to G G den Rang fc besitzt, dann existiert eine Umgebung U{to) C G dieses Punktes, dessen Bild /([/(to)) C M" eine glatte Flache in M" ist. Denn in diesem Fall konnen die Gleichungen (8.136), wie wir schon oben bemerkt haben, in einer Umgebung U{to) von to G G durch das aquivalente System rk+l
^
k+1
{x\.
n, .139)
Lp"{x^,...
,a;*)
8.7 Flachen in R" und bedingte Extrema
547
ersetzt werden. (Zur Vereinfachung der Schreibweise nehmen wir an, dass das System / ^ , . . . , /*" Rang k besitzt.) Mit F'ix\...,x")=
a;*+* - <^*+i {x\...,x''),
(i = 1,...
,n - k)
formen wir das System (8.139) in die Gestalt (8.137) um. Da die Ungleichung (8.138) erfiillt ist, garantiert uns Beispiel 6, dass die Menge / ( [ / ( t o ) ) tatsachlich eine fc-dimensionale glatte Flache in MP ist. 8.7.2 D e r T a n g e n t i a l r a u m Bei der Untersuchung des Bewegungsgesetzes x = x{t) einer P u n k t m a s s e in M? haben wir, ausgehend von der Gleichung x{t) = x{0) + x'{0)t + o{t)
fiir
t^O
(8.140)
und unter der Annahme, dass der P u n k t t = 0 kein stationarer P u n k t der Abbildung M 9 t i-)- x{t) £ K^ ist, d.h. x'{0) 7^ 0, die Tangente an die Trajektorie im P u n k t a;(0) als lineare Teilmenge von ffi^ definiert. Sie kann in parametrischer Form durch die Gleichung x-xo=x'{0)t
(8.141)
x-xo=^-t
(8.142)
oder die Gleichung formuliert werden, mit XQ = x{0) und dem Richtungsvektor ^ = x'{0) der Geraden. Im Wesentlichen haben wir dies bei der Definition der Tangentialebene an den Graphen einer Funktion z = f{x,y) in M^ wiederholt. Wenn wir die Gleichung z = f{x, y) durch die trivialen Gleichungen x = x und y = y erganzen, erhalten wir namlich eine Abbildung M^ 9 {x,y) ^ (^x,y, f{x,y)) G ffi^, mit der Tangente im P u n k t {xo,yo), die durch die lineare Abbildung
0
^
] (^
x(a;o,2/o) fy{xo,yo) J
^^
- Xo
.143)
-yo
mit ZQ = ,f{xo,yo) gegeben wird. Wenn wir hierbei t = (x — xo,y — yo) und x = (x — XQ, y — yo,z — ZQ) setzen und die Jacobimatrix dieser Transformation in (8.143) mit a;'(0) bezeichnen, konnen wir erkennen, dass der Rang von (8.143) zwei ist und dass Gleichung (8.143) in dieser Schreibweise die Form (8.141) besitzt. Das Besondere an Gleichung (8.143) ist, dass nur die letzte Gleichung der dazu aquivalenten drei Gleichungen
= 2/ - 2/0 , = fxi^o,yo){x
(8.144) -xo)
+ fyixo,y
-0){y
-yo)
548
8 Differentialrechnung mit Punktionen mehrerer Variabler
eine nicht triviale Gleichung ist. Genau dies ist der Grund dafiir, dass sie bei der Definition der Tangentialebene an den Graphen von z = f{x,y) in (a;o,2/0)-^o) als Gleichung beibehalten wird. Mit dieser Beobachtung sind wir nun in der Lage, eine Definition einer kdimensionalen Tangentialebene an eine fc-dimensionale glatte Flache 5 C M" zu geben. Aus Definition 1 fiir eine Flache wissen wir, dass eine fc-dimensionale Flache S in einer Umgebung jedes ihrer P u n k t e XQ & S parametrisch definiert werden kann, d.h. mit Hilfe der Abbildungen l'^ 3 (t^,...,t*^) i->(a;^,... ,a;") £ S. Eine derartige Parametrisierung kann als Restriktion der Abbildung (f~^: I"^U{xo) auf die fc-dimensionale Ebene t*+^ = • • • = t " = 0 betrachtet werden (vgl. Abb. 8.10). Da (p~^ ein Diffeomorphismus ist, ist die Determinante der Jacobimatrix der Abbildung Lp~^ : / " —>• U{xo) in jedem P u n k t des Wiirfels / " ungleich Null. Dann muss aber die Abbildung / * 3 ( t ^ , . . . , t*^) H^ ( a ; ^ , . . . , x " ) € S, die wir durch Restriktion von (p~^ auf diese Ebene erhalten, ebenfalls in jedem P u n k t von 7*^ Rang fc besitzen. Setzen wir nun ( t ^ , . . . , t*) = t £ 7*^ und bezeichnen 7*^ 3 t H^ a; £ 5 mit X = x{t), erhalten wir eine lokale parametrische Darstellung der Flache S, die die durch (8.140) zum Ausdruck gebrachte Eigenschaft besitzt. Auf dieser Basis verstehen wir (8.141) als die Gleichung des Tangentialraums oder der Tangentialebene an die Flache 5 C ffi" in XQ £ S. Somit konnen wir die folgende Definition iibernehmen. D e f i n i t i o n 2. Ist eine fc-dimensionale Flache 5 c M " , l < f c < n i n einer Umgebung von XQ G S durch eine glatte Abbildung (t^,... ,t'') = t >->• x = {x^,...,x") definiert, so dass XQ = x{0) und besitzt die Matrix a;'(0) den Rang fc, dann wird die fc-dimensionale Flache in ffi", die parametrisch durch die Matrixgleichung (8.141) definiert wird, als Tangentialebene oder als Tangentialraum an die Flache S in XQ G S bezeichnet. In Koordinatenschreibweise ergibt (8.141) das folgende Gleichungssystem: x' (8.145) /^i rp '<'
y-i rp ' ^
,^"--o" = ir(o)t^ + --- + ir(o)t^ Wir werden den Tangentialraum an die Flache 5 in a; £ 5 wie zuvor mit TSx bezeichnen^. Eine wichtige und niitzliche Ubung, die der Leser selbstandig durchfiihren kann, ist der Beweis der Invarianz der Definition des Tangentialraums und Dies ist eine leichte Abanderung der iiblichen Schreibweise TxS bzw. Tx{S).
8.7 Flachen in R" und bedingte Extrema
549
der Beweis, dass die lineare Abbildung 11->- x'{0)t, die Tangente an die Funktion t H^ x{t) ist und die die Flache S lokal definiert, eine Abbildung des Raumes ffi* = TM^ auf die Ebene TSx{o) ist (vgl. Aufgabe 3 am Ende diesen Abschnitts). Wir wollen nun die Gleichung der Tangentialebene an die fc-dimensionale Flache S bestimmen, die in MP durch das System (8.137) definiert wird. Um Definitlieit siclierzustellen, werden wir annelimen, dass Bedingung (8.138) in einer Umgebung des Punktes XQ & S gilt. Wenn wir {x^,... ,x^) = u, {x''^^,... ,x") = v und ( F ^ , . . . ,F"~*^) = F schreiben, konnen wir das System (8.137) als F(u,v) = 0
(8.146)
schreiben und (8.138) als detF^{u,v)y^O
.
(8.147)
Mit Hilfe des Satzes zur impliziten Funktion wechseln wir in einer Umgebung des Punktes {uo,vo) = (XQ, ... ^ XQ ^ Xri ^... ^ XQ I von Gleichung (8.146) zur aquivalenten Gleichung V = f{u) . (8.148) Wenn wir diese mit der Identitat u = u erganzen, erhalten wir dadurch die parametrische Darstellung der Flache S in einer Umgebung von XQ £ S: u , .149)
fin) Aufbauend auf Definition 2 erhalten wir aus (8.149) die parametrische Gleichung u — UQ = E • t ,
.150) vo = f'iuo)
•t
fiir die Tangentialebene. Hierbei ist E die Einheitsmatrix und t = u — UQ. Wie schon fiir das System (8.144), behalten wir in (8.150) nur die nicht triviale Gleichung V-vo = f'{uo){u-uo) , (8.151) die eine Verbindung der Variablen x\ ... ,x mit den Variablen X herstellt, durch die der Tangentialraum bestimmt wird. Aus dem Satz zur impliziten Funktion folgt die Gleichung f(uo)
= -[F^iuo,vo)]~'[Fliuo,vo)]
,
mit deren Hilfe wir (8.151) wie folgt neu formulieren: Fl^{uo,vo)iu - uo) + Fl,{uo,vo)iv - WQ) = 0 .
»• • • » X
550
8 Differentialrechnung mit Punktionen mehrerer Variabler
Daraus erhalten wir, nachdem wir zu den Variablen (x^,... ,x") = x zuriickgekehrt sind, die gesuchte Gleichung fiir den Tangentialraum TSxg C ffi", namlich Fl^(xo)(x-xo)=0 • (8.152) In Koordinatenschreibweise ist (8.152) aquivalent zu folgendem Gleichungssystem: — {xo){x^ - 4 ) + • • • + 7fir(a;o)(a;" - x'S) = 0 ,
dx^
dx^'
.153) dx^
-{xo){x^ - 4 ) + • • • +
a „ {xo){x" -xl^)
dx^'
=0
Nach Voraussetzung ist der Rang dieses Systems gleich n — k, und daher wird dadurch eine fc-dimensionale Ebene in M" definiert. Die affine Gleichung (8.152) ist (bei gegebenem Punkt XQ) aquivalent zur Vektorgleichung F^(a;o)-C = 0 (8.154) mit ^ = X — XQ.
Somit liegt der Vektor ^ in der Ebene TSxg, die in XQ G S zur Flache 5 C M" tangential ist, die genau dann durch die Gleichung F{x) = 0 definiert wird, wenn sie die Bedingung (8.154) erfiillt. Daher konnen wir TSxg als den Vektorraum verstehen, der aus den Vektoren ^ besteht, die (8.154) erfiiUen. Diese Tatsache motiviert die Verwendung des Ausdrucks Tangentialraum. Wir woUen nun den folgenden Satz beweisen, den wir bereits aus einem SpezialfaU kennen (vgl. Abschnitt 6.4). Satz. Der Raum TSx„, der in einem Punkt XQ G S zu einer glatten Flache 5 C ffi" tangential ist, besteht aus den Vektoren, die zu glatten Kurven auf der Flache S, die durch den Punkt XQ verlaufen, tangential sind. Beweis. Die Flache S sei in einer Umgebung des Punktes XQ G S durch das Gleichungssystem (8.137) definiert, das wir in Kurzform als F{x) = 0
(8.155)
schreiben, mit F = ( F ^ , . . . ,F"~*), x = (a;^,... ,a;"). Sei T : / -)• 5 ein behebiger glatter Weg mit Spur in S. Sei / = {t € M| |t| < 1}. Wir werden annehmen, dass a;(0) = XQ. Da x{t) £ S fiir t G I, erhalten wir nach Substitution von x{t) in (8.155), dass F{x{t)) = 0 (8.156) fiir t G I. Wir erhalten, wenn wir diese Identitat nach t ableiten, dass Fi{x{t))-x'{t)=0.
8.7 Flachen in R" und bedingte Extrema
551
Insbesondere erhalten wir fiir t = 0, wenn wir ^ = x'{0) setzen, dass
d.h., der Vektor ^, der zur Trajektorie in XQ (zur Zeit t = 0) tangential ist, erfilUt die Gleichung (8.154) des Tangentialraums TSx„Wir wollen nun zeigen, dass zu jedem Vektor ^, der (8.154) erfiillt, ein glatter Weg F : I ^ S existiert, der eine Kurve in S definiert, die durch XQ in t = 0 verlauft und zur Zeit t = 0 den Geschwindigkeitsvektor ,f besitzt. Dadurch wird gleichzeitig die Existenz glatter Kurven, die durch XQ verlaufen, in S sichergestellt, die wir implizit im ersten Teil des Beweises dieses Satzes vorausgesetzt haben. Zur Definitheit nehmen wir an, dass die Bedingung (8.138) gilt. Wenn wir die ersten k Koordinaten S},... ,^'' des Vektors ^ = (^^,..., ^*, ^*+^,..., ,f") kennen, konnen wir die anderen Koordinaten ^*^+^,...,^" eindeutig aus (8.154) bestimmen (das zum System (8.153) aquivalent ist). Wenn wir daher feststellen, dass ein Vektor ^ = (^^,... ,^*,^*+^,... ,^") die Gleichung (8.154) erfiillt, konnen wir folgern, dass C = •?• Wir werden dies ausnutzen. Aus Bequemlichkeit fiihren wir wieder die Schreibweisen u = (a;^,..., a;*), V = (a;*"'""'^,... ,a;"), x = {x^ ^... ,x") = {u,v) und F{x) = F{u,v) ein. Damit nimmt (8.155) dieselbe Gestalt an wie (8.146) und die Bedingung (8.138) wird zu (8.147). Im Teilraum ffi* C ffi" der Variablen x^,... ,a;* wahlen wir eine parametrisch definierte Gerade X
S t )
~ XQ
t eK
et,
a;*
niit deni Richtungsvektor (^^,...,^*), den wir mit ^„ bezeichnen. In noch kiirzerer Form lasst sich diese Gerade wie folgt schreiben: u = uo+^ut-
(8.157)
Wenn wir (8.146) nach v auflosen, erhalten wir nach dem Satz zur impliziten Funktion eine glatte Funktion (8.148), die, wenn wir die rechte Seite von (8.157) als Argument einsetzen und sie durch (8.157) erganzen, eine glatte Kurve in MP ergibt, die wie folgt definiert ist: u = uo+^ut
, t e C/(0) e M .
(8.158)
= 0, hegt diese Kurve offensichthch in der Flache S. AuDa F(u,f{u)) fierdem ist aus den Gleichungen (8.158) klar, dass die Kurve fiir t = 0 durch den Punkt {UQ,VQ) = (a;J,...,XQ,XQ^ , • • •,XQ) = XQ G S verlauft.
552
8 Differentialrechnung mit Punktionen mehrerer Variabler Wenn wir die Identitat F{uit),vit))
=F{uo
+ ^ut,fiuo+U))
=0
nach t ableiten, erhalten wir fiir t = 0, dass
wobei £,u = t^'(O) = (C*"*"^) • • • iC")- Diese Gleichung zeigt uns, dass der Vektor ^ = (^„,^„) = ( ^ i , . . . , ^ * , ^ * + i , . . . , ^ » ) die Gleichung (8.154) erfiillt. Daher konnen wir mit der oben getrofFenen Anmerkung folgern, dass ^ = £,. Der Vektor ^ ist aber der Geschwindigkeitsvektor der Trajektorie (8.158) fiir t = 0. Damit ist der Satz bewiesen. D
8.7.3 E x t r e m a mit N e b e n b e d i n g u n g e n a. P r o b l e m s t e l l u n g Eine der brillantesten und am besten bekanntesten Errungenschaften der Differentialrechnung ist ihre Vorschriftensammlung um E x t r e m a von Funktionen aufzufinden. Die notwendigen Bedingungen und hinreichenden Priifungen des Differentials zur Bestimmung von Extrema, die wir aus dem Satz von Taylor erhalten, gelten, wie wir wissen, fiir innere Extrema. Anders ausgedriickt, so lassen sich diese Ergebnisse nur zur Untersuchung des Verhaltens von Funktionen M" 3 a; i->- /(a;) £ M in einer Umgebung eines P u n k t e s XQ G M " anwenden, wenn das Argument x in einer Umgebung von xo in ffi" jeden Wert annehmen kann. Oft treffen wir auf eine kompliziertere, und aus praktischer Sicht sogar interessantere Situation, bei der ein E x t r e m u m einer Funktion unter gewissen Nebenbedingungen, die den Veranderungsbereich des Arguments einschranken, gesucht wird. Ein typisches Beispiel ist die Suche nach einem Korper mit maximalem Volumen unter der Bedingung, dass seine Oberflache eine vorgegebene Flache ist. Um einen fiir uns zuganglichen mathematischen Ausdruck fiir ein derartiges Problem zu erhalten, werden wir die Aussage vereinfachen und annehmen, dass wir aus der Menge der Rechtecke mit festem Umfang 2p dasjenige mit der grofiten Flache a suchen. Wir bezeichnen die Langen der Seiten des Rechtecks mit x und y und schreiben a{x, h) = X • y , x + y = p• Daher suchen wir ein E x t r e m u m der Funktion a{x,y) unter der Bedingung, dass die Variablen x und y durch die Gleichung x + y = p miteinander verbunden sind. Wir suchen das E x t r e m u m nur auf der Menge von P u n k t e n in M^, die diese Gleichung erfiillen. Dieses spezielle Problem lasst sich natiirhch ohne Schwierigkeiten losen: Dazu geniigt es, y = p — x zu schreiben und diesen
8.7 Flachen in R" und bedingte Extrema
553
Ausdruck in die Formel fiir a{x,y) einzusetzen und dann das Maximum der Funktion x(p — x) mit den iiblichen Methoden zu bestimmen. Wir benotigten dieses Beispiel nur, um die Problemstellung als solches zu erklaren. Im Allgemeinen stellt sich die Frage nach einem E x t r e m u m mit Nebenbedingungen iiblicherweise so, dass wir ein E x t r e m u m einer Funktion mit reellen Werten y = f(x\...,xn (8.159) mit n Variablen suchen, wobei diese Variablen ein Gleichungssystem Fi(a;i,...,a;") = 0, (8.160) F™(a;i,...,a;") = 0 erfiillen miissen. Da wir die Absicht haben, mit Hilfe der DifFerenzierbarkeit Bedingungen fiir ein E x t r e m u m zu formulieren, gehen wir davon aus, dass alle diese Funktionen differenzierbar sind, j a sogar stetig difFerenzierbar. 1st der Rang des Systems von Funktionen F^,... ,F"^ gleich n — k, dann wird durch die Bedingungen (8.160) eine fc-dimensionale glatte Flache S in M" definiert. Vom geometrischen Standpunkt aus entspricht die Suche nach einem E x t r e m u m mit Nebenbedingungen der Suche nach einem E x t r e m u m der Funktion / auf der Flache S. Genauer formuliert, so betrachten wir die Restriktion / | der Funktion / auf die Flache S und suchen ein E x t r e m u m dieser Funktion. Die Bedeutung des Konzepts eines lokalen Extremums als solches bleibt natiirlich unverandert, d.h., ein P u n k t XQ G S ist ein lokales E x t r e m u m von / auf S oder, kiirzer, von / | g , falls eine Umgebung^^ Us{xo) von a;o in 5 C M" existiert, so dass f{x) > f{xo) fiir jeden P u n k t x G Us{xo) (in diesem Fall ist XQ ein lokales Minimum) oder f{x) < f{xo) (und dann ist XQ ein lokales Maximum). Gelten diese Ungleichungen streng fiir x G Us{xo) \ XQ, dann werden wir es, wie schon zuvor, als ein isoliertes E x t r e m u m bezeichnen. b . E i n e n o t w e n d i g e B e d i n g u n g fiir e i n E x t r e m u m m i t Nebenbedingung S a t z 1. Sei f : D ^ W eine Funktion in C ( i ) ( D ; K ) . Sei S Eine notwendige Bedingung ein lokales Extremum von f | „
auf einer ojfenen Menge D C ffi" definierte eine glatte Flache in D. dafiir, dass ein nicht stationdrer Punkt XQ G S ist, ist TS,,
C
TN,^
.161)
wobei TSxo (^^^ Tangentialraum an die Flache S in XQ ist und TN^g ist der Tangentialraum an die Niveauflache N = {x G D\ f{x) = / ( X Q ) } von f, mit xo G N. ^° Wir wiederholen, dass Us{xo) = S Ci U{xo), wobei U{xo) eine Umgebung von xo in R" ist.
554
8 Differentialrechnung mit Punktionen mehrerer Variabler
Wir beginnen mit der Anmerkung, dass die Forderung, dass der Punkt xo ein nicht stationarer Punkt von / ist, keine wesentliche Einschrankung ini Zusanimenhang mit der hier betrachteten Suche nach einem Extremum mit Nebenbedingung ist. Selbst dann, wenn der Punkt XQ G D ein stationarer Punkt der Funktion / : _D —>• ffi oder ein Extremum der Funktion ware, ist klar, dass er auch ein mogliches oder tatsachliches Extremum fiir die Funktion / | sein konnte. Aber das Neue an diesem Problem ist ja gerade, dass die Funktion / kritische Punkte und Extrema haben kann, die verschieden von denen von / sind. Beweis. Wir wahlen einen beliebigen Vektor ^ £ TSxg und einen glatten Weg X = x{t) in S, der fiir t = 0 durch diesen Punkt verlauft, wobei der Vektor ^ der Geschwindigkeit fiir t = 0 entspricht, d.h. rlx
-(0)=C.
(8.162)
Ist Xo ein Extremum der Funktion / | , dann muss die glatte Funktion f{x{t)) mt = 0 ein Extremum besitzen. Nach der notwendigen Bedingung fiir ein Extremum muss ihre Ableitung fiir t = 0 verschwinden, d.h., es muss f{xo)-^
=0
(8.163)
gelten, wobei
'•<^«' = ( l ? — ^ )
'•"' « = «'—«").
Da Xo ein nicht stationarer Punkt von / ist, ist die Bedingung (8.163) aquivalent zur Bedingung, dass ^ £ TN^^, da Gleichung (8.163) genau die Gleichung fiir den Tangentialraum TN^^ ist. Somit haben wir bewiesen, dass TS^o C TN^g• Wird die Flache S in einer Umgebung von XQ durch das Gleichungssystem (8.160) definiert, dann wird der Raum TSxg, wie wir wissen, durch das lineare Gleichungssystem
T(^o)?' + --- + 7rir(^o)r = o, .164)
beschrieben. Der Raum TNx„ wird durch die Gleichung ^(«^o)?'+--- + ^ M r
= 0
(8.165)
8.7 Flachen in R" und bedingte Extrema
555
definiert und, da jede Losung von (8.164) eine Losung von (8.165) ist, ist die letzte Gleichung eine Folgerung aus (8.163). Aus diesen Betrachtungen folgt, dass die Relation TSx^ C TN^^ zu der analytischen Aussage aquivalent ist, dass der Vektor grad/(a;o) eine Linearkombination der Vektoren gradF*(a;o), (« = 1 , . . . ,m) ist, d.h. (8.166) Lagrange schlug die Benutzung der folgenden Hilfsfunktion m
L{x,\)=!{x)-Y,\iF\x)
(8.167)
i=l
fiir die Suche nach eineni Extremuni mit Nebenbedingungen vor, wobei dabei die Schreibweise in (8.166) fiir die notwendige Bedingung fiir ein Extremum einer Funktion (8.159), deren Variablen durch (8.160) miteinander verkniipft sind, beriicksichtigt wurde. Diese Funktion besitzt m -\- n Variable (x. A) = (a;i,...,a;™,Ai,...,A„). Diese Funktion wird Lagrange Funktion genannt und die Methode, in der sie zum Einsatz kommt, wird als Methode der Lagrange MultipUkatoren bezeichnet. Die Funktion (8.167) ist aufierst praktisch, da die notwendigen Bedingungen fiir ein Extremum, wenn sie als Funktion von (x, A) = (x^,..., a;™, A i , . . . , A„) betrachtet werden, genau (8.166) und (8.160) entsprechen. Tatsachlich gilt
'"' dL --{x,X)
>. dXi
= -F'{x)=0,
(8.168) (i = l , . . . , m ) .
Somit konnen wir bei der Suche nach einem Extremum einer Funktion (8.159), deren Variablen die Bedingungen (8.160) erfiillen miissen, die Lagrange Funktion (8.167) mit unbestimmten Multiplikatoren formulieren und ihre stationaren Punkte bestimmen. Wenn es moglich ist, XQ = (XQ, ... ,XQ) aus dem System (8.168) zu bestimmen, ohne A = ( A i , . . . , Am) zu finden, dann ist es im Hinblick auf das Ausgangsproblem das, was getan werden sollte. Wie wir an (8.166) erkennen konnen, sind die Multiplikatoren Aj, (i = 1 , . . . , m) eindeutig bestimmt, wenn die Vektoren grad F*(a;o), (« = 1 , . . . , m) linear unabhangig sind. Die Unabhangigkeit dieser Vektoren ist aquivalent zur Aussage, dass der Rang des Systems (8.164) gleich m ist, d.h., dass aUe Gleichungen in diesem System wesentlich sind (keine davon ergibt sich aus den anderen).
556
8 Differentialrechnung mit Punktionen mehrerer Variabler
Dies ist iiblicherweise der Fall, da wir davon ausgehen, dass alle Gleichungen (8.160) unabhangig sind und dass der Rang des Systems von Funktionen F^,...,F™ in jedem P u n k t x £ X gleich m ist. Die Lagrange Funktion wird aucli oft als m
i=l
gesclirieben. Sie untersclieidet sicli von dem obigen Ausdruck nur durch den unwesentlichen Ersatz von Aj durch — Aj^^. Beispiel
9. Wir suchen die Extrenia einer synimetrisclien quadratisclien Form n f{x)
= ^
ttijX^x^
(ttij = Qji)
(8.169)
auf der Kugelschale n
F{x) = ^ ( a ; * ) 2 - 1 = 0 .
(8.170)
i=l
Wir woUen die Lagrange Funktion /
n
^
L{x,X) = Y, (^ij^'^^ - ^( ^(a;*)^ - 1 fiir dieses Problem formulieren sowie die notwendigen Bedingungen fiir ein E x t r e m u m von L{x,X) unter Beriicksichtigung von a^ = OJJ: — (x,A) = 2(^^aijx^-Xx'\
=0,
<
(i = l , . . . , n ) , (8.171)
8L
/
"
3j(x,A)=(_g(«V-l Wenn wir die erste Gleichung mit x* multiplizieren und iiber i summieren, erhalten wir unter Beriicksichtigung der zweiten Gleichung, dass in einem E x t r e m u m die Beziehung n
Y^
Qijx'x^ - A = 0
(8.172)
gelten muss. Im Hinblick auf das notwendige Kriterium fiir ein Extremum mit Nebenbedingung vgl. Aufgabe 6 in Abschnitt 10.7 (Teil 2).
8.7 Flachen in R" und bedingte Extrema
557
Das System (8.171) minus der letzten Gleichung lasst sich wie folgt neu forniulieren: n
Y^ttijx^
=Xx\
{i = l,...,n)
.
(8.173)
«=i
Daraus folgt, dass A ein Eigenwert des linearen Operators A ist, der durch die Matrix (a^) definiert wird und dass x = (x^,... ,x") ein Eigenvektor dieses Operators zu diesem Eigenwert ist. Da die auf der kompakten Menge S = ix G W^\ ^ (x*)^ = 1 > stetige Funktion (8.169) ihren Maximalwert in einem Punkt annehmen muss, muss das System (8.171) und somit auch (8.173) eine Losung besitzen. Somit haben wir im Vorbeigehen sichergestellt, dass jede reelle symmetrische Matrix (ttij) mindestens einen reellen Eigenwert besitzt. Dies ist ein aus der linearen Algebra wohl bekanntes und zentrales Ergebnis im Existenzbeweis einer Basis von Eigenvektoren fiir einen symmetrischen Operator. Um die geometrische Bedeutung des Eigenwerts A zu zeigen, merken wir an, dass wir fiir A > 0 beim Ubergang zu den Koordinaten f = x^VX anstelle von (8.172) die Gleichung n
J2 aijtH^ = 1
(8.174)
erhalten und anstelle von (8.170):
J2itr = I •
(8.175)
n
^ ( t * ) ^ entspricht aber dem Quadrat des Abstands vom Ursprung zum i=l
Punkt t = {t^,... ,t") auf der durch (8.174) beschriebenen Flache. Beschreibt daher (8.174) ein EUipsoid, dann entspricht das Reziproke 1/A des Eigenwertes A dem Quadrat der Lange einer ihrer Halbachsen. Dies ist eine niitzliche Beobachtung. Sie zeigt uns insbesondere, dass die Gleichungen (8.171), die notwendige Bedingungen fiir ein Extremum mit Nebenbedingung sind, noch nicht hinreichend sind. SchlieBlich besitzt ein Ellipsoid in ffi^ neben seiner groBten und kleinsten Halbachsen eine dritte Halbachse, deren Lange zwischen der der anderen liegt, und in jeder Umgebung des Endpunkts dieser Halbachse gibt es sowohl Punkte, die naher am Ursprung liegen und Punkte die weiter entfernt vom Ursprung liegen als der Endpunkt. Das letztere wird vollkommen offensichtlich, wenn wir die Ellipsen betrachten, die wir erhalten, wenn wir einen Schnitt des urspriinglichen Ellipsoids mit zwei Ebenen bilden, die durch die Halbachse mit mittlerer Lange und durch die kleinste Halbachse bzw. die groBte Halbachse bestimmt wird. In einem der beiden FaUe ist die Halbachse mit mittlerer Lange die groBe Halbachse der EUipse des Schnitts. In der anderen Ebene ist sie die kleine Halbachse.
558
8 Differentialrechnung mit Punktionen mehrerer Variabler
Dem gerade Gesagten soUten wir noch hinzufiigen, dass dann, wenn 1/vA die Lange dieser mittleren Halbachse ist, A ein Eigenwert des Operators A ist, wie wir aus der kanonischen Gleichung eines EUipsoiden erkennen konnen. Daher wird das System (8.171), das die notwendigen Bedingungen fiir ein E x t r e m u m der Funktion / | zum Ausdruck bringt, tatsachlich eine Losung besitzen, die nicht einem E x t r e m u m der Funktion entspricht. Das in Satz 1 (die notwendige Bedingung fiir ein E x t r e m u m mit Nebenbedingung) erhaltene Ergebnis ist in Abb. 8.11a und Abb. 8.11b veranschaulicht.
A b b . 8.11. Die erste dieser Abbildungen erklart, warum der P u n k t XQ auf der Flache S kein E x t r e m u m von / L sein kann, wenn S keine Tangente an die Flache N = {x £ MP\ f{x) = f{xo) = Co} in XQ ist. Dabei haben wir angenommen, dass grad/(a;o) ^ 0. Diese Annahme sorgt dafiir, dass in einer Umgebung von XQ sowohl P u n k t e existieren, die auf einer hoheren C2-Niveauflache der Funktion / liegen, als auch P u n k t e einer tieferen ci-Niveauflache. Da die glatte Flache S die Flache N schneidet, d.h. die co-Niveauflache der glatten Funktion / , folgt, dass S sowohl hohere als auch tiefere Niveauflachen von / in einer Umgebung von XQ schneiden wird. Dies bedeutet aber, dass XQ kein E x t r e m u m von / sein kann. Die zweite Abbildung zeigt, warum der P u n k t XQ sich dann, wenn N in XQ Tangente an S ist, als E x t r e m u m herausstellen kann. In der Abbildung ist XQ ein lokales Maximum von f \ „ . Dieselben Uberlegungen erlauben es, zu skizzieren, dass das notwendige Kriterium fiir ein E x t r e m u m nicht hinreichend ist. So konnen wir beispielsweise in Anlehnung an Abb. 8.12 I{x,y)
= y
und
F{x,y)
= x"^ - y = 0
betrachten. Dabei wird offensichtlich, dass y im P u n k t (0,0) kein Extrem u m auf der Kurve 5 C ffi^, die durch die Gleichung y = x^ definiert wird, besitzt. Dies gilt sogar, obwohl diese Kurve in diesem P u n k t Tangente an die Niveaukurve f{x,y) = 0 der Funktion / ist. Wir merken an, dass grad/(0,0) = ( 0 , 1 ) ^ 0 .
8.7 Flachen in R" und bedingte Extrema
559
S Co
^
^
^
N
Xo
A b b . 8.12. OflFensichtlich ist dies im Wesentlichen dasselbe Beispiel, das uns friiher schon dazu diente, den Unterschied zwischen notwendigen und hinreichenden Bedingungen fiir ein klassisches inneres Extrenium einer Funktion zu verdeutlichen. c. E i n e h i n r e i c h e n d e B e d i n g u n g fiir e i n E x t r e m u m m i t Nebenbedingung Wir werden nun die folgende hinreichende Bedingung fiir die Gegenwart oder Abwesenheit eines Extremunis mit Nebenbedingung beweisen. S a t z 2. Sei f : D ^ W eine auf einer ojfenen Menge D C ffi" definierte Funktion, die zur Klasse C^ ''{D;W) gehort. Sei S die durch (8.160) definierte Flache in D, mit F* £ C^"^' {D; ffi), (« = 1 , . . . , m) und der Rang des Systems von Funktionen {F^,..., F™} sei in jedem Punkt von D gleich m. Angenommen, die Parameter A i , . . . , Xm in der Lagrange Funktion m
L{x) = L{x- A) = !{x\.
..,x")-J2
>^iP'i^'
,...,x")
i=\
seien so gewahlt worden, dass die fiir ein Extremum der Funktion / L XQ G S mit Nebenbedingung notwendige Bedingung (8.166) erfiiUt ist}"^ Ist die quadratische Form
in
fiir Vektoren ^ G TSx„ entweder positiv definit oder negativ definit, dann ist dies eine hinreichende Bedingung dafiir, dass der Punkt XQ ein Extremum der Funktion f „ ist. Ist die quadratische Form (8.176) aufTSxg positiv definit, dann ist XQ ein isoliertes lokales Minimum von /1 „. Ist sie negativ definit, dann ist XQ ein isoliertes lokales Maximum. Nimmt die Form (8.176) aufTSxg sowohl negative als auch positive Werte an, dann ist dies eine hinreichende Bedingung dafiir, dass der Punkt XQ kein Extremum von f I „ ist. ^'^ Wenn wir A festhalten, wird L{x; A) eine nur von x abhangige Funktion. Wir bezeichnen diese Funktion mit L(x).
560
8 Differentialrechnung mit Punktionen mehrerer Variabler
Beweis. Wir halten zunachst fest, dass L{x) = f{x) fiir x G S, so dass wir, wenn wir zeigen, dass XQ & S ein E x t r e m u m der Funktion L L ist, auch gleichzeitig gezeigt haben, dass XQ auch ein E x t r e m u m von / L ist. Laut Annahme ist das notwendige Kriterium (8.166) fiir ein E x t r e m u m von / | in XQ erfiillt, so dass in diesem P u n k t also gradL(a;o) = 0 gilt. Daher lautet die Taylor-Entwicklung von L{x) in einer Umgebung von XQ = (XQ, ... ,XQ) fiir X ^ XQ: 1 d^L L{x) - L{xo) = ^Q^iQ^jMix'
- xl,){x'
- xi) + o{\\x - xoW") .
(8.177)
Wir erinnern nun daran, dass wir bei der Motivation fiir Definition 2 bemerkt haben, dass eine lokale (beispielsweise in einer Umgebung von XQ G S) parametrische Definition einer glatten fc-dimensionalen Flache S moglich ist (in diesem Fall ist k = n — m). Anders formuliert, so existiert eine glatte Abbildung K 9 ( t \ . . . , t ^ ) =t^x=
ix\...,x")
eK"
(wie zuvor werden wir sie in der Form x = x(t) schreiben), unter der sich eine Umgebung des P u n k t e s 0 = ( 0 , . . . , 0) £ M*^ bijektiv auf eine Umgebung von XQ in S abbilden lasst, wobei XQ = x{0) gilt. Wir merken an, dass die Relation x{t) - x{0) = x'{0)t + o{\\t\\) fiir t ^ 0 , die die Differenzierbarkeit der Abbildung t i->- x{t) fiir t = 0 zum Ausdruck bringt, zu den n Koordinatengleichungen x^t)
- x\0)
= —{0)e
+ o{\\t\\) ,
(* = 1 , . . . , n )
(8.178)
aquivalent ist, in der sich der Index a iiber die Zahlen 1 bis k erstreckt und die Summation iiber diesen Index verlauft. Aus diesen numerischen Gleichungen folgt, dass \x'{t)-x\0)\
=0(||t||)
fiirt^O
und daher \\x{t) - X ( 0 ) | | R « = 0 ( | | t | | R . ) fiir t ^ 0 .
(8.179)
Mit Hilfe der Gleichungen (8.178), (8.179) und (8.177) erhalten wir, dass fiir t -^ 0 gilt: L{x{t))
- L{x{0))
= ^dijL{xo)dax'(0)dpx(0)et^
+ o{\\tW').
(8.177')
8.7 Flachen in R" und bedingte Extrema
561
Daher folgt aus der Annahme, dass die Form dijL{xo)dax'(0)dfix\0)et'^
(8.180)
positiv oder negativ definit ist, dass die Funktion L(a;(t)) iiir t = 0 ein Extremum besitzt. Nimmt die Form (8.180) sowohl positive als auch negative Werte an, dann besitzt L(a;(t)) kein Extremum fiir t = 0. Da aber unter der Abbildung t H^ x{t) eine Umgebung des Punktes 0 £ ffi* auf eine Umgebung von x{0) = XQ G S auf der Flache S abgebildet wird, konnen wir folgern, dass die Funktion L | entweder auch ein Extremum in XQ von derselben Art wie die Funktion L(a;(t)) haben wird oder wie L(x{t)) kein Extremum haben wird. Daher bleibt zu zeigen, dass fiir Vektoren ^ e TS^o die Ausdriicke (8.176) und (8.180) nur verschiedene Schreibweisen fiir dasselbe Phanomen sind. Tatsachhch erhalten wir, wenn wir ^ = x'{0)t setzen, einen Vektor ^ der zu S in XQ tangential verlauft. Und fiir ^ = (^^,... , ^ " ) , x{t) = {x^,... ,x"-){t) und t = {t^,... ,t*) gelangen wir zu ^ = dpx^{0)t^,
(i = l , . . . , n ) ,
woraus folgt, dass die Ausdriicke (8.176) und (8.180) iibereinstimmen. D Wir halten fest, dass die praktische Nutzbarkeit von Satz 2 durch die Tatsache behindert wird, dass nur k = n — m der Koordinaten des Vektors ^ = (C^,... ,^") £ TSxo unabhangig sind, da die Koordinaten von ^ das System (8.164) erfiillen miissen, das den Raum TSxg definiert. Daher erzielt eine direkte Anwendung des Tragheitssatzes auf die quadratische Form (8.176) in diesem Fall im AUgemeinen nichts: Die Form (8.176) kann auf TR"^ zwar weder positiv noch negativ definit sein, aber dennoch auf TSxg definit. Wenn wir aber m Koordinaten des Vektors ^ durch die anderen k Koordinaten wie in den Gleichungen (8.164) formulieren und dann die sich ergebenden linearen Formen in (8.176) einsetzen, gelangen wir zu einer quadratischen Form mit k Variablen, deren positive bzw. negative Definitheit mit Hilfe des Tragheitssatzes untersucht werden kann. Wir woUen das Gesagte durch einige einfache Beispiele verdeutlichen. Beispiel 10. Angenommen, die Funktion f{x,y,z)
= x^ -y^
+z'^
sei im Raum ffi^ mit den Koordinaten x, y, z gegeben. Wir suchen nach einem Extremum dieser Funktion in der Ebene S, die durch die Gleichung F{x, y,z) = 2x — y — 3 = 0 definiert wird.
562
8 Differentialrechnung mit Punktionen mehrerer Variabler Wir schreiben die Lagrange Funktion L{x, y, z) = (x^ -y^ + z^) - \{2x - y - 3)
und die notwendigen Bedingungen fiir ein Extremuni ' dL T ^ = 2a; - 2A = 0 , ox 2y + X =--0,
dy
— - 2z= 0 , dz aL k dx '
{2x-y-
-3)
0
und erhalten daraus das mogliche Extremum p = (2,1,0). Als Nachstes bestimmen wir die Form (8.176): (8.181) Wir stellen fest, dass der Parameter A in diesem Fall nicht in dieser quadratischen Form auftritt, weswegen wir ihn auch nicht berechnet haben. Nun schreiben wir die Bedingung ^ £ TSp:
^e-e
0
(8.182)
Aus dieser Gleichung erhalten wir ^^ = 2^^. Dieses Ergebnis setzen wir in die Form (8.181) ein, wodurch sie folgende Gestalt annimmt: 3\2
-mr + (r) Dieses Mai sind S} und ^^ unabhangige Variable. Diese letzte Form kann offensichtlich sowohl positive als auch negative Werte annehmen und daher besitzt die Funktion / „ kein Extremum in p £ 5. Beispiel 11. Wir ersetzen in Beispiel 10 M^ durch M^ und die Funktion / durch
f{x,y) = x^ Wir behalten die Bedingung 2a; - 2/ - 3 = 0
bei, die nun eine Gerade S in der Ebene ffi^ definiert und finden p = (2,1) als ein mogliches Extremum.
8.7 Flachen in R" und bedingte Extrema
563
Anstelle der Form (8.181) erhalten wir die Form ie?
- ie?,
(8.183)
wobei zwischen ^^ und ^^ die obige Gleichung (8.182) gilt. Somit nimmt die Form (8.183) auf TSp nun die Gestalt
-He? an, d.h., sie ist negativ definit. Wir folgern daraus, dass der Punkt p = (2,1) ein lokales Maximum von / ist. Die folgenden einfachen Beispiele sind in mehrerer Hinsicht aufschlussreich. An ihnen konnen wir gezielt die Arbeitsweise sowohl der notwendigen als auch der hinreichenden Bedingungen fiir Extrema mit Nebenbedingungen verfolgen, einschlieBlich der Rolle des Parameters und der informellen RoUe der Lagrange Funktion als solches. Beispiel 12. Auf der Ebene ffi^ ist die Funktion
in kartesischen Koordinaten (x, y) gegeben. Wir suchen das Extremum dieser Funktion auf der Ellipse, die durch die kanonische Gleichung
fiir 0 < a < & gegeben wird. Aus geometrischen Betrachtungen ist offensichtlich, dass m i n / | = d^ und max /1 = 6^. Wir wollen dieses Ergebnis mit Hilfe der durch Satz 1 und Satz 2 empfohlenen Prozedur erhalten. Wenn wir die Lagrange Funktion
L{x,y,\) = {x^+y')-\[^
+
y^-\)
formuheren und die Gleichung dL = 0 losen, d.h. das System | ^ = ^ 1^ = 0, erhalten wir als Losungen (a;, y, A) = (±a, 0, a^),
=
(0, ±b, h"^) .
In Ubereinstimmung mit Satz 2 schreiben und untersuchen wir nun diese quadratische Form ^-d^L^ , die dem zweiten Glied der Taylor-Entwicklung der Lagrange Funktion in einer Umgebung der entsprechenden Punkte entspricht:
\i^,e^(,^^yef^{.-^)ief
564
8 Differentialrechnung mit Punktionen mehrerer Variabler
In den Punkten (±a, 0) der Ellipse S nimmt der Tangentialvektor ^ : (^^,C^) die Gestalt (0,.^^) an und fiir X = a^ lautet die quadratische Form:
('-ft«^ &2,
Wenn wir die Bedingung 0 < a < & beriicksiclitigen, konnen wir folgern, dass diese Form positiv definit ist und dalier besitzt die Funktion / L in den Punkten (±a, 0) £ S ein isoliertes lokales (und in diesem Fall offensiclitlich aucli globales) Minimum, d.li. m i n / | = a^. Auf ahnliclie Weise erhalten wir die Form
fiir die Punkte (0, ±b) G S und daraus m a x / | g = b'^. Anmerkung. Beacliten Sie hierbei die Rolle der Lagrange Funktion im Vergleich zur Rolle der Funktion / . In den entspreclienden Punkten auf den Tangentialvektoren verschwindet das Differential von / (wie auch das Differential von L), und die quadratische Form jd^/^^ = (^^)^ + (C^)^ ist in jedem der Punkte, in der sie berechnet wird, positiv definit. Nichtsdestotrotz besitzt die Funktion / L in den Punkten (±a, 0) ein isoliertes Minimum und ein isoliertes Maximum in den Punkten (0,±6). Um zu verstehen, was hier passiert, betrachten wir wieder den Beweis von Satz 2 und versuchen Relation (8.176') durch Einsetzen von / fiir L in (8.177) zu erhalten. Beachten Sie, dass dabei ein zusatzlicher Ausdruck auftritt, in dem x"{0) vorkommt. Der Grund dafiir, dass er im Unterschied zu dL nicht verschwindet, ist der, dass das Differential d/ von / in den entsprechenden Punkten nicht identisch NuU ist, obwohl die Funktionswerte tatsachhch auf den Tangentialvektoren (der Form a;'(0)) NuU sind. Beispiel 13. Wir suchen die Extrema der Funktion f{x,y,z)
= x^ +y^ +z'^
auf dem Ellipsoid S, die durch die Gleichung 2
2
2
F{x,y,z) = ^+ 1^ + ^-1 a^
0^
c^
=0
fiir 0 < a < b < c definiert sind. Wenn wir die Lagrange Funktion 2
L(x,y,z,X)
= {x'+y'
2
2
+ z^) - A ( ^ + f j + ^ " l )
in Ubereinstimmung mit der notwendigen Bedingung fiir ein Extremum schreiben, erhalten wir als Losung der Gleichung dL = 0, d.h. dem System dL_ — dL_— dl± — ^—V\ Auaa dx ~ dy ~ dz ~ d\ " ' - ' ' "'^^^
(a;, y, z, A) = (±a, 0,0, a^) ,
(0, ±b, 0, 6^) ,
(0, 0, ±c, c^) .
8.7 Flachen in R" und bedingte Extrema
565
Auf jeder der entsprechenden Tangentialebenen nimmt die quadratische Form
folgende Gestalt an:
(i-5j)(a» + (i-J)«V.
(»)
In den Fallen (a) und (c) liaben wir m i n / | = a? bzw. m a x / | = c^ gefunden, da 0 < a < & < c, wie aus dem hinreichenden Kriterium fiir die Gegenwart oder Abwesenheit eines Extremums mit Nebenbedingungen aus Satz 2 folgt. Dagegegen besitzt die Funktion / L in den P u n k t e n (0, ± 6 , 0 ) £ 5 , die zum Fall (6) gehoren, kein Extremuni. Dies stinimt voUstandig mit den offensichtliclien geometrisclien Betraclitungen, die wir bei der Diskussion des notwendigen Kriteriums fiir ein E x t r e m u m mit Nebenbedingungen aufgestellt haben, iiberein. Andere wichtige Gesichtspunkte der Konzepte der Analysis und der Geometrie, auf die wir in diesem Absclmitt trafen und die manchmal ganz sinnvoU sind, werden in den folgenden Ubungen und Aufgaben vorgestellt. Dazu gehort die pliysikalische Interpretation des Problems eines Extremums mit Nebenbedingung als solches, wie aucli des notwendigen Kriteriums (8.166) interpretiert als Krafte in einem Gleichgewiclitspunkt und die Interpretation der Lagrange Multiplikatoren als Betrag der reaktiven Kraft idealer Nebenbedingungen. 8.7.4 U b u n g e n u n d A u f g a b e n 1. Wege und Flachen. a) Sei / : / ^ R^ eine Abbildung der Klasse C<^'(/;R^) des Intervalls / C R. Wir betrachten diese Abbildung als Weg in R^. Zeigen Sie an Beispielen, dass ilire Spur / ( / ) manchmal keine Teilmannigfaltigkeit des R^ ist, wohingegen der Graph dieser Abbildung in R^ = R^ xR^ stets eine ein-dimensionale Teilmannigfaltigkeit des R^ ist, deren Projektion auf R^ der Spur / ( / ) des Weges entspricht. b) Losen Sie Aufgabe a) fiir den Fall, dass / ein Intervall in R* ist und / G C*-^'(/;R"). Zeigen Sie, dass in diesem Fall der Graph der Abbildung / : / — > • R" eine glatte fc-dimensionale Flache in R* x R" ist, deren Projektion auf die Unterraume R" gleich / ( / ) ist. c) Seien / i : Ji —>• S und f^ '• I2 ^ S zwei glatte Parametrisierungen derselben Flache 5* C R", wobei / i keine stationaren Punkte in / i besitzt und /2 keine stationaren Punkte in I-z- Zeigen Sie, dass dann die Abbildungen
566
8 Differentialrechnung mit Punktionen mehrerer Variabler /r'o/2:/2^/i,
n'oh-h^li
glatt sind. 2. Die Kugelschale in R" . a) Bestimmen Sie eineii maximalen Giiltigkeitsbereich fiir die krummlinigen Koordinaten ((/?, t/"), die man aus den Polarkoordinaten in R"' (vgl. (8.116) im vorigen Abschnitt) fiir p = 1 erhalt. b) Beantworten Sie die Frage a) fiir den Fall der (m —l)-dimensionaIen Kugelschale = {x e R I ||a;|| = 1)
c)
d) e)
f)
in R"* und den Koordinaten (931,..., (/^m-i), die man aus den Polarkoordinaten in R™ (vgl. (8.118) im vorigen Abschnitt) fiir /s = 1 erhalt. Lasst sich die Kugelschale S* C R*"'"'^ durch ein einziges Koordinatensystem {t^,... ,i*) definieren, d.h. einen einzigen Diffeomorphismus f : G ^ R*+^ eines Gebiets G C R * ? Wie grofl ist die minimale Anzahl von Karten, die in einem Atlas fiir die Oberflache der Erde benotigt werden? Wir wollen den Abstand zwischen Punkten der Kugelschale 5*^ C R^ durch die Lange der kiirzesten Kurve messen, die auf der Kugelschale 5*^ verlauft und die Punkte verbindet. Eine derartige Kurve entspricht dem Bogen eines geeigneten grofien Kreises. Gibt es eine lokale ebene Karte der Schale, so dass alle Abstande zwischen Punkten der Kugelschale zu den Abstanden zwischen ihren Bildern auf der Karte proportional sind (mit derselben Proportionalitatskonstanten)? Der Winkel zwischen Kurven (ob sie nun auf der Kugelschale liegen oder nicht) in ihrem Schnittpunkt wird als der Winkel zwischen den Tangenten an diese Kurven in diesem Punkt definiert. Zeigen Sie, dass lokale ebene Karten einer Kugelschale existieren, fiir die die Winkel zwischen den Kurven auf der Schale und den entsprechenden Kurven auf den Karten gleich sind (vgl. Abb. 8.13, die die sogenannte stereographische Projektion veranschaulicht.)
A b b . 8.13.
3. Der
Tangentialraum.
a) Beweisen Sie durch direkte Berechnung, dass die tangentiale Mannigfaltigkeit TSxo *ri eine glatte fc-dimensionale Flache S C R" in einem Punkt xo £ S unabhangig von der Wahl des Koordinatensystem in R" ist.
8.7 Flachen in R" und bedingte Extrema
567
b) Zeigen Sie, dass dann, wenii eine glatte Flache S C D auf eine glatte Flache S' C D' mit einem Diffeomorphismus f : D ^ D' des Gebiets _D C R" auf das Gebiet D' C R" abgebildet wird, wobei der Punkt xo £ S auf den Punkt X'Q G S' abgebildet wird, der Vektorraum TSXQ unter der linearen Abbildung f'{xo) '• R" —> R", die an / in xo G -D tangential ist, isomorph auf den Vektorraum TS', abgebildet wird. Xg
U
c) Wenn unter den Bedingungen der vorigen Aufgaben die Abbildung f : D ^ D' eine beliebige Abbildung der Klasse C*-^'(-D; D') ist, unter der f{S) C S", dann gilt f'{TSxo) C TS'^,^. Zeigen Sie dieses. d) Zeigen Sie, dass die ortliogonale Projektion einer glatten fc-dimensionalen Flache S C R" auf die zu ihr in xo G S fc-dimensionale Tangentialebene TSXQ in einer Umgebung des Beriihrpunktes xo eine eins-zu-eins Abbildung ist. e) Angenommen, dass ^ G TSXQ mit ||^|| = 1 unter den Bedingungen der vorigen Aufgabe. Die Gleichung x — xo = (,t einer Geraden in R", die in TSXQ liegt, kann benutzt werden, umjeden Punkt x G TSxo\xo durcli das Paar (t,$) zu cliarakterisieren. Zeigen Sie, dass die glatten Kurven an die Flache S, die diese nur im Punkt Xo schneiden, in einer Umgebung von xo zu Geraden x — xo = ^t gehoren. Zeigen Sie, dass wir, wenn wir t als Parameter auf diesen Kurven festlegen, Wege erhalten, auf denen die Geschwindigkeit fiir i = 0 dem Vektor ^ G TSxg entspricht, der die Gerade x — xo = (,t festlegt, aus der wir die vorgegebene Kurve auf S erhalten haben. Daher konnen die Paare (t,C), wobei ^ G TSxg, \\S,\\ = 1 und t eine reelle Zahl aus einer Umgebung C/(0) von 0 in R ist, in einer Umgebung von xo € S als Analogon zu Polarkoordinaten dienen. 4. Die Funktion F G C*'^-'(R";R), die keine stationaren Punkte besitzt, sei derart, dass die Gleichung F{x^,... , x") = 0 eine kompakte Flache S in R" definiert (d.h., S ist eine kompakte Teilmenge von R"). Zu jedem Punkt x G S gibt es einen Vektor ri(x) = gradF(a;), der zu S in a; normal ist. Wenn wir jeden Punkt x € S dazu zwingen, sich gleichformig mit der Geschwindigkeit ri{x) zu bewegen, erhalten wir eine Abbildung S B x ^ x + ri{x)t G R". a) Zeigen Sie, dass diese Abbildung fiir Werte i, die hinreichend nahe bei Null liegen, bijektiv ist und dass sich aus S fiir jedes derartige t eine glatte Flache St ergibt. b) Sei E eine Menge in R". Wir definieren die (5-Umgebung der Menge E als die Menge von Punkten in R", deren Abstand von E kleiner als 5 ist. Zeigen Sie, dass fiir Werte t nahe bei Null die Gleichung F{x\...,x")=t eine kompakte Flache St C R" definiert und zeigen Sie, dass die Flache St in der (5(t)-Umgebung der Flache St liegt, wobei S{t) = o{t) fiir t —> 0. c) Wir verkniipfen jeden Punkt x der Flache S = So mit einem normalen Einheitsvektor
und betrachten die neue Abbildung S B x i-^ x + ii{x)t G R".
568
8 Differentialrechnung mit Punktionen mehrerer Variabler Zeigen Sie, dass fiir alle Werte von t, die hinreichend nahe bei Null liegeii, diese Abbildung bijektiv ist, dass die Flaclie St, die wir fiir eineii Wert von t erhalten,
glatt ist und dass St^ Ci St^ = 0 fiir ii ^ t2. d) Wir verlassen uns auf das Ergebnis der vorigen Aufgabe. Zeigen Sie, dass ein (5 > 0 existiert, so dass es eine eins-zu-eins Abhangigkeit zwisclien den Punkten der (5-Umgebung der Flaclie S und den Paaren {t, x) gibt, wobei t G] — S, S[C R, X € S. Sind (t^,... ,t'') lokale Koordinaten auf der Flaclie S in der Umgebung Us{xo) von xo, dann konnen {t,t^,... ,i ') in einer Umgebung U{xo) von xo G R als lokale Koordinaten dienen. e) Zeigen Sie, dass fiir \t\ < S der Punkt x G S der Punkt auf der Flache S ist, der {x + n(x)t) G R" am naclisten liegt. Dalier ist fiir |i| < S die Flaclie St der geometrische Ort der Punkte in R" im Abstand \t\ von S. 5.
a) Sei dp : S —>• R die Funktion auf einer glatten fc-dimensionalen Flache 5* C R", die durcli die Gleichung dp(x) = \\p — x\\ definiert ist, wobei p ein fester Punkt in R" ist, X ein Punkt auf S und ||p — a^H der Abstand zwischen diesen Punkten inR". Zeigen Sie, dass der Vektor p — x in den Extrema der Funktion dp{x) zur Flaclie S orthogonal ist. b) Zeigen Sie, dass es auf jeder Geraden, die die Flache S im Punkt g £ S orthogonal schneidet, hochstens k Punkte p gibt, so dass die Funktion dp{x) den Punkt q als entarteten stationaren Punkt besitzt (d.h., einen Punkt, in deni die Hessesche Matrix der Funktion verschwindet). c) Zeigen Sie, dass im Fall einer Kurve S {k = 1) in der Ebene R^ {n = 2) der Punkt p, fiir den der Punkt q G S ein entarteter stationarer Punkt von dp{x) ist, ein Zentrum der Kriimmung der Kurve S im Punkt g G 5* ist.
6. Konstruieren Sie in der Ebene R^ mit kartesischen Koordinaten x, y die Niveaukurven der Funktion f(x, y) = xy und die Kurve S = {ix,y)GR'\x''+y'
=
l}.
Untersuchen Sie das Problem nach Extrema der Funktion / mit Hilfe der sich Is ergebenden Abbildung. 7. Die folgenden Funktionen der Klasse C'°°' (R^; R) seien auf der Ebene R^ mit den kartesischen Koordinaten x, y definiert: ( x'' -y + e " ' / ^ ' sin i , falls x j^ 0 ,
f{x,y) = x'^ -y ;
F{x,y) = I y x:^ — y ,
falls x = 0 .
a) Zeichnen Sie die Niveaukurven der Funktion f{x,y) und die Kurve S, die durch die Gleichung F{x, y) = 0 definiert werden. b) Untersuchen Sie die Funktion f auf Extrema. Is c) Zeigen Sie, dass die Bedingung, dass die Form dijf{xo)CS.'' positiv oder negativ definit auf TSa;,, ist, im Gegensatz zu dieser Bedingung an die Form dijL{xo)CS.'' auf TSxo *u^ Satz 2, imnier noch nicht hinreichend dafiir ist, dass das mogliche Extremum xo G S ein tatsachliches Extremum der Funktion / ist. Is
8.7 Flachen in R" und bedingte Extrema
569
d) Uberpriifen Sie, ob der Punkt xo = (0, 0) ein stationarer Punkt der Punktion / ist und ob das Verhalten von / in einer Umgebung dieses Punktes untersucht warden kann, wenn wir dazu nur das zweite (quadratische) d i e d der Taylorschen Forniel betrachten, wie wir es in c) angenommen haben. 8. Bei der Bestimmung der Hauptkriimmung und den Hauptrichtungen in der Differentialgeometrie ist es niitzlich, ein Extremum einer quadratischen Form hiju'u-' unter der Annahme bestimmen zu konnen, dass eine andere (positiv definite) Form gijU^vP konstant ist. Losen Sie dieses Problem durch Analogie zu Beispiel 9, das oben diskutiert wurde. 9. Sei A = [a]] eine quadratische Matrix der Ordnung n, so dass n
^{a]y
= Hj
(j = l , . . . , n ) ,
i= l
wobei Hi, . . . , H„ eine feste Menge von n nicht negativen reellen Zahlen ist. a) Zeigen Sie, dass det^ A unter diesen Bedingungen genau dann ein Extremum haben kann, wenn die Zeilen der Matrix A in R" paarweise orthogonale Vektoren sind. b) Zeigen Sie, ausgehend von der Gleichung det^ A = detA-
det A* ,
wobei A* die Transponierte von A ist, dass unter den obigen Bedingungen gilt: m a x det A = Hi • • • Hn • A
c) Beweisen Sie fiir jede Matrix [a'j] die Hadamard Ungleichung n
det^(aj) < n 3=1
/
n
E(«j)' ^ i=l
d) Geben Sie eine intuitive geometrische Interpretation der Hadamard Ungleichung. 10.
a) Zeichnen Sie die Niveaukurven der Punktion / und die Ebene S in Beispiel 10. Erklaren Sie das im Beispiel erzielte Ergebnis an der Abbildung. b) Zeichnen Sie die Niveaukurven der Punktion / und die Gerade S in Beispiel 11. Erklaren Sie das im Beispiel erzielte Ergebnis an der Abbildung.
11. In Beispiel 6 in Abschnitt 5.4 haben wir ausgehend vom Fermatschen Prinzip das Snelliussche Gesetz zur Lichtbrechung an der Grenzflache zweier Medien fiir eine ebene Grenzflache erhalten. Behalt das Gesetz fiir beliebige glatte Grenzflachen seine Giiltigkeit? 12.
a) Ein Massepunkt kann sich in einem Potentialkraftfeld nur in stationaren (kritschen) Punkten im Gleichgewicht (auch Ruhezustand oder stationarer Zustand genannt) befinden. In diesem Zusammenhang entspricht eine stabile Gleichgewichtslage einem isolierten Minimum des Potentials und ein instabiles Gleichgewicht einem isolierten Maximum. Beweisen Sie dies.
570
8 Differentialrechnung mit Punktionen mehrerer Variabler
b) Auf welches (von Lagrange geloste) Extremwertprobleni mit Nebenbedingungen lasst sich die Frage nach den Gleichgewichtslagen einer Punktmasse im Potentialkraftfeld (z.B. dem Gravitationsfeld) mit idealen Nebenbedingungen (z.B. ein Punkt ist auf eine glatte Plache beschrankt oder eine Perlenkette ist auf einen glatten Paden beschrankt oder eine Kugel auf einen glatten Weg) zuriickfiihren? Die Nebenbedingung ist ideal (es gibt keine Reibung). Dies bedeutet, dass ihre Auswirkung auf den Punkt (die reaktive Kraft der Nebenbedingung) immer normal zur Nebenbedingung ist. c) Welche physikahsche (mechanische) Bedeutung besitzen in diesem Pall die Entwicklung (8.166), das notwendige Kriterium fiir ein Extremum mit Nebenbedingungen und die Lagrangeschen Multiplikatoren? Beachten Sie, dass jede der Punktionen im System (8.160) durch den Absolutbetrag des Gradienten dividiert werden kann, wodurch wir zu einem aquivalenten System gelangen (falls sein Rang iiberall gleich m ist). Daher konnen alle Vektoren gradF'(xo) auf der rechten Seite von (8.166) als normale Einheitsvektoren an die entsprechende Plache betrachtet werden. d) Stimmen Sie damit iiberein, dass die Lagrangesche Methode zur Auffindung eines Extremums mit Nebenbedingungen nach der gerade formulierten physikalischen Interpretation offensichtlich und natiirlich wird?
Einige Aufgaben aus den Halbjahrespriifungen
1. Einfiihrung der Analysis (Zahlen, Funktionen, Grenzwerte) Aufgabe 1. Die Lange eines Sells urn die Erde am Aquator wlrd um 1 Meter verlangert. Dadurch entsteht zwlschen dem Sell und der Erde elne Liicke. Konnte elne Amelse durch dlese Liicke krabbeln? Wle grofi ware der absolute und der relative Anstleg des Radius der Erde, wenn der Aquator um dlesen Betrag verlangert werden wiirde? (Der Radius der Erde betragt ungefahr 6400 km.) Aufgabe 2. Wle liangen die VoUstandlgkelt (Stetlgkelt) der reellen Zahlen, die Unbeschranktlielt der Folge der natiirlichen Zahlen und das archlmedlsche Prlnzlp zusammen? Warum 1st es mogllch, jede reelle Zahl belleblg genau durch rationale Zahlen anzunahern? Erklaren Sle mlt Hllfe des Modells ratlonaler Briiche (ratlonaler Funktionen), dass das archlmedlsche Prlnzlp versagen kann und dass In derartlgen Zahlensystemen die Folge natiirllcher Zahlen beschrankt 1st und dass es unendllch klelne Zahlen glbt. Aufgabe 3. Vler In den Ecken des Elnheltsquadrats sltzende Kafer beglnnen elnander mlt Elnheltsgeschwlndlgkelt zu verfolgen, wobel jeder die Rlchtung des Verfolgten elnschlagt. Beschrelben Sle die Trajektorlen Ihrer Bewegungen. Wle lange 1st jede Trajektorle? Wle lautet das Bewegungsgesetz (In karteslschen oder Polarkoordlnaten)? Aufgabe 4. Zelchnen Sle eln Flussdlagramm zur Berechnung von y ^ , (a > 0) durch die rekurslve Prozedur 2V
a;„ /
Wle hangt das Losen der Glelchung mlt der Suche nach elnem Flxpunkt zusammen? Wle bestlmmen Sle v ^ ?
572
Eiiiige Aufgaben aus den Halbjahrespriifungen
Aufgabe 5. Sei ^(a;) = f{x) + o(/(a;)) fiir a; —>• oo. 1st auch zutreffend, dass f{x) = g{x) + o[g{x)) fiir x —>• oo? Aufgabe 6. Bestimnien Sie die ersten (oder alle) Koeffizienten der Potenzreihe fiir (1 + x)" mit a = — 1 , - ^ , 0 , ^ , 1 , | mit der Methode der unbestimmten Koeffizienten (oder einer anderen Methode). (Durch die Interpolation von Koeffizienten gleicher Potenzen von x in derartigen Entwicklungen forniuHerte Newton das Gesetz zur Bildung der Koeffizienten fiir jedes cc e M. Dieses Ergebnis ist als Newtonscher Binomialsatz bekannt.) Aufgabe 7. Bestimnien Sie mit der Methode der unbestimmten Koeffizienten (oder einer anderen Methode) die ersten (oder aUe) Gheder der PotenzreihenEntwicklung der Funktion ln(l + x), wenn Sie die Potenzreihen-Entwicklung der Funktion e* kennen. Aufgabe 8. Berechnen Sie expA fiir eine der Matrizen A: 0
0\
0 oy '
/O
1
1^0 0
0 0 0
1 0 0
0\ 1 , 0/
/I 0 0 0 2 0 VO 0 3
Aufgabe 9. Wie viele Gheder der Reihe von e* miissen beriicksichtigt werden, um ein Polynom zu erhalten, mit dessen Hilfe e* auf dem Intervah [—3, 5] bis auf 10~^ genau berechnet werden kann? Aufgabe 10. Skizzieren Sie die Graphen der folgenden Funktionen: x^
a) logpgg ^ sin x ;
h) arctan •( l - a ; ) ( l + a ; ) 2
2. Differentialrechnung in einer Variablen Aufgabe 1. Zeigen Sie, dass der Betrag |v(t)| konstant bleibt, wenn der Beschleunigungsvektor a(t) zum Vektor v(t) zu jeder behebigen Zeit t orthogonal ist. Aufgabe 2. Seien (a;,t) bzw. {x,t) die Koordinate und die Zeit eines sich bewegenden Punktes in zwei MaBsystemen. Angenommen, wir kennen die Formeln x = ax + pt und t = ^x -\- 6t fiir die Transformation von einem System zum anderen. Bestimnien Sie die Formeln fiir die Transformation von Geschwindigkeiten, d.h. den Zusammenhang zwischen v = ^ und v = ^ . Aufgabe 3. Die Funktion f{x) = x^ sin ^ fiir a; ^ 0 mit /(O) = 0 ist in M differenzierbar, aber / ' ist in a; = 0 unstetig (beweisen Sie dies). Wir werden jedoch „beweisen", dass / ' in jedem Punkt a £ ffi stetig ist, wenn / : M —>• M in ffi differenzierbar ist. Nach dem Mittelwertsatz gilt
2. Differentialrechnung in einer Variablen
fi^) - f{a) X—a
no,
wobei .f ein P u n k t zwischen a und x ist. Dann folgt aus x ^ Nach Definition ist
,.
lim x^a
f{x) - f{a) X—a
573
a, dass ^ ^
a.
,
= / (a) ,
und da der Grenzwert existiert, besitzt die rechte Seite des Mittelwertsatzes diesen Grenzwert: D.h., / ' ( ^ ) —>• / ' ( a ) fiir ^ —>• a. Die Stetigkeit von / ' ist damit „bewiesen". Wo liegt der Fehler? A u f g a b e 4. Angenonimen, die Funktion / besitze n + 1 Ableitungen im P u n k t XQ und sei ^ = XQ+6X{X — XQ) der mittlere P u n k t im Restglied nach Lagrange ^ / ( " ) ( ^ ) ( a ; —a;o)", so dass 0 < ^j; < 1. Zeigen Sie, dass 9^ —>• -Ar[ fur x -^ XQ, falls/("+!)(a;o) ^ 0A u f g a b e 5. Beweisen Sie die Ungleicliung a"^ • • • a^" < aitti + • • • + a„an , wobei o i , . . . , a „ , c c i , . . . , ctn niclit negative Zahlen mit a i + • • • + a „ = 1 sind. A u f g a b e 6. Zeigen Sie, dass lim 11 H— )
= e^(cosy + ismy)
,
(z = x + iy) ,
SO dass es nur natiirlich ist, e'^ = cosy + i s i n y (die Eulersclie Formel) und e^ = e*e'^ = e^ (cos y + i sin y) anzunehmen. A u f g a b e 7. Bestimmen Sie die Form der Oberflaclie einer Fliissigkeit, die sicli mit konstanter Winkelgeschwindigkeit in einem Glas drelit. 2
2
A u f g a b e 8. Zeigen Sie, dass die Tangente an die Ellipse fs^ + fr = 1 im P u n k t {xo,yo) die Gleichung ^ + ^ = 1 besitzt und dass Liclitstralilen einer in einem der Foki Fi = (— x/a^ — &2 ^ Q"J oder F2 = {^/a? — b"^, O) einer Ellipse mit den Halbachsen a > 6 > 0 platzierte Lampe durcli einen elliptischen Spiegel im anderen Fokus gespiegelt werden. A u f g a b e 9. Ein Teilclien beginnt olme auBere Einwirkung unter der Scliwerkraft von der Spitze eines Eisbergs an mit elliptischem Durchschnitt zu rutschen. Die Gleichung des Durchschnitts lautet a;^ +5y'^ = 1, 2/ > 0. Berechnen Sie die Trajektorie der Bewegung des Teilchens, bis es den Boden erreicht.
574
Eiiiige Aufgaben aus den Halbjahrespriifungen
3. Integration und Einfiihrung mehrerer Variabler Aufgabe 1. Bestimnien Sie die entsprechenden Ungleichungen fiir Integrale, falls Sie die Holdersche, Minkowskisclie und Jensen-Ungleichungen kennen. Aufgabe 2. Berechnen Sie das Integral J e * da; mit einem relativen Fehler, 0
der geringer als 10% ist. Aufgabe 3. Die Funktion erf {x) = -k= J e~* dt, die Fehlerfunktion genannt — X
wird, ist das Integral der Gaufiverteilung. Sie besitzt fiir x -^ +oo den Grenzwert 1. Zeichnen Sie den Graphen dieser Funktion und bestimnien Sie ihre Ableitung. Zeigen Sie, dass fiir x —>• +oo gilt: ^, , ^ 2 _^2/ 1 1 erf(x) = l - ^ e (^-- ^
1-3 1-3-5 / I N + ^ - ^ ^ + o(^J
Wie lasst sich diese asymptotisclie Formel auf Reilien erweitern? Gibt es Werte a; e ffi, fiir die diese Reilie konvergiert? Aufgabe 4. Hangt die Lange eines Weges vom Bewegungsgesetz (der Parametrisierung) ab? Aufgabe 5. Sie lialten das Ende eines Gumniibandes der Lange 1 km in Handen. Ein Kafer krabbelt vom anderen Ende, das festgebunden ist, mit 1 cm/s auf Sie zu. Jedesmal, wenn er 1 cm gekrabbelt ist, verlangern Sie das Band um 1 km. Erreicht der Kafer jemals Ihre Hand? Falls ja, wie lange braucht er ungefalir dazu? (Eine Aufgabe von L. B. Okun', die A. D. Sakharov vorgeschlagen wurde.) Aufgabe 6. Berechnen Sie die Arbeit, die bei der Bewegung einer Masse im Gravitationsfeld der Erde verrichtet wird und zeigen Sie, dass diese Arbeit nur von der Hohe der Anfangs- und Endpositionen abhangt. Bestimmen Sie die Arbeit, die notwendig ist, um die Masse aus dem Gravitationsfeld der Erde zu entfernen und die zugehorige Fluchtgeschwindigkeit. Aufgabe 7. Erklaren Sie am Beispiel eines Pendels und eines doppelten Pendels, wie lokale Koordinaten und Umgebungen in die Menge der entsprechenden Konfigurationen eingefiihrt werden konnen und wie dabei eine natiirliche Topologie auftritt, die es in einen Konfigurationsraum eines mechanischen Systems umwandelt. Kann dieser Raum unter diesen Bedingungen mit einer Metrik versehen werden? Aufgabe 8. Ist der Einheitskreis in ffi" kompakt? In C[a,b]?
4. DifFerentialrechnung mehrerer Variabler
575
Aufgabe 9. Eine Teilmenge einer vorgegebenen Menge wird e-Gitter genannt, wenn jeder Punkt der Menge in eineni Abstand von einem Punkt der Menge liegt, der kleiner als e ist. Bezeichnen Sie mit N{e) die kleinstmogliche Zahl von Punkten in eineni e-Gitter fiir eine vorgegebene Menge. Schatzen Sie die e-Entropie log2 N{e) einer abgeschlossenen Strecke, einem Quadrat, einem Wiirfel und einem beschrankten Bereich in M" ab. Spiegelt die Gr6i3e log'^d/e) fur e ^ 0 die Dimension des betrachteten Raums wider? Kann eine derartige Dimension etwa gleich 0, 5 sein? Aufgabe 10. Die Temperatur T verandere sich stetig auf der Oberflache der Einheitskugel S in M? als Funktion des Ortes. Muss es Punkte auf der Kugelschale geben, in denen die Temperatur ein Minimum oder ein Maximum annimmt? Falls es Punkte gibt, in denen die Temperatur zwei vorgegebene Werte annimmt, muss es dann auch Punkte geben, in denen sie Zwisclienwerte annimmt? Welche dieser Aussagen gilt noch, wenn die Einheitskugel im Raum C[a, b] betrachtet wird und die Temperatur im Punkt f G S wie folgt gegeben wird: _-^
b
Tif)=(
f\f\{x)dx)
?
Aufgabe 11. a) Beginnen Sie mit 1,5 als anfangliclie Naherung an \/2 und fiihren Sie zwei Iterationen der Newtonsclien Metliode aus und beobacliten Sie dabei, wie viele genaue Dezimalstellen Sie in jedem Scliritt erhalten. b) Finden Sie mit einer rekursiven Prozedur eine Funktion / , die die folgende Gleichung erfiillt: X
.f{x)=x+
hit) At.
4. Differentialrechnung mehrerer Variabler Aufgabe 1. a) Wie groB ist der relative Feliler 5 = Kj^- bei der Bereclmung des Funktionswertes f{x,y,z) im Punkt {x,y,z), dessen Koordinaten die absoluten Feliler Ax, Ay bzw. Az aufweisen? b) Wie grofi ist der relative Fehler bei der Berechnung des Volumens eines Raumes mit den folgenden Ausdehnungen: Lange a; = 5 ± 0, 05 m, Breite 2/ = 4 ± 0, 04 m und Holie z = 3 ± 0, 03 m? c) Stimmt es, dass der relative Fehler des Wertes einer hnearen Funktion mit deni relativen Fehler in den Argumenten iibereinstimmt? d) Stimmt es, dass das Differential einer linearen Funktion mit der Funktion selbst iibereinstimmt? e) Stimmt es, dass die Gleichung / ' = / fiir eine hneare Funktion / gilt?
576
Eiiiige Aufgaben aus den Halbjahrespriifungen
Aufgabe 2. a) Eine der partiellen Ableitungen einer Funktion zweier in einer Scheibe definierter Variabler ist in jedem Punkt gleich Null. Bedeutet dies, dass die Funktion von der entsprechenden Variablen auf der Scheibe unabliangig ist? b) Andert sicli die Antwort, wenn wir die Scheibe durch einen beliebigen konvexen Bereich ersetzen? c) Andert sich die Antwort, wenn wir die Scheibe durch einen beliebigen Bereich ersetzen? d) Sei X = x{t) das Bewegungsgesetz eines Punktes in der Ebene (oder in K") im Zeitintervall t G [a, b]. Sei v{t) seine Geschwindigkeit als Funktion der Zeit und C = conv{v(t) \t G [a,b]} die kleinste konvexe Menge, die alle Vektoren v(t) enthalt (iiblicherweise von einer Menge aufgespannte konvexe Hiille genannt). Zeigen Sie, dass ein Vektor v in C existiert, so dass x(6) — x(a) = v • (& — a). Aufgabe 3. a) Sei F{x,y,z) = 0. Stimmt es, dass ff • f^ • ff = - 1 ? Zeigen Sie dies fiir die Gleichung 2^ — 1 = 0 (in Analogie zum Gesetz von Clapeyron fiir ein ideales Gas: - ^ = R). b) Nun sei F{x,y) = 0. Stimmt es, dass | ^ | | = 1? c) Was lasst sich im AUgemeinen iiber die Gleichung F{xi,..., a;„) = 0 aussagen? d) Wie lassen sich die ersten Glieder der Taylor-Entwicklung der impliziten Funktion y = f{x) bestimmen, die in einer Umgebung eines Punktes {xo,yo) durch eine Gleichung F{x, y) = 0 definiert ist, wenn Sie die ersten Glieder der Taylor-Entwicklung der Funktion F(x, y) in einer Umgebung von {xo,yo) kennen, wobei F{xo,yo) = 0 und F'{xo,yo) = 0 invertierbar ist? Aufgabe 4. a) Beweisen Sie, dass die Tangentialebene an das EUipsoid ^ + fj- -h f^ = 1 im Punkt {xo,yo, zo) durch die Gleichung ^ + ^ + ^ = 1 definiert werden kann. b) Der Punkt P{t) = ( ; ^ i 7 f ) ; ^ ) ' ^ taucht zur Zeit t = 1 auf dem Ellipsoid 2
2
2
^ + ^ + ^ = 1 auf. Sei p{t) der Punkt desselben EUipsoiden, der zur Zeit t dem Punkt P(t) am nachsten kommt. Bestimmen Sie die asymptotische Lage von p{t) fiir t -^ -l-oo. Aufgabe 5. a) Konstruieren Sie in der Ebene ffi^ mit den kartesischen Koordinaten {x,y) die Niveaukurven der Funktion f{x,y) = xy und der Kurve S = {(a;, y) e ffi^ I a;^ -I- 2/^ = 1}. Untersuchen Sie die Lage der Extremwerte von / | „, der Einschrankung von / auf den Kreis 5, mit Hilfe des sich ergebenden Bildes. b) Welche physikalische Bedeutung besitzen die Lagrange Multiphkatoren bei der Lagrange Methode zur Auffindung von Extrema mit Nebenbedingungen, wenn eine Gleichgewichtslage fiir eine Punktmasse in einem
4. DifFerentialrechnung mehrerer Variabler
577
Schwerkraftfeld gesucht wird, wobei die Bewegung des P u n k t e s durch ideale Relationen (etwa Gleichungen der Form Fi{x,y,z) = 0, F2{x,y,z) = 0) eingeschrankt ist?
Priifungsgebiete
1. Erstes Semester 1.1. Einfiihrung in die Analysis und die DifFerentialrechnung in einer Variablen 1. Reelle Zahlen. Beschrankte (von oben bzw. unten) Zahlenmengen. Das Vollstandigkeitsaxiom und die Existenz eines kleinsten oberen (grofiten unteren) Elements einer Menge. Unbeschranktheit der Menge der natiirlichen Zahlen. 2. Zentrale Satze in Verbindung mit der Vollstandigkeit der Menge der reellen Zahlen K (geschachtelter IntervaUsatz, endliche Uberdeckung, Haufungspunkt). 3. Grenzwert einer Folge und das Cauchysche Konvergenzkriterium. Hilfsmittel fiir die Existenz eines Grenzwertes einer nionotonen Folge. 4. Unendliche Reihen und die Sunime einer unendlichen Reihe. Geonietrische Progressionen. Das Cauchysche Kriterium und eine notwendige Bedingung fiir die Konvergenz einer Reihe. Die harmonische Reihe. Absolute Konvergenz. 5. Ein Test fiir die Konvergenz einer Reihe mit nicht negativen Gliedern. Der oo
Vergleichssatz. Die Reihe ({s) = ^ n~*. n=l
6. Das Konzept eines Logarithmus und der Zahl e. Die Funktion exp(a;) und die darstellende Potenzreihe. 7. Der Grenzwert einer Funktion. Die wichtigsten Filterbasen. Definition des Grenzwertes einer Funktion auf einer beliebigen Basis und ihre Ubertragung auf Spezialfalle. Infinitesimale Funktionen und ihre Eigenschaften. Vergleich des schliefilichen Verhaltens von Funktionen, asymptotischen Formeln und die wichtigsten Operationen mit den Symbolen o(-) und 0{-). 8. Der Zusammenhang zwischen dem Ubergang zum Grenzwert und den algebraischen Operationen und der Ordnungsrelation in M. Der Grenzwert
580
Priifungsgebiete
9. Der Grenzwert einer verketteten Funktion und einer nionotonen Funktion. Der Grenzwert von (l H—) fiir a; —^ CXD. 10. Das Cauchysche Kriterium fiir die Existenz des Grenzwertes einer Funktion. 11. Stetigkeit einer Funktion in einem Punkt. Lokale Eigenschaften stetiger Funktionen (lokale Bescliranktheit, Erhalt des Vorzeicliens, arithmetisclie Operationen, Stetigkeit einer verketteten Funktion). Stetigkeit von Polynomen, rationalen Funktionen und trigonometrisclien Funktionen. 12. Globale Eigenschaften stetiger Funktionen (Zwisclienwertsatz, Extrema, gleiclimafiige Stetigkeit). 13. Unstetigkeiten nionotoner Funktionen. Der Satz zur inversen Funktion. Stetigkeit der inversen trigonometrisclien Funktionen. 14. Das Bewegungsgesetz, Verschiebungen in einem kleinen Zeitintervall, der monientane Geschwindigkeitsvektor, Trajektorien und ihre Tangenten. Definition der Differenzierbarkeit einer Funktion in einem Punkt. Das Differential, sein Definitionsbereich und Wertebereich. Eindeutigkeit des Differentials. Die Ableitung einer reellen Funktion niit einer reellen Variablen und ihre geometrische Interpretation. Differenzierbarkeit von sinx, cos a;, e^, In \x\ und x". 15. Differenzierbarkeit und arithnietische Operationen. Differentiation von Polynomen, rationalen Funktionen, Tangens und Cotangens. 16. Das Differential einer verketteten Funktion und einer inversen Funktion. Ableitungen der inversen trigononietrischen Funktionen. 17. Lokale Extrema einer Funktion. Eine notwendige Bedingung fiir ein inneres Extremum einer differenzierbaren Funktion (Satz von Fermat). 18. Satz von RoUe. Der Mittelwertsatz in den Varianten von Lagrange und Cauchy. 19. Taylorsche Formeln mit den Restgliedern nach Cauchy und Lagrange. 20. Taylor-Reihen. Die Taylor-Entwicklungen von e^, cos a;, sin a;, ln(l -I- x) und (1 -l-a;)" (Newtons Binomialformeln). 21. Die lokalen Taylorschen Formeln (Restglied nach Peano). 22. Der Zusammenhang zwischen der Art der Monotonie einer differenzierbaren Funktion und dem Vorzeichen ihrer Ableitung. Hinreichende Bedingungen fiir die Vorhandensein oder das Fehlen eines lokalen Extremums mit Hilfe der ersten, zweiten und Ableitungen hoherer Ordnung. 23. Konvexe Funktionen. Konvexitat und das Differential. Lage des Graphen einer konvexen Funktion relativ zu ihrer Tangente. 24. Die allgemeine Jensen-Ungleichung fiir eine konvexe Funktion. Konvexitat (oder Konkavitat) des Logarithmus. Die klassischen Ungleichungen von Cauchy, Young, Holder und Minkowski. 25. Komplexe Zahlen in algebraischer und trigonometrischer Schreibweise. Konvergenz einer Folge komplexer Zahlen und einer Reihe mit komplexen Gliedern. Das Cauchysche Kriterium. Absolute Konvergenz und hinreichende Bedingungen fiir die absolute Konvergenz einer Reihe mit komplexen Gliedern. Der Grenzwert lim (l -I- —) .
2. Zweites Semester
581
26. Die Konvergenzscheibe und der Konvergenzradius einer Potenzreihe. Die Definition der Funktionen e^, cosz, sin 2; (z G C). Eulersche Formeln und die Verbindung zwischen elenientaren Funktionen. 27. Differentialgleichungen als mathematische Modelle der Realitat an Beispielen. Die Methode der unbestimmten KoefRzienten und Eulersches Poly gonzugverfahren . 28. Stammfunktionen und die wichtigsten Methoden fiir ihre Bestimmung (gliedweise Integration von Summen, partielle Integration, Integration durch Substitution). Stammfunktionen der elementaren Funktionen.
2. Zweites Semester 2.1. Integration. DifFerentialrechnung mit mehreren Variablen 1. Das Riemannsche Integral auf einem abgesclilossenen Intervall. Eine notwendige Bedingung fiir die Integrierbarkeit. Mengen mit MaB Null, ihre allgemeinen Eigenscliaften, Beispiele. Das Kriterium nacli Lebesgue fiir die Riemann-Integrierbarkeit einer Funktion (nur die Aussage). Der Raum der integrierbaren Funktionen und zulassige Operationen fiir integrierbare Funktionen. 2. Linearitat, Additivitat und allgemeine Berechnung eines Integrals. 3. Berechnung des Integrals einer Funktion mit reellen Werten. Der (erste) Mittelwertsatz. 4. Integrale mit variabler oberen Integrationsgrenze, ihre Eigenschaften. Existenz einer Stammfunktion einer stetigen Funktion. Die verallgemeinerte Stammfunktion und ihre allgemeine Form. 5. Der Fundamentalsatz der Integral- und Differentialrechnung (NewtonLeibniz Formel). Substitution im Integral. 6. Partielle Integration in einem bestimmten Integral. Taylorsche Formeln mit Integralen als Restglied. Der zweite Mittelwertsatz. 7. Additive (orientierte) Intervallfunktionen und Integration. Das allgemeine Muster fiir das Auftreten von Integralen in Anwendungen. Beispiele dazu: Lange eines Weges (und ihre Unabhangigkeit von der Parametrisierung), Flache eines krummlinigen Trapezes (Flache unter einer Kurve), Volumen eines Rotationskorpers, Arbeit, Energie. 8. Das Riemannsche Integral. 9. Das Konzept eines uneigentlichen Integrals. Kanonische Integrale. Das Cauchysche Kriterium und der Vergleichssatz fiir die Untersuchung der Konvergenz eines uneigentlichen Integrals. Der Integraltest fiir die Konvergenz einer Reihe. 10. Lokale Linearisierung, Beispiele: Momentane Geschwindigkeit und Verschiebung; Vereinfachung der Bewegungsgleichung fiir kleine Oszillationen eines Pendels; Berechnung linearer Korrekturen fiir die Werte von exp(A), A~^, det(-B), (a, b) bei kleinen Veranderungen in den Argumenten (hierbei
582
11.
12.
13.
14.
15. 16.
17. 18. 19. 20. 21. 22.
23. 24.
25. 26.
Priifungsgebiete ist A eine invertierbare Matrix, E die Einheitsmatrix, a und b Vektoren und (•,•) das innere Produkt). Die Norm (Lange, Absolutwert, Betrag) eines Vektors in einem Vektorraum; die wichtigsten Beispiele. Der Raum L{X,Y) der stetigen linearen Transformationen und die Norm darin. Stetigkeit einer linearen Transformation und Beschranktheit ihrer Norm. Differenzierbarkeit einer Funktion in einem Punkt. Das Differential, sein Definitionsbereich und Wertebereich. Koordinatenschreibweise des Differentials einer Abbildung / : ffi™ -^ ffi". Der Zusammenhang zwischen Differenzierbarkeit, Stetigkeit und der Existenz von partiellen Ableitungen. Ableitung einer verketteten Funktion und der inversen Funktion. Koordinatenschreibweise der sich ergebenden Gesetze bei der Anwendung auf verschiedene Falle der Abbildung / : M™ -^ M". Ableitung entlang eines Vektors und der Gradient. Geometrische und physikalische Beispiele fiir die Benutzung des Gradienten (Niveauflachen von Funktionen, steilster Abstieg, die Tangentialebene, das Potentialfeld, Eulersche Gleichung fiir die Dynamik einer idealen Fliissigkeit, das Gesetz von Bernoulli und die Arbeit eines Fliigels). Homogene Funktionen und die Eulersche Gleichung. Dimensionsanalyse. Der Mittelwertsatz. Seine geometrische und physikahsche Bedeutung. Beispiele seiner Anwendung (eine hinreichende Bedingung fiir die Differenzierbarkeit mit Hilfe partieller Ableitungen; Bedingungen dafiir, dass eine Funktion in einem Gebiet konstant ist). Ableitungen hoherer Ordnung und ihre Symmetric. Die Taylorschen Formeln. Extrema von Funktionen (notwendige und hinreichende Bedingungen fiir ein inneres Extremum). Kontraktionsabbildungen. Die Fixpunktsatze von Banach und PicardLindelof. Der Satz zur impliziten Funktion. Der Satz zur inversen Funktion. Krummlinige Koordinaten und Rektifizierung. Glatte fc-dimensionale Flachen in ffi" und ihre Tangentialebenen. Methoden zur Definition einer Flache und die zugehorigen Gleichungen des Tangentialraums. Der Rang-Satz und funktionale Abhangigkeit. Extrema mit Nebenbedingung (notwendige Bedingung). Geometrische, algebraische und physikahsche Interpretation der Methode der Lagrange Multiplikatoren. Eine hinreichende Bedingung fiir ein Extremum mit Nebenbedingung. Metrische Raume, Beispiele. Offene und abgeschlossene Teilmengen. Umgebungen eines Punktes. Die induzierte Metrik, Teilraume. Topologische Raume. Umgebungen eines Punktes, Trennungseigenschaften (das Hausdorff-Axiom). Die auf Teilmengen induzierte Topologie. Abschluss einer Menge.
2. Zweites Semester
583
27. Kompakte Mengen, ihre topologische Invarianz. Abgeschlossenheit einer kompakten Menge und Konipaktheit abgeschlossener Teilniengen einer kompakten Menge. Geschachtelte kompakte Mengen. Kompakte metrische Raume, e-Gitter. Kriterien dafiir, dass ein metrischer Raum kompakt ist und seine spezielle Gestalt in K". 28. Vollstandige metrische Raume. Abgeschlossenheit von M, C, ffi", C" und dem Raum C[a, b] der stetigen Funktionen bei gleichmaBiger Konvergenz. 29. Kriterien fiir die Stetigkeit einer Abbildung zwischen topologischen Raumen. Erhalt der Kompaktheit und des Zusammenhangs unter einer stetigen Abbildung. Die klassischen Satze zur Beschranktheit, der Satz zum Maximalwert und der Zwischenwertsatz fiir stetige Funktionen. GleichmaBige Stetigkeit auf einem kompakten metrischen Raum.
Literaturverzeichnis
1. Klassische Werke 1.1 Hauptquellen Newton, I.: a. (1687): Philosophise Naturahs Principia Mathematica. Jussu Societatis Reg i s ac typis Josephi Streati, London. Englische Ubersetzung der 3. Auflage (1726): University of Cahfornia Press, Berkeley, CA (1999). b. (1967-1981): The Mathematical Papers of Isaac Newton, D. T. Whiteside, ed., Cambridge University Press. Leibniz, G.W. (1971): Mathematische Schriften. C. L Gerhardt, ed., G. Olms, Hildesheim.
1.2 Wichtige umfassende grundlegende Werke Euler, L. a. (1748): Introductio in Analysin Infinitorum. M. M. Bousquet, Lausanne. Nachdruck der deutschen Ubersetzung von H. Maser: Springer-Verlag, Berlin Heidelberg - New York (1983). b. (1755): Institutiones Calculi Differentialis. Impensis Academic Imperialis Scientiarum, Petropoli. Englische Ubersetzung: Springer, Berlin - Heidelberg New York (2000). c. (1768-1770): Institutionum Calculi Integralis. Impensis Academiae Imperialis Scientiarum, Petropoli. Cauchy, A.-L. a. (1989): Analyse Algebrique. Jacques Gabay, Sceaux. b. (1840-1844): Legons de Calcul Differential et de Calcul Integral. Bachelier, Paris.
1.3 Klassische Vorlesungen in Analysis aus der ersten Halfte des 20. Jahrhunderts Courant, R. (1988): Differential and Integral Calculus. Ubersetzt aus dem Deutschen. Vol. 1 Nachdruck der 2. Auflage 1937. Vol. 2 Nachdruck des Orginals
586
Literaturverzeichnis
1936. Wiley Classics Library. A Wiley-Intercience Publication. John Wiley & Sons, Inc., New York, de la Vallee Poussin, Ch.-J. (1954, 1957): Cours d'Analyse Infinitesimale. (Tome 1 11 ed.. Tome 2 9 ed., revue et augmentee avec la collaboration de Fernand Simonart.) Librairie universitaire, Louvain. Englische Ubersetzung einer friiheren Ausgabe, Dover Publications, New York (1946). Goursat, E. (1992): Cours d'Analyse Mathematiques. (Vol. 1 Nachdruck der 4. Auflage 1924, Vol. 2 Nachdruck der 4. Auflage 1925) Les Grands Classiques Gauthier-Villars. Jacques Gabay, Sceaux. Englische Ubersetzung, Dover Publ. Inc., New York (1959).
2. Lehrbiicher^^ Apostol, T. M. (1974): Mathematical Analysis. 2. Aufl. World Student Series Edition. Addison-Wesley Publishing Co., Reading, Mass.-London-Don Mills, Ont. Courant, R. (1971/1972): Vorlesungen iiber Differential- und Integralrechnung Bd. 1 und 2, 4. Aufl. Springer, Berlin - Heidelberg - New York. Rudin, W. (1999) Reelle und komplexe Analysis, Oldenbourg, Miinchen. Spivak, M. (1980): Calculus. 2. Aufl. Berkeley, California: Publish Perish, Inc. Stewart, J. (1999) Calculus. Brooks/Cole Publishing, Paciflc Grove.
3. Studienunterlagen Amann, H., Escher, J. (1998/1999/2001): Analysis I,II,III. Birkhauser Verlag, Basel - Boston - Berlin. Behrends, E. (2004): Analysis 1,2. Vieweg, Braunschweig. Blatter, C. (1991/1992/1981): Analysis I,II,III. Springer, Berlin - Heidelberg - New York. Gelbaum, B. (1982): Problems in Analysis. Problem Books in Mathematics. Springer-Verlag, New York-Berlin, 1982. Gelbaum, B., Olmsted, J. (1964): Counterexamples in Analysis. Holden-Day, San Francisco. Heuser, H. (1990/1993): Lehrbuch der Analysis I,II. B.G. Teubner, Stuttgart. Hildebrandt, S. (2003/2006): Analysis 1,2. Springer, Berlin - Heidelberg - New York. Konigsberger, K. (2004): Analysis 1,2. Springer, Berlin - Heidelberg - New York. Meyberg, K., Vachenauer, P. (2003/2005): Hohere Mathematik 1,2. Springer, Berlin - Heidelberg - New York. Polya, G., Szego, G. (1970/71): Aufgaben und Lehrsatze aus der Analysis. SpringerVerlag, Berlin - Heidelberg - New York. Walter, W. (2002/2004): Analysis 1,2. Springer, Berlin - Heidelberg - New York. Das Literaturverzeichnis wurde fiir die deutsche Ausgabe erheblich verandert.
4. Weiterfiihrende Literatur
587
4. Weiterfiihrende Literatur Arnol'd, V. I. a. (1989): Huygens and Barrow, Newton and Hooke: Pioneers in Mathematical Analysis and Catastrophe Theory, from Evolvents to Quasicrystals. Nauka, Moscow. b. (1988) Mathematische Methoden der klassischen Mechanik. Birkhauser, Basel. Avez, A. (1986): Differential Calculus. A Wiley-Intercience Publication. John Wiley & Sons, Ltd., Chichister. Bourbaki, N. (1971): Elemente der Mathematikgeschichte. Vandenhoeck u. Ruprecht, Gottingen. Cartan, H. Buttin, C. (1974): Differentialrechnung. Bibliogr. Inst., Mannheim. Courant, R., Hilbert, D. (1989): Methods of Mathematical Physics, Vol. 1 and 2, John Wiley, New York. Dieudonne, J. (1985): Grundziige der modernen Analysis. Vieweg, Braunschweig. Einstein, A. (1982): Ideas and Opinions. Three Rivers Press, New York. Enthalt Ubersetzungen der Schriften "Motive des Forschens", S. 224-227, und "Physics and Reality," S. 290-323. Estep, D. (2005): Angewandte Analysis in einer Unbekannten. Springer-Verlag, Berlin - Heidelberg - New York. Eriksson, K., Estep, D., Johnson, C. (2004/2005/2005): Angewandte Mathematik: Body and Soul. Springer-Verlag, Berlin - Heidelberg - New York. Feynman, R., Leighton, R., Sands, M. (1997): Hauptsachlich Mechanik, Strahlung und Warme. Oldenbourg, Miinchen. Gel'fand, I. M. (1989): Lectures on Linear Algebra. Englische Ubersetzung einer friiheren Ausgabe: Dover, New York (1989). Halmos, P. (1974): Finite-dimensional Vector Spaces. Springer-Verlag, Berlin - Heidelberg - New York. Havin, V. P., Nikolski, K. (Hrsg.) (2000): Complex Analysis, Operators, Related Topics. Birkhauser, Basel - Boston. Jost, J. (2005): Postmodern Analysis. 2. ed. Universitext. Berlin: Springer. Kolmogorov, A.N., Fomin, S. V. (1975): Reelle Funktionen und Funktionalanalysis. Dt. Verl. der Wiss., Berlin. Kostrikin, A.I., Manin, Y.I. (1989): Linear Algebra and Geometry. Gordon and Breach, New York. Landau, E. Dalkowski, H. (2004): Grundlagen der Analysis. Heldermann, Lemgo. Lax, P. D., Burstein S. Z., Lax A. (1972): Calculus with Applications and Computing. Vol. I. Schrift zur Vorlesung an der New York Universitat. Courant Institute of Mathematical Sciences, New York University, New York. Manin, Y.I. (1981): Mathematics and Physics. Birkhauser, Basel - Boston. Milnor, J. (1963): Morse Theory. Princeton University Press. Poincare, H., Lindemann, F. (1973): Wissenschaft und Methode. Teubner, Stuttgart. Unveranderter Nachdruck der Ausgabe von 1914. Pontrjagin, L. S. (1965): Gewohnliche Differentialgleichungen. Dt. Verl. der Wissenschaften. Reiffen, H. J., Trapp, H. W. (1996): Differentialrechnung. Spektrum, Akad. Verlag. Schwartz, L. (1998): Analyse. Hermann, Paris.
588
Literaturverzeichnis
Spivak, M. (1965): Calculus on Manifolds: a Modern Approach to the Classical Theorems of Advanced Calculus. W. A. Benjamin, New York. Weyl, H. (1926): Die heutige Erkenntnislage in der Mathematik. Weltkreis-Verlag, Erlangen. Whittaker, E. T, Watson, J.N. (1979): A Course of Modern Analysis. AMS Press, New York. Zorich, V. A. (1995): Analysis (Vorlesungsmitschrift fiir Studierende am Institut fiir Mathematik der Freien Universitat Moskau und am Fachbereich fiir Mechanik und Mathematik der staatlichen Moskauer Universitat). In drei Einheiten. Einheit 1. Vorlesungen 5-7: Das Differential. Einheit 2. Vorlesung 8: Der Satz zur impliziten Funktion. Einheit 3. Vorlesungen 9-11: Anwendungen des Satzes zur impliziten Funktion. Fachbereich fiir Mechanik und Mathematik der staatlichen Moskauer Universitat. (Russisch)
Sachverzeichnis
Abbildung, 13-24 Beriihrungsordnung, 192 beschrankte, 117, 439 bijektive, 17 gleichmafiig stetige, 169 Identitat, 19 injektive, 17 inverse, 18, 20, 522-524 konstante, 115 lineare, 452-453 Rang, 527 schliefllich beschrankte, 117, 439 stetige, 157-162, 444-449 surjektive, 17 verkettete, 18 zusammengesetzte, 18 Abel-Dirichlet Konvergenztest, 424 Abelsche Gruppe, 38, 52 Abelsche Umformung, 372 Abelscher Satz zu Potenzreihen, 283 Ableitung, 187-194, 457 arithmetische Operationen, 201-205 einer impliziten Punktion, 213-218 einer inversen Punktion, 208-213, 470 einer Potenzreihe, 291 einer verketteten Punktion, 205-208, 465 hoherer Ordnung, 218 komplexe Punktion, 291 Linearitat, 462 logarithmische, 207 nach einem Vektor, 467-470 partielle, 459, 467, 481-484 Tabelle der Elementarfunktionen, 214
Abschluss einer Menge, 435 Absolutwert, 60 Abstand auf der reellen Geraden, 60 in R*", 432 zwischen Mengen, 438 Aquivalenzrelation, 22 algebraische Abgeschlossenheit, 293-297 analytische Punktion, 235 Anordnung, 40 archimedisches Prinzip, 55 Areasinus Hyperbolicus, 210 Asymptote eines Graphen, 265 asymptotische Aquivalenz von Punktionen, 147 asymptotisches Verhalten einer Punktion, 144, 148 Aussonderungsaxiom, 29 Auswahlaxiom, 31 Axiom Dedekind-, 69 VoUstandigkeits-, 40, 46, 69, 74, 77 Axiomensystem, 29, 41, 73 der Mengenlehre, 7 der reellen Zahlen, 38, 56, 69 B Basis (Pilterbasis), 133, 135 Basis, orthonormale, 455 Bernoullische Ungleichung, 70, 94, 251 Bernoullisches Gesetz, 474 Beriihrungsordnung, 192 Beschleunigung, 181, 195 Betrag einer reellen Zahl, 60 Bild einer Punktion, 17
590
Sachverzeichnis
Binomialsatz, 234 binomische Formel, 70, 219 Bolzano-Weierstrafl, Lemma von, 95, 99 Bolzano-Weierstrafl, Satz von, 76 Borel-Lebesgue, Satz von, 75 Brechungsgesetz, 251 Buckinghamsches iT-Theorem, 477
Cantor-Menge, 82 Cauchy Hauptwert, 427 Konvergenzkriterium fiir eine Funktion, 137, 441 Konvergenzkriterium fiir Folgen, 90 Konvergenzkriterium fiir uneigentliche Integrate, 418 Konvergenzkriterium in R", 440 Mittelwertsatz, 229 Cauchy-Bunjakowski Ungleichung, 377 Cauchy-Cantor, Satz von, 74 Cauchy-Hadamard, Formel von, 282 Cauchy-Folge, 280, 440 Cosinus Hyperbolicus, 210, 286 Cotangens Hyperbolicus, 212 D Darboux-Summe, 355, 363 de Moivre Formel, 288 Definitionsmenge, 13 Dezimalsystem, 49 Diffeomorphismus, 522 einfacher, 534 Differential einer Funktion, 187-194, 451-461 Differentialgleichung, 186, 301-316, 342 Differentiation arithmetische Operationen, 201-205 bei mehreren Variablen, 480-481 einer impliziten Funktion, 213-218 einer inversen Funktion, 208-213, 470 einer Potenzreihe, 291
einer verketteten Funktion, 205-208, 465 Linearitat, 462 Dimensionsanalyse, 475 direktes Produkt, 10 Dirichlet-Funktion, 164 Dreiecksungleichung, 60, 253, 432, 454 E Einheitswurzel, 279 Einschrankung einer Funktion, 13 Element einer Menge, 8 elliptisches Integral, 402, 409 endliche Uberdeckung, 75 Energie, 405 Ersetzungsaxiom, 30 euklidischer Algorithmus, 70, 110 euklidischer Raum, 456 Eulersche Formel, 285 Eulersche Gleichung, 474 Eulersche Konstante, 154 eulersches Polygonzugverfahren, 311 Exponentialfunktion, 123-128, 198, 310 mit komplexem Argument, 285 Extensionalitatsaxiom, 29 Extremum, 223, 486 Bedingung fiir ein, 247-249 inneres, 224 mit Nebenbedingung, 542, 552-565 Extremwertsatz, 168
Faktorisierung eines Polynoms, 296 Faser, 24 Fehler, 62-64, 207 absoluter, 84 Felilerfunktion, 429 Fermat, Satz von, 224 Fermatsches Prinzip, 251 Fibonacci Zahlen, 110 finite Differenzen, 245 Flache, 493, 542 Dimension, 542-543 Trapez, 402 Folge, 74, 84 absteigende, 92 anwachsende, 92
Sachverzeichnis beschrankte, 86, 92 Cauchy-, 90, 440 divergente, 85 fundamentale, 90, 280, 440 geschachtelte, 75, 76 komplexer Zahlen, 280 konvergente, 85 monotone, 92 schliefllich konstante, 86 fundamentale Folge, 280, 440 Fundamentalsatz der Algebra, 295-296 Fundamentalsatz der Aritlimetik, 70 Fundamentalsatz der Integral- und Differentialreclinung, 380 Funktion, 12-24 absteigende, 142 analytische, 235, 293 anwachsende, 142 asymptotisches Verhalten, 144 beschrankte, 117, 439 bijektive, 17 difFerenzierbare in einem Punkt, 186-187, 456 Dirichlet-, 164, 362 Durchschnitt, 389 Exponential-, 123-128, 198, 310 gleichmafiig stetige, 169 harmonische, 498 homogene, 475 Hyperbel-, 210 implizite, 213-218, 221, 504-514 infinite, 145 infinitesimale, 118-120, 144, 145 injektive, 17 integrierbare, 349 inverse, 18, 172-175, 208, 522-524 involutive, 274 komplexe, 288 konkave, 254 konstante, 115, 228, 247 konvexe, 253-256 Lagrange, 555 Logarithmus, 128-132 mehrerer Variabler, 431-449 monotone, 142, 143, 228, 246 Niveauflache, 554 Oszillation, 440, 445 periodische, 288
591
Potenz-, 132 Riemann-, 164, 362 schliefllich beschrankte, 117, 119, 136, 143, 439 schliefllich konstante, 117 stetige, 157-162, 444-449 surjektive, 17 verkettete, 18 zusammengesetzte, 18 Funktional, 13, 15, 365 funktionale Abhangigkeit, 533 Funktionskeim, 179
Galilei-Transformation, 215-218 Geschwindigkeit Invarianz, 203 momentane, 182-186 gleichmaflige Stetigkeit, 169-171, 446 Satz von Heine, 171 Gradient, 469-470 Gradientenmethode, 470 Graph, 253-276, 493-497 einer inversen Funktion, 176 Grenzwert auf einer Basis, 132-137 einer Folge, 84-86, 90, 96 einer Funktion, 112-143, 439 einer Teilfolge, 97 groflte untere Schranke, 47 Gruppe, 38 H Hadamard Ungleichung, 569 Hadamard, Lemma, 537 Haufungspunkt, 76 Hamilton-Gleichungen, 520 harmonische Funktion, 498 harmonischer Oszillator, 314 Haufungspunkt, 435 hebbare Unstetigkeit, 163 Heine-Borel, Satz von, 75 Hermite Polynom, 244 Hessesche Matrix, 519 Holdersche Ungleichung, 252, 377 Homoomorphismus, 522 Hyperbelfunktion, 286
592
Sachverzeichnis
imaginare Einheit, 276 implizite Funktion, 504-514 Induktionsprinzip, 49, 50 Infimum, 47 inneres Produkt, 455 Integral, 377-389 absolute Konvergenz, 419 bedingte Konvergenz, 423 bestimmtes, 345-349 -cosinus, 328 Darboux-Summe, 355 elliptisches, 337, 340, 402, 409 Gauss-, 425 Hauptwert, 427 Linearitat, 365 -logarithmus, 329, 427 Mittelbildung, 388 rationaler Teil, 338 Riemannsches, 348-349 Singularitaten, 425 -sinus, 328 unbestimmtes, 321-329 uneigentliches, 413-418 Vergleichssatz, 420 Integration, 345 Anderung der Variablen, 326, 383 Kriterium nach Lebesgue, 359 Mittelwertsatz, 370-376 partielle, 326, 381, 417 Substitution, 326, 383 Intervall, 59 -schachtelung, 74 Lange, 55 Intervallfunktion, 368, 393 inverse Funktion, 172-175, 522 Ableitung, 470 Stetigkeit, 175 Isomorphismus, 41
Jacobimatrix, 461, 487 Jensen-Ungleichung, 259, 377 K Kardinalzahl, 27 kartesisches Produkt, 10 Keplersche Fassregel, 391
Keplersches zwei-Korper Problem, 181 Kettenbruch, 109 Kettenregel, 205, 465 kleinste obere Schranke, 47 Korper, 72 algebraischer, 39 kompakte Menge, 169, 436 Komplement einer Menge, 9 komplexe Zalil, 276-299 Betrag, 277 konjugierte, 277 Polardarstellung, 278 konkave Funktion, 254 Kontinuum, 80 Konvergenz M-Test, 104 absolute, 102, 104, 281, 419 Cauchysches Kriterium fiir Reihen, 100 einer Folge, 85 Kriterium fiir eine Funktion, 137 Kriterium fiir komplexe Reihen, 281 Kriterium fiir monotone Folgen, 92 Kriterium fiir Reihen, 102 Kriterium fiir uneigentliche Integrate, 418 Kriterium nach Cauchy fiir Folgen, 90 Kriterium nach D'Alembert, 105, 234 Majorantenkriterium, 104 notwendige Bedingung bei Reihen, 100 von Reihen, 100 Konvergenzradius, 282 Konvergenztest Abel-Dirichlet, 424 Cauchyscher, 104 Gauss'scher, 155 Quotientenkriterium, 105 Weierstrafischer, 92, 104 Konvexitat, 254-256 Koordinaten -achsen, 494 eines Punktes, 58 in R*", 432 krummlinige, 493-494
Sachverzeichnis Polar-, 278, 524 spharische, 525 kritischer Punkt, 487 entarteter, 537 Kriimniung, 275 Kurve Kriimniung, 275 parametrisierte, 396 Rektifizierung, 526 Schmiegekreis, 276 Kurvenlange, 395-402 L Lagrange Punktion, 559 Multiplikatoren, 555 Polynom, 244, 391 Schrankensatz, 227 Laplace-Operator, 498 Lebesgue Integrierbarkeit, 359 Legendre Polynom, 390 Legendre-Transformation, 274, 518-519 Legendresche Normalform, 338 Leibnizsche Formel, 219 I'Hopital, Regel von, 261 Limes inferior und superior, 96 lineare Abbildung, 452-453 logarithmische Skala, 208 Logarithmus, 128, 129 natiirlicher, 129, 300 Lorentz-Transformation, 217 M MacLaurin-Formel, 231 Machtigkeit des Kontinuums, 80-81 einer Menge, 78 Machtigkeit einer Menge, 27 Majorante, 46 Majorantenkriterium, 104 Mannigfaltigkeit, 543 Mantisse, 73 Matrix, 453 Maximum, 47, 168 lokales, 223, 248-250, 486-493 mit Nebenbedingung, 542 Menge, 5-11, 27 abgeschlossene, 433-437
593
Abschluss, 435 Abstand, 438 abzahlbare, 78 aquipotente, 27 beschrankte, 46, 437-438 Durchmesser, 437 endliche, 28 induktive, 30, 49 invariante, 26 kompakte, 169, 436 Komplement, 9 komplexe Zahlen, 276 leere, 9 Machtigkeit, 78 Mafi Null, 359 offene, 433-437 Potenz-, 28 stetige Funktionen, 160 iiberabzahlbare, 80 zusammenhangende, 447 Methode der kleinsten Quadrate, 500 Methode der unbestimmten KoefRzienten, 298, 312 Metrik, 432-433 Minimalabweichung, 178 Minimum, 47, 168 lokales, 223, 248-250, 486-493 mit Nebenbedingung, 542 Minkowskische Ungleichung, 252, 377 Minorante, 46 Mittel arithmetisches, quadratisches. 111 einer Punktion, 388 harmonisches, 101, 111 Mittelwertsatz, 226-229, 478 der Integration, 370-376 verallgemeinerter, 229 Modell Absorption, 318 barometrische Hohenformel, 304 Pall in der Atmosphare, 308 Peder elastische, 405 ideale inkompressible Pliissigkeit, 473 Parabolspiegel, 196 Pendel, 408 Radioaktivitat, 306 Rakete, 302 Schleifvorgang, 502
594
Sachverzeichnis
Schwingung, 313 Monotonie Bedingung, 246 einer Punktion, 228 inverse Punktion, 172 Morse-Lemma, 537 N Newton-Leibniz Formel, 346 Newtonsches Gesetz, 181 Newtonsches Potential, 410 Niveauflaclie, 554 kurve, 505 menge, 472 Norm eines Vektors, 185, 453-455 Normalenvektor, 495 NuUstelle eines Polynoms, 245, 293-299 Vielfadiheit, 297 Nullteiler, 72 O orthogonale Vektoren, 455 Ostrogradski, Methode nach, 338 Oszillation einer Punktion, 137, 160, 440, 445
Paarungsaxiom, 29 Parametrisierung einer Kurve, 396 Partialbruchzerlegung, 298, 331 partielle Ableitung, 459, 467 hoherer Ordnung, 481-484 partielle Integration, 326, 381 Pendel, 408 Periode einer Punktion, 201 periodische Punktion, 288 Planetenbahn, 320 Polarkoordinaten, 278, 524 Polygonzugverfahren, 311 Polynom Paktorisierung, 296 Hermite, 244 Lagrange, 391 Lagrangesches, 244 Legendre, 390 Nullstellen, 293-299 Potential
-feld, 473 einer Kraft, 405-407 Potenzfunktion, 132 Potenzmenge, 28 Potenzmengenaxiom, 30 Potenzreihe, 282-284 Abelscher Satz, 283 Ableitung, 291 Primzahl, 52, 143-148 Projektion, 11, 14, 446 Proximum, 178 Q Quadratur, 392 Quantor, 8 Quotientenkriterium, 105 R Rang einer Abbildung, 527 Rang-Satz, 527 Raum euklidischer, 456 metrischer, 432 Tangential-, 547 vollstandiger, 138, 440 Rechteckregel, 392 Reihe, 99 absolut konvergente, 102 geometrische, harmonische, 101 konvergente, 100 Konvergenztest durch Integration, 419 numerische, 100 Potenz-, 232 Produkt, 284 Taylor-, 233 Umordnung, 101 Vergleichssatz, 103 Rektifizierung, 526 Relation, 21-23 Anordnungs-, 22, 59 funktionale, 23 Inklusion, 72 Restglied in der Taylorschen Pormel, 230-242, 484 nach Cauchy, 231 nach Lagrange, 231, 238, 383, 485 nach Peano, 237, 485 Restriktion, 13
Sachverzeichnis Richtungsableitung, 470 Riemann-Punktion, 164, 362 Riemannsche Summe, 346-349 Treppenfunktion, 355 RoUe Satz von, 500 RoUe, Satz von, 225
Sattelpunkt, 495 Schmiegekreis, 276 Schranke einer Menge, 46 Schrankensatz, 227 Schroder-Bernstein, 33 Schwarzsche Ungleichung, 377 Schwingung, 313-316 Sekante, 192 Simpson-Regel, 392 Sinus Hyperbolicus, 210, 286 Snelliussches Gesetz, 250 spharische Koordinaten, 525 Spur eines Weges, 396 Stammfunktion, 321-329, 377-381 rationaler Punktionen, 329 stationarer Punkt, 487 Stellenwertsystem, 65 Stetigkeit, 157-162 gleichmai^ige, 169-171, 446 Grenzwertbildung, 159 inverse Punktion, 175 monotone Punktion, 174 Satz von Heine, 171 Stetigkeitsmai^, 177 Stromlinie, 474 Supremum, 47 Symbol o, 145 O, 147
Tangens Hyperbolicus, 212 Tangente, 184-193 Tangentialabbildung, 457, 487 ebene, 494-497 raum, 457, 547-552 vektor, 495 Taylor
595
Entwicklung einer Punktion, 232-242 Pormel, 229-242, 381-383, 484-485 Restglied, 230-242 Polynom, 236-240 Reihe, 293 Teilfolge, 95 Teilgrenzwert, 97 Teilmenge, 7 Topologie, 114 Transformation, 13 Galilei-, 14 lineare, 452-453 Lorentz-, 14 Trapezregel, 392 Treppenfunktion, 355 Tschebyscheff Polynome, 179 U Uberdeckungssatz, 75 Umgebung eines Punktes, 61, 76, 112, 433 punktierte, 112 Unendlichkeitsaxiom, 30 Unstetigkeit, 162-165 Urbild einer Punktion, 17 V Vektor -feld, 473 Normalen-, 495 orthogonaler, 455 Tangential-, 495 Vektorraum, 451 7^[o,6], 357 Vereinigungsaxiom, 29 Vergleichssatz, 103, 420 Verkettung von Abbildungen, 19, 205, 453, 465 Vielfachheit einer Nullstelle, 297 Viete's Pormel, 155 Vollstandigkeitsaxiom, 40, 46, 69, 74 Volumen eines Drehkorpers, 404 W Warmegleichung, 498 Weg, 395 aquivalenter, 472 Spur, 396
596
Sachverzeichnis
Weglange, 395-402 Weierstrafl Extremwertsatz, 168 Konvergenzkriterium, 92 Wendepunkt, 258 Wertebereich, 13 Wurzel n-te, 124 einer komplexen Zahl, 279 Y Youngsche Ungleichung, 251 Z Zahl algebraische, 55, 71 e, 94, 107-109, 128-141 Fibonacci, 110 ganze, 52 irrationale, 55, 71 komplexe, 276 natiirliche, 49 TT, 5 5
positive, 46 Prim-, 52, 143-148 rationale, 53, 57 reelle, 37 transzendente, 55, 71 Zahlengerade, 58 Zermelo-Fraenkel-Mengenlehre, 31 Zwischenwertsatz, 167
Namensverzeichnis
Abel, N., 38, 283, 337, 372, 424 Archimedes (^Apxi-l^r]5r](i), 55, 56 B Bernoulli, Daniel, 474 Bernoulli, Jakob, 70, 94 Bernoulli, Joliann, 20, 251, 261 Bernstein, F., 28 Bolyai, J., 21 Bolzano, B., 76, 90, 95, 167, 201 Bonnet, P., 375 Borel, E, 75 Bourbaki, N., 5 Buffon, G., 412 Bunjakowski, B., 377
Cantor, G., 5, 28, 74, 80 Carnot, L., 120 Cauchy, A., 62, 74, 90, 100, 104, 106, 137, 167, 229, 231, 280, 440 Clapeyron, B., 304
D dV Darboux, G., 243, 355 de Moivre, A., 279, 288 de Morgan, A., 10 Dedekind, R., 28, 69, 71 Descartes, R., 11 Dirichlet, R, 164, 424 du Bois-Reymond, P., 364 E Einstein, A., 452 Euklid (EvKAet<57y), 70, 81 Euler, L., 94, 154, 285, 311, 342
Fermat, P., 11, 224, 250 Fibonacci (Leonardo of Pisa), 110 Fraenkel, A., 31 Fresnel, A., 342
Galilei, Galileo, 1, 14 Gauss, C., 155, 296 Gel'fond, A., 55 H Hadamard, J., 282, 537 Hamilton, W., 520 Heine, E., 75, 116, 171 Hermite, Gh., 244 Hilbert, D., 55, 69 Holder, O., 252, 261, 377 Hooke, R., 319 Huygens, Cli., 412, 492 J Jacobi, C., 461 Jensen, J., 259 K Kelvin, Lord (W. Thomson), 304 Kepler, J., 181
Lacroix, S., 21 Lagrange, J., 189, 226, 231, 555 Laplace, P., 498 Lebesgue, H., 75, 359 Legendre, A., 274, 390, 518 Leibniz, G., 1, 219, 346, 380 I'Hopital, G., 261 Lindemann, F., 55
598
Namensverzeichnis
Lorentz, H., 14, 217 M
Meshcherski, I., 303 Minkowski, H., 252, 377
N Newton, I., 1, 70, 181, 234, 346, 380 O Ohm, G., 26 Ostrogradski, M., 338
Poisson, S., 342 R Riemann, B., 164, 346 Rolle, M., 225
Simpson, T., 392 Snell van Royen, W., 250 Stokes, G., 381 Sylvester, J., 489
Taylor, B., 230, 381, 484 Tschebyscheff, P., 144, 179
Vallee Poussin, Cli., 178 van der Waerden, B., 201 Viete, P., 155 von Neumann, J., 30 W Weierstrafl, K., 76, 92, 95, 168, 201
Y Young, W., 251