Reinhart Weber
Physik
Reinhart Weber
Physik Teil I: Klassische Physik – Experimentelle und theoretische Grundlagen
...
138 downloads
2081 Views
6MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Reinhart Weber
Physik
Reinhart Weber
Physik Teil I: Klassische Physik – Experimentelle und theoretische Grundlagen
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar. Prof. Dr. rer. nat. Reinhart Weber Geboren 1932 in Königsberg, Ostpreußen. Abitur 1953 am Naturwissenschaflichen Gymnasium Spiesergasse (jetzt Albertus-Magnus-Gymnasium). Anschließend Physikstudium in Köln, Frankfurt a. M. und Freiburg, Br. Dissertation unter Professor L. Genzel, Promotion 1967. Danach 2 Jahre Research Associate an der Cornell-University in Ithaca, N.Y., USA bei Prof. A. J. Sievers. Von 1969 bis 1974 Assistent am 2. Physikalischen Institut der Universität Stuttgart bei Professor H. Pick. Habilitation 1974. Seit 1974 Professor an der Fakultät Physik der Universität Konstanz. Forschungsgebiete Festkörperphysik. Clusterphysik, Physik der weichen Materie, hauptsächlich mit Methoden der optischen Spektroskopie. Seit 1997 im Ruhestand.
1. Auflage 2007
Alle Rechte vorbehalten © B. G. Teubner Verlag / GWV Fachverlage GmbH, Wiesbaden 2007 Lektorat: Ulrich Sandten / Kerstin Hoffmann Der B. G. Teubner Verlag ist ein Unternehmen von Springer Science+Business Media. www.teubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Waren- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: Ulrike Weigel, www.CorporateDesignGroup.de Druck und buchbinderische Verarbeitung: Strauss Offsetdruck, Mörlenbach Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8351-0065-7
Inhaltsverzeichnis Einführung…………………………………...…………………………………………....…I I
Mechanik
1
Kinematik…………………………………………………………………….. 5
1.1
Bewegung in einer Dimension………………………………………………………….. 5 1.1.1 Mittlere Geschwindigkeit und Momentangeschwindigkeit…………………… 5 1.1.2 Beschleunigung………………………………………………………………... 6 Bewegung in drei Dimensionen………………………………………………………… 7 1.2.1 Der Begriff des Massenpunktes……………………………………………….. 7 1.2.2 Ortsvektor und Geschwindigkeit…………………………………………….... 7 1.2.2.1 Relativgeschwindigkeit…………………………………………….. 8 1.2.3 Beschleunigung……………………………………………………………….. 9 1.2.3.1 Bewegung mit konstanter Beschleunigung……………………….. 10 1.2.3.2 Bewegung mit nicht-konstanter Beschleunigung………………… 12
1.2
Zusammenfassung…………………………………………………………………………….. 13 Übungsaufgaben………………………………………………………………………………..15
2
Bezugssysteme in gleichförmiger Geschwindigkeit……………………….. 17
2.1 2.2 2.3
Inertialsysteme……………………………………………………………………….... 17 Die Lichtgeschwindigkeit……………………………………………………………… 18 Lorentz-Transformation………………………………………………………………. 18 2.3.1 Konsequenzen der Lorentz-Transformation………………………………… 20 2.3.1.1 Relativität der Gleichzeitigkeit…………………………………… 20 2.3.1.2 Längenkontraktion……………………………………………….. 22 2.3.1.3 Zeitdilatation……………………………………………………… 23 2.3.1.4 Relativistisches Additionstheorem der Geschwindigkeiten……… 25 2.3.1.5 Struktur der Raumzeit……………………………………………. 26
Ergänzung: Ableitung der Lorentz-Transformation………………………………………….. 26 Zusammenfassung…………………………………………………………………………….. 28 Übungsaufgaben………………………………………………………………………………. 29
3
Die Grundgleichungen der Mechanik……………………………………... 31
3.1 3.2 3.3
Die Newtonschen Axiome…………………………………………………………….. 31 Messung von Massen………………………………………………………………….. 32 Messung von Kräften………………………………………………………………….. 33
VI 3.4
3.5 3.6 3.7
3.8
Inhaltsverzeichnis Bewegungsgleichung eines Massenpunktes unter dem Einfluss einer Kraft…………. 33 3.4.1 Konstante Kräfte…………………………………………………………….. 34 3.4.2 Ortsabhängige Kräfte………………………………………………………… 35 3.4.3 Zeitabhängige Kräfte………………………………………………………… 36 Elementarteilchen und Kräfte in der Natur……………………………..…………….. 37 Kraftfelder……………………………………………………………………………... 39 Der Energieerhaltungssatz der Mechanik……………………………………………… 39 3.7.1 Arbeit und Leistung…………………………………………………………... 40 3.7.2 Wegunabhängige (konservative) Kräfte……………………………………… 41 3.7.3 Potentielle Energie und kinetische Energie…………………………………... 41 3.7.4 Energieerhaltungssatz………………………………………………………… 43 Anwendungen der Energieerhaltungssatzes…………………………………………… 44 3.8.1 Das Federpendel……………………………………………………………… 44 3.8.2 Fluchtgeschwindigkeit eines Projektils………………………………………. 45
Zusammenfassung…………………………………………………………………………….. 46 Übungsaufgaben…………………………………………………………………………….… 47
4
Systeme von Massenpunkten und Impulserhaltungssatz…………..…..… 49
4.1 4.2 4.3 4.4
Impulserhaltung als Folge des dritten Newtonschen Axioms………………………… 49 Schwerpunkt oder Massenmittelpunkt eines Systems von zwei Massenpunkten……... 51 Verallgemeinerung auf mehrere Massenpunkte………………………………………. 52 Anwendungen des Impulserhaltungssatzes……………………………………………. 54 4.4.1 Stoßprozesse…………………………………………………………………. 54 4.4.1.1 Stöße in einer Dimension…………………………………………. 55 4.4.1.1.1 Der elastische Stoß……………………………………... 55 4.4.1.1.2 Der vollkommen inelastische Stoß…………………….. 56 4.4.1.2 Stöße in zwei und drei Dimensionen…………………………….. 57 4.4.2 Elastischer Stoß im Schwerpunkt-System…………………………………….58 4.4.3 Raketenantrieb als Folge des Impulserhaltungssatzes……………………..… 59
Zusammenfassung…………………………………………………………………………….. 61 Übungsaufgaben………………………………………………………………………………..62
5
Der Drehimpulserhaltungssatz…………………………………………….. 65
5.1 5.2 5.3 5.4 5.5
Drehimpuls eines Massenpunktes und Drehmoment………………………………….. 65 Drehimpuls eines Systems von Massenpunkten………………………………………. 68 Eine einfache Anwendung – Statisches Gleichgewicht……………………………….. 70 Drehbewegungen starrer Körper………………………………………………………. 70 Trägheitsmoment eines starren Körpers……………………………………………….. 72
Inhaltsverzeichnis 5.6 5.7 5.8
5.9
VII
Steinerscher Satz………………………………………………………………………. 74 Experimentelle Verifikation des Drehimpulserhaltungssatzes: Drehschemel-Versuche………………………………………………………………... 77 Rotation um freie Achsen……………………………………………………………... 78 5.8.1 Der Trägheitstensor………………………………………………………….. 78 5.8.2 Freie Achsen…………………………………………………………………. 79 5.8.3 Die Eulerschen Gleichungen…………………………………………………. 80 5.8.4 Der kräftefreie symmetrische Kreisel………………………………………... 82 8.5 5. Die Eulerschen Winkel…………………………………………………….… 85 5.8.6 Der Kreisel unter dem Einfluss einer Kraft: Präzession des symmetrischen Kreisels ..………………………………….… 86 Rotationsenergie………………………………………………………………………. 89
Zusammenfassung…………………………………………………………………………….. 91 Übungsaufgaben………………………………………………………………………………. 92
6
Gravitation……………………………………………………………….….. 95
6.1 6.2 6.3 6.4 6.5
Newtonsches Gravitationsgesetz……………………………………………………… 95 Ermittlung der Gravitationskonstante…………………………………………………. 95 Die Keplerschen Gesetze der Planetenbahnen………………………………………… 96 Bestimmung der Masse von Himmelskörpern………………………………………. 100 Swing-by-Methode für Weltraumsonden……………………………………………. 101
Ergänzung: Rutherfordstreuung als Beispiel einer Potentialstreuung ………………………..101 Zusammenfassung…………………………………………………………………………... 103 Übungsaufgaben…………………………………………………………………………..… 104
7
Relativistische Dynamik…………………………………………………... 105
7.1 7.2 7.3
Relativistischer Impuls und relativistische Massenzunahme………………………… 105 Relativistische Kraft………………………………………………………………….. 107 Kinetische Energie, Gesamtenergie, Masse-Energie-Äquivalenz……………………. 109
Zusammenfassung…………………………………………………………………………… 111 Übungsaufgaben……………………………………………………………………………... 113
VIII
8
Inhaltsverzeichnis
Beschleunigte Bezugssysteme………………………………………...…… 115
8.1 8.2
Geradlinig beschleunigte Bezugssysteme……………………………………………. 115 Gleichförmig gegeneinander rotierende Bezugssysteme……………………………. 116 8.2.1 Zentrifugalkraft……………………………………………………………... 116 8.2.2 Corioliskraft………………………………………………………………… 116 8.2.3 Anwendungsbeispiele………………………………………………………. 118 8.2.3.1 Erdbeschleunigung unter dem Einfluss der Zentrifugalkraft……. 118 8.2.3.2 Beispiele für Corioliskräfte……………………………………… 119 Ergänzung: Ableitung von Zentrifugal- und Corioliskraft………………………………….. 119 Zusammenfassung………………………………………………………………………….... 122 Übungsaufgaben…………………………………………………………………………..…. 122
9
Eigenschaften realer Festkörper………………………………………….. 123
9.1 9.2
Atomare Kräfte und Aggregatzustände……………………………………………… 123 Deformierbare Festkörper……………………………………………………………. 124 9.2.1 Kompression……………………………………………………………...… 124 9.2.2 Dehnung bzw. Stauchung………………………………………………...… 125 9.2.3 Scherung……………………………………………………………………. 127 Reibungskräfte zwischen Festkörpern……………………………………………….. 128 9.3.1 Haftreibung…………………………………………………………………. 128 9.3.2 Gleitreibung………………………………………………………………… 129 9.3.3 Rollreibung…………………………………………………………….…… 129 Zur Mechanik deformierbarer fester Körper – Allgemeine Behandlung……………. 130 9.4.1 Der Deformationstensor…………………………………………………….. 130 9.4.2 Lineare Dehnung……………………………………………………………. 132 9.4.3 Winkeländerungen………………………………………………………….. 133 9.4.4 Volumenänderungen……………………………………………………..… 133 9.4.5 Aufspaltung des Deformationstensors……………………………………… 134 9.4.6 Spannungstensor……………………………………………………………. 135 9.4.7 Hookesches Gesetz…………………………………………………………. 135
9.3
9.4
Zusammenfassung……………………………………………………………………….….. 136 Übungsaufgaben……………………………………………………………………………... 138
Inhaltsverzeichnis
IX
10
Eigenschaften flüssiger und gasförmiger Materie……………….………. 139
10.1
Ruhende Flüssigkeiten……………………………………………………………….. 139 10.1.1 Verschiebbarkeit der Flüssigkeitsteilchen……………………………….… 139 10.1.2 Statischer Druck und Auftrieb……………………………………………… 140 10.1.3 Anwendungen………………………………………………………………. 142 Flüssigkeitsgrenzflächen……………………………………………………………... 143 10.2.1 Oberflächen- und Grenzflächenspannung………………………………….. 143 10.2.2 Kapillarität………………………………………………………………….. 146 Gase……………………………………………………………………………….…. 147 10.3.1 Gasdruck als Folge ungeordneter Bewegung der Moleküle……………….. 147 10.3.2 Barometrische Höhenformel……………………………………………….. 148 10.3.3 Diffusion……………………………………………………………………. 149 Strömende Flüssigkeiten und Gase………………………………………………….. 150 10.4.1 Grundbegriffe……………………………………………………………….. 150 10.4.2 Strömungen idealer Flüssigkeiten…………………………………………... 151 10.4.2.1 Eulersche Gleichung…………………………………………….. 151 10.4.2.2 Kontinuitätsgleichung…………………………………………… 152 10.4.2.3 Bernoulli-Gleichung…………………………………………….. 154 10.4.2.4 Anwendungsbeispiele…………………………………………… 156 10.4.3 Innere Reibung……………………………………………………………… 157 10.4.3.1 Allgemeiner Ausdruck für die Reibungskraft…………………… 157 10.4.3.2 Stokessches Reibungsgesetz, Kugelfallviskometer………….….. 159 10.4.3.3 Laminare Strömungen durch Rohre……………………………... 160 10.4.3.4 Navier-Stokes-Gleichung………………………………………... 162 10.4.3.5 Entstehung und Charakterisierung von Wirbeln………………… 164
10.2
10.3
10.4
Zusammenfassung…………………………………………………………………………….169 Übungsaufgaben……………………………………………………………………………... 171
11
Mechanische Schwingungen und Wellen………………………….…..…. 173
11.1 11.2 11.3 11.4 11.5 11.6 11.7
Lineares Kraftgesetz und harmonische Schwingungen……………………………… 173 Freie gedämpfte Schwingungen…………………………………………………… . 174 Erzwungene Schwingungen………………………………………………………….. 178 Energiebilanz bei der linearen Schwingung…………………………………………. 181 Gekoppelte Oszillatoren…………………………………………………………..… 185 Mechanische Wellen…………………………………………………………………. 188 Fortschreitende Wellen, Wellengleichung…………………………………………… 188 11.7.1 Harmonische Wellen……………………………………………………….. 190 Stehende Wellen……………………………………………………………………… 191
11.8
Inhaltsverzeichnis
X
11.9 Überlagerung von Wellen – Dispersion……………………………………………… 196 11.10 Der Dopplereffekt. …………………………………………………………………… 197 11.10.1 Dopplereffekt bei Wellen, die an ein Medium gebunden sind…………… 197 11.10.2 Dopplereffekt bei elektromagnetischen Wellen…………………………….. 200 Zusammenfassung………………………………………………………………………….... 201 Übungsaufgaben………………………………………………………………………….….. 202
12
Analytische Mechanik……………………………………………………... 205
12.1
Das Hamiltonsche Prinzip und die Lagrangesche Form der Mechanik…………….... 205 12.1.1 Das Hamiltonsche Prinzip………………………………………………….. 205 12.1.2 Verallgemeinerte Koordinaten……………………………………………… 207 12.1.3 Verallgemeinerte Kräfte…………………………………………………….. 213 Hamiltonsche Theorie…………………………………………………………………215 12.2.1 Grundlagen………………………………………………………………….. 215 12.2.2 Kanonische Transformation………………………………………………… 219 12.2.3 Hamilton-Jacobische Gleichung……………………………………………. 223 12.2.4 Behandlung des eindimensionalen harmonischen Oszillators im Hamiltonformalismus…………………………………………………… 225 12.2.5 Die Poissonklammer…………………………………………………..…… 228
12.2
Zusammenfassung…………………………………………………………………………... 234 Übungsaufgaben………………………………………………………………………………236
II
Thermodynamik
13
Phänomenologische Wärmelehre……………………………….…….…... 237
13.1 13.2 13.3
Grundgröße Temperatur……………………………………………………………… 237 Wärmemenge und spezifische Wärme……………………………………….………. 242 Wärmeleitung……………………………………………………………………...…. 244 13.3.1 Wärmeleitung in festen Stoffen…………………………………………….. 244 13.3.2 Wärmeleitung in Flüssigkeiten und Gasen…………………………………. 247 13.4 Zustandsgrößen und Zustandsgleichungen…………………………………………… 247 13.5 Einbeziehung der Wärmeenergie in den Energieerhaltungssatz: Der erste Hauptsatz………………………………………………………………........250 13.6 Anwendungen des ersten Hauptsatzes auf einphasige Einkomponentensysteme……. 251 13.6.1 Isochore Prozesse…………………………………………………………… 252 13.6.2 Isobare Prozesse……………………………………………………………. 252
Inhaltsverzeichnis
XI
13.6.3 Isotherme Prozesse…………………………………………………………. 253 13.6.4 Adiabatische Prozesse………………………………………………………. 254 13.7 Verwandelbarkeit von Wärme in Arbeit: Der zweite Hauptsatz…………………….. 256 13.7.1 Reversible und irreversible Prozesse……………………………………….. 256 13.7.2 Der Carnotsche Kreisprozess……………………………………………….. 257 13.7.3 Der Otto-Motor…………………………………………………………….. 260 13.7.4 Der zweite Hauptsatz……………………………………………………….. 262 13.7.5 Entropie…………………………………………………………………….. 262 13.7.6 Thermodynamische Temperaturskala………………………………………. 267 13.7.7 Ableitung der Maxwell-Geraden………………………………………….... 267 13.7.8 Der Joule-Thomson-Versuch……………………………………………….. 268 13.8 Thermodynamische Potentiale……………………………………………………….. 270 13.9 Der dritte Hauptsatz………………………………………………………………….. 276 13.10 Anwendung der Hauptsätze auf mehrphasige Einkomponentensysteme……………. 281 13.10.1 Temperaturabhängigkeit des Gleichgewichtsdruckes verschiedener Phasen 281 13.10.1.1 Einführung in die Theorie………………………………………. 281 13.10.1.2 Dampfdruckkurve……………………………………………….. 283 13.10.1.3 Schmelzdruckkurve und Sublimationsdruckkurve……………… 287 13.11 Anwendung der Hauptsätze auf einphasige Mehrkomponentensysteme……………. 289 13.11.1 Thermodynamische Potentiale von idealen Gasen und Gasmischungen…… 289 13.11.2 Chemisches Gleichgewicht und Massenwirkungsgesetz…………………… 293 13.12 Anwendung der Hauptsätze auf mehrphasige Mehrkomponentensysteme………….. 296 13.12.1 Gibbssche Phasenregel……………………………………………………… 296 13.12.2 Osmose…………………………………………………………………….... 297 13.12.3 Dampfdruckerniedrigung…………………………………………………… 299 13.12.4 Siedepunkterhöhung und Gefrierpunkterniedrigung……………………….. 302 Zusammenfassung…………………………………………………………………………… 303 Übungsaufgaben………………………………………………………………………………306
14
Kinetische Gastheorie……………………………………………………… 309
14.1 14.2 14.3 14.4 14.5 14.6
Temperatur…………………………………………………………………………... 309 Poissongleichungen………………………………………………………………….. 311 Boltzmannverteilung……………………………………………………………….… 313 Maxwell-Boltzmannsche Geschwindigkeitsverteilung…………………….………… 314 Mittlere freie Weglänge……………………………………………………………… 318 Statistische Deutung der Entropie……………………………………………………. 319
Zusammenfassung………………………………………………………………………..…. 322 Übungsaufgaben…………………………………………………………………………..… 324
XII
Inhaltsverzeichnis
III
Elektrik und Optik
15
Elektrostatik……………………………………………………….…..…... 325
15.1 Elektrische Ladung………………………………………………………………….. 325 15.1.1 Das Coulomb-Gesetz……………………………………………………….. 325 15.1.2 Maßsysteme……………………………………………………………….... 327 15.2 Elektrisches Feld……………………………………………………………………... 328 15.2.1 Elektrische Feldstärke.…………………………………………………….. 328 15.2.2 Elektrischer Kraftfluss……………………………………………………… 330 15.3 Elektostatisches Potential und elektrische Spannung………………….……………. 332 15.4 Einige spezielle Felder und zugehörige Potentiale…………………………………… 334 15.4.1 Feld einer Punktladung……………………………………………………… 334 15.4.2 Feld zweier gleichnamiger Punktladungen…………………………………. 334 15.4.3 Feld eines elektrischen Dipols……………………………………………… 335 15.4.4 Feld einer geladenen Platte…………………………………………………. 337 15.4.5 Feld einer homogen geladenen Kugel………………………………………. 337 15.4.6 Felder höherer Multipole: Multipolentwicklung des Potentials……………. 338 15.5 Elektrische Ladungen auf Leitern……………………………………………………. 339 15.5.1 Influenz……………………………………………………………………... 339 15.5.2 Kapazität und Kondensatoren………………………………………………. 341 15.5.2.1 Plattenkondensator………………………………………………. 342 15.5.2.2 Koaxialkabel und Kugel………………………………………… 342 15.5.2.3 Parallel- und Reihenschaltung von Kondensatoren…………….. 344 15.6 Elektrisches Feld als Träger der elektrostatischen Energie………………………….. 344 15.7 Dielektrika im elektrostatischen Feld………………………………………………… 345 15.7.1 Dielektrische Suszeptibilität und Dielektrizitätskonstante…………………. 345 15.7.2 Elektrostatische Feldgleichungen in Materie……………………………….. 350 15.7.3 Elektrostatische Feldenergie im Dielektrikum……………………………… 351 15.8 Elektronen und Ionen im elektrischen Gleichfeld……………………………………. 352 15.8.1 Millikan-Versuch…………………………………………………………… 352 15.8.2 Ablenkung von Ladungsträgern im elektrischen Gleichfeld……………….. 353 15.8.3 Kontaktspannung…………………………………………………………… 354 15.8.4 Hohe Spannungen: Teilchenbeschleuniger und Gewitterentstehung……… 355 15.8.5 Elektrostatische Staubabscheider…………………………………………… 356 15.8.6 Xerografie…………………………………………………………………... 357 Ergänzung 1: Multipolentwicklung in kartesischen Koordinaten ………………………… 357 Ergänzung 2: Lokales elektrisches Feld…………………………………………………… 361 Zusammenfassung………………………………………………………………………….... 363 Übungsaufgaben…………………………………………………………………………...... 364
Inhaltsverzeichnis
XIII
16
Elektrischer Strom……………………………………………….……...… 367
16.1 16.2 16.3 16.4
Stationärer elektrischer Strom……………………………………………………….. 367 Elektrischer Widerstand und Ohmsches Gesetz……………………………………… 368 Elektrische Leistung…………………………………………………………………. 370 Stromverzweigungen………………………………………………………………… 371 16.4.1 Kirchhoffsche Regeln………………………………………………………. 371 16.4.2 Reihenschaltung von Widerständen………………………………………… 372 16.4.3 Parallelschaltung von Widerständen……………………………………….. 372 Messung elektrischer Ströme………………………………………………………… 373 16.5.1 Strommessung………………………………………………………………. 373 16.5.2 Spannungsmessung…………………………………………………………. 373 16.5.3 Widerstandsmessung……………………………………………………….. 374 Leitungsmechanismen in Festkörpern, Flüssigkeiten und Gasen……………………. 375 16.6.1 Elektrische Leitung in Metallen……………………………………………. 375 16.6.2 Elektrische Leitung in Halbleitern…………………………………………. 378 16.6.3 Elektrische Leitung in Supraleitern………………………………………… 380 16.6.4 Ionenleitung in Flüssigkeiten………………………………………………. 381 16.6.5 Ladungstransport in Gasen, Gasentladungen………………………………. 383 Stromquellen…………………………………………………………………………. 388 16.7.1 Galvanische Elemente……………………………………………………… 389 16.7.2 Akkumulatoren……………………………………………………………... 390 16.7.3 Brennstoffzellen……………………………………………………………. 391 16.7.4 Solarzellen……………………………………………………………….…. 393 16.7.5 Thermoelemente………………………………………………………….… 395 16.7.6 Kondensatoren als Energiespender………………………………………… 397
16.5
16.6
16.7
Zusammenfassung…………………………………………………………………………… 398 Übungsaufgaben……………………………………………………………………………... 399
17
Statische Magnetfelder………………………………………………..…... 401
17.1
Eigenschaften des magnetischen Feldes………………………………………….….. 401 17.1.1 Permanentmagnete…………………………………………………………. 401 17.1.2 Die Grundgleichungen des magnetischen Feldes im Vakuum…………….. 403 17.1.3 Magnetische Felder einiger spezieller Leiteranordnungen………………… 406 17.1.3.1 Magnetfeld eines homogenen Zylinders………………………… 406 17.1.3.2 Magnetfeld im Inneren einer langen Spule……………………… 406 17.1.4 Das Vektorpotential………………………………………………………… 407 17.1.5 Biot-Savartsches Gesetz für beliebige Stromverteilungen…………………. 408
Inhaltsverzeichnis
XIV 17.1.6
17.2
17.3 17.4
17.5
Anwendungen des Biot-Savartschen Gesetzes……………………………... 410 17.1.6.1 Magnetisches Feld eines geraden, dünnen Leiters……………… 410 17.1.6.2 Magnetisches Feld einer Stromschleife…………………………. 410 17.1.6.3 Magnetisches Feld einer Helmholtz-Anordnung………………... 412 17.1.6.4 Magnetisches Feld einer zylindrischen Spule…………………… 414 Kräfte auf bewegte Ladungsträger im Magnetfeld………………………………….. 415 17.2.1 Lorentzkraft………………………………………………………………… 415 17.2.1.1 Drehspulmessinstrumente……………………………………….. 416 17.2.1.2 Grundlagen magnetischer Linsen……………………………….. 417 17.2.1.2.1 Abbildung im homogenen magnetischen Längsfeld einer langen Spule………………………………….. 417 17.2.1.2.2 Abbildung im inhomogenen magnetischen Längsfeld einer kurzen Spule………………………. 419 17.2.1.2.3 Abbildung durch ein magnetisches Querfeld………. 421 17.2.1.2.4 Geschwindigkeitsfilter……………………………… 423 17.2.1.3 Hall-Effekt ……………………………………………………… 423 17.2.1.4 Kräfte zwischen stromdurchflossenen Leitern………………...... 425 Relativistischer Zusammenhang zwischen elektrischen und magnetischen Feldern…………………………………………………………… 425 Materie im magnetischen Feld……………………………………………………….. 429 17.4.1 Übersicht……………………………………………………………………. 429 17.4.2 Diamagnetismus…………………………………………………………….. 430 17.4.3 Paramagnetismus…………………………………………………………… 431 17.4.4 Ferromagnetismus………………………………………………………….. 431 17.4.5 Andere Formen des Magnetismus………………………………………….. 434 17.4.6 Grundgleichungen des statischen magnetischen Feldes in Materie………… 434 Das Magnetfeld der Erde…………………………………………………………….. 436
Zusammenfassung…………………………………………………………………………… 438 Übungsaufgaben…………………………………………………………………………..… 440
18
Zeitlich veränderliche Felder……………………………………….…..… 443
18.1 18.2
Faradaysches Induktionsgesetz………………………………………………………. 443 Selbstinduktion………………………………………………………………………. 445 18.2.1 Selbstinduktion einer langen Spule…………………………………………. 446 18.2.2 Selbstinduktion eines Koaxialkabels……………………………………….. 448 Gegeninduktion………………………………………………………………………. 449 Energie des magnetischen Feldes……………………………………………………. 451
18.3 18.4
Inhaltsverzeichnis
XV
18.5
Anwendungen des Induktionsgesetzes………………………………………………. 452 18.5.1 Generatoren und Motoren…………………………………………………... 452 18.5.1.1 Gleichstrom-Maschinen…………………………………………. 453 18.5.1.2 Wechselstrom-Maschinen……………………………………….. 456 18.5.1.3 Drehstrom-Maschinen……………………………………..……. 457 18.5.2 Wechselstromkreise mit komplexen Widerständen………………………… 460 18.5.2.1 Stromkreis mit Induktivität……………………………………... 460 18.5.2.2 Stromkreis mit Kapazität……………………………………….. 461 18.5.2.3 Stromkreis Induktivität, Kapazität und Ohmschem Widerstand……………………………………... 461 18.6 Einfache Netzwerke………………………………………………………………….. 464 18.7 Der Transformator …………………………………………………………………… 467 18.7.1 Der ideale Transformator……………………………………………….….. 467 18.7.2 Anwendungen……………………………………………………………… 469 18.8 Wechselstrom-Gleichrichtung……………………………………………………….. 471 18.9 Leistungsanpassung………………………………………………………………….. 472 18.10 Die Grundgleichungen des elektromagnetischen Feldes im Vakuum: Die Maxwell-Gleichungen…………………………………………………………… 473 18.11 Elektromagnetische Schwingungen und Wellen…………………………………….. 477 18.11.1 Elektromagnetische Schwingungen………………………………………… 477 18.11.1.1 Freie gedämpfte Schwingungen…………………………………. 477 18.11.1.2 Erzwungene Schwingungen…………………………………….. 480 18.11.1.3 Gekoppelte Schwingungskreise…………………………………. 481 18.11.2 Elektromagnetische Wellen………………………………………………… 485 18.11.2.1 Wellengleichung und ebene Wellen als deren Lösung………….. 486 18.11.2.2 Das elektromagnetische Feld des Hertzschen Dipol……………. 489 18.11.2.3 Energie und Leistung einer elektromagnetischen Welle………... 492 18.11.2.4 Erzeugung und Nachweis elektromagnetischer Wellen………… 494 18.11.2.5 Röntgenbremsstrahlung und Synchrotronstrahlung…………….. 496 18.11.2.6 Experimentelle Bestimmung der Lichtgeschwindigkeit………… 498 18.11.3 Koaxialkabel, Hohlleiter und Hohlraumresonatoren……………………….. 500 18.11.3.1 Koaxialkabel…………………………………………………….. 500 18.11.3.2 Rechteck-Hohlleiter………………………………………….…. 503 18.11.3.3 Hohlraumoszillatoren……………………………………………. 507 Ergänzung 1: Das elektromagnetische Feld des Hertzschen Dipols………………………. 509 Ergänzung 2: Die Energiestromdichte in einer elektromagnetischen Welle: Der Poyntingvektor…………………………………………………………. 513 Zusammenfassung………………………………………………………………………….... 514 Übungsaufgaben……………………………………………………………………………... 516
XVI
Inhaltsverzeichnis
19
Elektromagnetische Felder in Materie…………………………….…..…. 519
19.1
Elektromagnetische Felder in optisch dünner Materie………………………………. 519 19.1.1 Brechungsindex…………………………………………………………….. 519 19.1.2 Dispersion und Absorption…………………………………………………. 522 19.1.3 Streuung elektromagnetischer Wellen und Teilchen……………………….. 525 19.1.3.1 Einteilung der Streuprozesse……………………………………. 525 19.1.3.2 Formfaktor und Strukturfaktor………………………………….. 526 19.1.3.3 Streuung an geordneten Strukturen – Kohärente Streuung...…… 529 19.1.3.4 Streuung an ungeordneten Systemen – Inkohärente Streuung…... 531 19.1.3.5 Beispiele für inkohärente Streuung……………………………… 532 19.1.3.6 Formfaktor für Kügelchen………………………………………. 533 19.1.3.7 Polarisation des gestreuten Sonnenlichtes………………….…... 535 Elektromagnetische Felder in optisch dichter Materie………………………………. 536 19.2.1 Maxwell-Gleichungen in Materie…………………………………………... 537 19.2.2 Elektromagnetische Wellen in isotropen Dielektrika………………………. 538 19.2.2.1 Brechungsindex…………………………………………………. 538 19.2.3 Elektromagnetische Wellen in Metallen……………………………………. 541 19.2.4 Reflexion und Brechung elektromagnetischer Wellen an nichtleitenden Grenzflächen……………………………………………………………….. 544 19.2.4.1 Stetigkeitsbedingungen………………………………………….. 544 19.2.4.2 Reflexions- und Brechungsgesetz………………………………. 546 19.2.4.3 Intensitäts- und Polarisationsverhältnisse bei Reflexion und Brechung – die Fresnelschen Formeln……………………… 549 19.2.4.4 Reflexions- und Transmissionsvermögen einer Grenzfläche…… 552 19.2.4.5 Der Fall senkrechter Inzidenz…………………………………… 554 19.2.4.6 Brewsterwinkel………………………………………………….. 554 19.2.4.7 Totalreflexion……………………………………………………. 555 19.2.5 Reflexion an Metalloberflächen……………………………………………. 559 19.2.6 Ausbreitung elektromagnetischer Wellen in anisotropen Medien…………. 559 19.2.6.1 Der dielektrische Tensor………………………………………… 560 19.2.6.2 Ebene Wellen im Medium………………………………………. 562 19.2.6.3 Wellen in optisch einachsigen Kristallen……………………….. 566 19.2.6.4 Doppelbrechung…………………………………………………. 572 19.2.7 Erzeugung und Nachweis polarisierten Lichtes………………………….… 573 19.2.7.1 Erzeugung linear polarisierten Lichtes……………………….… 574 19.2.7.2 Erzeugung zirkular und elliptisch polarisieren Lichtes…………. 576 19.2.7.3 Polarisationsdreher………………………………………………. 577 19.2.7.4 Optische Aktivität……………………………………………….. 578
19.2
Inhaltsverzeichnis
XVII
19.2.8 Durchgang von Licht durch isotrope Medien bei Anlegung äußerer Felder……….... 580 19.2.8.1 Faraday-Effekt………………………………………………..…. 580 19.2.8.2 Elektrische Doppelbrechung (Kerr-Effekt)…………………...… 580 19.2.8.3 Magnetische Doppelbrechung (Cotton-Mouton-Effekt)……...… 582 19.2.8.4 Spannungsdoppelbrechung……………………………………… 583 19.3 Nichtlineare Optik ………………………………………………………………...… 584 19.3.1 Nichtlineare Suszeptibilität…………………………………………………. 584 19.3.2 Optische Frequenzverdopplung…………………………………………….. 584 19.3.3 Optische Frequenzmischung……………………………………………….. 585 19.3.4 Phasenanpassung…………………………………………………………… 585 19.3.5 Die Erhaltungssätze bei der Frequenzverdopplung………………………… 586 19.3.6 Nichtlineare Absorption…………………………………………………….. 587 19.3.7 Selbstfokussierung von Licht……………………………………………….. 587 Zusammenfassung…………………………………………………………………………… 589 Übungsaufgaben…………………………………………………………………………….. 592
20
Geometrische Optik……………………………………………….….….... 593
20.1 20.2 20.3 20.4
Grundlagen der Strahlenoptik………………………………………………………... 593 Optische Abbildung………………………………………………………………….. 594 Abbildung durch Hohlspiegel………………………………………………………... 595 Strahlengang in durch Ebenen begrenzten Körpern…………………………………. 598 20.4.1 Ebener Spiegel……………………………………………………………… 598 20.4.2 Planparallele Platte…………………………………………………………. 598 20.4.3 Prismen……………………………………………………………………... 599 Linsen………………………………………………………………………………... 602 20.5.1 Brechung an einer sphärischen Fläche……………………………………… 603 20.5.2 Dünne Linsen……………………………………………………………….. 604 20.5.3 Dicke Linsen………………………………………………………………... 607 20.5.4 Linsensysteme………………………………………………………………. 610 20.5.5 Abbildungsfehler………………………………………………...…………. 611 20.5.5.1 Chromatische Aberration……………………………………..… 612 20.5.5.2 Sphärische Aberration…………………………………………… 613 20.5.5.3 Koma…………………………………………………………….. 615 20.5.5.4 Astigmatismus…………………………………………………… 616 20.5.5.5 Bildfeldwölbung………………………………………………… 617 20.5.5.6 Verzeichnung……………………………………………………. 618 20.5.5.7 Aplanatische Abbildung…………………………………………. 619
20.5
XVIII
Inhaltsverzeichnis
20.5.6 Die Wirkung von Blenden…………………………………………………………... 619 20.5.6.1 Öffnungsblende………………………………………………….. 620 20.5.6.2 Gesichtsfeldblende………………………………………………. 621 20.6 Anwendung der Strahlenoptik auf die Atmosphäre………………………………….. 622 20.6.1 Lichtablenkung in der Atmosphäre………………………………………… 622 20.6.2 Regenbogen………………………………………………………………… 624 Ergänzung 1: Matrizenmethoden der paraxialen Optik…………………………………... 626 20A1.1 Die Brechungsmatrix…………………………………………………………….. 627 20A1.2 Die Translationsmatrix…………………………………………………………… 628 20A1.3 Die Transformationsmatrix………………………………………………………. 629 20A1.4 Hauptebenen……………………………………………………………………... 630 20A1.5 Anwendung auf dicke Linsen……………………………………………………. 632 20A1.6 Abbildungsmatrix einer Linse…………………………………………………… 633 20A1.7 Darstellung des elektrischen Feldvektors……………………………………….. 635 Ergänzung 2: Abbesche Sinusbedingung…………………………………………………. 635 Zusammenfassung…………………………………………………………………………... 638 Übungsaufgaben…………………………………………………………………………..… 639
21
Interferenz und Beugung………………………………………………….. 641
21.1
Interferenz………………………………………………………………………...…. 641 21.1.1 Zeitliche und räumliche Kohärenz…………………………………………. 641 21.1.2 Anordnungen zur Zweistrahlinterferenz………………………………….... 643 21.1.2.1 Fresnelscher Spiegelversuch……………………………………. 643 21.1.2.2 Fresnelsches Biprisma………………………………………….. 645 21.1.2.3 Youngscher Doppelspaltversuch…………………………….….. 645 21.1.2.4 Erzeugung von Interferenzen mit einer planparallelen Platte…… 646 21.1.2.5 Michelson-Interferometer………………………………………. 648 21.1.2.6 Michelson-Morley-Experiment………………………………… 650 21.1.2.7 Fourierspektroskopie……………………………………………. 652 21.1.3 Vielstrahlinterferenz……………………………………………………..… 655 21.1.3.1 Überlagerung von Wellen gleicher Amplitude……………….… 655 21.1.3.2 Überlagerung von Wellen abnehmender Amplitude……………. 656 21.1.3.3 Fabry-Perot-Interferometer……………………………………… 659 21.1.3.4 Lummer-Gehrcke-Platte………………………………………… 661 21.1.4 Antireflexschicht………………………………………………………….... 662 21.1.5 Dielektrische Spiegel ……………………………………………………… 663
Inhaltsverzeichnis 21.2
21.3
XIX
Beugung……………………………………………………………………………... 663 21.2.1 Huygens-Fresnelsches Prinzip……………………………………………… 663 21.2.2 Fraunhofersche Beugung…………………………………………………... 665 21.2.2.1 Beugung am rechteckigen Spalt……………………………...…. 666 21.2.2.2 Beugung am linearen Gitter……………………………………... 667 21.2.2.3 Beugung am Flächen- und Raumgitter………………………..... 671 21.2.3 Fresnelsche Beugung……………………………………………………….. 673 21.2.3.1 Fresnelsche Zonenplatte…………………………………………. 673 21.2.3.2 Fresnelsche Beugung an einem Spalt und einem Draht…….…… 677 21.2.3.3 Fresnelsche Beugung an einer Kante……………………………. 678 21.2.3.4 Fresnelsche Beugung an einer kreisförmigen Öffnung und einer Scheibe……………………………………………..… 678 21.2.4 Babinetsches Theorem……………………………………………………… 680 21.2.5 Holographie………………………………………………………………… 681 21.2.5.1 Prinzip…………………………………………………………… 681 21.2.5.2 Erzeugung eines Hologramms………………………………….. 682 21.2.5.3 Rekonstruktion………………………………………………….. 683 21.2.5.4 Weißlicht-Holographie………………………………………….. 684 21.2.5.5 Anwendungen…………………………………………………… 685 Spektralapparate……………………………………………………………………... 689 21.3.1 Optischer Aufbau…………………………………………………………… 689 21.3.2 Winkel- und Lineardispersion……………………………………………… 690 21.3.3 Auflösungsvermögen……………………………………………………….. 692 21.3.4 Gegenüberstellung von Interferometer- und Gitterspektrometer…………… 695 21.3.5 Lichtstärke von Monochromatoren…………………………………………. 696
Ergänzung 1: Ableitung der Kirchhoffschen Integralformel…………………………….... Ergänzung 2: Entwicklung der Feldamplitude in der Kirchhoffschen Integralformel……. Zusammenfassung……………………………………………………………………..……. Übungsaufgaben……………………………………………………………………………..
698 701 703 705
XX
Inhaltsverzeichnis
22
Optische Instrumente…………………………………………………….... 707
22.1 22.2 22.3
Das menschliche Auge………………………………………………………………. 707 Die Lupe……………………………………………………………………………... 709 Das Mikroskop………………………………………………………………………. 710 22.3.1 Strahlengang, Vergrößerung und Auflösungsvermögen…………………… 710 22.3.2 Abbesche Theorie der Bildentstehung……………………………………... 712 22.3.3 Spezielle Techniken der Mikroskopie………………………………...…… 713 22.3.3.1 Phasenkontrastverfahren……………………………………..… 713 22.3.3.2 Dunkelfeldverfahren…………………………………………… 714 22.3.3.3 Konfokale Mikroskopie………………………………………… 714 22.3.3.4 Optische Nahfeldmikroskopie…………………………………... 716 Das Fernrohr……………………………………………………………………….… 717 Aktive und adaptive Optik…………………………………………………………… 719 Fourieroptik………………………………………………………………………..… 723 22.6.1 Fourierdarstellung der Fraunhoferschen Beugung…………………………. 723 22.6.2 Beugung an einer rechteckigen Blende…………………………………….. 724 22.6.3 Die Linse als Fouriertransformator…………………………………………. 726 22.6.4 Optische Filterung…………………………………………………………... 729 22.6.4.1 Tiefpassfilter…………………………………………………….. 729 22.6.4.2 Hochpassfilter…………………………………………………… 730 22.6.4.3 Zernikesches Phasenkontrastverfahren………………………….. 732 22.6.5 Optische Mustererkennung…………………………………………………. 733 22.6.6 Wirkungsweise des Nahfeldmikroskops…………………………………… 733
22.4 22.5 22.6
Zusammenfassung…………………………………………………………………………... 735 Übungsaufgaben…………………………………………………………………………..… 737
A1
Mathematischer Formel-Anhang…………………………………………. 739
A1.1 Vektorrechnung……………………………………………………………………… 739 A1.1.1 Definition von Vektoren……………………………………………………. 739 A1.1.2 Polare und axiale Vektoren…………………………………………………. 740 A1.1.3 Addition und Subtraktion von Vektoren……………………………………. 740 A1.1.4 Multiplikation eines Vektors mit einem Skalar oder einem Vektor………... 740 A1.1.4.1 Multiplikation eines Vektors mit einem Skalar…………………. 741 A1.1.4.2 Skalare Multiplikation eines Vektors mit einem Vektor………… 741 A1.1.4.3 Vektorielle Multiplikation eines Vektors mit einem Vektor……. 742
Inhaltsverzeichnis
A1.2
A1.3
A1.4 A1.5 A1.6
XXI
A1.1.5 Multiplikation von mehr als zwei Vektoren………………………………... 743 A1.1.5.1 Skalare Multiplikation eines polaren und eines axialen Vektors... 743 A1.1.5.2 Vektorielle Multiplikation eines polaren und eines axialen Vektors………………………………………. 743 A1.1.6 Differentiation eines Vektors nach einem Skalar………………………...… 745 Elemente der Vektoranalysis………………………………………………………… 746 A1.2.1 Der Gradient einer skalaren Funktion……………………………………… 746 A1.2.2 Die Divergenz eines Vektorfeldes…………………………………………. 747 A1.2.3 Die Rotation eines Vektorfeldes…………………………………………… 749 A1.2.4 Der Nabla-Operator, mehrfache Ableitungen…………………………….... 753 A1.2.5 Der Greensche Satz………………………………………………………… 755 Koordinatensysteme…………………………………………………………………. 755 A1.3.1 Kartesische Koordinaten…………………………………………………… 755 A1.3.2 Zylinderkoordinaten………………………………………………………… 756 A1.3.3 Sphärische Koordinaten…………………………………………………….. 757 Komplexe Zahlen……………………………………………………………………. 758 Elemente der Tensorrechnung……………………………………………………….. 761 Grundzüge der Variationsrechnung…………………………………………………. 768 A1.6.1 Variation ohne Nebenbedingungen………………………………………… 769 A1.6.2 Variation mit Nebenbedingungen………………………………………….. 772
Lösungen der Übungsaufgaben………………………………………………….. 775 Literaturverzeichnis……………………………………………………………… 815 Namen- und Sachverzeichnis…………………………………………………….. 821
XXII
Physikalische Konstanten
Gravitationskonstante
G
6,672591 10-11
m3/kg s2
128
Lichtgeschwindigkeit
c
299792458
m/s
exakt
Avogadro-Konstante
6,0221367 10
NA
Boltzmannkonstante
k
1,380658 10
Gaskonstante
R
8,314510
23
-23
1/mol
0,95
J/K
8,5
J/mol K
8,4
3
Molvolumen
VM
22,41410
m /mol
8,4
Dielektrizitätskonstante
H
8,854187817 10-12
As/Vm
exakt
Vs/Am
exakt
Permeabilitätskonstante
µ0
4
-7
10 =
1,25663706 10-6 Plancksche Konstante
h h/2 S
=
6,6260755 10
-34
Js
0,6
1,0545726 10
34
Js
0,60
As
0,30
kg
0,59
As/kg
0,59
Elementarladung
e
Elektronenmasse
me
spez. Ladung
e/me
Protonenmasse
mp
1,6726231 10
Massenverhältnis
me/mp
1836,152701
Atomare Masseneinheit
AME
Bohr-Radius
a0
Feinstrukturkonstante
D
Rydbergkonstante
Ry f
1,60217733 10 9,1093897 10
-31
-1,7588196 10
1,6605402
-19
-11
-27
kg 0,30
10
5,2917725 10
-27
-11
7,29735308 10
7
1,0973731534 10
7
kg
0,59
m
0,045
-
0,045
1/m
0,0012
Nach E.R. Cohen and B.N. Taylor: The 1986 CODATA Recommended Values of the Fundamental Values of the Fundamental Physics Constants, J. Phys. Chem. Ref. Data 17, 1795 – 1803 (1988)
Umrechnungstabelle
XXIII
Energie-Umrechnungstabelle J
eV
cm-1
kWh 18
2,778 10
-7
5,035 10
K 22
7,244 1022
1J
1
6,242 10
1eV
1,6021 10-19
1
4,450 10-26
8,066 103
1,161 104
1kWh
3,60 106
2,247 1019
1
1,812 1027
2,608 1029
cm-1
1,9863 10-23
1,240 10-4
5,518 10-30
1
1,439
1K
1,3805 10-23
8,620 10-5
3,835 10-30
6,950 10-1
1
Einführung In der Frühzeit der Erdgeschichte waren die Menschen mit der Natur eng verbunden Als Jäger und Sammler lebten sie von deren Früchten, waren dabei natürlich auch ihren Unbilden ausgesetzt. Es ist daher gut nachvollziehbar, dass den Naturkräften Gottheiten zugeordnet wurden. In der ägyptischen Mythologie stand die Sonne in ihrem Mittelpunkt. Der Sonnengott Rê überquerte bei Tag in seiner Sonnenbarke und bei Nacht in seiner Mondbarke den Himmel, für uns heute ein besonders poetisches Bild. Nur langsam wurden solche Vorstellungen abgelöst durch Fragen nach der Struktur der Welt. Die Babylonier gewannen erste Erkenntnisse über ihren Aufbau aus der Beobachtung der Bewegung der Gestirne. So konnten sie die Dauer eines Jahres und Monats bestimmen. Langjährige Beobachtungen versetzten sie in die Lage, Mondfinsternisse vorherzusagen. Im Fortgang der Geschichte gewann die Naturphilosophie, vor allem die Lehren von Aristoteles (350 v. Chr.), großen Einfluss. Über viele Jahrhunderte hinweg dominierte sie die Naturlehre. Bei der Ausarbeitung seiner Lehren stützte sich Aristoteles zwar auch auf empirische Zusammenhänge, aber im Vordergrund stand ein abstraktes Gedankengebäude, das nach der Grundlage allen Seins fragte. Etwa ein Jahrhundert später findet sich mit Archimedes (250 v. Chr.), ein Forscher, der mehr den in seiner Umwelt auftretenden praktischen Fragestellungen nachging. Das Archimedische Prinzip als Ursache des Auftriebs ist ein Beispiel. Die Entwicklung zur exakten Naturwissenschaft setzte etwa mit dem 16. Jahrhundert ein. Herausragende Forscher waren Kopernikus, Galilei, Brahe und Bruno. Zunächst standen die Gesetze unseres Planetensystems und die Rolle der Erde bzw. der Sonne als ihr Zentrum im Vordergrund. Das von ersterem zunächst aus ästhetischen Gründen vorgeschlagene neue Weltbild erschütterte die Stellung des Menschen jener Zeit, denn sie hatten sich bisher mit der Erde als das Zentrum des Universums betrachtet. Galilei verdanken wir seine zahlreichen experimentellen Beiträge zu diesem Thema, aber auch wichtige Beiträge zu den Grundlagen der Mechanik. Zu Beginn des 17. Jahrhunderts entwickelte Kepler auf der Basis von Brahes Beobachtungen die Gesetze der Planetenbewegung. 1666 stellte Newton das fundamentale Gravitationsgesetz auf und formulierte wenig später die nach ihm benannten drei Newtonschen Postulate, welche die Grundlage der gesamten klassischen Mechanik sind. Sie erfuhren Anfang des 20. Jahrhunderts in ihrer Erweiterung durch Lorentz und Einstein ihre endgültige Form. Im Bereich der Optik setzte sich durch die Versuche von Fresnel (1816/17) und Young die bereits von Huygens 1678 formulierte Theorie der Wellennatur des Lichtes durch. In das 19. Jahrhundert fallen auch wichtige Erkenntnisse zu den Erscheinungen der Elektrizität durch Ohm, Faraday und Henry. Sie fanden ihre Krönung durch die Maxwellschen Gleichungen (1873). Kurz danach gelang es Hertz als erstem, elektromagnetische Wellen zu erzeugen und nachzuweisen. Parallel dazu entwickelte sich durch die Einbeziehung der Wärme als weitere Energieform die Thermodynamik mit ihren drei Hauptsätzen. Um 1870 entstand durch Clausius und Boltzmann mit der kinetischen Gastheorie eine erste theoretische Formulierung. Die Zeitenwende ist durch die Begründung der Quantentheorie durch Planck ausgezeichnet. Ihr waren experimentelle Untersuchungen anderer Forscher zur Wärmestrahlung eines schwarzen Strahlers vorausgegangen. Bereits seit Ende des 19. Jahrhunderts hatte das Interesse zunehmend der Struktur der Atome gegolten. Rutherford konnte 1909 mit seinen Mitarbeitern mit einem Streuexperiment von D-Teilchen an Wasserstoffatomen das Thomsonsche Atommodell erweitern und verfeinern. Die Messergebnisse fanden 1911 ihren quantitativen Niederschlag in der nach Rutherford benannten Streuformel. Balmer war bereits 1885 die Einordnung der von
2
Einführung
ihm selbst und anderen entdeckten Spektrallinien von H-Atomen in eine Serienformel gelungen. Die gewonnenen Erkenntnisse führten Bohr zur Aufstellung seines Atommodells, das aus den berühmten drei Bohrschen Postulaten bestand. Wichtigstes Merkmal ist die Quantennatur der Strahlung. Die Übertragung der Postulate in eine allgemeine Theorie gelang Heisenberg (1925) und Schrödinger (1926). in der Formulierung durch Letzteren in der grundlegenden Schrödingergleichung. Durch die Einbeziehung des Elektronenspins in die Theorie durch Dirac konnte ein weites Erfahrungsmaterial theoretisch eingeordnet werden. Pauli hatte schon 1924 das nach ihm benannte Ausschließungsprinzip, das sog. Pauliprinzip aufgestellt, das nun ebenfalls durch die Quantentheorie seine Einordnung fand. Die Quantentheorie enthielt nicht die Wechselwirkung zwischen einem Strahlungsfeld und Atomen oder Molekülen. Die erforderliche Erweiterung wurde in den vierziger Jahren von Feynman, Schwinger und Tomonaga im Rahmen der Quantenelektrodynamik vorgenommen. Sie beschreibt alle Phänomene, die von geladenen punktförmigen Teilchen wie Elektronen und Positronen, und von Photonen verursacht werden. Dieser kurze Streifzug durch die Entwicklung der Physik macht die zentrale Stellung der Physik als Grundlagenwissenschaft der unbelebten Natur deutlich. Mit zunehmender Erweiterung der Forschungsfelder bildeten sich mehrere Wissenschaftszweige heraus, die aus einer Kombination mit anderen naturwissenschaftlichen Fächern bestehen wie etwa die Biophysik, die Geophysik oder die Astrophysik. Die Grundlage chemischer Prozesse bilden die Kräfte zwischen den Atomen und deren Elektronenhüllen. Auch für die Vorgänge in lebenden Organismen sind physikalische Prozesse von großer Bedeutung. Die Übertragung physikalischer Gesetzmäßigkeiten auf praktische Fragestellungen führte zu zahlreichen Anwendungen in Medizin und Technik, die aus unserem Leben nur schwer wegzudenken sind. Das Studium der Physik an den deutschen Universitäten wird meistens in Experimentalphysik und Theoretische Physik unterteilt, wobei in der Regel erstere am Anfang steht. Die Physikalischen Grundlagen werden an Hand vieler Demonstrationsversuche und einfacher Modelle stufenweise induktiv erarbeitet. Der eigentliche theoretische Unterbau erfolgt dann im Rahmen der Theorie-Vorlesungen. Dieses Vorgehen hat aber einige Nachteile. Die Modellvorstellungen im experimentellen Teil können aus Zeitgründen häufig nur qualitativ oder zu stark vereinfacht ausfallen und sind daher unbefriedigend. In der Theorievorlesung fehlt oft das Verständnis der Studierenden, da sie die experimentellen Erläuterungen im Einzelnen nicht mehr im Kopf haben oder noch gar nicht kennen. Auch weiß der Dozent häufig nicht, was in der Experimentalvorlesung bereits behandelt wurde und wie gründlich. Daraus resultiert nicht selten ein unnötiger Verständnis- und Zeitverlust. Deswegen wird an mehreren Universitäten Physik in den ersten Jahren als integrierter Kurs gelehrt, wobei sich ein Experimentalphysiker und ein Theoretiker, die beide in der Vorlesung anwesend sind, nach Bedarf miteinander abwechseln. Dieses auf zwei Bände angelegte Lehrbuch der Physik versucht, dieser Problematik Rechnung zu tragen. Es behandelt den Stoff sowohl aus experimenteller wie aus theoretischer Sicht. Um auch Studierenden, die weiterhin separate Experimental- und Theorievorlesungen hören, oder solchen mit Nebenfach Physik das Buch zugänglich zu machen, werden überwiegend theoretische Abschnitte als Ergänzungen der jeweiligen Stoffes den einzelnen Kapiteln angefügt. Das betrifft vor allem die Analytische Mechanik, die einem gesonderten Kapitel vorbehalten ist. Dagegen sind bei der Darstellung der Phänomenologischen Thermodynamik Experiment und Theorie miteinander verflochten.
Einführung
3
Der erste Teil beginnt mit einer Einführung in die Bewegungslehre unter Einschluss relativistischer Geschwindigkeiten (Kap. 1-2). Anschließend werden die Bewegungen von Körpern unter der Einwirkung von Kräften untersucht (Kap. 3). Ausgangspunkt ist das Modell des Massenpunktes. Darunter ist ein Körper zu verstehen, dessen Masse in einem Punkt vereinigt gedacht wird. So brauchen zunächst Komplikationen, die durch die endliche Ausdehnung eines Körpers bedingt sind, nicht berücksichtigt zu werden. Schrittweise erfolgt die Erweiterung zu einem System von Massenpunkten und zum Begriff des starren Körpers (Kap. 4-5). Die gewonnenen Erkenntnisse werden in Kap. 6 auf die Keplerschen Gesetze angewandt. Alle bis hierher abgeleiteten Gesetzmäßigkeiten der Mechanik (die Kinematik also ausgenommen) setzen voraus, dass die vorkommenden Geschwindigkeiten klein gegenüber der Lichtgeschwindigkeit sind. In Kap. 7 erfolgt eine Ausdehnung auf relativistische Geschwindigkeiten. In Kap. 8 wird besprochen, welche Erweiterungen nötig sind, wenn Vorgänge nicht wie bisher in einem Inertialsystem untersucht werden, sondern in einem beschleunigten Bezugssystem. Die Beschränkung auf starre Körper wird in den nächsten Kapiteln (Kap. 9, 10) auch noch fallen gelassen. Es werden hier einige Eigenschaften realer deformierbarer Festkörper bzw. Flüssigkeiten und Gase behandelt. Unter den Bewegungsmöglichkeiten eines Körpers nehmen periodische Vorgänge in Raum und Zeit einen besonders wichtigen Platz ein. Ihnen ist daher zum Abschluss der Newtonschen Mechanik ein eigenes Kapitel, 11, gewidmet. Kap. 12 bringt die bereits erwähnte Einführung in die analytische Mechanik. Daran schließt sich die Thermodynamik an, indem die Energieformen der Mechanik, potentielle und kinetische Energie, um die thermische Energie erweitert werden. Am einfachsten sind die Auswirkungen auf Gase zu verstehen. Sie sind daher der Untersuchungsgegenstand. Es gibt zwei Zugänge: In diesem Band steht die phänomenologische Behandlung im Vordergrund (Kap. 13). Der andere Weg, die Eigenschaften von Gasen mit den Methoden der statistischen Mechanik zu beschreiben, wird in Kap. 14 lediglich im Rahmen der kinetischen Gastheorie dargestellt, da im Allgemeinen die mathematischen Voraussetzungen für eine weitergehende Behandlung noch fehlen. Kapitel 15-19 sind den Erscheinungen der Elektrostatik und -dynamik gewidmet. Die bisherigen Basisgrößen werden um die neue Grundgröße der elektrischen Ladung q erweitert und der Begriff und die Eigenschaften des statischen elektrischen Feldes, zunächst im Vakuum und dann in Materie formuliert. Um auch den Magnetismus einführen zu können, wird im 16. Kapitel die Stromleitung in Metallen, Halbleitern, Elektrolyten und Gasen besprochen und der Aufbau und die Wirkungsweise der verschiedenen Stromquellen beschrieben. Es zeigt sich, dass die Eigenschaften zeitunabhängiger elektrischer und magnetischer Felder in vier Grundgleichungen zusammengefasst werden können. Im 18. Kapitel folgt die Erweiterung auf zeitabhängige Felder. Zu Beginn steht die Besprechung der magnetischen Induktion. Die Verallgemeinerung des Induktionsgesetzes führt zur 2. Maxwell-Gleichung, die Deutung der Wechselstromleitung in Stromkreisen mit Kondensatoren zum Begriff des Verschiebungsstromes und zur 3. Maxwell-Gleichung. Die vollständige Beschreibung des Elektromagnetismus gelingt durch die Ergänzung dieser Beziehungen durch zwei bereits für statische Felder entwickelte Grundgleichungen. Damit ist der Weg frei zur Einführung elektromagnetischer Schwingungen und Wellen. Ihnen gelten die zwei nächsten Kapitel. Zur besseren Übersicht und damit zu einem leichteren Verständnis wird im 19. Kapitel zunächst der Durchgang von Licht durch optisch dünne Materie besprochen, also
4
Einführung
vor allem durch Gase unter Normalbedingungen. Als ein Beispiel zur Thematik der weichen Materie wird der Lichtstreuung in kolloidalen Suspensionen ein eigener Abschnitt gewidmet. In einem zweiten Schritt folgt die Erweiterung auf optisch dichte Materie, insbesondere auf die Ausbreitung von Licht in Festkörpern. Dazu werden als erstes die Maxwell-Gleichungen so ergänzt, dass sie auch in Materie gültig sind. Anschließend erfolgt die Diskussion der Eigenschaften elektromagnetischer Wellen in isotropen und danach in anisotropen Medien. Der letzte Abschnitt bringt eine kurze Einführung in die nichtlineare Optik, die besonders im Bereich der Laser-Physik und Technik wichtig ist. Die beiden nächsten Kapitel sind der Optik gewidmet. Dem Anliegen dieses Buches folgend beschränkt sich Kap. 20 auf solche Phänomene, die mit Hilfe geometrischer Strahlführung verstanden werden können, also der Ausbreitung von Licht in begrenzten Lichtbündeln. Die Wirkungsweise optischer Elemente wie Spiegel und Linsen lassen sich damit bereits einfach und übersichtlich darstellen. Der Lichtweg durch komplexe optische Systeme, wie sie in vielen optischen Instrumenten eingesetzt werden, ist im Allgemeinen schwierig zu überblicken. In solchen Fällen wird die Berechnung wesentlich erleichtert durch die Benutzung der Matrixmethode. Sie wird daher in einem eigenen Unterabschnitt behandelt. Abweichungen von den geometrischen Strahlengängen treten dann auf, wenn interferenzfähige Lichtbündel auf geometrische Begrenzungen und enge Öffnungen treffen. Bei einer optischen Abbildung sind das z.B. Blenden, welche die Lichtbündel begrenzen. Die dabei auftretenden Beugungserscheinungen begrenzen das geometrische Auflösungsvermögen optischer Instrumente und das spektrale Auflösungsvermögen von Spektrometern. Letztere analysieren das einfallende Licht nach ihrer Frequenz, wodurch Aussagen über den Aufbau der Materie möglich werden. Sie sind Gegenstand von Kap. 21, in dem als weitere wichtige Anwendung auch auf die Holographie eingegangen wird. Die in den beiden Kapiteln gewonnenen Erkenntnisse dienen im letzten Kapitel 22 dazu, Aufbau, Funktionsweise und Leistungsfähigkeit optischer Instrumente darzulegen. Neben dem klassischen Instrumentarium werden moderne Methoden wie die Nahfeldmikroskopie, die aktive und adaptive Optik, die u.a. bei großen Spiegelteleskopen eingesetzt werden, sowie die optische Filterung behandelt. In diesem Zusammenhang werden auch die Grundelemente der Fourieroptik eingeführt. Jedem Kapitel sind eine knappe Zusammenfassung des gebrachten Stoffes sowie einige Übungsaufgaben angefügt, die der Kontrolle und der Festigung des Stoffes dienen sollen. Zur Erarbeitung der theoretischen Abschnitte ist ein gewisses mathematisches Rüstzeug unumgänglich. Dieses wird in einem Formel-Anhang zusammengestellt. An mehreren Stellen werden Sie Hinweise auf die Unvollständigkeit der Modelle finden, die in der atomaren Struktur der Materie und der Wechselwirkung elektromagnetischer Wellen mit dieser ihre Ursache haben. Eine bessere Beschreibung und damit ein vertieftes Verständnis setzt eine Kenntnis der Quantentheorie voraus. Diesem Feld ist der 2. Band gewidmet. Mehreren Personen bin ich zu Dank verpflichtet. Etliche Mitarbeiter der Ebene P10 haben mir bei der Einarbeitung in die relevanten PC-Programme immer wieder geholfen, ganz besonders PD. Dr. M. Deicher, Frau S. Lucas und Dr. R. Tweer. Bei der Zusammenstellung der Übungsaufgaben waren mir meine ehemaligen Mitarbeiter Dr. C. Graf, Dr. C. Johner, Dr. H. Kramer und Dr. C. Martin behilflich. K. Döpfner hat mir den Vorlesungsvorbereitungsraum für die fotographischen Aufnahmen zur Verfügung gestellt und mir zu Beginn tatkräftig zur Seite gestanden. Bei allen bedanke ich mich herzlich. Den Lektoren Herrn U. Sandten und Frau K. Hoffmann schließlich danke ich für ihre große Geduld und Hilfe bei den Korrekturen.
I
Mechanik
1
Kinematik
1.1 Bewegung in einer Dimension 1.1.1 Mittlere Geschwindigkeit und Momentangeschwindigkeit Bewegungsvorgänge werden im Allgemeinen die Beschreibung in einem dreidimensionalen Koordinatensystem notwendig machen. Ihre Beschreibung erfordert wenigstens elementare Kenntnisse der Vektorrechnung. Um den Ungeübten darin den Einstieg zu erleichtern, beginnen wir daher zunächst mit eindimensionalen Bewegungen, also mit solchen, die längs einer geraden Linie erfolgen, wie es der Weg in nebenstehender Abbildung andeutet. Unsere Wanderung möge 4,8 km vor einem in der Ferne sichtbaren Gemäuer beginnen. Er führt uns durch eine ebene, gerade Allee (Abb. 1.1). Zwischendurch bieten sich uns interessante Ausblicke und wir verlangsamen unseren Schritt, um die Landschaft näher zu betrachten. Am Ende der Allee finden wir schließlich ein kleines, altes Schlösschen. Wir machen eine erste kleine Pause und stellen fest, dass wir bereits 1,2 Stunden unterwegs waren; die mittlere Abb. 1.1: Auf dem Weg Geschwindigkeit, definiert als
v:
'x , 't
(1.1)
betrug also 4 km/std. 'x ist die in der Zeit 't zurückgelegte Strecke. Die Zeichenkombination “ : = ” bedeutet “ist definiert als”. Die Geschwindigkeit zu einem bestimmten Zeitpunkt heißt Momentangeschwindigkeit. Darunter verstehen wir den Ausdruck
§ 'x · v lim ¨ ¸ 't o 0 ' t © ¹
(1.2)
Nach den Regeln der Differentialrechnung bedeutet das die erste Ableitung des Weges nach der Zeit. In unserem Beispiel variiert die Momentangeschwindigkeit erheblich.
6
1 Kinematik
1.1.2 Beschleunigung Während der kleinen Wanderung hat sich also unsere Geschwindigkeit mehrfach geändert; eine solche Änderung, dividiert durch die zugehörige Zeit, heißt mittlere Beschleunigung a:
'v . 't
(1.3)
Lassen wir das Zeitintervall beliebig schrumpfen, so geht (1.3) in die Momentanbeschleunigung über:
a : lim
't o 0
'v dv 't dt
(1.4)
Die Geschwindigkeit hat immer einen positiven Zahlenwert; die Beschleunigung kann auch negative Werte annehmen, je nachdem ob die Geschwindigkeit zu- oder abnimmt. Wie groß sind Momentangeschwindigkeit v und zurückgelegter Weg s bei konstanter Beschleunigung als Funktion der Zeit? Es gilt nach (1.4) t
adt
dv o a
v
³
t t0
v
v0 a (t t0 )
dt
³ dv
o a (t t0 )
v v0
(1.5a)
v0
v0 at0 at
(1.5b)
Die Anfangswerte, hier also die der Geschwindigkeit und der Zeit, wurden wie üblich mit dem Index “0” versehen. Eine Bewegung, bei welcher der Geschwindigkeitszuwachs pro Zeit konstant ist, ist der freie Fall eines Körpers (die Luftreibung werde vernachlässigt). Die Beschleunigung wird in diesem Fall mit dem Buchstaben “g” bezeichnet und beträgt g
9.81 m / s 2 .
(1.6)
Integration von (1.5b) ergibt für den zurückgelegten Weg, wenn wir den Zeitnullpunkt t0 = 0 setzen
1 x x0 v 0 t at 2 . 2
(1.7)
1 Kinematik
7
In Abb. 1.2 sind x, v und a als Funktion der Zeit für t0 = 0 dargestellt.
v
x
a a0
v0
x0 t
t
t
Abb. 1.2: Eindimensionale Bewegung mit konstanter Beschleunigung: Weg-Zeit-Relation und Geschwindigkeit-Zeit-Relation
1.2
Bewegung in drei Dimensionen
1.2.1 Der Begriff des Massenpunktes Im Allgemeinen werden Bewegungen nicht längs einer geraden Linie verlaufen, sondern auf einer krummlinigen Bahn in einer Ebene bzw. im dreidimensionalen Raum. Ein Beispiel für eine zweidimensionale Bewegung ist die Bahnkurve beim schiefen Wurf. Eine dreidimensionale Bewegung beschreibt etwa ein Auto, das ein Gebirge mit vielen Serpentinen durchquert oder ein Gefährt auf einer „Achterbahn“. Im Folgenden erweitern wir die Ergebnisse des letzten Kapitels auf zwei und drei Dimensionen. Zur präzisen Beschreibung von Bewegungen eines Körpers ist es zweckmäßig, diesen durch den Begriff des Massenpunktes darzustellen. Darunter wollen wir einen ausdehnungslosen Körper verstehen, dessen Masse in einem Punkt konzentriert ist. Drehbewegungen werden damit vorerst ausgeschlossen.
1.2.2 Ortsvektor und Geschwindigkeit Den Ort eines Massenpunktes legen wir durch den Ortsvektor fest. Dazu wählen wir zunächst ein rechtwinkliges, kartesisches Koordinatensystem. Der Ortsvektor setzt sich nach den Regeln der Vektorrechnung aus seinen Komponenten längs der Koordinatenachsen zusammen.
G r
xeˆx yeˆy zeˆz
G G Damit wird der Verbindungsvektor zwischen zwei Punkten rA und rB (Abb. 1.3)
(1.8)
8
1 Kinematik
G G G 'r rB rA ( xB x A )eˆx ( yB y A )eˆy ( z B z A )eˆz (1.9)
z r rA
r Dr r rB
Die Geschwindigkeit ist bestimmt durch die Richtung, in der die Bewegung verläuft, und durch ihren Betrag. Die mittlere Geschwindigkeit ist in Erweiterung der eindimensionalen Bewegung gegeben durch
y
G v:
xG
Abb. 1.3:Verbindungsvektor ' r G G der Ortsvektoren rA und rB
G G dr v: dt
G 'r 't
(1.10)
G wobei 'r durch (1.3) bestimmt ist. Die Momentangeschwindigkeit ist definiert als
dx dy dz eˆx eˆy eˆz dt dt dt
oder
G G dr v: dt
v x eˆx v y eˆy v z eˆz
(1.11a,b)
Nach dem Lehrsatz des Pythagoras gilt für den Betrag der Geschwindigkeit
v 2 v 2x v 2y v 2z
o
v
v 2x v 2y v 2z
(1.12)
1.2.2.1 Relativgeschwindigkeit
Nicht immer ruht der Beobachter. In solchen Fällen kann es zweckmäßig sein, Ort und Bewegung eines Massenpunktes nicht in einem ortsfesten Koordinatensystem zu beschreiben, sondern zu einem bewegten Bezugssystem überzugehen. Betrachten wir zwei Massenpunkte A und B; sie mögen z in einem gemeinsamen Koordinatensystem die OrtsG G r koordinaten rA und rB besitzen und sich mit den Ger rAB rA G G schwindigkeiten v A und v B bewegen (Abb. 1.4). Wir G r interessieren uns für die Geschwindigkeit v AB von A rB relativ zu einem in B verankerten Koordinatensystem:
y x Abb. 1.4: Zur Erläuterung der Relativgeschwindigkeit zweier Teilchen A und B
G drAB G v AB dt
G G v A vB .
(1.13)
Für die Geschwindigkeit von B relativ zu A ergibt sich
G G G G v BA v B v A v AB
(1.14)
1 Kinematik
9
1.2.3 Beschleunigung Die mittlere Beschleunigung ist analog definiert als
G G 'v a: 't
(1.15)
G G wobei 'v analog zu 'r aus (1.3) zu bilden ist. Die Momentanbeschleunigung ist bestimmt durch (1.4)
G G dv a: dt
(1.4)
Einsetzen von (1.11b) und Ausführung der Differentiation liefert
G dv y dv G dv dv x a eˆx eˆy z eˆz . dt dt dt dt
(1.16)
Das ist äquivalent mit
G a ax eˆx a y eˆy az eˆz
(1.17)
Daraus ergibt sich für den Betrag der Beschleunigung
a
ax2 a y2 az2
(1.18)
Benutzen wir für die zeitliche Differentiation die sog. Kurzform, so schreibt sich diese Beziehung
a
x 2 y 2 z2
(1.19)
Diese Art der Formulierung erspart eine Menge Schreibarbeit, doch wir werden sie erst in Kap. 12 benutzen, weil die Punkte über den Formelzeichen leicht übersehen werden.
10
1 Kinematik
1.2.3.1 Bewegung mit konstanter Beschleunigung
Ein einfaches Beispiel einer eindimensionalen Bewegung mit konstanter Beschleunigung wurde bereits in Kap. 1.1.2 angesprochen: der freie Fall eines Teilchens ( a g ). Geschwindigkeit und Weg als Funktion der Zeit ergeben sich durch Integration. Die Geschwindigkeit wird analog zu (1.5b)
dv gdt v v 0 g (t t 0 )
(1.20)
und der zurückgelegte Weg
z
z0 v 0 t t0
1 g t 2 t02 gt0 t t0 . 2
Starten wir den zunächst bei z0
z
0 ruhenden Körper zur Zeit t0
(1.21a) 0 , so folgt
1 gt 2 . 2
(1.21b)
Ein Beispiel einer zweidimensionalen Bewegung mit konstanter Beschleunigung ist der schräge oder („schiefe“) Wurf, dem wir uns jetzt zuwenden wollen. Ein Gegenstand, etwa ein Ball, möge unter einem Winkel - gegen die Horizontale x in die Höhe geworfen werden. Der Einfluss der Luftreibung werde wieder vernachlässigt. Die Anfangsgeschwindigkeit hat die Komponenten (Abb. 1.5a):
v 0 x v 0 cos -
r v
y
P
r v0
Der Ball erfährt eine negative Beschleunigung in yRichtung. In der dazu senkrechten x-Richtung ist die Geschwindigkeit vx konstant, also ax = 0.
(v 0 ) y (r0 ) y
(1.22)
v 0 y v 0 sin -
J
ay
g
(v 0 ) x (r0 ) x
ax
0
x
Abb. 1.5a: Erläuterung der Anfangsbedingungen beim schiefen Wurf
(1.23a,b)
Durch Integration von (1.23a) folgt für t0 = 0
v y v 0 y gt ; v x v 0 x
(1.24)
1 Kinematik
11
Der zurückgelegte Weg ist in Komponentenschreibweise
x x0
v0 x t (1.25)
1 y y0 v0 y t gt 2 2 Die allgemeine Bahngleichung finden wir durch Elimination der Zeit. Setzen wir x0 so ergibt sich
y
v0 y v0 x
x
g 2 x 2v 02 x
y0
0,
(1.26)
Diese quadratische Gleichung bedeutet, dass die Bahnkurve eine Parabel ist. Sie lässt sich in die allgemeine Form bringen
b · § y ax 2 bx a ¨ x 2 x ¸ a ¹ © 2
b · b2 § a ¨ x ¸ 2 . © 2a ¹ 4a
y (1.27) J
Die Bahn (Abb. 1.5b) verläuft durch den Ursprung des Koordinatensystems; ihr Scheitel xS befindet sich bei
xS
v0 x v0 y
(1.28)
g
0
xS
x
Abb. 1.5b: Bahnkurve beim schiefen Wurf für den Fall x0 = y0 = 0
Einsetzen der Komponenten der Anfangsgeschwindigkeit, (1.22), ergibt
xS
v 02 sin 22g
(1.29)
Da die Parabel eine symmetrische Kurve ist, liegt die Auftreffstelle bei dem doppelten Wert, x = 2xs. Die größte Steighöhe yS wird damit
yS
v 02 y 2g
v 02 sin 2 - . 2g
Während die Wurfweite bei - 90q , den größten Wert an.
(1.30) 45q maximal wird, nimmt die Höhe beim senkrechten Wurf,
12
1 Kinematik
1.2.3.2 Bewegung mit nicht-konstanter Beschleunigung
Die Beschleunigung eines Teilchens ist nicht mehr konstant, wenn sich ihr Betrag oder ihre Richtung während der Bewegung ändert. Ein wichtiges Beispiel für letztere Art der Bewegung ist die gleichförmige Kreisbewegung, bei welcher der Betrag der Geschwindigkeit konstant ist. Die Beschleunigung infolge der dauernden Richtungsänderung der Geschwindigkeit bezeichnen wir als Zentripetalbeschleunigung aN, weil sie immer zum Kreismittelpunkt weist. Zur Erläuterung betrachten wir Abb. 1.5a; sie zeigt einen Ausschnitt der Bahnkurve eines rotierenden Körpers. Wir ermitteln zuerst den Betrag der Beschleunigung; dazu bestimmen wir die G Differenz der Geschwindigkeiten 'v zwischen zwei Positionen P1 und P2 des Körpers. Es gilt auf Grund der Ähnlichkeit des Dreiecks OP1P2 in Abb. 1.6a und dem in Abb. 1.6b
a)
'v 'r 'r bzw. 'v v R R v
b)
P2 R r Dr
DQ O
r v1
r v2
r Dv
P1
R
DQ r v1
(1.31)
Division durch 't und Bildung des Grenzüberganges 't o 0 liefern
aN
'v v 2 R 't o 0 't lim
(1.32)
r v2
Die Richtung der Beschleunigung erhalten wir, wenn wir berücksichtigen, dass im G Abb. 1.6: Zur Ableitung der ZentripetalbeGrenzfall '4 o 0 der Vektor 'v senkG schleunigung recht auf v steht (s. Abb. 1.6b), also stets zum Kreismittelpunkt weist. Damit ist auch der Beschleunigungsvektor senkrecht zum Kreismittelpunkt gerichtet. Manchmal ist es zweckmäßig, aN als Funktion der Umlaufzeit auszudrücken. Die Geschwindigkeit ist ja, dem Betrage nach, der pro Umlaufzeit T durchlaufene Kreisumfang.
v
2S R T
(1.33)
Setzen wir v in (1.32) ein, so erhalten wir für die Zentripetalbeschleunigung
aN
(2S R / T ) 2 R
4S 2 R T2
(1.34)
1 Kinematik
13
Zusammenfassung x Bei eindimensionaler Bewegung gelten die folgenden Festlegungen: Mittlere Geschwindigkeit:
v:
xE x A 'x { t E t A 't
Momentangeschwindigkeit:
v:
dx { x dt
Mittlere Beschleunigung:
a:
v E v A 'v { . t E t A 't
Momentanbeschleunigung:
a:
dv d 2 x { dt dt 2
x Bei konstanter Beschleunigung gelten für t0 = 0 die Relationen
1 x x0 v 0 t at 2 ; 2
v
v0 a t
x Im dreidimensionalen Raum ist der Ort eines Teilchens gegeben durch
G r : xeˆx yeˆy z eˆz und die Geschwindigkeit durch
v:
G dr dt
dx dy dz eˆx eˆy eˆz . dt dt dt
Ihr Betrag ergibt sich zu
v
v 2x v 2y v 2z .
14
1 Kinematik
x Die Beschleunigung ist gegeben durch
G d vy d vz G d v d vx a eˆx eˆy eˆz . dt dt dt dt Ihr Betrag folgt zu
a
ax2 a y2 az2 .
x Der reibungslose freie Fall ist ein Beispiel einer eindimensionalen Bewegung mit konstanter Beschleunigung, der reibungsfreie, schräge Wurf ein analoges Beispiel in zwei Dimensionen, ay = -g; die Geschwindigkeitskomponenten sind mit t0 = 0
v y v0 y gt ;
v x v0 x .
x Die Bahnkurve ist eine Parabel, die den Koordinatenursprung berührt; sie hat die Gestalt
§ v02 y ¨¨ y 2g ©
· g v0 x v0 y ½ ¸¸ 2 ® x ¾ 2v0 x ¯ g ¿ ¹
2
x Die gleichförmige Kreisbewegung ist ein Beispiel einer Bewegung mit konstantem Betrag der Beschleunigung. Wir bezeichnen sie als Zentripetalbeschleunigung.
1 Kinematik
15
Übungsaufgaben G 1. Ein Flugzeug fliegt mit einer Reisegeschwindigkeit v eine Strecke s hin und zurück. Es G weht ein Wind mit einer Geschwindigkeit u genau in Flugrichtung bzw. beim Rückflug in Gegenrichtung. Gleicht der Gewinn an Flugzeit beim Hinflug den Verlust beim Rückflug aus?
2. Zwei Neutronen bewegen sich im Weltall mit den Geschwindigkeiten G G v1 (104 , v 2, v 1) m/s . Z. Zt. t = 0 s befinden sie sich bei r1 (0, 0, 0) m und G r2 (0,1, 0) m a) Wie groß ist ihr Abstand als Funktion der Zeit? b) Wann ist ihr Abstand am kleinsten und wie groß ist er? G 3. Auf der Autobahn fährt ein Pkw mit der Geschwindigkeit v 130 km/h . Bei einem erforderlichen Abbremsmanöver gelingt es dem Fahrer nur noch, sein Fahrzeug bis auf 10 km/h abzubremsen, bevor es auf einen vor ihm stehen gebliebenen Pkw auffährt. Wie groß war sein (zu geringer) Abstand beim Beginn der Abbremsung, wenn die Bremsverzögerung 6 ms-2 betrug? Welchen Mindestabstand hätte er einhalten müssen, damit er rechtzeitig zum Stillstand gekommen wäre?
4. Eine Maus sei (ohne Schwanz) 10 cm lang. Ein Habicht kann ein Objekt noch erkennen, das seinem Auge mindestens unter einem Winkel von einer Minute erscheint. a) Bis zu welcher Flughöhe h kann der Vogel die Maus noch erkennen? b) Der Habicht greift die Maus im Sturzflug an (Nehmen Sie freien Fall an). Wie viel Zeit hat die Maus, um sich in Sicherheit zu bringen? 5. An einer Schnur, die oben in einem Turm befestigt ist, sind in zunehmendem Abstand Holzkugeln befestigt. Die unterste Kugel berührt gerade den Boden. Wie muss der Abstand der Kugeln bemessen werden, damit nach dem Lösen der Schnurbefestigung alle 0,2 s eine Kugel den Boden erreicht? 6. Eine Kanonenkugel wird auf der Erde unter einem bestimmten Winkel in die Höhe geschossen, steigt bis auf 1000 m und trifft ihr Ziel auf der Erde 10 km vom Abschussort entfernt. Vernachlässigen Sie bei den folgenden Fragen den Luftwiderstand. a) Wie groß ist die Abschussgeschwindigkeit? b) Wie lang ist die Flugzeit? c) Welches Gewicht hat die Kugel? d) Wie weit käme das Geschoss, wenn es zur Erde gemessen unter 45° abgefeuert würde? 7. In einem oben nicht angeschlossenen gekrümmten Abflussrohr gleitet reibungsfrei eine (als G Punkt angenommene) Kugel. Wenn sich das Rohr mit der Winkelgeschwindigkeit Z dreht, soll sich die Kugel an jeder Stelle im Gleichgewicht befinden. Welche Form hat das Rohr?
2
Bezugssysteme in gleichförmiger Geschwindigkeit
2.1
Inertialsysteme
Bisher haben wir dem Bezugspunkt, also etwa der Ursprung eines kartesischen Koordinatensystems wenig Aufmerksamkeit geschenkt. Zur Beschreibung des momentanen Ortes eines Teilchens gibt es im Allgemeinen mehrere Möglichkeiten. Als Beispiel betrachten wir einen langsam fahrenden Bus. Einem der Mitfahrenden fällt durch eine kleine Unachtsamkeit ein Apfel aus einer Tüte, der daraufhin über den Boden des Busses rollt. Nehmen wir vereinfachend an, dass die Bewegung des Apfels auch von einem auf dem Gehweg stehenden Beobachter verfolgt werden kann. Zur Beschreibung der Bahnkurve wird der Businsasse ein Koordinatensystem wählen, das fest mit dem Bus verbunden ist. Der draußen stehende Beobachter beschreibe die Bahn in einem in ihm verankerten Koordinatensystem. Kommen beide Beobachter bez. der Bahnkurve zum gleichen Ergebnis? Zur Untersuchung erweist es sich als zweckmäßig zwei Fälle zu unterscheiden: a) Der Bus fährt mit, nach Richtung und Betrag, konstanter Geschwindigkeit; b) Der Bus bewegt sich beschleunigt, z.B. indem er seine Richtung ändert. In diesem Kapitel befassen wir uns mit dem ersten Fall, der ein Beispiel dafür ist, dass die beiden gewählten Bezugssysteme Inertialsysteme sind. Ein Koordinatensystem ist ein Inertialsystem, wenn in ihm alle Körper, die keinerlei äußeren Kräften unterliegen, ruhen oder sich gleichförmig geradlinig bewegen. Wir können also allgemein ein Inertialsystem S durch ein anderes Bezugssystem S´ ersetzen, sofern sich dieses mit konstanter Geschwindigkeit relativ zum Inertialsystem bewegt, denn von ihm aus gesehen bewegt sich der Körper ebenfalls mit konstanter Geschwindigkeit auf einer geradlinigen Bahn. Wir ergänzen diesen Sachverhalt durch die uns selbstverständlich erscheinende Festlegung, dass die Beobachter bez. der Zeitmessung übereinstimmen. Beide Fakten zusammen genommen werden als Newtonsches Relativitätsprinzip bezeichnet. Beschleunigte Koordinatensysteme, auf die wir in Kap. 9 eingehen, sind demnach keine Inertialsysteme. Der Ort eines Körpers bez. zweier Inertialsysteme lässt sich also beschreiben durch
G G G r c r ut ; t t c .
(2.1)
G u ist die konstante Relativgeschwindigkeit der beiden Bezugssysteme S und S´, wobei vorausG gesetzt wird, dass u “hinreichend” klein ist. Die zeitlichen Abläufe in beiden Bezugssystemen sind gleich. Die Beziehungen (2.1) werden als Galilei-Transformation (Galilei, G. 15641642) bezeichnet.
18
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.2
Die Lichtgeschwindigkeit
Es bleibt die Frage zu klären, was unter einer hinreichend kleinen Geschwindigkeit zu verstehen ist. Wie wir unten sehen werden, ist die Bezugsgeschwindigkeit die Lichtgeschwindigkeit; sie hat unabhängig vom Bezugssystem im Vakuum den Wert
c (299792458r1, 2) m/s
(2.2)
Diese Aussage widerspricht der Galilei-Transformation, denn wie aus (2.1) durch Differentiation folgt, müsste sich die in S´ gemessene Lichtgeschwindigkeit von der in S gemessenen durch die Relativgeschwindigkeit der betreffenden Inertialsysteme unterscheiden. Michelson (1852-1931) und Morley haben in dem nach ihnen genannten Experiment als erste gezeigt, dass dies nicht der Fall ist. Die Versuchsanordnung wird ausführlich in Kap. 21.1.2.6 besprochen. Die Lichtgeschwindigkeit ist in allen Bezugssystemen gleich, unabhängig von deren Relativgeschwindigkeit zur Lichtquelle. Die Galilei-Transformation muss durch ein Transformationsschema ersetzt werden, das sicherstellt, dass alle Naturgesetze in jedem Inertialsystem die gleiche Form haben. Die Forderung wird als Einsteinsches Relativitätsprinzip (Einstein, A. 1879-1955) bezeichnet.
2.3
Lorentz-Transformation
Die richtigen Transformationsformeln, die bei jeder Geschwindigkeit zweier Inertialsysteme gelten, sind in der Lorentz-Transformation (H. Lorentz, 1853-1928) zusammengefasst. Wir beschränken uns bei ihrer Formulierung auf den Spezialfall, dass die Koordinatenachsen der beiden Systeme zueinander parallel sind und dass sich ihre bei t = 0 zusammenfallenden Nullpunkte mit der Geschwindigkeit (vx, 0, 0) bewegen (Abb. 2.1).
O(t = 0) = O´(t = 0) ;
(2.3)
r r r (t) = ct r r r ¢(t) = c¢ t
S´ z
S
r r (t)
x y
z´
P
r r ¢(t)
x´ y´
r v = v x eˆ x
Abb. 2.1: Beschreibung eines Ereignisses P in einem ruhenden Inertialsystem und in einem sich gegenüber S mit der konstanten Geschwindigkeit vx bewegenden System
2 Bezugssysteme in gleichförmiger Geschwindigkeit
19
Die Lorentz-Transformationsformeln lauten dann
x vt
xc yc y zc z tc
xc yc zc tc
1 v2 / c2 bzw.
t v x / c2
J ( x E ct ) y z J (t ( E / c) x)
(2.4)
1 v2 / c2
Dabei bedeutet
J:
1
1 2
1 v / c
2
1 E 2
.
(2.5)
Die Rücktransformation ist
x J ( xc E ct );
y y c; z z c; t J (t c ( E / c) xc)
(2.6)
Der Vergleich mit der Galilei-Transformation zeigt, dass nun auch die Zeitangaben in den beiden Inertialsystemen im Allgemeinen unterschiedlich sind. Außerdem entnehmen wir der ersten der vier Gleichungen, dass Zeit- und Raumangaben nicht mehr unabhängig voneinander sind. Diese Ergebnisse erscheinen uns fremdartig, was aber allein daran liegt, dass unsere Erfahrungen sich auf solche Geschwindigkeiten beziehen, die sehr klein gegenüber der Lichtgeschwindigkeit sind. In solchen Fällen geht die Lorentz-Transformation in die GalileiTransformation über: Vernachlässigen wir nämlich v/c gegenüber 1 bzw. gegenüber t, so folgt aus (2.6)
xc yc zc tc
x vt y z t
Galilei-Transformation
Eine Ableitung der Lorentz-Transformation findet sich am Ende des Kapitels.
(2.7)
20
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.3.1 Konsequenzen der Lorentz-Transformation Die Lorentztransformation hat etliche Konsequenzen. Im Rahmen der Bewegungslehre, mit der wir uns hier beschäftigen, gehören dazu: Die Relativität der Gleichzeitigkeit; darunter verstehen wir, dass Ereignisse, die für einen Beobachter in einem Inertialsystem gleichzeitig ablaufen, für einen Beobachter in einem relativ zu diesem sich bewegenden Inertialsystem zu verschiedenen Zeiten geschehen; die Längenkontraktion: Zwei Inertialsysteme mögen sich relativ zueinander mit konstanter Geschwindigkeit bewegen. Ein Messstab, der parallel zur Bewegungsrichtung liegt, erscheint einem Beobachter, der sich parallel zum Messstab bewegt, kürzer als einem Beobachter in dem Koordinatensystem, in dem der Messstab ruht; die Zeitdilatation: Die Dauer eines Vorganges erscheint in einem sich bewegenden Koordinatensystem länger als in dem Koordinatensystem, in dem die Uhr ruht; das Additionstheorem der Geschwindigkeiten, nach dem Geschwindigkeiten vektoriell zu addieren sind, ist durch einen neuen Zusammenhang zu ersetzen.
2.3.1.1 Relativität der Gleichzeitigkeit Wir wenden uns als Erstes der Relativität von Ereignissen zu. Wie bereits oben angegeben, verstehen wir darunter, dass Ereignisse, die für einen Beobachter gleichzeitig ablaufen, für einen anderen Beobachter, der sich relativ zum ersten bewegt, zu verschiedenen Zeiten geschehen. Zur Zeitbestimmung werden S´ Uhren benötigt, die synchronisiert C´ A´ S B´ sein müssen. Wir betrachten dazu zwei Uhren, die im KoordinatenB C A system S an den Punkten A und B im Abstand l voneinander fest aufAbb. 2.2: Zum Problem der Gleichzeitigkeit gestellt sind (Abb. 2.2). In der Mitte zweier Ereignisse C zwischen A und B befinde sich eine Blitzlampe. Erreicht ein von dieser ausgehender Lichtpuls die beiden Uhren in A und B, so sollen diese starten. Für den Beobachter in C sind damit die Uhren synchronisiert. Natürlich könnte sich der Beobachter auch an einem anderen Ort befinden; zur Synchronisierung müsste er in diesem Fall die unterschiedlichen Zeiten berücksichtigen, die das Licht von den Punkten A und B bis zu ihm benötigte. Gleichzeitigkeit können wir daher wie folgt festlegen:
2 Bezugssysteme in gleichförmiger Geschwindigkeit
21
In einem Inertialsystem geschehen zwei Ereignisse an den Orten A und B gleichzeitig, wenn die von den Ereignissen ausgesandten Lichtsignale einen Beobachter in der Mitte zwischen A und B gleichzeitig erreichen. Wir kommen jetzt zur Relativität der Gleichzeitigkeit zweier Ereignisse. Zur Einführung möge das folgende von Einstein stammende Beispiel dienen: Auf einem Bahnsteig stehe ein Beobachter C. Seine Position sei in einem Bezugssystem S angegeben, das fest mit dem Bahnsteig verbunden ist und damit für ihn ruht. Ein Zug fahre mit konstanter Geschwindigkeit v an ihm vorbei. Im Zug ist ein Koordinatensystem S´ verankert, das sich also relativ zum Beobachter C bewegt. In der Mitte des Zuges soll sich ein Beobachter C´ befinden. Anfang und Ende des Zuges mögen von zwei Blitzen getroffen werden. Die Einschläge sollen im Ruhesystem S des Bahnsteiges gleichzeitig erfolgen. Mit anderen Worten: Der Beobachter C auf dem Bahnsteig in der Mitte zwischen den Orten A und B, an denen die Blitze eingeschlagen sind, sieht diese zur gleichen Zeit. Der Beobachter C´ in der Mitte des Zuges ist mit dieser Aussage nicht einverstanden. Er sieht den Blitz an der Spitze des Zuges vor dem Blitz am Ende des Zuges! Betrachten wir dazu die Bewegung von C´ im Bezugssystem S. In der Zeit, die der Lichtpuls benötigt, um von der Zugspitze bis zum Beobachter C´ zu gelangen, hat sich der Zug mit ihm um eine bestimmte Strecke in Richtung des vorderen Blitzeinschlages bewegt. Die Lichtwege sind also verschieden lang. Der Beobachter C´ kommt daher zum Schluss, dass der Blitz die Spitze des Zuges eher getroffen hat als das Ende. An die Stellen A und B des Bahnsteiges bringen wir zwei synchronisierte Uhren. Der sich im Bezugsystem S´ ergebene Zeitunterschied zweier im Bezugssystem S synchronisierten Uhren lässt sich mittels der Lorentz-Transformation berechnen. Wir ordnen den Punkten A und B die Koordinaten x1 und x2 zu und berechnen die Zeitpunkte t1c und t2c , die diese Uhren für die Zeitpunkte t1 und t2 anzeigen. Wir finden
t1c J (t1
v x1 ) c2
und
t2c
J (t2
v x2 ) . c2
Daraus folgt
(t1c t2c ) J (t1 t2 )
Jv c2
( x1 x2 ) .
Der Begriff “gleichzeitig” ist also nicht absolut, sondern relativ. Er bezieht sich auf das vorgegebene Koordinatensystem.
(2.8)
22
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.3.1.2 Längenkontraktion Ein Koordinatensystem S´ bewege sich relativ zum Koordinatensystem S entlang der x-Achse mit der Geschwindigkeit (vx, 0, 0). Wir fragen nun, ob sich die Länge eines Messstabes, der im Koordinatensystem S´ ruht, für einen Beobachter in S ändert. Es sind zwei Fälle zu unterscheiden. a) Der Messstab liege senkrecht zur Bewegungsrichtung der beiden Koordinatensysteme (Abb. 2.3). Die Lorentz-Transformation ergibt
y c y;
z c z.
z´
z S
(2.9)
S´ vx
x
x´
Abb. 2.3: Ein in S´ ruhender, zu dessen Bewegungsrichtung senkrecht liegender Messstab der Länge l0 erscheint einem Beobachter in S unter der gleichen Länge
y´
y
Die Länge eines Messstabes senkrecht zur Bewegungsrichtung ist unabhängig von der Bewegung. b) Der Messstab in S´ liege in Bewegungsrichtung (Abb. 2.4). Die beiden Enden des Messstabes seien mit 1 und 2 bezeichnet. Die Differenz der Koordinaten wird als Ruhelänge bezeichnet
x1c x2c : l0
(2.10)
Der Beobachter in S hat einen sich bewegenden Messstab vor sich. Um seine Länge zu
z´
z
S
S´ vx I0
x y
y´
x´
Abb. 2.4: Ein in S´ ruhender, längs dessen Bewegungsrichtung liegender Messstab der Länge l0 erscheint einem in S befindlichen Beobachter verkürzt
2 Bezugssysteme in gleichförmiger Geschwindigkeit
23
bestimmen, misst er gleichzeitig die Koordinaten x1, x2 und bildet die Differenz für t1 = t2. Die Lorentz-Transformation ergibt
x2c x1c J ( x2 vt2 ) J ( x1 vt1 ) J ( x2 x1 ) J l ;
(2.11a)
also wird
l l0 1 E 2
Lorentzkontraktion
(2.11b)
Ein Beobachter in S misst eine Kontraktion des Messstabes.
2.3.1.3 Zeitdilatation Wir betrachten eine Uhr, die im Koordinatensystem S´ ruht und in regelmäßigen zeitlichen Abständen einen Lichtblitz aussendet. Die Zeit zwischen Ereignissen, die in einem Koordinatensystem am selben Ort stattfinden, heißt Eigenzeit W 0 . Also können wir schreiben
tnc nW 0 ; n 0,1, 2,3,...
(2.12)
Ein in S ruhender Beobachter misst für die zeitliche Abfolge der Lichtpulse, tn nach der Lorentz-Transformation (2.4)
tn
tnc 1 E 2
nW v
wobei
Wv
W0 1 E 2
(2.13)
Die Vorrückzeit der Uhr zwischen zwei Ereignissen in S´ ist die Eigenzeit W 0 , diejenige im bewegten Koordinatensystem ist W v . Da W v ! W 0 , gehen bewegte Uhren langsamer als ruhende. Beispiel: Myonen sind instabile Teilchen der Masse m ~ 207 mElektron, die entsprechend dem Zerfallsgesetz, N N 0 e t / T1/ 2 nach der Halbwertszeit T1/2 zur Hälfte zerfallen sind. In Ruhelage im Labor gemessen, beträgt T1/2 = 1,5 10-6 s. Die Teilchen entstehen in der Atmosphäre in ca. 60 km Höhe als Folge von Zusammenstößen kosmischer Strahlung. Ihre Geschwindigkeit entspricht fast Lichtgeschwindigkeit. Nehmen wir an, dass v = 0,999 c = 2,9947 108 m/s ist. Zur Erreichung der Erde benötigen die Myonen eine Zeit von
t
6 104 s 2 104 s . 8 2.9949 10
(2.14)
24
2 Bezugssysteme in gleichförmiger Geschwindigkeit
Diese Zeit entspricht ungefähr 133 T1/2. Wenn die Zeitmessung auf der Erde und in dem Bezugssystem, in dem das Myon ruht, identisch wäre, so würde nur ein kleiner Bruchteil, nämlich (1/2)133 der ursprünglichen Zahl N0 der Myonen, die Erdoberfläche erreichen ( 1040 N 0 ). Experimentelle Untersuchungen zeigen dagegen, dass die Zahl der Myonen auf Meereshöhe sehr viel größer ist. Die Erklärung für diese Diskrepanz ist die Zeitdilatation. Die Zeit t, die das Myon braucht, um die Atmosphäre zu durchqueren, gemessen vom Beobachter auf der Erde, ist sehr viel größer als die (Eigen-) Zeit t´, die von einem Beobachter gemessen wird, der sich relativ zum Myon in Ruhe befindet. Es ergibt sich quantitativ
t c t 1 v2 / c2 2 104 4,5 102 s | 9 106 s | 6T1/ 2
(2.15)
Die Zahl der auf die Erdoberfläche treffenden Myonen beträgt also N / N 0 (1/ 2)6 1/ 64 , in Übereinstimmung mit den experimentellen Ergebnissen. Die Zeitdehnung können wir uns auch ohne Benutzung der Lorentz-Transformation klarmachen. Sie kann direkt aus dem Relativitätsprinzip und der Konstanz der Lichtgeschwindigkeit abgeleitet werden. Wir führen dazu ein Gedankenexperiment aus, das auf der LichtimpulsB uhr beruht (Abb. 2.5). Letztere besteht aus einem S´ S Kasten der Länge d; auf ihrer unteren Seite befindet d sich eine Blitzlampe, die einen Lichtpuls aussendet und damit eine Uhr startet. Das Lichtsignal wird an einem Spiegel an der oberen Seite des Kastens C reflektiert und von einem Empfänger bei A regisA triert, wodurch die Uhr angehalten wird. Die Zeit Abb. 2.5: Lichtimpulsuhr zur ' t 2 d / c dient im Bezugssystem S, in dem die Messung der Zeitdilatation Lichtuhr ruht, als Zeiteinheit. Wir setzen jetzt die Uhr in ein Bezugssystem S´, das sich senkrecht zu ihrer Längsrichtung relativ zu S mit der Geschwindigkeit v bewegt. Für den Beobachter in S durchläuft der Lichtpuls jetzt die längere Strecke ABC 2
§ v't · 2 ABC 2 ¨ ¸ d . © 2 ¹ Damit folgt für
't
(2.16)
't 2d
c 1 v2 / c2
.
(2.17)
2 Bezugssysteme in gleichförmiger Geschwindigkeit Der Beobachter in S´ misst dagegen die Zeit
't c
25
' t´.
2d . c
(2.18)
Der Beobachter in S misst also eine Zeit, die um den Faktor 1
1-v 2 /c 2 länger ist als in S´.
2.3.1.4 Relativistisches Additionstheorem der Geschwindigkeiten Das Koordinatensystem S´ bewege sich relativ zum Koordinatensystem S entlang der x-Achse G mit der Geschwindigkeit vc (vcx ,0,0) , für das Teilchen P im Koordinatensystem S´ ist sie G u c (vcx , vcy , vcz ) . Wie groß ist die Geschwindigkeit für einen Beobachter im KoordinatenG system S ? Die Geschwindigkeit u ist definiert als
G G u dr / dt ,
(2.19)
also benötigen wir zu ihrer Berechnung die Differentiale dx, dy, dz und dt. Durch Auflösen der Lorentz-Tranformationsformeln (2.6) nach x und t ergibt sich
x J xc JE ct c y yc
dx J dxc JE cdt c dy dy c
o
z zc t J tc
JE c
xc
(2.20)
dz dz c dt J dt c
JE c
dxc
G Damit erhalten wir für u :
ux
dx dt
dxc E cdt c ; uy dt c ( E / c) dxc
dy dt
dy c ; uz J (dt c ( E / c)dxc
dz dt
dz c J (dt c ( E / c)dxc (2.21a)
Ersetzen wir noch die gestrichenen Größen durch die zugehörigen Geschwindigkeiten, so erhalten wir als relativistisches Additionstheorem der Geschwindigkeiten
ux
u cy 1 v 2 / c 2 u xc v u zc 1 v 2 / c 2 ; u ; u y z 1 (v / c 2 ) u xc 1 (v / c 2 ) u xc 1 (v / c 2 ) u cx
(2.21b)
26
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.3.1.5Struktur der Raumzeit
t
t´
absolute Zukunft
x´
absolutes
Anderswo x
absolute Vergangenheit
Abb. 2.6: Die Bereiche von Vergangenheit, Gegenwart und Zukunft.
Unsere Auffassung von dem Begriff der Gegenwart, mit der wir aufgewachsen sind, setzt stillschweigend eine Allgemeingültigkeit voraus, wie sie in Wirklichkeit nicht existiert. Der Begriff der absoluten Gleichzeitigkeit ist zu revidieren, wenn die relative Geschwindigkeit zweier Inertialsysteme sich der Lichtgeschwindigkeit nähert. An die Stelle einem scharf definierten Gegenwartspunkt tritt ein möglicher breiter Bereich von Gegenwart zwischen den beiden Lichtkegeln (Abb. 2.6), in dem für jeden der beiden Beobachter ein Ereignis „jetzt“ sein kann. Sie stimmen jedoch darin überein, dass dieses „anderswo“ stattfindet. Ereignisse innerhalb der Lichtkegel sind dagegen für die Beobachter kein mögliches „jetzt“. Die Bereiche definieren die absolute Vergangenheit bzw. absolute Zukunft.
Ergänzung: Ableitung der Lorentz-Transformation Die Transformationsformeln, welche an die Stelle der Galilei-Transformation treten, basieren auf den zwei Einstein-Postulaten: 1. Die Naturgesetze haben in allen Inertialsystemen die gleiche Form. Kein Inertialsystem ist vor dem anderen ausgezeichnet (Relativitätsprinzip). 2. Die Lichtgeschwindigkeit im Vakuum ist in jedem Inertialsystem konstant und gleich, unabhängig von der Relativgeschwindigkeit von Lichtquelle und Beobachter. Diese Forderungen wenden wir nun auf zwei Bezugssysteme S und S´ an. Letzteres möge sich gegenüber S mit konstanter Geschwindigkeit bewegen. Der Einfachheit halber nehmen wir an, dass die Bewegung entlang der x-Achse erfolgen soll. Die Koordinaten eines Ereignisses in S seien (x, y, z), der zugehörige Zeitpunkt t. Analog wollen wir die Koordinaten des Ereignisses in S´ mit (x´, y´, z´) bezeichnen und den Zeitpunkt mit t´. Zu den Zeitpunkten t = t´ = 0 mögen die Nullpunkte von S und S´ zusammen fallen. Wir suchen nun nach den richtigen Transformationsformeln für x und t; bezüglich der anderen beiden Koordinaten gilt wegen der speziell gewählten Bewegung der beiden Bezugssysteme y = y´ und z = z´. Wir nehmen an, dass die Transformationsformel für x bis auf einen Faktor J mit der Galilei-Transformationsformel übereinstimmt:
x J ( x ' vt ') .
(2A.1)
2 Bezugssysteme in gleichförmiger Geschwindigkeit
27
Für die inverse Transformation gilt dann
x ' J ( x vt ) .
(2A.2)
Wir denken uns einen Lichtpuls, der im Ursprung von S zum Zeitpunkt t = 0 losgeschickt wird. Entsprechend unserer Annahme startet der Lichtpuls in S´ ebenfalls zur Zeit t´. Wegen der Konstanz der Lichtgeschwindigkeit gilt für die x-Koordinate des Pulses
x ct bzw. x ' ct ' .
(2A.3)
Diese beiden Koordinaten setzen wir in (2A.1) bzw. (2A.2) ein und erhalten
ct J (ct ' vt ') J t '(c v) ,
(2A.4)
ct ' J (ct vt ) J t (c v) .
(2A.5)
Eliminierung von t oder t´ ergibt
J2 J
1 1 v2 / c2 1
1
1 v2 / c2
1 ß2
(2A.6)
Damit haben wir die Transformationsformel für x gefunden. Die Beziehung zwischen t und t´ lässt sich aus (2A.1) und (2A.2) ableiten. Ersetzen wir in (2A.2) x durch (2A.1), so erhalten wir
x ' J ^J ( x ' vt ') vt` , woraus für t folgt
vx ' · § t J ¨ t ' 2 ¸ . c ¹ ©
(2A.7)
Die Ergebnisse zusammengefasst, ergibt
x J ( xc E ct c) y yc z zc t J (t c ( E / c) xc).
(2A.8)
28
2 Bezugssysteme in gleichförmiger Geschwindigkeit
Zusammenfassung x Inertialsysteme sind solche Bezugssysteme, in denen sich ohne Einwirkung einer äußeren Kraft ein Körper geradlinig gleichförmig bewegt. x Die Lichtgeschwindigkeit ist in allen Bezugssystemen gleich groß, unabhängig von deren Relativgeschwindigkeit zur Lichtquelle; sie hat den Betrag c 299792458 m/s . x Die Naturgesetze sind in allen Inertialsystemen gleich, es gibt also kein bevorzugtes Bezugssystem. x Aussagen 2 und 3 stellen die Grundlage für die Lorentz-Transformation dar. Sie liefert eine Beziehung zwischen den Koordinaten (x,y,z) sowie dem Zeitpunkt t eines Ereignisses in einem Inertialsystem S und den Koordinaten (x´,y´,z´) und dem Zeitpunkt t´ desselben G Ereignisses in einem Inertialsystem S´, das sich relativ zu S mit der Geschwindigkeit v bewegt. Für eine Bewegung in der positiven x-Richtung lautet die Transformation
xc
x vt 1 v2 / c2
;
yc
y;
zc z;
tc
t v x / c2 1 v2 / c2
x Aus der Lorentz-Transformation folgen:
a) die Relativität der Gleichzeitigkeit. Wenn zwei Ereignisse, die in x-Richtung die Koordinaten x1, x2 haben, einem Beobachter gleichzeitig erscheinen, so erscheinen sie einem bewegten Beobachter zu unterschiedlichen Zeiten 't ( x1 x2 )v / c 2 . b) die Zeitdehnung: Bewegte Uhren laufen um den Faktor 1/ 1 v 2 / c 2 langsamer als ruhende: c) die Längenkontraktion: Ein in x-Richtung orientierter bewegter Messstab erscheint einem ruhenden Beobachter um den Faktor
1 v 2 / c 2 verkürzt: d) Addition von Geschwindigkeiten: Geschwindigkeiten müssen nach dem relativistischen Geschwindigkeits-Theorem berechnet werden
ux
u cy 1 v 2 / c 2 u cx v u cz 1 v 2 / c 2 ; u ; u . y z 1 (v / c 2 )u xc 1 (v / c 2 )u cx 1 (v / c 2 )u cx
2 Bezugssysteme in gleichförmiger Geschwindigkeit
29
Übungsaufgaben G 1. Ein Raumschiff hat bezüglich des Koordinatensystems S die Geschwindigkeit u . Welche Geschwindigkeit hat es im Koordinatensystem S‘, das sich relativ zu S mit der GeschwindigG a) u1 (u0 , 0, 0) G keit v (v, 0, 0) bewegt? Prüfen Sie, ob für die Zahlenwerte G b) u2 (0, u0 , 0) mit u0 = 10 km/s, v = 100 km/s die Lorentztransformation deutliche Unterschiede gegenüber der Galilei-Transformation liefert.
2. Während einer Prüfung, die mit der Uhr des Professors gemessen genau eine Stunde dauern soll, bewegt sich der Professor relativ zum Prüfling mit der Geschwindigkeit v = 0,5 c, nachdem beide sich zu Beginn der Prüfung an demselben Ort befanden. Nach der vereinbarten Zeit sendet der Professor dem Prüfling ein Lichtsignal zum Zeichen, dass die Prüfung beendet ist. Welche Zeit stand dem Prüfling zur Verfügung? 3. Im Koordinatensystem S´, das sich relativ zu S mit der Geschwindigkeit v = 0,5 c bewegt, bildet ein 1 m langer Stab mit der Bewegungsrichtung den Winkel D = 45°. Welchen Winkel bildet er in S mit der Bewegungsrichtung und welche Länge besitzt er? G 4. Ein radioaktiver Atomkern bewege sich mit der Geschwindigkeit v K
(0,3 c, 0, 0) relativ G zum Laborsystem und emittiere ein Elektron mit der Geschwindigkeit ve,K 0, 75c relativ G zum Kern. Berechnen Sie den Betrag und die Richtung von v e im Laborsystem bei Emission G a) in Richtung von v K , G b) entgegengesetzt zu v K , G c) senkrecht zu v K .
3
Die Grundgleichungen der Mechanik
Unsere bisherigen Überlegungen galten Bewegungsabläufen; dabei haben wir Letztere im Allgemeinen nach der Art der Beschleunigung des betreffenden Körpers eingeteilt. Welche Ursache führt zu der betreffenden Bahnkurve? Dieser Frage wollen wir jetzt nachgehen. Dazu müssen wir die Begriffe Kraft und Masse einführen. Den Begriff der Kraft kennen wir aus dem täglichen Leben; bereits in früher Kindheit haben wir die Erfahrung gemacht, dass wir uns anstrengen müssen, wenn wir z.B. ein größeres Stofftier hochheben oder einen Fußball G den Eltern zuspielen wollen. Die Vorgänge werden durch eine Kraft F ermöglicht. Dabei besteht offensichtlich ein Zusammenhang mit der Masse m eines Körpers. Um einen „schweren“ Ball genau so weit werfen zu können wie einen „leichten“, benötigen wir eine größere Kraft. Zur Quantifizierung ist es zweckmäßig, von den drei Newtonschen Axiomen (Newton, I. 1643-1727) auszugehen.
3.1
Die Newtonschen Axiome
Die Newtonschen Axiome lauten 1. In einem Inertialsystem bleibt ein Körper, auf den keine Kraft einwirkt, in Ruhe oder bewegt sich mit konstanter Geschwindigkeit. 2. Greift in einem Inertialsystem an einem frei beweglichen Körper eine Kraft an, so wird er beschleunigt; es gilt (Aktionsprinzip)
G G d (m v) . F dt
(3.1)
G Ist die Geschwindigkeit v sehr klein gegenüber der Lichtgeschwindigkeit, so ist die Masse konstant und (3.1) lässt sich schreiben
G G F ma
(3.2)
3. Kräfte treten immer paarweise auf. Die Kraft, die ein Körper 1 auf einen Körper 2 ausübt, ist entgegengesetzt gleich der Kraft, die Körper 2 auf Körper 1 ausübt. Von Newton stammt die Formulierung “actio = reactio”,
G G F12 F21 .
(3.3)
Die Axiome 1 und 2 sind von allgemeiner Gültigkeit, d.h. sie gelten auch im Bereich großer Geschwindigkeiten, die vergleichbar mit der Lichtgeschwindigkeit sind. Das dritte Axiom gilt nur mit Einschränkungen (s. Kap. 8.2).
32
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
Zunächst sei v c. - Das erste Newtonsche Axiom heißt auch Trägheitsgesetz. Wir ordnen einem Körper der Masse m eine Trägheit zu, auf Grund deren er seine Geschwindigkeit beibehält, die er beim Abschalten einer Kraft besitzt. Die Masse heißt deswegen träge Masse. Dem zweiten Newtonschen Axiom kommt besondere Bedeutung zu. Ist nämlich die Kraft, die auf einen Körper wirkt, bekannt, so lässt sich seine Bahnkurve berechnen. Deswegen heißt das zweite Newtonsche Axiom auch “Grundgesetz der Mechanik”. Es sei angemerkt, dass das erste Newtonsche Axiom bereits im zweiten als Spezialfall a = 0 enthalten ist. Da es aber das Inertialsystem definiert, ist es zweckmäßig, es als eigenständiges Axiom beizubehalten. Das dritte Newtonsche Axiom beschreibt die Tatsache, dass Kräfte immer paarweise auftreten. Denken wir etwa an eine Feder, die an einem Ende an einem Stativ befestigt ist. Wollen wir G die Feder dehnen, so müssen wir dazu am anderen Ende eine Kraft F12 aufwenden. Ihr G G entgegen wirkt die rücktreibende Kraft F21 F12 der Feder.
3.2
Messung von Massen
Zur Messung der Masse eines Körpers gibt es prinzipiell zwei Möglichkeiten. Zum einen können wir die träge Masse bestimmen und zum anderen die schwere Masse. Betrachten wir zunächst eine einfache Messanordnung zur Ermittlung der schweren Masse (Abb. 3.1a). Auf der einen Waagschale einer Balkenwaage befinde sich ein Körper mit unbekannter Masse; auf der anderen Seite werden Körper mit bekannter Masse mN aufgebracht, so dass die Waage ins Gleichgewicht kommt. Auf beide Körper wirkt die “Schwerkraft”, welche durch die Anziehung der Körper durch die Erde bewirkt wird. Mit der Balkenwaage lässt sich also die schwere Masse eines Körpers bestimmen. Als bekannte Massen können wir Körper benutzen, die sich von der Abb. 3.1a: Balkenwaage zur Standardmasse (Massennormal) 1 kg ableiten. 1 kg Messung der schweren Masse ist die Masse eines Platin-Iridium-Zylinders, der als Massennormal in Paris aufbewahrt wird. Die andere Möglichkeit besteht darin, die Trägheit eines Körpers auszunutzen und damit die träge Masse zu bestimmen. Dazu setzen wir einen Gleiter, auf dem sich ein Körper bekannter Masse mN befindet, auf eine Luftkissenschiene und lassen auf ihn eine (beliebige) konstante Kraft wirken Abb. 3.1b: Zur Bestimmung der (Abb. 3.1b). Die sich einstellende Beschleunigung trägen Masse wird gemessen. Dann tauschen wir den Normkörper durch den Körper aus der ersten Versuchsanordnung, dessen Masse ermittelt werden soll, aus und wiederholen den Versuch. Auf den Gleiter möge dieselbe Kraft wirken wie im gerade durchgeführten Versuch.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
33
Es gilt dann nach dem Grundgesetz der Mechanik
mN mx
ax aN
o mx
aN mN ax
(3.4)
Aus den gemessenen Beschleunigungen und den bekannten Masse mN lässt sich also die Masse ermitteln. Wir nennen sie träge Masse; es ergibt sich für sie der gleiche Wert wie für die schwere Masse. Sehr genaue Messungen haben gezeigt, dass schwere und träge Masse mindestens bis auf 1011 einander gleich sind.
ms mt m
3.3
Messung von Kräften
Zur Messung einer Kraft nutzen wir die Verformbarkeit von Körpern durch äußere Kräfte aus. Ein bekanntes Beispiel ist wiederum eine Schraubenfeder, die an ihrem einen Ende an einem Stativ befestigt sei (Abb. 3.2). Lassen wir auf ihr anderes Ende eine Kraft wirken, z.B. die Gewichtskraft eines Körpers der Masse m, so wird sie um eine Strecke x gedehnt. Zwei Körper der Gesamtmasse 2m bewirken die doppelte Auslenkung usw. Eine solche Feder lässt sich daher als Kraftmesser verwenden. Die Eichung kann mittels eines Beschleunigungsversuches mit bekannter Kraft erfolgen.
3.4
(3.5)
Abb. 3.2: Messung der Kraft
Bewegungsgleichung eines Massenpunktes unter dem Einfluss einer Kraft
Im Folgenden wollen wir untersuchen, welche Bahnkurve ein Körper unter der Einwirkung einer äußeren Kraft beschreibt. Da jeder Körper eine endliche Ausdehnung hat, kann er nicht nur reine Translationsbewegungen ausführen, sondern auch um eine beliebige Achse innerhalb des Körpers rotieren. Nichtstarre Körper, wie z.B. Gummi oder Flüssigkeiten, lassen sich ferner verformen. Die vollständige Beschreibung derartiger Bewegungen erfordert einen größeren Aufwand als die der reinen Translationsbewegungen. In diesem Kapitel wollen wir daher zunächst die Ausdehnung eines Körpers vernachlässigen. Wir beschreiben ihn als sog. “Massenpunkt”: Der Körper wird als punktförmig angesehen, seine Masse ist in diesem Punkt vereint. Die Bewegung des Massenpunktes ist durch das Grundgesetz der Mechanik, (3.2), bestimmt. Deswegen bezeichnen wir es auch als Bewegungsgleichung.
34
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.4.1 Konstante Kräfte In diesem Abschnitt wird der Fall besprochen, dass die auf den Massenpunkt einwirkende Kraft konstant ist. Das gilt auf der Erdoberfläche z.B. in sehr guter Näherung für die Gravitationskraft (Schwerkraft). Die Bewegungsgleichung lautet
G F
G d 2r m 2 dt
const. o
G d 2r dt 2
G dv dt
G F m
G a
const
(3.6)
Für die Geschwindigkeit des Massenpunktes folgt durch Integration
G dr dt
G G v(t ) a ³ dt C1
G G v(t ) at C1 .
(3.7) (3.8)
Durch nochmalige Integration ergibt sich die Bahnkurve
G G r (t ) a ³ tdt ³ C1dt C2 .
(3.9)
C1 und C2 sind Integrationskonstanten, die durch die Anfangsbedingungen festgelegt werden. Wir hätten natürlich auch wie im 1. Kapitel gleich die Anfangsbedingungen in den Integralen berücksichtigen können. In der Folge werden beide Methoden benutzt. Aus (3.8 ) folgt für t = 0 die Konstante C1 zu
C1
G G v(t 0) { v0
G G G v(t ) at v0
(3.10)
G Für C2 in (3.9) ergibt sich für t = 0 der zugehörige Ort ro des Teilchens
G r (t )
1G 2 G G at v0 t r0 2
(3.11)
Durch Festlegung der Anfangsbedingungen lassen sich also Geschwindigkeit und Bahnkurve des Massenpunktes in Abhängigkeit von der Zeit berechnen. Die Beziehungen sind schon in G G Kap. 1 hergeleitet worden ( a g ). Wir haben sie aber jetzt aus der Forderung abgeleitet, dass die die Bewegung bestimmende Kraft konstant sein soll.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
35
3.4.2 Ortsabhängige Kräfte Ortsabhängige Kräfte finden sich in vielen Bereichen der Physik. Wichtige Beispiele sind die Gravitationskraft eines Himmelskörpers auf einen Probekörper und die elektrostatische Kraft, die eine geladene Kugel auf eine Probeladung ausübt. In beiden Fällen ist die Ortsabhängigkeit durch ein 1/r2 - Gesetz gegeben; r ist der Abstand zwischen den jeweiligen Körpern. Große Bedeutung haben ortsabhängige Kräfte auch im atomaren Bereich. Da wir uns in diesem Teil mit makroskopischer Physik befassen, wählen wir zur weiteren Erläuterung die Gravitationskraft (die ausführlich in Kap. 7 diskutiert wird).
G G mM F (r ) G 2 rˆ ; r
(3.12)
G ist die Gravitationskonstante. Die Kraft ist attraktiv, wirkt also entgegen dem Einheitsvektor rˆ , der senkrecht auf dem betreffenden Himmelskörper steht und von ihm weg weist; daher steht das Minuszeichen. Wir wollen die Geschwindigkeit eines Geschosses, das in radialer Richtung von der Erde abgeschossen wird, berechnen. Dazu setzen wir (3.12) in das Grundgesetz der Mechanik ein und integrieren. Wir wählen das Koordinatensystem zweckmäßigerweise so, dass etwa die z-Achse in vertikaler Richtung verläuft.
v (0, 0, v z ) . Mit
a
dv dt
(3.13)
dv dz dz dt
dv v. dz
(3.14)
Wir erhalten also
vdv adz
GM dz z2
(3.15)
Durch Integration folgt
1 2 GM v C1 . z 2
(3.16)
Das Projektil werde mit der Anfangsgeschwindigkeit v0 von der Erdoberfläche (z = r0) abgeschossen. Damit wird die Integrationskonstante C1
C1
1 2 GM v0 2 r0
1 2 v0 gr0 2
und (3.16) wird unter Berücksichtigung von GM / r gr02 / z
(3.17)
36
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
v 2
gr02 1 2 v 0 gr0 z 2
(3.18)
Das ist die gesuchte Beziehung für die Geschwindigkeit eines Geschosses in Abhängigkeit von der Höhe. Die maximale Steighöhe zmax ergibt sich aus ihr, indem wir v = 0 setzen:
g r02 zmax
1 gr0 v 02 ; 2
zmax
gr02 gr0 v02 / 2
zmax
r0 1 (v / 2r0 g ) 2 0
(3.19a)
(3.20)
Welche Anfangsgeschwindigkeit v0 muss dem Geschoss gegeben werden, damit es die Erde verlassen kann? Aus (3.20) folgt, dass Letzteres der Fall ist, wenn gilt
v0 o 2gr0 ,
(3.21)
denn für diesen Wert strebt der Nenner gegen null und der Abstand von der Erdoberfläche, zmax , gegen unendlich. Wir wollen die Geschwindigkeit
v z v0
2 gr0 11, 2 km/s
(3.22)
als Fluchtgeschwindigkeit bezeichnen.
3.4.3 Zeitabhängige Kräfte Häufig sind Kräfte von der Zeit abhängig. Denken wir etwa an ein schwingungsfähiges System, das durch eine zeitlich periodische Kraft zu Schwingungen angeregt wird. Schwingungsprobleme werden wegen ihrer Bedeutung und des großen Umfangs detailliert in einem gesonderten Kapitel, (Kap. 11), behandelt. Mit der Zeit unperiodisch anwachsende oder abfallende Kräfte spielen ebenfalls eine wichtige Rolle. Als Beispiel sei eine exponentiell abfallende Kraft genannt: 2 2
F (t ) Ae a t .
(3.23)
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
37
Wie groß ist die Endgeschwindigkeit eines Massenpunktes der Masse m, der vor Einwirkung der Kraft ruhte? Einsetzen von F(t) in die Bewegungsgleichung ergibt für die Endgeschwindigkeit v f
F ma o
mv
0
v
f
2 2
a t ³ F dt A³ e dt 0
A S 2a
A S . 2am
(3.24a)
(3.24b)
3.5 Elementarteilchen und Kräfte in der Natur Bei der Klassifizierung der Kräfte erscheint es sinnvoll, bereits hier kurz auf die grundlegenden Kräfte der Natur einWechselwirkung Quarks Leptonen zugehen. In Band II werden wir auf diesen Komplex etwas ausStarke Wechelwirkung u s b führlicher zurückkommen. Mit d c t chemischen Mitteln lässt sich die Materie auf die Elemente Elektromagnetische des Periodischen Systems zuWechselwirkung ´´ e µ W rückführen. Die elektrisch neuSchwache tralen Atome bestehen aus dem Wechselwirkung ´´ Qe Qµ QW positiv geladenen Kern und den ihn umgebenden negativ geladeTab. 3.1: Fermionen und zwischen ihnen wirkende nen Elektronen. Letztere sind Kräfte nicht weiter teilbar. Dagegen kann der Kern zweierlei Nukleonen enthalten, die positiv geladenen Protonen und die aus einem Proton und einem Elektron bestehenden, somit neutralen, Neutronen. Protonen setzen sich aus den Grundbausteinen der Materie zusammen, Quarks und Leptonen (Tab. 3.1). Diese besitzen alle einen Spin (anschaulich: einen Eigendrehimpuls, und heißen Fermionen. (L3.1). Das Schema der Abb. 3.3 gibt Ihnen aber einen ersten Überblick über die Fermionen. Es existieren drei Familien, innerhalb derer Quarks und Leptonen die gleichen Eigenschaften haben. Sie unterscheiden sich lediglich in ihrer Masse. Die Elementarteilchen werden durch Kräfte zusammengehalten, die durch Bosonen vermittelt werden. Bosonen sind Teilchen ohne Spin. Der Austausch findet jedoch nicht durch reelle, sondern durch virtuelle Teilchen statt. Um das zu verstehen, müssen wir etwas vorgreifen. In der klassischen (makroskopischen) Physik gilt in geschlossenen Systemen der Energieerhaltungssatz. Die Quantenmechanik zeigt, dass dieser für kurze Zeiten verletzt werden kann. Energieverletzung und zugehörige Zeitspanne sind durch die Heisenbergsche Unbestimmtheitsrelation miteinander verknüpft:
'E 't d h / 2S .
38
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
Proton up-Quark -
Gluonen
Elektronen Z+
Kern
up-Quark down-Quark
Protonen und Neutronen
Darin bedeutet h 6, 63 1034 Js das Plancksche Wirkungsquantum (M. Planck, 1858-1947). Auf Grund der MasseEnergie-Relation lässt sich den AustauschBosonen eine Masse m 'E / c 2 zuordnen. Ihre Reichweite 's c 't ist also umso kleiner, desto größer ihre Masse ist. Der Typ der beteiligten Bosonen erklärt die unterschiedliche Stärke von drei der existierenden vier Grundkräfte (Wechselwirkungen).
Abb. 3.3: Zum Aufbau des Atoms Es sind dies der Größe nach 1. Die starke Wechselwirkung 2. Die elektromagnetische Wechselwirkung 3. Die schwache Wechselwirkung 4. Die Gravitation
1 10-2 10-7 10-40
Schwache und elektromagnetische Wechselwirkung können zu einer einheitlichen Wechselwirkung zusammengefasst werden. An der Vereinigung der verbleibenden drei Grundkräfte wird intensiv gearbeitet (vgl. Kap. 21.1.2.6). Die starke Wechselwirkung wird durch die sog. Gluonen bewirkt; sie besitzt nur eine 14
kurze Reichweite ( d 10 m), wirkt also nur im Atomkern. Die elektromagnetische Kraft wird durch Photonen vermittelt; sie wirkt auf Ladungen (elektrische Kraft) und Ströme (magnetische Kraft) und ist langreichweitig. Da die Atome elektrisch geladene Elektronen und Protonen enthalten, beruht also die Bildung von Molekülen, Flüssigkeiten und Festkörpern aus Atomen auf der elektromagnetischen Wechselwirkung. Folglich sind die meisten im täglichen Leben auftretenden Kräfte ebenfalls elektromagnetischer Natur, z.B. die elastischen Kräfte einer Feder. Die schwache Wechselwirkung wird durch W- und Z-Bosonen vermittelt; diese besitzen eine große Masse. Folglich wirkt sie wie die starke Wechselwirkung nur innerhalb atomarer Dimensionen. Sie ist z.B. verantwortlich für den radioaktiven ß-Zerfall des Neutrons. Alle diese Bosonen lassen sich als reelle Teilchen erzeugen. Das Photon als Quant des Lichts ist uns allen bekannt. Ebenfalls langreichweitig ist die Gravitationskraft. Ein Blick auf die obige Aufstellung der relativen Kräfte zeigt, dass sie mit Abstand die schwächste Grundkraft ist. Aber sie wirkt bekanntlich zwischen elektrisch neutralen Körpern, aus der die makroskopische Materie besteht. Außerdem ist die Masse unserer Erde und die der anderen Himmelskörper sehr groß, daher ihre Bedeutung. Sie lässt sich aber bisher nicht in obiges Konzept einbinden.
39
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.6
Kraftfelder
Weiter oben haben wir notiert, dass Kräfte ortsabhängig sein können. Als Beispiel führten wir u.a. die Gravitationskraft an, Gl. (3.12). Wir erläutern jetzt an diesem Beispiel das Konzept des G Kraftfeldes. An jedem Punkt des Raumes wirkt auf einen Massenpunkt eine vom Abstand r zwischen Erde und Massenpunkt abhängige Kraft. Wir können sie uns veranschaulichen r (Abb. 3.4), indem wir für alle Punkte des g µ (1/r 2 ) rˆ Raumes ihre Stärke gemäß (3.12) berechnen und durch die Länge eines zum Erdmittelpunkt weisenden Pfeils darstellen. Bei dieser + Festlegung müssen wir allerdings die Masse m des Massenpunktes kennen. Die Kraft existiert natürlich unabhängig von dem Massenpunkt (Sonden-Masse), mit dessen Hilfe wir ihre Größe und Richtung messen. Daher ist es zweckmäßig, (3.12) durch die Sondenmasse zu teilen. Die so entstandene Größe deAbb. 3.4: Gravitationsfeldstärke finieren wir als Feldstärke (hier Gravitaund Äquipotentiallinien tionsfeldstärke). Ein analoger Fall begegnet uns in der elektromagnetischen Kraft zwischen zwei Punktladungen. In diesen Fällen ist das Feldlinienbild besonders einfach, da es nur eine radiale Komponente hat; die Kraft ist nur G abhängig vom Abstandsvektor r , sie ist kugelsymmetrisch +
G G F const f (r ) .
(3.25)
Ein solches Kraftfeld heißt Zentralkraftfeld. Es ist eine Vektorgröße. Es gibt auch skalare Felder wie z.B. das Potentialfeld oder die Temperaturverteilung zwischen zwei Punkten unterschiedlicher Temperatur.
3.7
Der Energieerhaltungssatz der Mechanik
Bleibt bei allen physikalischen Prozessen eine physikalische Größe erhalten, so bezeichnen wir diese als Erhaltungsgröße. Im Bereich der Newtonschen Mechanik gibt es Erhaltungssätze für die Energie, den Impuls und den Drehimpuls. Darüber hinaus existieren zwei weitere Erhaltungssätze für die innere Energie und die elektrische Ladung. Sie werden später besprochen. Zunächst wollen wir den Energieerhaltungssatz der Mechanik ableiten. Ausgangspunkt ist der Begriff der Arbeit.
40
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.7.1 Arbeit und Leistung G Wir betrachten einen Massenpunkt, der durch Einwirkung einer Kraft F vom Ort a zum Ort b verschoben werde (Abb. 3.5). Die Kraft möge vom jeweiligen Ort des Massenpunktes abhängen. Um die im Allgemeinen gekrümmte Bahnkurve anzunähern, setzen wir sie aus r r y kurzen geradlinigen Abschnitten zusammen. D r 1 D r2 G Wir greifen ein Wegelement 'ri heraus, dessen r G D ri Ort also durch den Ortsvektor ri bestimmt wird. r r a F(ri ) Wir definieren nun das Skalarprodukt der an diesem Ort auf den Massenpunkt wirkenden b r G G ri Kraft F (ri ) und der durch sie bewirkten VerG schiebung 'ri des Massenpunktes als Arbeit. x
z
Abb. 3.5: Zur Definition der Arbeit
G G G 'Wi F ( ri ) 'ri
(3.26)
Die gesamte Arbeit W (a o b) längs des Weges von a nach b ist dann
W (a ob)
G G G G G G G G G F ( r1 ) 'r1 F (r2 ) 'r2 ... F (ri ) 'ri ... G G G ¦ i F (ri ) 'ri
(3.27)
Je kleiner die Wegelemente gewählt werden, umso genauer wird das Ergebnis. Den exakten G Wert erhalten wir, wenn wir 'ri gegen null streben lassen, d.h. wenn wir integrieren: b
W ( a o b)
G G
G
³ F (r ) dr
(3.28)
a
Bei Anwendungen sind die Richtungen der beiden Faktoren im Skalarprodukt zu beachten. Die Einheit der Arbeit ist das „Newtonmeter“ (Nm). (1 Nm = 1 J (Joule) = 1 Ws (Wattsekunde)). (J. P. Joule, 1818-1889). Eine andere wichtige Größe ist die pro Zeiteinheit verrichtete Arbeit. Sie wird als Leistung P bezeichnet.
P
dW . dt
(3.29)
Da die Einheit der Zeit die Sekunde (s) ist, folgt für die Einheit der Leistung: 1 J/s = 1 W
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
41
3.7.2 Wegunabhängige (konservative) Kräfte Kräfte wollen wir in zwei Klassen einteilen; ist die Arbeit, die eine äußere Kraft an einem Massenpunkt verrichtet, unabhängig von der Form des Weges C, auf dem es sich bewegt, so nennen wir die Kraft konservativ. Die Arbeit hängt also in diesem Fall nur vom Anfangs- und Endpunkt ab. Wir können das in integraler oder differentieller Form schreiben (Anhang 1.2).
G G
v³ Fdr
G G 0 oder differentiell rot F (r ) 0 .
(3.30)
C
Zu dieser Klasse von Kräften gehören die elastische Federkraft, die Gravitationskraft sowie die elektrostatische Kraft zwischen geladenen Körpern. Beispiele für nicht-konservative Kräfte sind Reibungskräfte (s. Kap. 10.5). Ein Beispiel für die Arbeit einer konservativen Kraft ist die Spannarbeit (Abb. 3.6): Um eine Feder zu dehnen, muss die rücktreibende Federkraft kompensiert werden. Die erforderliche Kraft ist also -D (x) F ( x) Dx , (3.31a) r F (x) wobei D eine Konstante, die Federkonstante, ist. x1 x 0 Die Arbeit ergibt sich zu x1
W (0, x1 )
³ D x dx 0
1 2 Dx1 2
(3.31b)
Abb. 3.6: Beispiel einer konservativen Kraft: Spannarbeit einer Feder
3.7.3 Potentielle Energie und kinetische Energie Verrichten wir an einem Massenpunkt Arbeit, so ist diese anschließend als Energie im System gespeichert. Das System kann daher jetzt seinerseits Arbeit verrichten; z.B. kann sich in unserem obigen Beispiel die Feder entspannen und dabei an einem Körper Arbeit verrichten. Oder bringen wir einen an einem Seil befestigten Körper der Masse m mittels einer Rolle entgegen der Schwerkraft auf die Höhe h, so kann dieser Körper beim Herabgleiten einen anderen Körper der Masse m1 m hochziehen. Das Vermögen eines Körpers, Arbeit zu verrichten, wird als potentielle Energie bezeichnet. Sie ist definiert als P1
E pot : W
G G
G
³ F (r ) dr
P0
.
(3.32a)
42
3 Grundgleichungen der Mechanik und Energieerhaltungssatz P1 G G G E pot : ³ F ( r ) dr
(3.32b)
P0
G G Hierin ist F (r ) wiederum die auf den Massenpunkt wirkende Kraft. – Der Nullpunkt der potentiellen Energie kann beliebig gewählt werden, da nur die Differenz definiert ist. Im obigen Beispiel ist die von der gespannten Feder gespeicherte potentielle Energie x1
E pot ³ ( D x) dx 0
1 2 Dx1 . 2
(3.33)
Häufig wird an Stelle der potentiellen Energie der Begriff des Potentials V benutzt. Wir führen diese Bezeichnung in (3.32a) ein. Für ein infinitesimal kleines Wegelement lautet sie
dV { dW pot
dW
G G G F (r ) dr .
(3.32a)
G Nach Kap. A1.2.1 ändert sich das Potential beim Fortschreiten um dr um
dV
G dr gradV .
Gehen wir damit in (3.31a) ein, so folgt
G G G F (r ) grad V (r ) .
(3.34)
Fassen wir die Kraft als Feldgröße auf, so sehen wir, dass an die Stelle des vektoriellen Kraftfeldes ein skalares Potentialfeld getreten ist. Da wir konservative Kraftfelder vorausgesetzt haben, gilt als Bedingung, dass sich eine Kraft als Gradient eines skalaren Potentials darstellen lässt, nach 3.30
G rot grad V ( r )
0
(3.35)
(3.34) ist nichts Anderes als die Umkehr von (3.32b), wie wir bei der Beschränkung auf eine Dimension sofort erkennen. In diesem Fall lautet (3.32a)
dV
F ( x) dx o F ( x)
dV . dx
Eine Kraft kann auch dazu dienen, einen Massenpunkt längs eines Weges zu beschleunigen.
43
3 Grundgleichungen der Mechanik und Energieerhaltungssatz Erinnern wir uns an das Grundgesetz der Mechanik:
G G dv F m dt
(3.3)
Die Arbeit einer Kraft ist durch (3.28) gegeben. Mit (3.2) folgt P1
W
G G G ³ F (r )dr
P0
G dv G m ³ dr dt P0 P1
P1
G G m ³ vd v P0
m 2 m 2 vP vP 2 1 2 0
(3.35a)
Als nichtrelativistische kinetische Energie eines Massenpunktes definieren wir die Größe
Ekin :
m 2 v 2
(3.36)
3.7.4 Energieerhaltungssatz Wir können jetzt den Energieerhaltungssatz der Mechanik formulieren. Potentielle und kinetische Energie an zwei Punkten P0 und P bezeichnen wir mit Epot(P0) und Ekin(P0) usw. Mit (3.32a/b) und (3.36) folgt P
G G G F ³ (r )dr E pot ( P) E pot ( P0 ) Ekin ( P) Ekin ( P0 )
(3.37a)
E pot ( P ) Ekin ( P)
(3.37b)
P0
oder
E pot ( P0 ) Ekin ( P0 )
E
const.
Die Summe aus potentieller und kinetischer Energie am Ort P ist gleich der Summe aus potentieller und kinetischer Energie am Ort P0.
E pot +E kin = const.
Energieerhaltungssatz.
(3.38)
44
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.8 Anwendungen des Energieerhaltungssatzes 3.8.1 Das Federpendel Eine Feder hänge an ihrem einen Ende an einem Stativ (Abb. 3.7); an ihrem unteren Ende sei ein Massenpunkt der Masse m befestigt. Die Feder möge frei schwingen; die Rückstellkraft ist wieder durch F D x gegeben. Die Bewegungsgleichung ist
Abb. 3.7: Zur Erläuterung des Energieerhaltungssatzes am Beispiel des Federpendels
m
d2x Dx 0 dt 2
d2x D x 0 dt 2 m
(3.39a)
(3.39b)
Aus Erfahrung wissen wir, dass das Pendel eine (harmonische) Schwingung ausführt; die Auslenkung ist also gegeben durch
x
x0 cos Zt
(3.40)
Die erste und zweite zeitliche Ableitung sind
dx dt
Z x0 sin Zt ;
d2x dt 2
Z 2 x0 cos Zt .
(3.41)
Einsetzen von (3.40) und (3.41) in die Bewegungsgleichung, Gl. (3.39b), ergibt für die Frequenz Z
Z
D m
(3.42)
Zu jedem Zeitpunkt muss der Energieerhaltungssatz erfüllt sein. Wir wollen dies nachprüfen.
E E pot Ekin
D 2 m 2 x v 2 2
(3.43)
Einsetzen von x, v liefert
E
D 2 m x0 cos 2 Zt Z 2 x02 sin 2 Zt 2 2
(3.44)
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
45
Mit (3.42) folgt
E
m 2 2 Z x0 (cos 2 Zt sin 2 Zt ) 2
D 2 x0 const. 2
(3.45)
Die Gesamtenergie während einer Schwingungsperiode bleibt konstant. Es findet eine dauernde Umwandlung von potentieller in kinetische Energie und umgekehrt statt.
3.8.2 Fluchtgeschwindigkeit eines Projektils In Kap. 3.4 haben wir die Geschwindigkeit eines Projektils, die zum Verlassen des Anziehungsbereiches der Erde erforderlich ist, berechnet. Dabei sind wir vom Grundgesetz der Mechanik ausgegangen. Um die Momentangeschwindigkeit zu erhalten, mussten wir die Bewegungsgleichung integrieren. Kennen wir dagegen die potentielle und kinetische Energie des Problems, so können wir uns die Integration ersparen. Zunächst berechnen wir die potentielle Energie. Sie ergibt sich aus der Arbeit, die benötigt G wird, um einen Körper von einem unendlich weit entfernten Punkt an den Ort r zu bringen: r
Mm J ³ () 2 dr r f
E pot
r
§ 1 ·º J Mm ¨ ¸» © r ¹¼f
J
Mm r
(3.46)
Also gilt für die Gesamtenergie E
E
E pot Ekin
gmrEr2 m 2 v ; 2 r
(3.47)
die Größe rEr bezeichnet den Erdradius. In unendlicher Entfernung vom Erdmittelpunkt ist neben der potentiellen Energie auch die kinetische Energie gleich null. (Der Einfluss anderer Himmelskörper als der der Erde werde vernachlässigt). Einsetzen von E = 0 in (3.47) ergibt
m 2 v 2
gmrEr2 r
(3.48)
Ist also die Geschwindigkeit des Geschosses größer als
v0
2 grEr ,
(3.49)
so kann es die Erde verlassen. Wie bereits erwähnt, bezeichnen wir v0 als die Fluchtgeschwindigkeit. Das Ergebnis ist in Übereinstimmung mit dem in Kap. (3.4) berechneten Ausdruck für die Fluchtgeschwindigkeit.
46
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
Zusammenfassung x Die Mechanik lässt sich auf den Newtonschen Postulaten aufbauen. Sie lauten
1.1 Wirken auf einen Körper keine Kräfte ein, so verharrt er im Zustand der Ruhe oder bewegt sich mit konstanter Geschwindigkeit längs einer Geraden. Ein Bezugssystem, in dem dieser Sachverhalt gilt, heißt Inertialsystem. 1.2 Die zeitliche Impulsänderung eines Körpers ist gleich der von außen wirkenden Kraft. Der Impuls ist definiert als das Produkt aus Masse und Geschwindigkeit des Körpers.
G dpG F dt
o
G G p m v.
Für nichtrelativistische Geschwindigkeiten (v c) wird
G G F ma ; m const Diese Beziehung heißt auch Grundgesetz der Mechanik oder Bewegungsgleichung. 1.3 Jede Kraft ruft eine Gegenkraft hervor,
G G F12 F21 x Unter einem Massenpunkt ist ein ausdehnungsloser Körper der Masse m zu verstehen x Träge und schwere Masse besitzen den gleichen Wert. x Alle Kräfte in der Natur können auf drei Grundkräfte zurückgeführt werden. x Eine Kraft lässt sich durch ein vektorielles Kraftfeld beschreiben. x Mechanische Arbeit ist definiert als das Wegintegral der auf den Massenpunkt von außen einwirkenden Kraft b
W ( a o b)
G G
G
³ F (r ) dr . a
Die Einheit ist 1 kg m = 1 J = 1Ws. x Leistung ist Arbeit pro Zeiteinheit. Die Einheit ist 1 W.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
47
x Kräfte, die nicht von der Art des Weges abhängen, heißen konservativ. x Die potentielle Energie ist definiert als die negative Arbeit, die von der WechselG G wirkungskraft (der inneren Kraft) F (r ) verrichtet wird b G G G E pot : ³ F (r ) dr . a
x Die kinetische Energie eines Massenpunktes ist definiert als
Ekin :
1 m v2 . 2
x Für konservative Kräfte gilt der Energieerhaltungssatz
E pot Ekin const. .
Übungsaufgaben 1. Ein punktförmiger Körper der Masse m gleitet reibungsfrei unter dem Einfluss der Schwerkraft vom höchsten Punkt eines Zylinders, der sich auf einer ebenen Tischplatte befindet, herab. Seine Anfangsgeschwindigkeit sei vernachlässigbar. a) Unter welchem Winkel zur Vertikalen löst sich der Körper vom Zylinder ab? b) In welchem Abstand zur fixierten Auflagelinie des Zylinders trifft die Kugel auf den Tisch auf? 2. Ein zur Ausstrahlung von Fernsehprogrammen vorgesehener Satellit soll mit einer Rakete auf eine geostationäre Bahn gebracht werden, d.h. er soll immer über dem gleichen Punkt der Erde stehen. Wie groß muss sein Abstand von der Erdoberfläche sein? Wie viele solcher Satelliten werden benötigt, um jeden Punkt am Äquator zu erreichen? 3. Zwei Fahrer mit ihren identischen Pkw starten zur gleichen Zeit in eine nichtüberhöhte Kurve. Der eine Fahrer benutzt die innere der beiden Fahrspuren, der andere die Außenspur. Wer erreicht das Ziel am Ende der Kurve zuerst, wenn beide gerade so schnell fahren, dass ihr Fahrzeug nicht ausbricht? 4. Warum wird beim Straßenbau eine Kurve überhöht angelegt? Wie muss die Überhöhung gewählt werden, wenn die Kurve mit dem Krümmungsradius r mit der Geschwindigkeit v durchfahren werden soll?
48
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
5. Gegeben seien die Funktionen V x 2 y 2 r 2 und y 1/ r 2 . a) Berechnen Sie für beide Fälle den Gradienten. b) Welche anschauliche Bedeutung kommt dem Gradienten zu? c) Welche anschauliche Bedeutung kommt dem div-Operator zu, welche dem rot-Operator? 6. Was bedeutet der Begriff der Fluchtgeschwindigkeit und welchen Wert besitzt diese? Ist sie an allen Orten gleich groß? 7. Berechnen Sie die potentielle Energie eines Körpers der Masse m0 im Gravitationsfeld einer Kugelschale, wenn sich der Körper innerhalb bzw. außerhalb der Kugelschale befindet. 8. Ein Mann trägt einen 50 kg schweren Sandsack 10m eine Rampe (D=10°). hinauf zu einem Lastwagen. Dort hebt er ihn auf die 0,75 m hohe Ladefläche. Wie groß sind Arbeit und mittlere Leistung, wenn er insgesamt 40 s benötigt? Wie groß wäre die Arbeit für D = 0? 9. Ein Körper mit der Masse von 4 kg bewegt sich auf einer schiefen Ebene (Neigungswinkel
D = 20°) aufwärts. Auf den Körper wirken außer der Schwerkraft eine horizontale Kraft von
80 N, eine Kraft von 100 N parallel zur Ebene und eine Reibungskraft von 10 N. Berechnen Sie die einzelnen Arbeitsbeträge und die Gesamtarbeit, welche das Kräftesystem verrichtet, wenn der Körper 20 m auf der Ebene gleitet.
4
Systeme von Massenpunkten und Impulserhaltungssatz
Bei der bisherigen Entwicklung der Mechanik haben wir uns auf einen Massenpunkt beschränkt. Nun gibt es aber Situationen und Prozesse, an denen mehrere Körper bzw. Teilchen beteiligt sind. Nur zwei Beispiele seien genannt: die Mechanik der Himmelskörper und Streuprozesse von „Elementarteilchen“ im Kraftfeld von Atomen oder anderen Teilchen. Wir wollen unsere Kenntnisse daher jetzt auf ein System von Massenpunkten erweitern. Dabei werden wir als zweiten Erhaltungssatz den Impulserhaltungssatz kennen lernen. Der Energieerhaltungssatz erlaubt, wie wir gesehen haben, in manchen Fällen die Berechnung der Geschwindigkeit eines Massenpunktes ohne Integration und erleichtert damit die Berechnung der Bahnkurve. Wird zusätzlich der Impulserhaltungssatz herangezogen, angewandt auf einen Stoß zweier Teilchen, so lassen sich bei bekannter Anfangsgeschwindigkeit der Stoßpartner die Geschwindigkeiten nach dem Stoß berechnen. Eine explizite Kenntnis der Kräfte ist dazu nicht nötig.
4.1
Impulserhaltungssatz als Folge des dritten Newtonschen Axioms
Der Impuls eines Teilchens (MP) ist definiert als das Produkt aus seiner Masse und Geschwindigkeit,
G p
G mv .
(4.1)
G G Wir betrachten nun ein System aus zwei Massenpunkten, auf die Kräfte F1 bzw. F2 einwirken. Das Grundgesetz der Mechanik lautet
G F1 G F2
G dp1 d G (m1v1 ) dt dt G dp2 d G (m2 v 2 ) dt dt
(4.2a)
Die Summe der Kräfte ist also
G G F1 F2
G G dp1 dp2 dt dt
(4.2b)
G G Wir zerlegen die Kräfte F1 und F2 in einen Anteil, der von äußeren Kräften (a) herrührt, und in einen Anteil, der die innerhalb des Systems wirkenden Kräfte berücksichtigt (i). Da das System nur aus zwei Teilchen besteht, kann eine innere Kraft auf Massenpunkt 1 nur von G G Massenpunkt 2 herrühren und umgekehrt. Sie seien mit F12i und F21i bezeichnet.
50
4 Systeme von Massenpunkten und Impulserhaltungssatz
Es gilt also
G G G F1 F1a F12i G G G F2 F2a F21i
(4.3)
Unabhängig davon, ob es sich um äußere oder innere Kräfte handelt, gilt nach dem dritten Newtonschen Axiom
G G F12 F21
(4.4)
Die zeitliche Ableitung des Gesamtimpulses ergibt sich damit zu
G dp G a G a G i G i G a G a F1 F2 F12 F21 F1 F2 dt
G dp a dt
(4.5)
Der Impuls des Systems wird also durch innere Kräfte nicht beeinflusst. Existieren keine äußeren Kräfte, so entnehmen wir (4.5), dass der Gesamtimpuls erhalten bleibt. Zur experimentellen Verifikation des Impulserhaltungssatzes zeigt Abb. 4.1 zwei auf einer Luftschiene gleitende Reiter. Ihre Geschwindigkeit kann mittels zweier Lichtschranken gemessen werden. Jeder der beiden Reiter ist mit einer Feder ausgestattet, die durch einen Faden gespannt gehalten wird. Der Impulserhaltungssatz fordert (die Vektorzeichen sind hier belanglos)
p1 p2 p1 p 2 Abb. 4.1: Demonstration des Impulserhaltungssatzes. Nach dem Durchbrennen des Fadens haben die identischen Reiter entgegengesetzt gleiche Geschwindigkeiten
m1v 1 m2 v 2
o
v 1 v 2
m2 m1
(4.6)
Links stehen die Impulse vor dem Stoß, rechts die nach dem Stoß. Zu Beginn ruhen beide Reiter (p1 + p2 = 0). Nach dem Durchbrennen des Fadens entspannen sich die Federn; für die Impulse bzw. die Geschwindigkeiten gilt (4.7)
Das Verhältnis der Endgeschwindigkeiten der beiden Massenpunkte ist reziprok zum Verhältnis ihrer Massen. Die Versuchsdurchführung bestätigt den Impulserhaltungssatz für das spezielle Beispiel.
51
4 Systeme von Massenpunkten und Impulserhaltungssatz
4.2
Schwerpunkt oder Massenmittelpunkt eines Systems von zwei Massenpunkten
Wir fragen nun nach der Bewegung zweier Massenpunkte unter dem Einfluss äußerer Kräfte. G G Zunächst führen wir den Begriff des Schwerpunktes ein. Sind r1 (t ) und r2 (t ) die Orte der beiden MP, so definieren wir als Ort des Schwerpunktes der MP die Größe
G R(t )
1 G G m1r1 (t ) m2 r2 (t ) . m1 m2
(4.8)
Der Schwerpunkt ist das mit den beiden Massen gewichtete Mittel der Ortskoordinaten. Er wird daher auch als Massenmittelpunkt bezeichnet. (4.2) lässt sich damit schreiben
G G F1a F2a
G dp a dt
d d G G ^ m1r1 (t )` ^ m2 r2 (t )` dt dt G d (m1 m2 ) R(t ) dt
(4.9)
Bei Anwesenheit äußerer Kräfte bewegt sich der Schwerpunkt des Systems der zwei Massenpunkte so, als ob seine Gesamtmasse (m1 + m2) in ihm vereinigt wäre und alle äußeren Kräfte direkt in ihm angriffen. Als Beispiel zeigt Abb. 4.2 die Bahnkurve einer Hantel; ihr Schwerpunkt beschreibt eine Parabel.
Abb. 4.2: Bahnkurve einer Hantel: Ihr Schwerpunkt beschreibt eine Parabel xx
52
4.3
4 Systeme von Massenpunkten und Impulserhaltungssatz
Verallgemeinerung auf mehrere Massenpunkte
Wir betrachten jetzt N Massenpunkte (Abb. 4.3). Die Kraft auf den i-ten Massenpunkt lässt G G sich wie oben in einen äußeren Anteil Fi a und in Anteile Fi j , j 1, 2,3,...N zerlegen, die von den anderen MP des Systems herrühren. mj
r F aj
m1
(1) r Fji
r rj
r ri
r Fia
mn
r ri
r ri r R
S
(2)
r Fi j mi
0 G Abb. 4.3b: Ortsvektor Ui eines Massenpunktes im Schwerpunktsystem
Abb. 4.3a: Auf zwei oder mehrere Massenpunkte können äußere und innere Kräfte wirken. Letztere heben sich paarweise auf Eine Kraft auf sich selbst gibt es nicht, d.h.
G Fii
0 .
Weiter gilt analog oben
G G Fi j Fj i .
(4.10)
Die Summation über alle Massenpunkte i ergibt
G ¦ Fi N
i 1
N N G G ¦ Fi a ¦¦ Fi j N
i 1
i 1 j 1
G ¦ Fi a N
i 1
G dpia ¦1 dt N
G dp a dt
(4.11)
G G Die Doppelsumme verschwindet, denn zu jedem Fi j gibt es ein Fji , so dass sie sich nach
dem dritten Newtonschen Postulat paarweise wegheben.
53
4 Systeme von Massenpunkten und Impulserhaltungssatz Erwartungsgemäß finden wir:
Der Gesamtimpuls eines Systems aus N Massenpunkten wird durch innere Kräfte nicht verändert. Sind keine äußeren Kräfte vorhanden, so bleibt der Gesamtimpuls konstant. Definieren wir den Ortsvektor des Schwerpunktes entsprechend (4.8)
G R
1 M
N
G
¦ mr , i
N
¦m ,
M
(4.12)
i
i 1
i 1
so ergibt sich aus (4.11)
G F ¦ Fi N
i 1
G ¦ Fi a N
i 1
G dpi dt
N
d G mi vi ¦ i 1 dt
G d § dR · ¨M ¸ dt © dt ¹
(4.13)
Ist die Masse konstant, so lässt sich (4.13) vereinfachen:
G G d 2R F M 2 dt
(4.14)
Der Schwerpunkt bewegt sich so, als ob die Gesamtmasse M in ihm vereinigt wäre und die Summe der äußeren Kräfte in ihm angriffe. Beim Fehlen äußerer Kräfte bewegt sich der Schwerpunkt geradlinig gleichförmig. Die vorstehenden Überlegungen zum Impuls setzten voraus, dass das Koordinatensystem im Labor verankert ist. Wie wir gleich sehen werden, ist es bei manchen Anwendungen zweckmäßig, den Impuls im Schwerpunktsystem zu Grunde zu legen. Zur Einführung gehen G wir von Abb. 4.03b aus. Der Ortsvektor eines Massenpunktes ri , werde geschrieben als
G ri
G G R Ui , i 1...N .
(4.15)
Den Impuls im Schwerpunkt-System definieren wir als
G d Ui S i : mi . dt G
G
mit o S i
G G dri dR mi mi dt dt
(4.16)
G m G pi pres . M
(4.17)
54
4 Systeme von Massenpunkten und Impulserhaltungssatz
Integration von (4.14) liefert den Gesamtimpuls
G dR M . dt
G pres
(4.18)
Summierung über alle Massenpunkte in (4.17) und Einsetzen von (4.18) führt zu N
G
¦S i i 1
G
S res
4.4
N
G
¦p
i
G pres
G G pres pres
0
(4.19a)
i 1
0
(4.19b)
Anwendungen des Impulserhaltungssatzes
4.4.1 Stoßprozesse Wir wollen zwei Körper betrachten, die sich mit vorgegebenen Geschwindigkeiten aufeinander zu bewegen mögen. Je nach Art der Wechselwirkung können sich die Stoßpartner berühren, wie bei zwei Billard-Kugeln, oder sich nur einander annähern. Im ersten Fall bezeichnen wir den Prozess als Stoß zweier Teilchen. Im zweiten Fall ist der Begriff der Streuung üblich. Allgemein verstehen wir darunter die Richtungsänderung von freie fliegenden Teilchen oder einer Welle beim Auftreffen auf ein Hindernis. Der Begriff wird einschränkend oft benutzt, wenn der korpuskulare Charakter der Materie betont werden soll, an dem ein Teilchen oder auch eine Welle gestreut wird. Ein Beispiel ist die Streuung positiv geladener 4 He 2 -Kerne im Feld der Protonen eines Atomkerns (Rutherford-Streuung). Die abstoßende Wechselwirkung zwischen den gleichnamig geladenen Teilchen bewirkt eine Ablenkung der 4 He 2 -Kerne, bevor eine direkte Berührung erfolgen kann. Ein anderer Fall ist die Streuung von „Lichtpartikeln“, den Photonen, an quasi ruhenden Elektronen, bekannt unter dem Namen ComptonEffekt. Die Stoßzeit mechanischer Stoßprozesse ist mit 1030 s relativ kurz, sie kann aber auch sehr lang werden wie im Bereich der Himmelsmechanik. Es ist zweckmäßig, zwischen elastischen und inelastischen Stößen zu unterscheiden. Elastische Stöße sind dadurch definiert, dass die gesamte kinetische Energie der Stoßpartner vor dem Stoß gleich deren gesamter kinetischen Energie nach dem Stoß ist. Von einem inelastischen Stoß sprechen wir, wenn ein Teil der vor dem Stoß vorhandenen kinetischen Energie beim Stoß in eine andere Energieform übergeht, z. B. in Wärmeenergie. Beim vollständig inelastischen Stoß bewegen sich beide Körper nach dem Stoß mit derselben Geschwindigkeit (sie „kleben“ aneinander). In der makroskopischen Physik besteht im Allgemeinen die Aufgabe darin, aus den bekannten Anfangsgeschwindigkeiten die Endgeschwindigkeiten und die Bahnen zu berechnen.
4 Systeme von Massenpunkten und Impulserhaltungssatz
55
4.4.1.1 Stöße in einer Dimension Wir wenden uns jetzt zentralen Stößen zu, d. h .zwei Körper sollen sich ohne Einwirkung äußerer Kräfte längs einer Geraden aufeinander zu bewegen. 4.4.1.1.1 Der elastische Stoß Zur Berechnung der Endgeschwindigkeit der beiden Stoßpartner benötigen wir zwei Gleichungen. Die erste Gleichung liefert uns der Impulserhaltungssatz, die zweite der Energieerhaltungssatz. Die beiden Körper mögen die Massen m1 und m2 (= const.) haben. Ihre Geschwindigkeiten vor dem Stoß seien v1 und v2, die nach dem Stoß v 1 und v 2 . Die Vektorzeichen lassen wir weg, da die Bewegung längs einer Geraden verläuft. Die beiden Gleichungen sind also
m1v1 m2 v 2 m1 v 1 m2 v 2 m1 2 m2 2 v1 v2 2 2
m1 2 m2 2 v 1 v 2 2 2
(4.20)
Die potentiellen Energien vor und nach dem Stoß seien gleich. Die Endgeschwindigkeiten ergeben sich zu
v 1
m m2 2m2 v2 1 v1 ; m1 m2 m1 m2
v 2
m m2 2m1 v1 1 v2 . m1 m 2 m1 m2
(4.21)
Spezialfälle: a)
m1
v 1
m2
v2 ;
v 2
v1
Reiter der gleichen Masse tauschen ihre Geschwindigkeit aus b)
m1 !! m2
v 1 | v1 ;
v 2 | 2v1 - v 2
Der schwerere Körper behält seine Geschwindigkeit annähernd bei. Der leichtere Körper wird für v1 = 0 am Schwereren reflektiert.
4 Systeme von Massenpunkten und Impulserhaltungssatz
56
4.4.1.1.2 Der vollkommen inelastische Stoß In diesem Fall „kleben“ die Körper nach dem Stoß aneinander, sie bewegen sich mit gleicher Geschwindigkeit. Statt des Energieerhaltungssatzes der Mechanik gilt also jetzt
v 1
v 2 .
(4.22)
Damit folgt aus dem Impulserhaltungssatz
v 1 v 2
m1 v1 m2 v 2 . m1 m2
(4.23)
Lehrreich ist auch der Spezialfall, dass vor dem Stoß Körper 2 ruht. Für die Energie vor dem Stoß gilt
E
m1 2 v1 2
und nach dem Stoß
m1 m2 2 E v 1 2
(4.24)
Einsetzen von v 1 ergibt
E
1 m12 v12 . 2 m1 m2
(4.25)
Wir erhalten also als Differenz der Energien vor und nach dem Stoß
'E
m1 § 2 m1v12 · ¨ v1 ¸ 2 © m1 m2 ¹
1 m1m2 2 1 v1 : Pred v12 . 2 m1 m2 2
(4.26)
µred ist die reduzierte Masse. Die kinetische Energie ' E geht beim vollständig inelastischen Stoß als mechanische Energie verloren; sie wird in Wärmeenergie verwandelt.
57
4 Systeme von Massenpunkten und Impulserhaltungssatz 4.4.1.2 Stöße in zwei und drei Dimensionen
Der Übersichtlichkeit halber werde der Fall betrachtet, dass sich ein Körper der Masse m1 entlang der x-Achse mit der Geschwindigkeit v1 auf einen ruhenden Körper der Masse m2 zu bewegt. Der Stoß soll jetzt aber nicht mehr zentral erfolgen, sondern die zunächst geradlinige Bahn möge in ihrer Verlängerung in einem gewissen Abstand am Mittelpunkt des zweiten Körpers vorbei führen. Dieser seitliche Versatz wird mit dem Buchstaben b bezeichnet und heißt Stoßparameter (Abb. 4.4). Wir beschränken uns im Folgenden auf den Fall, dass die beteiligten Körper nicht rotieren.
r v% 1
r v1
j1
b
r1
r2 b j2 r v% 2
Abb. 4.4: Nichtzentraler Stoß, charakterisiert durch den Stoßparameter b Die Bahnen der zwei Stoßpartner spannen eine Ebene auf, wir haben ein zweidimensionales Problem vor uns Die Aufgabe entspricht der bisherigen: in Abhängigkeit vom Stoßparameter sollen aus der bekannten Anfangsgeschwindigkeit des stoßenden Körpers die Endgeschwindigkeiten beider Körper und die Ablenkungswinkel M1 und M2 berechnet werden. Es sind also vier Unbekannte zu bestimmen, wofür wir vier Gleichungen benötigen. Zwei Beziehungen liefert uns der Impulserhaltungssatz für die x- und y-Komponente der Endgeschwindigkeiten
pges x
m1 v1 m1v 1 cos M1 m2 v 2 cos M2
pges y
0
m1 v 1 sin M1 m2 v 2 sin M2
(4.27)
Eine weitere Gleichung folgt aus dem Energieerhaltungssatz. Ist der Stoß elastisch, so gilt
m1 2 m1 2 m2 2 v1 v 1 v 2 2 2 2
(4.28)
Die noch fehlende vierte Gleichung liefert uns die Größe des Stoßparameters b:
sin M2
b /(r1 r2 ) .
Ein typischer Streuprozess, die Rutherford-Streuung, wird in Kap. 6 im Rahmen des Keplerproblems besprochen.
58
4 Systeme von Massenpunkten und Impulserhaltungssatz
4.4.2 Elastischer Stoß im Schwerpunkt-System In manchen Fällen ist es einfacher, Stoßprozesse nicht wie bisher im Laborsystem, sondern im Schwerpunktsystem zu behandeln. Wir wollen uns daher dieser Betrachtungsweise für den Fall des elastischen Stoßes zweier Körper zuwenden. Es gelten weiterhin der Impuls- und Energieerhaltungssatz. Wie weiter oben dargelegt, ist der Gesamtimpuls im Schwerpunktsystem immer gleich null. Es gilt also vor dem Stoß (Abb. 4.5)
G
r p1 r p 2¢
r p 1¢
S
0
G o S1
G S 2
(4.29a)
und nach dem Stoß
r p2
G
G
G
S ' 0 o S '1 S '2 .
(4.29b)
Der Energieerhaltungssatz lautet Abb. 4.5: Beim elastischen Stoß im Schwerpunktsystem ändern sich die Beiträge der Einzelimpulse nicht, sondern nur ihre Richtungen
S 12 2m1
S 22
S 1c2
2m2
2m1
S 2c2 2m2
.
(4.30)
Hierin können wir z.B. den Impuls des Teilchens 2 durch den des Teilchens 1 ausdrücken. Dabei kürzen sich die Massen heraus und es bleibt
S 12 S 1c2 .
(4.31a)
Analog erhalten wir
S 22 S 2c2 .
(4.31b)
Mit (4.29) folgt also für die Beträge der Impulse
S 1 S 2 S 1c S 2c .
(4.31c)
Die Winkel zwischen den Impulsvektoren hängen von den Anfangsbedingungen ab. x
m2 , v2 = 0
m1 ,v1 0
Abb. 4.6: Zentraler Stoß zweier Teilchen im Schwerpunktsystem
Als Beispiel betrachten wir den zentralen Stoß zweier Teilchen der Massen m1 und m2 (Abb. 4.6). Der Stoß möge längs der x-Achse erfolgen; Teilchen 2 soll vor dem Stoß ruhen. Die Koordinaten der Teilchen im Laborsystem seien x1 bzw. x2 = 0. Die Koordinaten der Teilchen im S-System sind dann gemäß (4.12)
4 Systeme von Massenpunkten und Impulserhaltungssatz
m1 x1 0 m1 m2
m2 x1 ; m1 m2
x1S
x1
x2 S
m1 x1 . 0 m1 m2
59
(4.32)
Aus diesen Gleichungen erhalten wir durch Differentiation die Geschwindigkeiten im SSystem zu
m2 v1 , m1 m2
v1S
v2S
m1 v1 m1 m2
(4.33)
Die Geschwindigkeiten nach dem Stoß folgen aus (4.29) durch Umdrehen der Vorzeichen. Die Rücktransformation in das Laborsystem ergibt sich durch (vektorielle) Addition der Schwerpunktgeschwindigkeit zu
v1c
m2 m1 v1 v1 m1 m2 m1 m2
m1 m2 v1 m1 m2
vc2
m1 m1 v1 v1 m1 m2 m1 m2
2m1 v1 m1 m2
.
(4.34)
4.4.3 Raketenantrieb als Folge des Impulserhaltungssatzes Bei dieser Anwendung handelt es sich um ein Beispiel eines Systems, bei dem sich während des Stoßprozesses die Massen der Stoßpartner ändern: Wir betrachten eine Rakete, die sich so weit von allen Himmelskörpern entfernt befinden soll, dass Gravitations- und Reibungskräfte vernachlässigt werden können (Abb. 4.7). Ihre Masse m nimmt in der Zeit dt durch Verbrennung von Treibstoff um dm ab und wird durch den Rückstoß um den Betrag dv beschleunigt. Die (als konstant angenommene) Geschwindigkeit der ausströmenden Treibstoffgase sei mit vTr bezeichnet. Wir haben ein abgeschlossenes System vor uns, es existieren keine äußeren Kräfte, die Impulsänderung ist null.
dp (m dm) dv (dm) vTr
0
(4.35)
Die von zweiter Ordnung kleine Größe ( dm dv ) kann vernachlässigt werden. Es folgt
m
dv dt
vTr
dm . dt
(4.36)
60
4 Systeme von Massenpunkten und Impulserhaltungssatz Diese Beziehung heißt Raketen-Gleichung oder Ziolkowski-Gleichung (nach K. E. Ziolkowski, 18571935). Wir fragen nach der Geschwindigkeit der Rakete. Division durch m ergibt die Beschleunigung
r dv
a
m + dm
r v Tr
vTr dm m dt
(4.37)
Auf der rechten Seite stehen zwei negative Größen, so dass die Beschleunigung einen (zu fordernden) positiven Wert besitzt. Die Geschwindigkeit der Rakete wird damit
-dm > 0
v
Abb. 4.7: Rakete der Masse (m + dm) nach dem Start
³ adt
vTr ³
1 dm dt vTr ln m C . m dt
(4.38)
Die Integrationskonstante folgt aus der Anfangsbedingung m = m0 für v = 0
0 vTr ln m0 C
(4.39)
C vTr ln m0 In (4.38) eingesetzt, ergibt sich
v vTr ln
m0 ; m
m0
mTr mNutzl .
(4.40)
Die Endgeschwindigkeit ist erreicht, wenn der gesamte Treibstoff verbrannt ist:
m o mNutzl ; v max vTr ln
mTr mNutzl . mNutzl
(4.41)
Typische Geschwindigkeiten der Treibstoffgase liegen bei einigen km/s. Beispiel:
v max 5 vTr const .
o
mTr 150 m Nutzl
(4.42)
4 Systeme von Massenpunkten und Impulserhaltungssatz
61
Zusammenfassung x An einem System von Massenpunkten können sowohl Kräfte von außen angreifen als auch solche zwischen den Massenpunkten wirken. Erstere bezeichnen wir kurz als äußere Kräfte, letztere als innere Kräfte. Sind die äußeren Kräfte gleich null, so bleibt der Gesamtimpuls des Systems erhalten. G x Der Schwerpunkt oder Massenmittelpunkt R (t ) ist das mit den einzelnen Massen mi gewichtete Mittel der Ortskoordinaten. Für zwei Massenpunkte gilt
G R (t )
1 G G m1r1 (t ) m2 r2 (t ) m1 m2
Bei Anwesenheit äußerer Kräfte bewegt sich der Schwerpunkt eines Systems von Massenpunkten so, als ob die Gesamtmasse in ihm vereinigt wäre und alle äußeren Kräfte direkt in ihm angriffen. x Der Impulserhaltungssatz spielt eine wichtige Rolle bei Stoßprozessen. Wir unterscheiden zwischen elastischen und inelastischen Stößen. Elastische Stöße liegen vor, wenn die kinetische Energie der Stoßpartner vor dem Stoß gleich der nach dem Stoß ist. Die Endgeschwindigkeiten v i zweier Körper der Masse mi ergeben sich in diesem Fall zu
v 1
m m2 2m2 v2 1 v1 m1 m2 m1 m2
v 2
2m1 m m2 v1 1 v2 . m1 m 2 m1 m2
x Beim vollkommen inelastischen Stoß haften die Körper aneinander; ein Teil ihrer kinetischen Energie wird in nicht-mechanische Energie umgewandelt. Die Geschwindigkeiten werden
v 1 v 2
m1 v1 m2 v 2 . m1 m2
x Eine Anwendung des Impulserhaltungssatzes ist der Raketenantrieb. Aus der Raketengleichung folgt für die Beschleunigung einer Rakete der anfänglichen Masse (m + dm)
a
vTr dm ; m dt
vTr ist die Geschwindigkeit der ausgestoßenen Treibstoffgase.
62
4 Systeme von Massenpunkten und Impulserhaltungssatz
Übungsaufgaben 1. Ein Ball trifft mit der Geschwindigkeit v0 = 5m/s auf eine schiefe Ebene; deren Kippwinkel D = 30° beträgt. a) Skizzieren Sie den weiteren Bewegungsverlauf; b) Wo trifft der Ball die schiefe Ebene zum zweiten Mal? 2. Ein Tennisspieler schlägt einen ihn mit einer Geschwindigkeit von 100 km/h erreichenden Ball (m = 57 g) mit einer Geschwindigkeit von 120 km/h in die gleiche Richtung zurück. Wie groß ist die Kraft auf den Tennisschläger während der 4 ms dauernden Berührung? 3. Bei der Uranspaltung entstehen schnelle Neutronen, die zur Auslösung weiterer Spaltprozesse abgebremst werden müssen. Das geschieht hauptsächlich durch elastische Stöße in einem Moderator. a) Welches Material ist dazu am geeignetsten? Welchen Bruchteil seiner kinetischen Energie kann ein Neutron dabei maximal an den Moderatorkern mit dem Atomgewicht A abgeben? Welches Material ist besonders geeignet? b) Wie groß ist dieser Bruchteil bei Verwendung von Graphit als Moderator und wie viele Stöße sind mindestens nötig, um die Energie des Neutrons auf das 10-6- fache zu reduzieren? 4. Berechnen Sie den Schwerpunkt einer homogenen, massiven Viertelkreisscheibe mit dem Radius R. 5. Ein ruhender 236Urankern zerfällt in zwei Bruchstücke mit den Massen 140mu und 90 mu. Die Differenz der kinetischen Energien nach und vor der Spaltung, Q, beträgt 190 MeV. Bestimmen Sie die Energie und die Geschwindigkeit der beiden Bruchstücke. 6. Ein zunächst in Ruhe befindlicher Kern zerfällt radioaktiv unter Abgabe eines Elektrons mit dem Impuls von 9,22 10-21 mkgs-1 sowie eines Neutrons mit dem Impuls von 5,33 10-21 mkgs-1, das im rechten Winkel zum Elektron abgegeben wird. a) In welcher Richtung stößt der Rest-Kern zurück? b) Wie groß ist sein Impuls? c) Wie groß sind die Geschwindigkeiten und die kinetische Energie des zurückgebliebenen Kerns, wenn dessen Masse 3,90 10-25 beträgt?
G 7. Im Laborsystem stoßen zwei Teilchen mit den Massen m1,2 und den Geschwindigkeiten v1,2 inelastisch zusammen (Einfangreaktion). Das neue Teilchen bewegt sich danach mit der G Schwerpunktsgeschwindigkeit vS weiter. a) Zeigen Sie, dass für die Differenz Q der kinetischen Energien vor und nach dem Stoß im G G G 2 gilt, wobei µ die reduzierte Masse und v12 = v1 × v 2 sind. Wie groß Laborsystem Q - 0,5 P v12 ist die kinetische Energie im Schwerpunktsystem?
4 Systeme von Massenpunkten und Impulserhaltungssatz
63
b) Betrachten Sie jetzt den Fall, dass zwei Autos mit den Massen m1 =1000 kg und G m2 =1500 kg jeweils mit der Geschwindigkeit v frontal zusammenprallen. Berechnen Sie die kinetischen Energien vor und nach dem Stoß im Laborsystem und vergleichen Sie die Differenz mit der kinetischen Energie im Schwerpunktsystem für v = 15 bzw. 30 km/h. Welches Ergebnis erhalten Sie für den Fall m2 = m1?
5
Der Drehimpulserhaltungssatz
5.1 Drehimpuls eines Massenpunktes und Drehmoment Bisher haben wir Translationsbewegungen eines oder mehrerer Massenpunkte untersucht. Jetzt wollen wir uns Drehbewegungen zuwenden. Zunächst beschränken wir uns auf einen einzelnen G Massenpunkt. Ein solcher befinde sich im Abstand r vom Nullpunkt (Abb. 5.1). Der Massenpunkt beschreibe um letzteren eine kreisförmige Bahn mit der Winkelgeschwindigkeit Z . Seine Bahngeschwindigkeit ist
G G dr v dt
r l
(5.1) r v
und sein Impuls
G G p m v; v c.
Die Bahngeschwindigkeit hängt bei konstanter Winkelgeschwindigkeit vom Abstand zum Drehzentrum ab. Es ist daher zweckmäßig, G eine neue Größe einzuführen, die sowohl r G wie p enthält. Letzteres leistet der Drehimpuls des Massenpunktes. Er ist definiert als G G das Vektorprodukt aus r und p :
G G G G G l r u p mr u p G G G l mrv sin )(r , v)
m
(5.2)
r r 0
Abb. 5.1: Ein Massenpunkt der Masse m auf einer krummlinigen Bahn besitzt bezüglich des Drehzentrums O den Drehimpuls G G G l = ruv
(5.3)
G G G Der Vektor l steht senkrecht auf der durch r und v aufgespannten Ebene. Er hat seinen G G G größten Wert, wenn p und r aufeinander senkrecht stehen; er wird null, wenn p parallel zu G r a 2 b 2 ist. Seine Richtung ist durch die Rechte-Hand-Regel festgelegt: Zeigen die Finger G der rechten Hand in Drehrichtung, weist der Daumen in die Richtung von l . Wir lassen nun G eine Kraft F auf den Massenpunkt wirken. Dadurch ändert sich der Drehimpuls. Nach (5.3) gilt
G dl dt
d G G (r u p) dt G G dr G G dp ( u p) (r u ) . dt dt
(5.4)
66
5 Der Drehimpulserhaltungssatz
G G Der erste Term ist null, da (dr dt ) & p ist. Also gilt
G dl dt
G G dp ru dt
G oder mit dem Grundgesetz der Mechanik, F
G dl dt
G G r uF
(5.5a) G dp dt ,
(5.5b)
G G Da die Drehimpulsänderung ebenfalls von zwei Vektorgrößen abhängt, nämlich von r und F , führen wir für die rechte Seite wiederum eine neue Größe ein, die Drehmoment genannt wird.
G dl dt
G D ,
(5.6)
G G G D: r u F
(5.7)
wobei
Die Beziehung (5.6) heißt Drehimpulssatz:
Die zeitliche Änderung des Drehimpulses eines Massenpunktes ist gleich dem wirkenden Drehmoment. Der Drehimpulssatz stellt eine zweckmäßige Form der Newtonschen Bewegungsgleichung (des Grundgesetzes der Mechanik) für Drehbewegungen dar. Sie erleichtert häufig die G Berechnung der Bahnkurve des Massenpunktes. Die Dimensionen und Einheiten von D und G l sind
> D @ > r @> F @ 1Nm = 1 J >l @ > D @>t @ 1 Js
(5.8)
Anwendungsbeispiel: Auf einer gelagerten Welle ist konzentrisch eine Trommel befestigt (Abb. 5.2). Das eine Ende eines auf ihr aufgewickelten Fadens ist über eine Umlenkrolle mit einem Körper verbunden. G G Dieser übt eine Gewichtskraft F G aus. Oberhalb des oberen Lagers ist eine dünne Stange
67
5 Der Drehimpulserhaltungssatz
G durch die Welle gesteckt. Im Abstand r befindet sich eine Kugel der Masse m, die durch die G G Kraft G die Geschwindigkeit v erhält. Gesucht wird der Drehwinkel M in Abhängigkeit der Zeit. Dabei soll die Masse der Trommel vernachlässigt werden. Ferner möge deren Radius r´ sehr klein sein gegenüber r.
G dl dt
G D
G mit l
r r
G G mrv mr Z , ( r const ) (v A r ) G dl mr 2 d Z ; D const , da r c, F const 2
r v r r¢
(5.9)
m
Einsetzen von dl und D führt zu
dZ D dt dZ D D; dt mr 2 (D Winkelbeschleunigung )
r G
mr 2
(5.10)
³ dZ D ³ dt C1 Z
dM 1 D t C1 ; M D t 2 C1t C2 . dt 2
Abb. 5.2: Anwendung des Drehimpulssatzes auf ein im Abstand r vom Zentrum rotierendes Teilchen der Masse m
Die Konstanten können aus den Anfangsbedingungen bestimmt werden. Zurück zur Bewegungsgleichung. Von besonderem Interesse ist der Fall, dass das Drehmoment gleich null ist, denn daraus folgt, dass der Drehimpuls konstant ist.
G G D 0 o l const .
Drehimpulserhaltungssatz
(5.11)
Wenn kein Drehmoment auf den Massenpunkt wirkt, ist der Drehimpuls konstant. G Das Drehmoment ist null für Kräfte, deren Richtung mit der von r übereinstimmt. Solche Zentralkräfte haben wir in Gestalt der Gravitationskraft oder der elektrostatischen Coulombkraft bereits kennen gelernt.
68
5 Der Drehimpulserhaltungssatz
5.2
Drehimpuls eines Systems von Massenpunkten
Wir wollen nun den Erhaltungssatz für den Drehimpuls auf ein System von Massenpunkten erweitern. Wir können etwa die Bewegung der Planeten oder Erdsatelliten denken. Abb. 5.3 G G G zeigt drei Massenpunkte mit den Ortsvektoren r1 , r2 , r3 relativ zu einem beliebigen Bezugspunkt. Auf jeden Körper wirken sowohl innere als auch äußere Kräfte. Die Newtonsche r F1a r F13i
r F2a
r F21i
r F12i r r1
r r2
Abb. 5.3: Zur Erweiterung des Drehimpulserhaltungssatzes auf ein System von N Massenpunkten mit den Abständen ri G vom Drehzentrum. Äußere Kräfte sind mit Fjka bezeichnet,
r r3 r F31i r F3a
r F23i
r F32i
G
innere Kräfte mit Fjik
Bewegungsgleichung für den ersten Massenpunkt lautet
G G G G d G (m1v1 ) F1 F13 F12 F1a dt
(5.12)
G Multiplizieren wir beide Seiten der Gleichung vektoriell mit r1 , so erhalten wir
G G G G G G (r1 u F13 ) (r`1 u F12 ) (r1 u F1a ) d G G m1 (r1 u v1 ) dt
(5.13a)
Analog folgt für die beiden anderen Massenpunkte
G G G G G G (r2 u F23 ) (r2 u F21 ) ( r2 u F2a )
d G G m2 (r2 u v 2 ) dt d G G G G G Ga G G (r3 u F32 ) ( r3 u F31 ) ( r3 u F3 ) m3 (r3 u v3 ) dt
(5.13b,c)
69
5 Der Drehimpulserhaltungssatz G G Addition der drei Gleichungen ergibt unter Berücksichtigung, dass F12 F21 usw.
G
F
12
G G G G G G G G u (r1 r2 ) F23 u ( r2 r3 ) F31 u (r3 r1 )
3 G G ¦ (ri u Fi a )
(5.14)
d§ 3 G G · ¦ mi (ri u vi ) ¸¹ dt ¨© i 1
i 1
G G G Die Kraft F12 wirkt & der Verbindungslinie (r1 r2 ) , also ist das erste Vektorprodukt gleich
null. Aus demselben Grund verschwinden auch die beiden nächsten Terme, so dass 3
G
G
i
i
d§ 3 G G · mi (ri u vi ) ¸ . ¦ ¨ dt © i 1 ¹
¦ (r u F ) i 1
(5.15)
Ein Vergleich der linken Seite mit (5.7) zeigt, dass diese die Summe der Drehmomente bezüglich des Ursprungs darstellt. Das gesamte Drehmoment, das die äußere Kraft auf das System ausübt, ist
G D
3
G
Ga
i
i
¦ (r u F
).
(5.16)
i 1
G Analog stellt die rechte Seite die zeitliche Änderung des Gesamtdrehimpulses L dar.
G L
3
G G
¦ m (r u v ) i
i
i
.
(5.17)
i 1
Also können wir (5.14) schreiben als
G G dL D . dt
(5.18)
Dies ist der Drehimpulssatz für ein System von drei Massenpunkten. Wir können ihn auf eine beliebige Anzahl erweitern, denn die Summation in (6.16) kann auf beliebig große i ausgedehnt werden. (5.18) ist die Grundgleichung für Rotationsbewegungen eines Systems von Massenpunkten. Ist die linke Seite gleich null, so folgt der Drehimpulserhaltungssatz: Ist das Drehmoment null, so ist der Drehimpuls des Systems konstant. G D
G 0oL
const.
(5.19)
70
5.3
5 Der Drehimpulserhaltungssatz
Eine einfache Anwendung – Statisches Gleichgewicht
Wir betrachten einen Waagebalken, dessen Masse wir vernachlässigen wollen (Abb. 5.4). Er G G sei in einem beliebigen Punkt unterstützt. Im Abstand r1 bzw. r2 vom Unterstützungspunkt G G G ( r1 0 ) wirkt die Kraft F1 bzw. F2 . Es herrscht Gleichgewicht, wenn der Waager r r2 r1 balken ruht ( Z 0 ); das ist der Fall, wenn 0 die Summe der Drehmomente verschwindet.
r F2
r F1
2
G
¦D
i
0;
(5.20)
i 1
denn für Abb. 5.4: Statisches Gleichgewicht herrscht, wenn die beiden Drehmomente bezüglich ihres Drehzentrums entgegengesetzt gleich sind
G G D1 D2 0 G G G G (r1 u F1 ) (r2 u F2 ) 0.
(5.21)
Die Kräfte mögen senkrecht zu den Abstandsvektoren gerichtet sein. Damit folgt als Bedingung für statisches Gleichgewicht
r1 F1 r2 F2 0 . F2
5.4
r1 F1 r2
(5.22)
Drehbewegungen starrer Körper
Bisher haben wir den Drehimpuls für ein System von Massenpunkten eingeführt, die sich relativ zueinander bewegen konnten. Wir wollen Letztere jetzt ersetzen durch einen ausgedehnten, beliebig geformten, starren Körper. Wir beschränken uns auf den einfachen Fall einer Kreisbewegung. Ausgangspunkt unserer Überlegungen ist wieder ein einzelner Massenpunkt der Masse mi , der sich ähnlich Abb. 5.2 an einer masselosen Stange im Abstand ri um eine starre Drehachse G bewegen möge (Abb. 5.5). Der Drehimpuls des Massenpunktes bez. des Abstandsvektors ri vom Ursprung ist
G G G G li ri u mi vi o li
G G mi ri vi ; da ri A vi
(5.23)
71
5 Der Drehimpulserhaltungssatz Wir wollen die z-Komponente des Drehimpulses berechnen; gemäß Abb. 5.5 ergibt sie sich zu
§S · li z li cos ¨ -i ¸ mi ri vi sin -i ©2 ¹
r eˆ z , w
(5.24)
Wir führen den senkrechten Abstand rA i des Massen-
r r0i
punktes von der Drehachse ein:
rA i
ri sin -i ;
vi
o
Zi rAi ,
(5.25)
r li
wobei Z die Winkelgeschwindigkeit ist. Damit er folgt
li z
(mi rA i / sin -i )Zi rA i sin -i
Ji
r ri
r vi
(5.26)
li z mi rA2i Zi
Abb. 5.5: Zur Definition des Drehimpulses eines starren Körpers bezüglich seiner Drehachse z
(5.27)
Die Winkelgeschwindigkeit aller Massenpunkte ist gleich, den Index i können wir daher weglassen. Wir beschränken uns zunächst wieder auf die Berechnung der z-Komponente des Drehimpulses. Der gesamte Drehimpuls setzt sich wie in Kap. 5.2 aus der Summe der Einzeldrehimpulse zusammen,
Lz
f
f
¦l
iz
i 1
G G
¦ (m r u v ) i i
i 1 f
i
(5.28a)
z
G
G G
i i
ì
f
G
¦ > m r u (Z u r )@ ¦ > m Z r u (eˆ i
z
i 1
i 1
i
z
G u ri ) @z
(5.28b)
G G G Die Projektion von L auf die z-Achse ist durch das Skalarprodukt Lz eˆz L L cos(eˆz L ) gegeben. Wir erhalten also die z-Komponente des Drehimpulses, indem wir die rechte Seite von (5.28b) skalar mit eˆz multiplizieren:
Lz
f
G
G z u ri )
¦ m Zeˆ (r u (eˆ i
z
i
i 1
f
¦ m Z (eˆ i
z
G G u ri )(eˆz u ri )
(5.28c)
i 1
Das rechte Gleichheitszeichen gilt wegen Regel (A1.24c) der Vektorrechnung. Die Vektoren G eˆz und ri schließen den Winkel - ein, folglich ist
G (eˆz u ri )
ri sin -i .
(5.29)
72
5 Der Drehimpulserhaltungssatz
Also ergibt sich für die z-Komponente des Drehimpulses f
¦ miZ (ri sin -i )2
Lz
i 1
f
2 i Ai
¦m r
Die Summe
f
2 i Ai
¦m r
(5.30)
Z
i 1
wollen wir als Trägheitsmoment I des Körpers bez. der Drehachse
i 1
bezeichnen.
5.5
Trägheitsmoment eines starren Körpers
Zur Ermittlung des Drehimpulses eines starren Körpers müssen wir sein Trägheitsmoment bez. der Drehachse a berechnen.
Ia
f
2 i Ai
¦m r
(5.31)
i 1
In unserem Fall ist a = z. Die Summe in (5.31) können wir in ein Integral umformen: m
Ia
V
2 2 ³ rA dm U ³ rA dV 0
(5.32)
0
Hierin ist U die als konstant angenommene Dichte des Körpers. Wir betrachten zwei Beispiele:
a)
Beispiel 1: Trägheitsmoment einer Scheibe homogener Dichte U (Abb. 5.6a/b).
b)
z
R
d
dr
R
r
Iz
³r
2
2SU d rdr
0
R
2SU d ³ r 3 dr 2SU d 0
Abb. 5.6a,b: Zur Berechnung des Trägheitsmomentes einer Scheibe bezüglich der z-Achse a
UV
R2 2
1 mR 2 2
R4 4
(5.33)
73
5 Der Drehimpulserhaltungssatz
Beispiel 2: Trägheitsmoment einer Vollkugel homogener Dichte bez. einer Drehachse durch den Mittelpunkt (Abb. 5.7). Dazu denken wir uns die Kugel aus einzelnen Scheiben zusammengesetzt. Für den Radius einer Scheibe im Abstand x vom Mittelpunkt gilt
r
R2 x2
(5.34)
Das Volumen der Scheibe ergibt sich aus dem Produkt aus Fläche x Abstand vom Mittelpunkt, also dV S r 2 dx . Durch Multiplikation mit U erhalten wir dm .
dm U dV US r 2 dx US ( R 2 x 2 ) dx
(5.35)
Das Trägheitsmoment der Scheibe ist durch (5.23) gegeben. Durch Einsetzen von (5.35) für dm folgt dI
1 2 1 2 r dm ( R x 2 ) US ( R 2 x 2 ) dx 2 2 (5.36) 1 2 US ( R x 2 ) 2 dx. 2
Integration über x = 0 bis x = R ergibt die Hälfte des Trägheitsmomentes der Kugel. Also müssen wir das Ergebnis mit 2 multiplizieren. Zur Integration wird der Klammerausdruck ausmultipliziert und die einzelnen Terme separat berechnet. I
S m 8R 5 V
15
2 mR 2 , 5
(5.37)
R 2 -x 2 dx x
R S
Abb. 5.7: Zur Berechnung des Trägheitsmomentes einer Vollkugel bezüglich einer Achse durch den Mittelpunkt
wobei wir U m / V und V 4S R 3 / 3 benutzt haben. In Tabelle 5.1 sind die Trägheitsmomente einiger einfacher Körper zusammengestellt. – Zurück zum Drehimpuls. Wir haben oben die zKomponente Lz für den starren Körper berechnet, wobei z die Drehachse ist. Greifen von außen Kräfte am Körper an, so gilt analog (5.18) dLz dt
Dza
(5.38)
Liegt ein abgeschlossenes System vor, so verschwinden äußere Kräfte und es folgt Lz
const .
Die Komponente des Drehimpulses bez. der Drehachse ist konstant.
(5.39)
74
5 Der Drehimpulserhaltungssatz
Bei einem starren, bez. der Drehachse symmetrischen Körper ist aus Symmetriegründen der gesamte Drehimpuls bez. der Drehachse gleich der z-Komponente des Drehimpulses. Im allgemeinen Fall fällt jedoch die Richtung des Drehimpulses nicht mit der Richtung der Winkelgeschwindigkeit zusammen. Beispiel:
r w
r L r r1
m2 r r2
m1
Abb. 5.8: Drehimpuls einer an einer rotierenden Welle schräg befestigten Hantel
5.6
An einer durch zwei Lager geführten Welle ist unter dem Winkel D eine Hantel angebracht (Abb. 5.8), deren Verbindungsstange masselos angenommen werde. Die Hantel rotiere mit der Winkelgeschwindigkeit Z um die z-Achse. Der Drehimpuls des Systems ist
G L
G G G G m`1 (r1 u v1 ) m2 (r2 u v 2 ) .
(5.40)
Die Geschwindigkeiten stehen senkrecht auf der Hantelachse. Bei ihrer Drehung ändert der Drehimpuls dauernd seine Richtung, fällt also nicht mit der Richtung von Z zusammen. Dazu sind Kräfte erforderlich, die von den Lagern aufgebracht werden müssen und diese daher entsprechend beanspruchen. In Kap. 5.8.6 werden wir uns näher mit diesem allgemeineren Fall befassen.
Steinerscher Satz
Im letzten Kapitel haben wir Trägheitsmomente behandelt, bei denen die Drehachse durch den Schwerpunkt verlief. Liegt die Drehachse außerhalb, so scheint die Berechnung des Trägheitsmomentes zunächst schwieriger. In solchen Fällen hilft uns der Steinersche Satz, der das Trägheitsmoment eines Körpers bez. seiner Drehachse durch den Schwerpunkt, Is, mit dem Trägheitsmoment I für eine parallele Achse durch einen beliebigen Punkt A in Beziehung setzt (Abb. 5.9):
I
ma 2 I s
(5.41)
Hierin ist m die Masse des Körpers, und a der Abstand der Drehachse vom Schwerpunkt (J. Steiner, 1796-1863). Der Satz lässt sich folgendermaßen beweisen: Wir wählen ein Koordinatensystem so, dass sich sein Ursprung im Schwerpunkt befindet und die yS-Achse in der Ebene liegt, die durch die beiden Drehachsen gebildet wird. Wie aus Abb. 5.10 ersichtlich, gilt für das Trägheitsmoment des Körpers bezüglich der Achse durch A
IS
f
2 i Ai
¦m r i 1
(5.42)
75
5 Der Drehimpulserhaltungssatz
m1 r1
A
S
a g1 x1
A
a Abb. 5.9: Zur Illustration des Steinerschen Satzes I = ma 2 +IS
S
Abb. 5.10: Zur Ableitung des Steinerschen Satzes
Ist Ui der Abstand eines Massenpunktes von der Achse durch den Schwerpunkt und J i der Winkel zwischen a und Ui , so können wir schreiben
IS
f
¦ m (a i
i 1
2
Ui2 2a Ui cosJ i ) ma 2 I S 2a ¦ mi xi
(5.43)
i
Die Summe auf der rechten Seite ist gleich null, da xi vom Schwerpunkt, d.h. vom Koordinatenursprung aus gezählt wird.
xS :
¦m x /¦m i i
i
i
0.
i
Damit ist der Steinersche Satz bewiesen.
(5.44)
76
5 Der Drehimpulserhaltungssatz
In Tab. 5.1 sind die Trägheitsmomente einiger symmetrischer Körper zusammengestellt.
Körper
Trägheitsmoment I
Reifen oder Ring, d<
mR2
Scheibe oder Zylinder
mR2/2
Modell 2(R-d)
2R Hohlzylinder, d<
mR2
l Stange um ihr Zentrum, d<
ml2/12
Vollkugel
2mR2/5
d
2R d
Hohlkugel, d<
2mR2/3 2(R-d)
Tabelle 5.1: Trägheitsmomente einiger Körper
5 Der Drehimpulserhaltungssatz
5.7
77
Experimentelle Verifikation des Drehimpulserhaltungssatzes: Drehschemel-Versuche
Wir wollen die Erhaltung des Drehimpulses mittels zweier Experimente demonstrieren. 1. Auf einem gut gelagerten, drehbaren Schemel sitze eine Person so, dass ihre Füße den Boden nicht berühren (Abb. 5.11a). In beiden Händen der ausgestreckten Arme halte sie je eine Hantel. Der Schemel wird nun in Drehung versetzt und dann sich selbst überlassen. Der Drehimpuls bleibt also bei Vernachlässigung der Reibung konstant. Er ist nach (5.30) bestimmt
Abb. 5.11a,b: Erhaltung des Drehimpulses. Dieser ist in diesem Fall gleich dem Produkt aus Trägheitsmoment und Winkelgeschwindigkeit a)
b)
durch das Produkt aus Trägheitsmoment und lässt sich prüfen, indem die Person auf dem Drehschemel die Hanteln an sich heran zieht (Abb. 5.11b). Ihre Winkelgeschwindigkeit steigt dabei entsprechend (5.30) deutlich an. 2. Die Person legt die Hanteln beiseite. Sie befinde sich auf dem ruhenden Drehschemel. In dieser Stellung übernimmt sie von außen ein schnell rotierendes Rad mit waagerechter Drehachse (Abb. 5.11c). Person und Rad bilden wieder ein abgeschlossenes System.
Abb. 5.11c,d: Einer auf dem ruhenden Drehschemel sitzender Person wird ein senkrecht zur Drehschemelachse rotierendes Rad übergeben. Die Person bleibt dabei in Ruhe. Kippt sie dagegen die Radachse nach oben, so beginnt sie sich in umgekehrter Richtung zu drehen
c)
d)
Ihr Gesamtdrehimpuls ist konstant. Da das Rad keine Drehimpulskomponente bez. der Drehachse des Drehschemels besitzt, bleibt die Person auf dem Drehschemel weiterhin in Ruhe. Das ändert sich, wenn die Person das Rad um 90° dreht, so dass dessen Drehachse jetzt parallel zu der des Schemels weist (Abb. 5.11d). Da sich der Gesamtdrehimpuls nicht ändern kann, rotiert die Versuchsperson nun entgegen dem Drehsinn des Rades. Das Verhältnis der
78
5 Der Drehimpulserhaltungssatz
Winkelgeschwindigkeiten ist entsprechend (5.30) umgekehrt proportional zu den jeweiligen Trägheitsmomenten bez. der Drehachsen.
ZPers ZRad
I Rad I Pers
5.8 Rotation um freie Achsen Der einfacheren Einsicht wegen haben wir uns in den letzten Abschnitten auf Drehbewegungen eines starren und bez. der Drehachse symmetrischen Körpers beschränkt. Wir erweitern unsere Überlegungen jetzt auf Bewegungen um eine beliebige Achse. Das Trägheitsmoment muss dann durch einen Tensor 2. Stufe (s. Kap. 23 A1.5) dargestellt werden.
5.8.1 Der Trägheitstensor Wir fassen einen beliebig geformten starren Körper ins Auge, der mit der Winkelgeschwindigkeit Z um irgendeine Achse durch seinen Schwerpunkt rotieren möge. Entsprechend (5.23) ist der Drehimpuls li eines Massenelementes 'm, das sich mit der G G G Geschwindigkeit vi Zi u ri bewegt,
G li
G G G G G 'mi (ri u vi ) 'mi (ri u (Zi u ri )) ;
(5.45)
Durch Benutzung der Relation (Kap.23. A1.24c)
G G G G G G G G G A u ( B u C ) ( A C ) B ( A B )C
G li
wird daraus
G G G G G 'mi ^ri 2 Z ( ri Zi ) ri ` .
(5.46)
Der Gesamtdrehimpuls ergibt sich durch Integration über alle Einzeldrehimpulse zu
G L
G2 G
³ ^r
G G G
Z (r Z ) r `dm ;
(5.47)
G
In Komponentenschreibweise lässt sich L schreiben als
Lx
I xxZ x I xyZ y I xzZ z
Ly
I yxZ x I yyZ y I yzZ z
Lx
I zxZ x I zyZ y I zzZ z .
(5.48)
79
5 Der Drehimpulserhaltungssatz Dabei sind die Koeffizienten
I xx I yy I zz
³ (r ³ (r ³ (r
2
x 2 ) dm ; I xy
I yx
³ x y dm ;
2
y 2 ) dm ; I yz
I zy
³ y z dm ;
2
z 2 ) dm ; I xz
I zx
³ x z dm .
(5.49)
In Matrixform wird aus (5.47)
L
IZ,
(5.50)
wobei I entsprechend (5.48) durch den Tensor gegeben ist
I
§ I xx ¨ ¨ I yx ¨I © zx
I xy I yy I zy
I xz · ¸ I yz ¸ I zz ¸¹
(5.51)
Er wird als Trägheitstensor bezeichnet. Die Diagonalelemente, also die Komponenten Ixx,, Iyy und Izz, geben die Trägheitsmomente bezüglich der Rotation um die drei Koordinatenachsen x, y, z an. Als symmetrischer Tensor 2. Stufe stellt I ein Ellipsoid dar. Seine Hauptachsen fallen im Allgemeinen nicht mit den Achsen des vorgegebenen kartesischen Koordinatensystems zusammen. Sie lassen sich jedoch immer durch eine Hauptachsentransformation finden. In diesem neuen Achsensystem, das wir mit xc, y c, z c bezeichnen wollen, lautet die Gleichung des Ellipsoids nach Normierung (s. Anhang A1.97)
x c 2 I a y c2 I b z c 2 I c
1;
(5.52)
Hierin sind a, b, c die drei Hauptachsen des Ellipsoids, also die drei Hauptträgheitsachsen. Die Bezeichnung der Achsen ist so festgelegt, dass
I a d Ib d Ic
gilt.
(5.53)
5.8.2 Freie Achsen Sicher haben Sie schon mal eine Eisläuferin beobachtet, die eine Pirouette drehte. Die Situation ist ähnlich wie in unserem Beispiel 1 zur Drehimpulserhaltung. Durch die Variation ihres Trägheitsmomentes kann die betreffende Person ihre Umdrehungsgeschwindigkeit verändern. Aber es kommt uns jetzt auf etwas Anderes an. Sehen wir von der Reibung zwischen Schlitt-
80
5 Der Drehimpulserhaltungssatz
schuh und Eis ganz ab, so rotiert die Person nicht mehr um eine feste Achse. In einem solchen Fall sprechen wir von der Rotation um freie Achsen. Weitere Beispiele finden wir vor allem im Bereich des Sports und Spiels. Denken wir etwa an einen fliegenden Diskus oder Frisby. Bei geschicktem Abwurf bleibt ihre Lage während des Fluges erhalten, solange sie sich in Rotation befinden. Das ist in Übereinstimmung mit dem Drehimpulserhaltungssatz. Auch die Drehung eines Turmspringers beim Salto erfolgt um eine freie Achse, und zwar um die Achse seines größten Hauptträgheitsmomentes. Zur näheren Erläuterung wollen wir statt des Sportlers einen flachen homogenen Quader betrachten. Seine Kantenlängen seien mit a, b, c bezeichnet und es gelte I a I b I c (Abb. 5.12). a)
b)
c)
? ?
?
a
a b
c
c
b
a b
c
Abb. 5.12: Hauptträgheitsachsen a, b, c eines Quaders. Bei Rotation um die Achse c des größten Trägheitsmomentes bleibt die Lage des Körpers stabil. Gleiches gilt auch bezüglich der Achse a des kleinsten Trägheitsmomentes Wir wollen untersuchen, wie stabil die Rotationen um diese freien Achsen sind. Dazu hängen wir den Quader mittels eines Fadens an eine von einem Motor angetriebene Welle. Es zeigt sich, dass die Rotation um die Achse des größten und des kleinsten Trägheitsmomentes stabil sind, nicht dagegen die um die Achse des mittleren Trägheitsmomentes. Im Fall b) führt der Quader eine Torkelbewegung aus und springt bei hinreichender Umdrehungsgeschwindigkeit um in die Lage der stabilen Rotation um die Hauptachse c, die offenbar die stabilste freie Achse darstellt.
5.8.3 Die Eulerschen Gleichungen Ein starrer Körper, der nur in einem Punkt unterstützt wird und sich um eine beliebige freie Achse dreht, wird als Kreisel bezeichnet. Sind alle drei Hauptträgheitsmomente unterschiedlich, so sprechen wir von einem asymmetrischen Kreisel. Ein Beispiel ist der rotierende Quader mit drei unterschiedlichen Kantenlängen in Abb. 5.12. Sind zwei Hauptträgheitsmomente wie bei einem Quader mit zwei sich gegenüberstehenden quadratischen Flächen gleich, so wird der sich drehende Körper symmetrischer Kreisel genannt. Dazu gehören ferner alle rotationssymmetrischen Körper. Je nachdem I a I b I c oder I a I b I c gilt, sprechen
81
5 Der Drehimpulserhaltungssatz
wir von einem prolaten oder oblaten symmetrischen Kreisel. Sind alle drei Hauptträgheitsmomente gleich, so heißt er sphärischer Kreisel. Zur Behandlung der Bewegung eines Kreisels gehen wir vom Drehimpulssatz aus. In einem raumfesten Koordinatensystem lautet er, wenn wir den Drehimpuls des Massenpunktes in (5.18) durch den des starren Körpers L analog zu (5.28) ersetzen,
G dL dt
G D.
(5.54)
Die Drehimpulsänderung in einem mit dem Kreisel fest verbundenen Koordinatensystem bezeichnen wir durch einen Strich. Sie schreibt sich also
G dLc dt
G D.
(5.55)
Zwischen beiden Größen besteht nach den Überlegungen in Anhang 3 die Verknüpfung
d ... dt
d '... Z u ... dt
o
G dL dt
G G G dL c (Z u L ) . dt
(5.56)
Setzen wir dies in (5.54) ein, so erhalten wir
D
G G G dL c (Z u Lc) . dt
(5.57a)
Diese Beziehung trägt den Namen Eulersche (Kreisel-) Gleichung (L. Euler, 1707-1783). In Komponentenschreibweise lautet sie
Da Db Dc
d Za ( I c I b )Zc Zb dt d Zb Ib ( I a I c )Za Zc dt d Zc Ic ( I b I a )Zb Za dt Ia
(5.57b)
Die drei gekoppelten Differentialgleichungen sind nicht linear. Daher ist es im Allgemeinen schwierig, ihre Lösungen zu finden. Eine Ausnahme macht der freie symmetrische Kreisel, dem wir uns jetzt zuwenden wollen.
82
5 Der Drehimpulserhaltungssatz
5.8.4 Der kräftefreie symmetrische Kreisel Ein symmetrischer Kreisel besitzt zwei identische Hauptträgheitsmomente. (Abb. 5.13). Wir bezeichnen das Moment parallel der Symmetrieachse mit I & und das dazu senkrechte mit I A :
I x I y :I A , I z :I & .
a
(5.58)
a Die z-Achse heißt bei solchen rotationssymmetrischen Körpern auch Figurenachse. Der Kreiselkörper sei so austariert, dass er einschließlich der Stange, die zur späteren Aufnahme eines Körpers der Masse m dient, ohne die Einwirkung äußerer Kräfte im Gleichgewicht ist. Es gilt dann
Drehachse
G dL dt
Abb. 5.13: Beispiel eines symmetrischen Kreisels und
G D 0 o L
I & Z& eˆ&
const.
(5.59)
Ein derartiger Kreisel heißt kräftefreier Kreisel. (5.59) bedeutet
Die Symmetrieachse eines kräftefreien Kreisels, der um seine Symmetrieachse rotiert, steht fest im Raum. Fällt die Zˆ -Richtung nicht mit der Figurenachse zusammen, so führt der Kreisel eine komplizierte Bewegung aus. Zu seiner Beschreibung müssen wir zwischen drei verschiedenen Achsen unterscheiden. Dies sind: Die raumfeste Drehimpulsachse, die nicht raumfeste, momentane Drehachse Zˆ und die Figurenachse des Kreisels, die nur in dem obigen Spezialfall (5.59) raumfest ist. Die Eulerschen Gleichungen für den kräftefreien Kreisel sind
0 0 0
d Za ( I & I A ) Zc Zb ; dt d Zb IA ( I A I & ) Z a Zc ; dt d Zc Ic o Z& const. dt IA
(5.60a-c)
Die Indizes a, b, c bezeichnen wieder die Hauptträgheitsachsen des Kreisels. Zur Lösung der ersten beiden Gleichungen differenzieren wir (5.60a) nach der Zeit:
83
5 Der Drehimpulserhaltungssatz
IA
d 2Za d Zb ( I & I A ) Zc 2 dt dt
0
(5.61)
Auflösen der zweiten Gleichung, (5.60b), nach d Zb / dt und Einsetzen in (5.60a) führt zu 2
d 2Za ( I & I A ) 2 Zc Za dt 2 I A2
0
(5.62)
Setzen wir zur Vereinfachung
( I& I A )2
Zc2
:2 ,
(5.63)
d 2Za : 2Za 2 dt
0.
(5.64)
I A2 so wird (5.62) zu
Wie wir in Kap. 11 sehen werden, ist dies die Schwingungs-Differentialgleichung des harmonischen Oszillators ( : { k ). Sie wird gelöst durch den Ansatz
Za
A sin : t B cos : t .
Setzen wir als Anfangsbedingung Za (t = 0) = 0, so erhalten wir
Za
A sin : t .
(5.65a)
Einsetzen von Z2 in (5.60b) liefert schließlich
Zb
A cos : t .
(5.65b)
G Für die Frequenz Z ergibt sich also
G
Z
A (sin : t eˆa cos : t eˆb ) Z3 eˆc .
(5.66)
Vom Koordinatensystem des Kreisels aus gesehen ist das die Gleichung eines Kreises um die Figurenachse. Der bei der Drehung entstehende Kegel heißt Rastpolkegel. Der im gleichen System gemessene Drehimpuls ist
G L
I A A(sin : t eˆa cos : t eˆb ) I & Z3 eˆc .
(5.67)
84
5 Der Drehimpulserhaltungssatz
Die Drehimpulsachse rotiert demnach mit der gleichen Frequenz : , aber mit anderer Amplitude um die Figurenachse. Sie führt eine Nutationsbewegung aus. Wir berechnen noch die Winkel zwischen den drei Achsen. Dazu treffen wir folgende Festlegungen:
)(eˆc , Lˆ ) D ;
)(eˆc , Zˆ )
ß.
(5.68)
G Zur Ermittlung von D multiplizieren wir eˆc skalar mit L :
G eˆc L
( I A A)2 ( I &Zc )2 cos D
L cos D
(5.69)
Andererseits gilt mit (5.67)
G eˆc L
I A A(sin :t eˆc eˆa cos :t eˆc eˆb ) I&Z3 eˆc eˆc
I & Zc
(5.70)
Gleichsetzen der beiden Beziehungen (5.69) und (5.70) ergibt
Rastpolkegel
r L
cos D r w
Figurenachse
Gangpolkegel
tan E
A
Zc
.
(5.71)
1 1 tan 2 D
(5.72)
lässt sich ((5.71) vereinfachen zu
tan D Abb. 5.14: Nutation eines symmetrischen Kreisels
( I A A) 2 ( I &Zc ) 2
Mit der trigonometrischen Beziehung
cos D Nutationskegel
I &Zc
IA A . I & Zc
(5.73a)
Auf analoge Weise ergibt sich für tan E (5.73b)
Es ist zu beachten, dass je nach Form des symmetrischen Kreisels D ! E oder D ß sein kann (Abb. 5.14).
85
5 Der Drehimpulserhaltungssatz
5.8.5 Die Eulerschen Winkel Bisher haben wir die Kreiselbewegung im körperfesten Koordinatensystem formuliert. Um auch die Bewegung im raumfesten System beschreiben zu können, benötigen wir die Beziehung zwischen diesen beiden Koordinaten. Es ist üblich, dazu einen Satz von drei zeitabhängigen Winkeln zu wählen, welche die Orientierung der Achsen des körperfesten (x´,y´,z´) zum raumfesten Koordinatensystem (x,y,z) beschreiben. Sie werden als Eulersche Winkel bezeichnet (Abb. 5.15).
z1¢
z1¢¢
z = z1¢
g
y1¢
x1¢
y¢¢¢
y¢¢ J
y1¢
y
j
x
z1¢¢¢ = z1¢¢
z1¢¢¢ = z1¢
x1¢ = x1¢¢
x1¢¢
y1¢¢
x1¢¢¢
Abb. 5.15: Zur Definition der drei Eulerwinkel
Dabei ist auf die Reihenfolge der Drehoperationen zu achten. Hier folgen wir der im Allgemeinen befolgten Schrittfolge. 1.
Drehung des körperfesten Systems um den Winkel M gegen den Uhrzeigersinn
x1´ x cos M y sin M ; y1´ x cos M y sin M ; z1´ z ; in Matrixschreibweise
§ x1´ · ¨ ¸ ¨ y1´ ¸ ¨ z ´¸ © 1 ¹ 2.
§ cos D ¨ ¨ sin D ¨ 0 ©
sin D cos D 0
0 ·§ x · ¸¨ ¸ 0 ¸¨ y ¸ ; ¸ 1 ¸¨ ¹© z ¹
(5.74a)
Drehung der neuen x1´-Achse (als Knotenlinie bezeichnet) gegen den Uhrzeigersinn um den Winkel -:
§ x1´´ · ¨ ¸ ¨ y1´´ ¸ ¨ z ´´ ¸ © 1 ¹
0 0 ·§ x1´ · §1 ¨ ¸¨ ¸ ¨ 0 cos - sin - ¸¨ y1´ ¸ ; ¨ 0 sin - cos - ¸¨ z ´ ¸ © ¹© 1 ¹
(5.74b)
86 3.
5 Der Drehimpulserhaltungssatz Drehung um die z1´´-Achse gegen den Uhrzeigersinn um den Winkel J :
§ x1 · ¨ ¸ ¨ y1 ¸ ¨z ¸ © 1¹
§ cos J ¨ ¨ sin J ¨ 0 ©
sin J cos J 0
0 ·§ x1´´ · ¸¨ ¸ 0 ¸¨ y1´´ ¸ . ¸ 1 ¸¨ ¹© z1´´ ¹
(5.74c)
Das Endresultat ergibt sich durch Multiplikation der drei Drehmatrizen
G rKf
DJ D- DM
G DrRf , wobei
§ sin M cos - sin J cos M cos J ¨ D ¨ sin M cos - cos J cos M sin J ¨ sin M sin ©
cos M cos- sin J sin M cos J cos M cos - cos J sin M sin J cos M sin -
sin - sin J · ¸ sin - cos J ¸ cos - ¸¹ (5.75)
5.8.6 Der Kreisel unter dem Einfluss einer Kraft: Präzession des symmetrischen Kreisels Wir befestigen jetzt ein Gewicht auf der Stange, so dass auf den Kreisel eine nach unten gerichtete Kraft wirkt.
F
G mg
mgeˆz .
(5.76)
Befindet er sich in Ruhe, so wird seine Achse auf Grund des wirkenden Drehmomentes nach unten kippen.
G D
G mg (r u eˆz ) mgr (eˆz u eˆ& ) .
(5.77)
Versetzen wir jetzt den Kreisel in eine Drehung um seine zunächst waagerecht angenommene Figurenachse, so kippt die Kreiselachse keineswegs, sondern beschreibt eine waagerechte
G
G
Kreisbahn. Dieses Phänomen wird als Präzession bezeichnet. Sie folgt aus D dL / dt , dem Drehimpulssatz. Das Drehmoment steht nach (5.7) senkrecht auf eˆz und eˆ& und weist in unserem Beispiel nach hinten (Abb. 5.15a):
G G G D A L, F .
87
5 Der Drehimpulserhaltungssatz
r L
r r D r w ,eˆ P ,L
r r
r r F = mg = mgeˆ ^
r L(t+dt)
j
r L(t)
Pressluft
r dL
Abb. 5.16: Kräfte, Drehmoment und Drehimpuls beim symmetrischen Kreisel a) Kugelkreisel mit Gewicht b) Drehimpulsänderung durch äußeres Drehmoment c) Präzedierender Kinderkreisel Folglich gilt
G dL
G D dt .
(5.78)
G Da das Drehmoment senkrecht auf eˆ& steht, ändert sich der Betrag von L nicht, wohl aber
seine Richtung: nach der Zeit dt hat sich die Figurenachse um den Winkel dM gedreht. Sie G G weicht also in der durch L und D gebildeten Ebene nach hinten aus. Nach Abb. (5.13b) gilt
dM
dM dt
dL L
ZPr
1 dL L dt
D L
mgr I &Z&
(5.79)
Bildet die Kreiselachse einen Winkel D mit der Vertikalen, so wirkt auf den Kreisel ein Drehmoment mit dem Betrag
D
mg r sin D .
(5.80)
Die Drehimpulsänderung ist in diesem Fall
dL
L sin D dM .
(5.81)
88
5 Der Drehimpulserhaltungssatz Bilden wir
Bahn der Figurenachse
Bahn der Drehimpulsachse
ZPr
D mgr sin D dL / dM L sin D , mgr mgr L I &Zc
(5.82)
so finden wir das gleiche Ergebnis wie vorher. Rotiert der Kreisel nicht um seine Figurenachse, so wissen wir aus dem vorhergehenden Abschnitt, dass er beim Fehlen Abb. 5.17: Nutationsbewegung der äußerer Kräfte eine Nutationsbewegung um Figurenachse die raumfeste Drehimpulsachse vollführt. Lassen wir jetzt ein äußeres Drehmoment zu, so präzediert die Drehimpulsachse mit der Frequenz ZPr um eine zur Kraftrichtung parallele Achse durch den Aufhängungspunkt. Die Figurenachse ihrerseits führt eine Nutationsbewegung um die präzedierende Drehimpulsachse aus (Abb. 5.17). Als 1. Anwendungsbeispiel wenden wir uns der Erde zu. Obgleich sie einen Kreisel mit völlig freier Drehachse darstellt, ist sie nicht kräftefrei. Da sie an den Polen abgeplattet ist und ihre Ekliptik um 23,5° geneigt ist, erzeugt vor allem die Sonne, aber auch der Mond durch ihre Gravitationskraft ein Drehmoment. Dieses bewirkt eine Präzessionsbewegung des oblaten Kreisels, als den wir die Erde ansehen wollen (Abb. 5.18).
Erdachse
wE S1
zur Sonne
23,5°
S2
Abb. 5.18: Die Erde als symmetrischer Kreisel; S1 und S2 sind die Schwerpunkte der beiden Wulsthälften; die Pfeile geben die auf sie wirkenden Kräfte an
Der Durchmesser des Äquators beträgt 12.756 km, der Poldurchmesser ist mit 12713 km um 43 km kleiner. Der Unterschied ist eine Folge der Zentrifugalkräfte. Zur weiteren Diskussion ist es hilfreich, sich die Erde als ideale Kugel mit aufgesetzten Wülsten, die am Äquator ihre größte Dicke erreichen, vorzustellen. Wir beschränken uns im Folgenden auf die Wirkung der Sonne. Den Wulst teilen wir in eine der Sonne zugewandte und eine der Sonne abgewandte Hälfte ein. Die Schwerpunkte der beiden Teile seien S1 und S2. Im Erdmittelpunkt halten sich
89
5 Der Drehimpulserhaltungssatz
G G Zentripetalkraft FZpetal und Zentrifugalkraft FZfugal die Waage. Das gilt aber nicht mehr für die
Schwerpunkte der beiden Wulsthälften. Im Schwerpunkt S1 des der Sonne zugewandten Teilwulstes ist die Anziehungskraft der Sonne größer als im Mittelpunkt der Erde, aus demselben Grund aber die Zentrifugalkraft kleiner. Im Schwerpunkt S2 liegen die Verhältnisse umgekehrt; es dominiert die Zentrifugalkraft. Das resultierende Kräftepaar führt zu der bereits oben angesprochenen Präzessionsbewegung der Erdachse. Eine Periode wird in 26000 Jahren durchlaufen. Diese Zeitspanne definiert das Platonische Jahr Zur quantitativen Analyse der Erdbewegung müssen der Einfluss des Mondes und der übrigen Planeten berücksichtigt werden. Sie führen zu kurzperiodischen Schwankungen der Präzessionsfrequenz, die in der Astronomie (fälschlicherweise) als Nutation bezeichnet werden. Aber es tritt auch eine echte Nutationsbewegung auf, die dadurch zustande kommt, dass Figurenachse und momentane Drehachse nicht genau zusammenfallen. Die Periodendauer T lässt sich in guter Näherung aus der bekannten Rotationsfrequenz der Erde zu T = 304 Tagen berechnen. Als 2. Anwendungsbeispiel überlegen wir uns die Wirkungsweise eines Kreiselkompasses. Wie der Name besagt, kann dieser zu Navigationszwecken herangezogen werden. Als Kreiselkörper dient ein schnelllaufender Elektromotor. Wie in Abb. 5.19 skizziert, ist seine Achse in einem Bügel so fixiert, dass sie sich immer senkrecht zum Radiusvektor der Erde befindet. Der Bügel selbst kann sich um eine vertikale Achse frei drehen. Der Schwerpunkt liegt Fester unterhalb des Aufhängepunktes. Da die AufDrehbarer Bügel hängeachse starr mit der Erde verbunden ist, dreht Bügel G sie sich mit deren Rotationsfrequenz ZE . Dadurch wirkt auf den Kreisel ein Drehmoment senkrecht zur Kreisel Papierebene, das zu einer Drehung der Kreiselachse G führt bis diese parallel zu ZE steht, also in NordSüd-Richtung weist. Ost G G G Dc I &ZKr u ZE . (5.83) West In diesem Fall wird das Drehmoment null.
5.9
Abb. 5.19: Kreiselkompass
Rotationsenergie
Vollführt ein Körper eine Drehbewegung, so besitzt er kinetische Energie. Wir bezeichnen sie als Rotationsenergie Erot. Betrachten wir einen Massenpunkt der Masse mi im Abstand r von der Drehachse (Abb. 5.19). Seine Rotationsenergie ist
Erot i
1 1 mi vi2 mi ri 2Z 2 2 2
(5.84)
Wir gehen nun zum ausgedehnten starren Körper über, d.h. wir müssen über die Beiträge der unendlich vielen Massenpunkte summieren bzw. integrieren.
90
5 Der Drehimpulserhaltungssatz
Erot
m
1 2 2 Z r dm 2 ³0
f
¦ Erot i i 1
1 2 Z I 2
ri R
Dmi r vi
Abb. 5.20: Zur Ableitung der Rotationsenergie eines starren Körpers
1 2 Za I a Zb2 Ib Zc2 I c 2 L2a L2 L2 b c 2Ia 2Ib 2Ic
Der letzte Ausdruck zeigt wieder die formale Äquivalenz G G zwischen p und L sowie von m und I . Besteht der rotierende Körper aus einem axialsymmetrischen Kreisel, so ergibt sich die Rotationsenergie zu
Erot
Lineare Bewegung
1 1 L&Z& LAZA 2 2
L2& 2 I&
L2A 2I A
(5.86)
Rotationsbewegung
Ortskoordinate
G x bzw. r
Winkelkoordinate
M
Geschwindigkeit
G v
Winkelgeschwindigkeit
Z
Masse
m
Trägheitsmoment
I
Kraft
G F
Drehmoment
G D
G G ruF
Impuls
G p
Drehimpuls
G L
G G rup
Bewegungsgleichung
G D
G Bewegungsgleichung F Kinetische Energie
Ekin
(5.85)
G mv
G dp dt m 2 v 2
p2 2m
Rotationsenergie
G
rot Ekin
G dL dt I 2 Z 2
Tabelle 5.2: Vergleich einiger Größen bei linearer und rotatorischer Bewegung
L2 2I
91
5 Der Drehimpulserhaltungssatz
Zusammenfassung x Der Drehimpuls eines Massenpunktes, der sich im Abstand vom Drehpunkt befindet, ist definiert als
G G l: ru p
G G mr u v .
Sein Betrag ist
G G G l mr vsin )(r , v) . G x Wirkt im Abstand r vom Drehpunkt eine äußere Kraft auf den Massenpunkt, so entsteht ein Drehmoment, das definiert ist als
G G G D: r u F . x Auf Grund des Drehmomentes ändert sich der Drehimpuls des Massenpunktes
G dL , dt
G D
Drehimpulssatz.
Ist das Drehmoment gleich null, so ist der Drehimpuls konstant.
G G D 0 o L
const.
Drehimpulserhaltungssatz
x Für ein System von Massenpunkten gelten analoge Beziehungen. x Für einen ausgedehnten starren Körper, der sich mit der konstanten Winkelgeschwindigkeit Z um die z-Achse bewegt, gilt
Lz
I zZ z .
Die Größe Iz heißt Trägheitsmoment des Körpers bez. der Drehachse z m
I
2 ³ rA dm 0
V
U ³ rA2 dV ; 0
rA = senkrechter Abstand des Massenelementes von der Drehachse, U = konstante Dichte des Körpers.
92
5 Der Drehimpulserhaltungssatz
x Der Steinersche Satz verknüpft das Trägheitsmoment eines Körpers bez. seiner Drehachse durch den Schwerpunkt, IS, mit dem Trägheitsmoment I bez. einer parallelen Achse im Abstand a vom Schwerpunkt
I
I S ma 2 .
x Die Drehachse eines symmetrischen Kreisels ( I x
I y : I A ; I z : I & ) bleibt raumfest,
wenn das äußere Drehmoment verschwindet. Ist es ungleich null, so führt die Kreiselachse eine Präzessionsbewegung aus mit der Frequenz
Z
G D G L
mgr ; I &Z&
r = Abstand des Angriffspunktes der Kraft vom Nullpunkt des Kreiselkörpers. G G Die Frequenz ist unabhängig vom Winkel )(r , F ) .
G x Die Rotationsenergie eines Körpers, der die Winkelgeschwindigkeit Z und den DrehG impuls L besitzt, ist gegeben durch
Erot
1 GG LZ . 2
Für einen axialsymmetrischen Körper gilt
Erot
1 1 L&Z& LAZA . 2 2
Übungsaufgaben 1. Die beiden äußeren Kreisscheiben eines Jojos aus Holz U
0,9 103 kg/m3 haben einen
Durchmesser 2R = 10 cm und eine Dicke d = 2 cm. Die Holzachse besitze einen Durchmesser von 2r = 1 cm und sei 1 mm lang. Ein Meter eines sehr dünnen, masselos angenommenen Fadens findet einlagig auf der Achse Platz. a) Welchen Durchmesser hat der Faden? b) Das so aufgewickelte Jojo werde am Fadenende aufgehängt und losgelassen. Geben Sie die Bewegungsgleichung für den Schwerpunkt an. c) Nach welcher Zeit ist das Jojo wieder oben angelangt? d) Welche Kraft wirkt auf den Aufhängepunkt? e) Welche Impuls- und Drehimpulsänderung erfährt das Jojo im Umkehrpunkt?
93
5 Der Drehimpulserhaltungssatz 2. Zwei dünne Scheiben mit den Radien r1,2 = 10 cm und den Massen m1,2 = 7 kg bilden, verbunden durch eine lange dünne Stange der Länge l = 17 cm und der Masse m3 = 3 kg, eine Hantel. a) Berechnen Sie mit Hilfe des Steinerschen Satzes das Trägheitsmoment der Hantel um die z-Achse; b) Die Hantel rotiere um die z-Achse mit einer Frequenz von 10 s-1. Wie groß ist der Drehimpuls? c) Sie wollen die rotierende Hantel in 5 s abbremsen. Wie groß muss die negative Winkelbeschleunigung sein? d) Welchen Wert muss das zugehörige Drehmoment haben?
3. In einem abgeschlossenen System befinden sich drei Teilchen mit den Massen m1 = 2 kg, m2 = 1kg, m3 = 4 kg. Das erste Teilchen hat eine Geschwindigkeit vy =5 m/s. Das zweite Teilchen bewegt sich in eine Richtung, die einen Winkel von –30° mit der x-Achse bildet; seine Geschwindigkeit beträgt 9 m/s. Wie groß ist die Geschwindigkeit des dritten Teilchens? 4. Ein symmetrischer hölzerner Kreiskegel U
0,9 103 kg/m3 habe die Länge h = 10 cm
und den Basisdurchmesser 2r = 5 cm. a) Berechnen Sie für eine Rotation um die Figurenachse das Trägheitsmoment. b) Berechnen Sie den Abstand des Schwerpunktes S des Kegels von der Kegelspitze. Anleitung: Stellen Sie sich den Kegel senkrecht zur Achse aus vielen dünnen Kreisscheiben bestehend vor. c) Der Kreisel rotiere mit einer Drehzahl von 50 s-1 um die Figurenachse. Wie groß ist sein Drehimpuls? d) Zeigen Sie, dass die Präzessionsfrequenz, mit welcher der Kreisel unter dem Einfluss der Schwerkraft rotiert, unabhängig vom Winkel ist, welche die Figurenachse mit der Vertikalen bildet. 5. Auf einer ebenen Autobahn löst sich ein defekter Reifen vom Rad eines LKW, der eine Geschwindigkeit von 100 km/h hat. Betrachten Sie den Reifen als Ring mit einem Durchmesser von 0,8 m. Welche Energie ist notwendig, um den Ring (Masse = 20 kg) auf v = 0 abzubremsen? 6. Auf einer konkav gekrümmten Bahn rollt eine kleine Kugel hinunter und verlässt diese an ihrem Ende horizontal. Der Start der zunächst ruhenden Kugel hat eine Höhe von hstart = 7 m, das Bahnende eine solche von hend = 2 m. In welchem Abstand vom Fußpunkt schlägt die Kugel auf den waagerecht verlaufenden Boden auf?
6
Gravitation
6.1
Newtonsches Gravitationsgesetz
Im Weltbild von Aristoteles (384-322 v. Chr.) und (etwas später) auch von Ptolemäus (ca. 85-165) stand die Erde im Zentrum der Welt. Zwar hatte bereits Aristarchus von Samos (ca. 260 v. Chr.) postuliert, dass sich die Planeten um die Sonne bewegen, er konnte sich damit aber nicht durchsetzen. Der Wandel hin zu einem heliozentrischen Weltbild begann erst mit Kopernikus (1473-1543). Die nächsten ca. 100 Jahre wurden durch die Beobachtungen bzw. Berechnungen dreier Forscher geprägt: T. Brahe (1546-1601), trug umfangreiches Beobachtungsmaterial zur Planetenbewegung zusammen. Es stand ihm dabei noch kein Fernrohr zur Verfügung. Als erster setzte Galilei ein von ihm weiter entwickeltes Teleskop ein. J. Kepler (1571-1630), der Assistent von Brahe war, analysierte nach dessen Tod die Daten und leitete aus ihnen die Gesetze der Planetenbewegungen ab. Die Ableitung des ihnen zu Grunde liegenden Gravitationsgesetzes gelang schließlich 1666 Newton. Wir wollen hier das Newtonsche Gravitationsgesetz an den Anfang stellen. Es lautet (vgl. Kap. 3.4.2)
G F
G
G mM r G ; r2 r
G
6.67 1011 Nm 2 /kg 2 .
(6.1a)
Die Gravitationsfeldstärke ist
EG
G F m
G
G M r G ; r2 r
(6.1b)
Die Gravitationskonstante G wurde erst 131 Jahre nach Entdeckung des Gravitationsgesetzes durch H. Cavendish (1731-1810) experimentell bestimmt. – Wie bereits erwähnt, handelt es G sich bei (6.1a) um eine Zentralkraft, denn sie wirkt längs des Verbindungsvektors r vom Zentrum der Masse m1 zu dem der Masse m2.
6.2
Ermittlung der Gravitationskonstante
Zur Ermittlung der Gravitationskonstante G diente Cavendish folgende Versuchsanordnung: Zwei kleine Kugeln der Masse m befinden sich an den Enden einer leichten (als masselos angenommenen) Stange (Abb. 6.1), die im Schwerpunkt der beiden Massen drehbar aufgehängt ist. Ein Spiegel in der Mitte der Stange bildet zusammen mit dem Lichtzeiger eine empfindliche Drehwaage. Den kleinen Kugeln gegenüber stehen zwei große Kugeln der Masse M. Zur Vermeidung von Störungen durch Luftbewegungen befindet sich die ganze Anordnung in einem luftdichten Glaskasten. Verlagern wir nun die großen Kugeln aus der Anfangsstellung A in die Stellung B, so wirkt auf jede kleine Kugel die Kraft mit dem Betrag
96
6 Gravitation
F
ma
m
s t2
2G
mM r2
o G
sr 2 . 2 Mt 2
(6.1c)
Der Faktor 2 rührt daher, dass der Aufhängedraht vor dem Umsetzen der großen Kugeln bereits bis zum Höchstwert verdrillt war. Deswegen ist nach deren Verlagerung die Beschleunigung doppelt so groß wie in dem Fall, dass die Kugeln den kleinen Kugeln aus großer Entfernung bis auf den Abstand r genähert werden.
Aufsicht
Seitenansicht
M
m
B r
M
m
vom Laser
A
Abb. 6.1: Drehwaage zur Messung der Gravitationskonstante Alle auf der rechten Seite stehenden Größen lassen sich messen. Die Methode wurde in der Folgezeit besonders von Eötvös für Präzisionsmessungen ausgebaut.
6.3 Die Keplerschen Gesetze der Planetenbahnen Aus dem Gravitationsgesetz folgen die drei Keplerschen Gesetze. 1. Die Planetenbahnen sind Ellipsen, in deren einem Brennpunkt die Sonne steht. 2. Der Abstandsvektor von der Sonne zum Planeten überstreicht in gleichen Zeitabschnitten gleiche Flächen („Flächensatz“). 3. Die Kuben der großen Halbachsen verschiedener Ellipsenbahnen verhalten sich wie die Quadrate ihrer Umlaufzeiten. Zur Berechnung der Planetenbahnen gehen wir vom Drehimpulserhaltungssatz aus. Dieser hat uns gezeigt, dass die Bahnen in einer Ebene verlaufen. Es ist daher zweckmäßig, von
Gravitation
97
kartesischen Koordinaten zu ebenen Polarkoordinaten M , r überzugehen. Der Drehimpuls eines Massenpunktes der Masse m im Abstand r vom Drehzentrum ist in ihnen dem Betrage nach gegeben durch
L
mr 2
dM dt
const .
(6.2)
Dabei haben wir angenommen, dass die Masse M im Drehzentrum sehr viel größer als die des um ihn kreisenden Planeten ist. Anderenfalls sind alle Größen auf das Schwerpunktsystem zu beziehen. Ferner gilt der Energieerhaltungssatz der Mechanik. Die kinetische Energie schreibt sich
Ekin
m 2 v 2
m 2 (v r vI2 ) , 2 2 2 ½ m °§ dr · 2 § dM · ° r ®¨ ¸ ¨ ¸ ¾. 2 ¯°© dt ¹ © dt ¹ ¿°
(6.3)
Mit Hilfe von (6.2) können wir den Energieerhaltungssatz schreiben als 2
E pot
m § dr · L2 ¨ ¸ 2 © dt ¹ 2mr 2
E
const.
(6.4)
Diese Gleichung lösen wir nach dr/dt auf und erhalten
2§ L2 ¨¨ E E pot m© 2mr 2
dr dt
· ¸¸ . ¹
(6.5)
Für die andere Variable, M , folgt aus (6.2)
dM dt
L . mr 2
(6.6)
Division durch die darüber stehende Gleichung ergibt eine Beziehung zwischen d M und dr:
dM dr
L m
1 r
2
2§ L2 · E E ¨ ¸ pot 2mr 2 ¹ m©
.
(6.7)
98
6 Gravitation
Unser Ziel ist es, eine Beziehung zwischen M und r zu gewinnen. Dazu müssen wir (6.7) integrieren. Erinnern wir uns, dass die potentielle Energie in unserem Fall gegeben ist durch E pot GM m / r . Das bedeutet, dass wir ein elliptisches Integral vor uns haben. Seine Lösung findet sich in Integraltafeln. Es ergibt sich
M
§ L2 GM m 2 ¨ r arccos ¨ ¨ (GM m 2 ) 2 2mEL2 ¨ ©
· ¸ ¸ . ¸ ¸ ¹
(6.8)
wobei nach der Integration der linken Seite als Anfangsbedingung M0 0 gesetzt wurde. Nach dem 1. Keplerschen Gesetz ist die Bahn die Randkurve eines Kegelschnitts. Wir führen daher versuchsweise zwei Abkürzungen ein.
a
GMm ; 2E
H
1
2 EL2 . G 2 M 2m3
(6.9)
Berücksichtigung in (6.8) ergibt
§ a (1 H 2 ) r · ¸. Hr © ¹
M arccos ¨
Diese Gleichung lösen wir noch nach r auf, wobei wir a(1 H 2 )
r
p , 1 H cos M
(6.10)
p setzen.
(6.10a)
Für positive H, also negative Gesamtenergie, ist dies, wie behauptet, die Gleichung einer Ellipse. Das setzt ein negatives Potential voraus, wie es mit dem Gravitationspotential gegeben ist. Für hinreichend große Geschwindigkeiten kann H < 1 werden. Dann ist die Bahnkurve eine Hyperbel. Für H 1 ergibt sich eine Parabel. Die Exzentrizität der Planetenbahnen ist mit Ausnahme denen von Merkur und Pluto nahezu null. Für die Erdbahn beträgt sie H = 0,0167. Das zweite Keplersche Gesetz ist eine Folge des Drehimpulserhaltungssatzes. Zu seiner Ableitung gehen wir von der Näherung aus, dass sich der Planet der Masse m2 um die Sonne als Ursprung bewegt. Die elliptischen Planetenbahnen werden also durch Kreisbahnen ersetzt. Wegen der geringen Exzentrizität ist das eine gute Näherung. Da das Gravitationsgesetz, wie gesehen, eine Zentralkraft darstellt, ist das Drehmoment null und somit der Drehimpuls konstant.
6 Gravitation
G dL dt
99
G D
G G G G r u F (r ) 0 o L
const.
(6.11)
r = Abstand des Zentrums des Planeten von dem der Sonne. Wir haben zu beweisen, dass die beiden vom Fahrstrahl pro Zeit überstrichenen Flächen A1 und A2 (s. Abb. 6.2) gleich sind:
dA1 dt
dA2 . dt
(6.12)
Beweis: Die Fläche des Dreiecks in Abb. 6.2 ist
A
r r d r1 = v1 dt
r r1 (t+dt) h
rh . 2
(6.13)
r r1 (t)
Benutzen wir diesen Ausdruck in (6.12), so ergibt sich
G G 1 r1 v1 dt sin )(r1 , v1 ) 2 dt
G G 1 r2 v 2 dt sin )(r2 , v 2 ) 2 dt
Abb. 6.2: Zum 2. Keplerschen Gesetzes
(6.14a)
G G G G r1 m v1 sin )(r1 , v1 ) r2 m v 2 sin )(r2 , v 2 ) G L1
G L2
(6.14b) (6.15)
G Da aber L const nach Richtung und Betrag, ist das zweite Keplersche Gesetz damit bewiesen. Unter den gleichen Voraussetzungen können wir auch die Aussage des dritten Keplerschen Gesetzes leicht verifizieren. Für die Kraft auf den Planeten gilt das Grundgesetz der Mechanik.
F
maz
m
v r
2
2
m § 2S r · ¨ ¸ ; r© T ¹
(6.16)
aZ ist die Zentripetalbeschleunigung. Andererseits wirkt als Kraft die Gravitationskraft.
G F
G FGrav.
C'
m , r2
C ' konst.
(6.17)
100
6 Gravitation
In (6.7) eingesetzt ergibt
4S 2 r 2 m m C' 2 2 T r r 3 1 r C' :C 2 4S 2 T r3 T2
const. , unabhängig von der Masse.
(6.18)
(6.19)
6.4 Bestimmung der Masse von Himmelskörpern Mit der Kenntnis der Gravitationskonstante lässt sich die Masse von Himmelskörpern bestimmen, wie schon von Cavendish erkannt wurde. Das Gewicht mKg eines Körpers ist gleich der Kraft, mit der er von der Erde angezogen wird. Sind mK, mE die Massen eines Probekörpers bzw. der Erde und rE der Erdradius, so gilt
Fg
mK g
G
mK mE rE2
(6.20)
woraus sich für die Erdmasse ergibt
mE
g rE2 G
(6.21)
Die Größen auf der rechten Seite der Beziehung haben die Werte g = 9,81m/s2, rE 6370 km, G 6, 67 1011 Nm 2 /kg 2 . Damit erhalten wir für die Erdmasse
mE
6 1024 kg
(6.22)
Die mittlere Dichte berechnet sich aus diesen Daten zu 5520 kg/m3. Wir können den Wert mit der bekannten Dichte der Erdkruste vergleichen. Dabei zeigt sich, dass der obige Wert etwa doppelt so groß ist. Also muss die Dichte im Erdinneren erheblich größer sein als die mittlere Dichte. Neben dem Wert für die Erdmasse lässt sich aus dem Gravitationsgesetz auch ein Wert für die Sonnenmasse ermitteln. Wir ersetzen die Erdbahn durch eine Kreisbahn mit dem Radius r = 14.96 107 km. Dies entspricht dem mittleren Abstand Sonne-Erde, der aus astronomischen Beobachtungen folgt. Wie bei der Ableitung des dritten Keplerschen Gesetzes erläutert, gilt
6 Gravitation
F
mS
101
FG
mE az
mE
v2 r
G
mE mS r2
v2 r . G
(6.23)
(6.24)
Die Umlaufgeschwindigkeit der Erde ist
v
2S r T
29,8 km/s
(6.25)
Damit folgt für die Sonnenmasse
mS
2,0 1030 kg | 3.33 105 mE
(6.26)
Analog lässt sich etwa die Masse des Mondes bestimmen.
6.5
Swing-by-Methode für Weltraumsonden
Wir wollen ein mechanisches System betrachten, das aus der Sonne als Bewegungszentrum, der Erde, mindestens einem weiteren Himmelskörper und einem zusätzlichen Planeten besteht. Das Ziel ist, mit möglichst geringem Energieaufwand den zweiten Planeten mit einer von der Erde gestarteten Raumsonde zu erreichen. Das leistet die Swing-by-Methode. Sie besteht darin, dass die Trägerrakete so gestartet wird, dass sie zunächst vom Gravitationsfeld eines zweiten Himmelskörpers (HK) (von diesem aus betrachtet) auf eine Hyperbel-Bahn gezwungen wird. Je näher der Vorbeiflug erfolgt, desto größer ist der Ablenkungswinkel. Die Geschwindigkeit der Sonde nach Passieren des Schwerefeldes des HK ist natürlich gleich der beim Eindringen. Von der Sonne aus betrachtet, hat diese aber erheblich zugenommen, denn HK hat einen Teil seiner Bewegungsenergie auf ihn übertragen. Der Vorgang kann mit einem auf eine flache Scheibe zufliegenden Ball verglichen werden, die sich auf ihn zu bewegt und von dieser der Ball elastisch zurückprallt (s. Kap. 4).
Ergänzung: Rutherfordstreuung als Beispiel einer Potentialstreuung Die gerade qualitativ beschriebene Ablenkung einer Sonde beim Vorbeiflug an einem Himmelskörper könnten wir formal als einen Streuprozess in dessen Potentialfeld ansehen. Allerdings ist das nicht üblich. Wir wollen jetzt an die Ableitung der Planetenbahnen anknüpfen und quantitativ die Streuung eines elektrisch geladenen Partikels im abstoßenden Coulombfeld eines gleichnamig geladenen zweiten Körpers untersuchen. Ein berühmtes
102
6 Gravitation
Beispiel dieser Potentialstreuung ist die Rutherfordstreuung (E. Rutherford, 1871-1937), bei der positiv geladene He-Kerne (D-Teilchen) beim Durchgang durch Materie am positiven Kernpotential gestreut werden. Bis auf das Vorzeichen ist Letzteres formal mit dem Gravitationspotential identisch:
V
1 q1 q2 . 4SH 0 r
Der Vorfaktor entspricht formal der Gravitationskonstante, die Ladungen den Massen der Himmelskörper. Die Gesamtenergie ist aber positiv und daher die Bahnkurve eine Hyperbel (Abb. 6A.1). Wir wollen den Ablenkungswinkel - eines D-Teilchens ermitteln, also den Winkel zwischen den beiden Asymptoten. Es gilt
r b
F1
F2
- 2Mf
cos
a Abb. 6A.1: Zur Rutherfordstreuung
2
S
sin Mf
H 2 1 H
o
-
S
2
2
Mf
(6.A1)
1 cos 2 Mf
H 2 1 cos Mf
H 2 1 sin . 2
(6.A2) Hierbei haben wir benutzt, dass mit M o Mf r o f strebt , was nur möglich ist, wenn der Nenner in (6.10a) null wird. Damit wird unter Berücksichtigung von (6.9)
cot
2
2 EL2 . q12 q22 m
(6.A3)
Die Gesamtenergie können wir mittels der Anfangsgeschwindigkeit v f ausdrücken, da die potentielle Energie in weiter Entfernung vom Kern null ist. Infolge des Drehimpulserhaltungssatzes gilt ferner
L
G G G G m v r sin(r , v) m v f rf sin(rf , vf ) m vf b ,
G G wobei wir rf sin(rf , vf )
b gesetzt haben (s. Abb. A2.1).
(6.A4)
6 Gravitation
103
Durch Einsetzen in (6.A3) ergibt sich
cot
m v f2 b . q1 q2
2
Die bereits in Kap. 4 eingeführte Größe b wird als Stoßparameter bezeichnet. Sie bildet gleichzeitig die kleinere Halbachse der Hyperbel. Durch die von Rutherford angeregten und von Geiger (H. W. Geiger, 1882-1945) und Marsden durchgeführten Streuexperimente und deren quantitativer Deutung gelang es, die Verteilung der negativen und der positiven Ladungen im Atom zu ermitteln. Dabei zeigte sich, dass der größte Teil der Masse eines Atoms im positiv geladenen Kern konzentriert ist. Sein Radius lässt sich zu
rK | r0 A1/ 3 ; r0 | 1,3 1015 m abschätzen. A ist die Massenzahl des betreffenden Kerns. Es ist ein glücklicher Zufall, dass die klassische Streuformel mit dem Ergebnis der quantenmechanischen Ableitung übereinstimmt.
Zusammenfassung x Körper der Masse m1 und m2 , die sich im Abstand r voneinander befinden, ziehen sich G nach dem Gravitationsgesetz mit einer Kraft F an:
G F
G mm r G m2 a G 1 2 2 G ; r r
G
6.67 1011 Nm 2 /kg 2
x Aus dem Gravitationsgesetz folgen die Gesetze der Planetenbewegung: 1. Die Planetenbahnen sind Ellipsen, in deren einem Brennpunkt die Sonne steht. 2. Der Abstandsvektor von der Sonne zum Planeten überstreicht in gleichen Zeitabschnitten gleiche Flächen („Flächensatz“). 3. Die Kuben der großen Halbachsen verschiedener Ellipsenbahnen verhalten sich wie die Quadrate ihrer Umlaufzeiten. Das zweite Keplersche Gesetz ist eine Folge des Drehimpulserhaltungssatzes. x Mit Hilfe des Gravitationsgesetzes können Massen von Himmelskörpern bestimmt werden
104
6 Gravitation
Übungsaufgaben 1. Die Gezeiten werden hauptsächlich vom Mond verursacht (der Einfluss der Sonne und die Eigenrotation der Erde sollen vernachlässigt werden). a) Welchen Abstand hat die Achse der gemeinsamen Bewegung von Erde und Mond vom Erdmittelpunkt? b) Welche Beschleunigung zusätzlich zur Schwerebeschleunigung wirkt in den Punkten A, B und C? mE = 6 1024 kg, RE = 6400 km, mM = 7,4 1022 kg, Abstand Erde-Mond = 384000 km) c) Wieso gibt es auf der Erde zweimal in 24 h Ebbe und Flut. Unterscheiden sich die beiden Flutberge? Wie entsteht eine Springflut? 2. Das Gewicht eines Mannes beträgt 80 kg. Wie viel würde er auf der Sonnenoberfläche wiegen, wie viel auf dem Mond, auf den Planeten Venus und Jupiter? Wie groß wären die Fluchtgeschwindigkeiten von den drei letztgenannten Himmelskörpern? 3. Berechnen Sie größenordnungsmäßig den Ereignishorizont eines Schwarzen Loches (mS.L. = 2 1031 kg). Innerhalb dieses Radius gelangt kein Signal vom Stern in die Außenwelt. Welche Längenänderung erfährt eine 2m lange Spiralfeder (als masselos angenommen), die mit ihrem einen Ende an der Decke eines Raumschiffes befestigt ist und an deren unteren Ende ein Körper der Masse m = 1 kg eingehängt ist. Das Raumschiff umkreise das Schwarze Loch im Abstand R = 5 106 m. Im entspannten Zustand ist die Feder 2 m lang; die Federkonstante beträgt k = 400 N/m. Was ergibt ein analoges Experiment auf der Erde? 4. Wie groß ist die Kraft auf einen Probekörper, der sich in einem Schacht senkrecht zur Oberfläche der als homogen angenommenen Erdkugel befindet? 5. Der Rhein habe eine Fließgeschwindigkeit von 7,2 km/h und eine Breite von 500 m. Sein Flussbett verlaufe genau von Süd nach Nord. Welchen Winkel bildet die Wasseroberfläche des Rheins (in Ost-West-Richtung) gegenüber der Horizontalen? Um wie viel unterscheidet sich der Wasserstand im Osten und im Westen? 6. Ein Stein werde am Äquator senkrecht nach oben geworfen. Wo landet er? Was passiert in unseren Breiten?
7
Relativistische Dynamik
Bis jetzt haben wir bei der Besprechung der Dynamik immer vorausgesetzt, dass die vorkommenden Geschwindigkeiten klein gegenüber der Lichtgeschwindigkeit sind. In diesem Fall gilt die Galilei-Transformation, die besagt, dass zwei Beobachter in Inertialsystemen S und S´, die sich relativ zueinander geradlinig bewegen, bei ihren Beobachtungen zum gleichen Ergebnis kommen (vgl. Kap. 2). Nun gibt es aber zahlreiche Experimente in der Hochenergiephysik, wie z.B. Stoßprozesse von schnellen Elektronen oder Protonen, die zeigen, dass solche Experimente nicht auf der Grundlage der Galilei-Transformation beschrieben werden können. Wenn sich die beiden Beobachter in S und S´ miteinander widerspruchslos verständigen wollen, müssen sie, wie im Rahmen der Kinematik bereits gezeigt, die LorentzTransformation benutzen. Im Folgenden wollen wir uns mit den wichtigsten Aspekten der relativistischen Dynamik beschäftigen.
7.1
Relativistischer Impuls und relativistische Massenzunahme
Den Impuls wollen wir so definieren, dass er sich für kleine Geschwindigkeiten, v << c, auf G G den klassischen Impuls p m v reduziert. Außerdem fordern wir, dass der Impulserhaltungssatz weiterhin gelten soll. Wir betrachten als spezielles Beispiel einen Stoßprozess in einem Bezugssystem S, in dem zwei Teilchen gleicher Masse (im Ruhezustand gemessen) mit entgegengesetzten Geschwindigkeiten aufeinander zu fliegen. Die Teilchen mögen elastisch streifend miteinander stoßen, so dass die x-Komponenten ihrer Geschwindigkeiten erhalten bleiben und die y-Komponenten sich umkehren (s. Abb. 7.1a). Der Gesamtimpuls vor und nach dem Stoß ist gleich null.
vy
r v
S¢
S
y
-v x
r v
y¢
y
-v y
r r v = vx
-v x r v
vx
x z
vy -v y
O z
O¢
x, x ¢
r v
vx Abb. 7.1: a) Die Geschwindigkeitskomponenten beim streifend elastischen Stoß zweier Kugeln in der xy-Ebene in einem vorgegebenen Koordinatensystem S, b) Stoß im Koordinatensystem S´, das sich gegenüber S mit der Geschwindigkeit vx bewegt Wir betrachten nun ein Koordinatensystem S´ (Abb. 7.1b), das sich gegenüber S mit der Geschwindigkeit v = vx bewegt; vx ist dabei die x-Komponente der Geschwindigkeit des
106
7 Relativistische Dynamik
Teilchens 1. Nach dem relativistischen Additionstheorem der Geschwindigkeiten, (2.20b), wissen wir, dass die von einem in S ruhenden Beobachter gemessene Geschwindigkeitskomponente vy von einem in S´ ruhenden Beobachter
v 'y
vy 1 vx v / c2
1
v2 c2
(7.1)
gemessen wird. Für vx haben wir vx(1) und vx(2) einzusetzen. Sie besitzen ein unterschiedliches Vorzeichen, also ergeben sich auch für vy´(1) und vy´(2) verschiedene Werte. Da ja die x´-Komponente der Geschwindigkeit jedes Teilchens beim Stoß gleich bleibt, folgt, dass sich die Geschwindigkeiten und damit die Impulse jetzt unterscheiden, Impulserhaltung also nicht gewährleistet ist. Also müssen wir die y-Komponente des Impulses anders formulieren. Wir wissen, dass eine Verschiebung ' y in y-Richtung unter der Lorentz-Transformation in den beiden Bezugssystemen übereinstimmt (s. Kap. 2.4.2). Die zum Durchfliegen der Strecke 'y erforderliche Zeit 't hängt dagegen vom Bezugssystem ab. Anstatt eine laborfeste Uhr zur Messung von 't zu benutzen, ist es zweckmäßig, sich auf eine vom Teilchen mitgeführte Uhr zu beziehen, die das zugehörige Eigenzeit-Intervall 'W des Teilchens misst. Wie wir in Kap. 2 gesehen haben, errechnen die Beobachter in S und der in S´ den gleichen Wert 'W . Folglich stimmt die Größe 'y / 'W in beiden Bezugssystemen überein. Nach (2.14) unterscheiden sich 't und 'W um den Zeitdilatationsfaktor
'W
§ v2 · 't ¨1 2 ¸ . © c ¹
(7.2)
Also ergibt sich
'y 'W
m/m 0
4
'y 't 't 'W
'y 't
1
1 v
2
/ c2
(7.3)
Definieren wir also den relativistischen Impuls als
2 0
0.0 0.4
0.8 v/c
Abb. 7.2: Relativistische Massenzunahme
G p:
G m0 v 1 v2 / c2
,
(7.4)
so gilt die Erhaltung der y-Komponente des Impulses in jedem Bezugssystem, das gegenüber dem Laborsystem eine konstante Geschwindigkeit in x-Richtung besitzt. Wegen der automatischen Erhaltung der xKomponente des Impul-ses in unserem Beispiel folgt, dass der relativistische Impuls eine Erhaltungsgröße ist. Dies gilt auch unabhängig von unserem speziellen Beispiel. Die Masse m0 ist die im Rahmen der Newtonschen Mechanik für v << c eingeführte Masse. Sie wird deshalb
7 Relativistische Dynamik
107
als Ruhemasse bezeichnet. Dagegen wollen wir als relativistische Masse eines Teilchens der Geschwindigkeit v die Größe
m:
m0
(7.5)
1 v2 / c2
definieren. Bei Annäherung von v an c wächst die Masse m über alle Grenzen (Abb. 7.2). Experimentell ist (7.5) gut bestätigt. Für kleine Geschwindigkeiten, v << c, können wir den Nenner entwickeln und nach dem ersten Glied abbrechen
m(v c)
m0 | m0 . 1 (1/ 2)v 2 / c 2
(7.6)
Entsprechend unserer eingangs aufgestellten Forderung gilt also für v << c
G p
7.2
G m0 v .
(7.7)
Relativistische Kraft
Im Rahmen der Newtonschen Mechanik gilt
G F
G dp . dt
(7.8)
Diese Beziehung bleibt auch in der relativistischen Mechanik gültig, aber bei hohen Geschwindigkeiten ist die Kraft nicht mehr parallel zur Beschleunigung. Das erkennen wir, G wenn wir den Impuls oben einsetzen und die Komponenten von dp / dt bilden. Wir wollen zunächst eine geradlinige Bewegung betrachten. Dann brauchen wir nur die Beträge zu berücksichtigen.
F
d ( mv) dt
· m0 v d§ ¨ ¸ 2 2 dt © 1 v / c ¹
m0
1 v
2
/c
3 2 2
a.
(7.9)
Diese Gleichung tritt bei geradliniger Bewegung an die Stelle der Beziehung F = ma. Jetzt betrachten wir die gleichförmige Kreisbewegung, d.h. der Betrag der Geschwindigkeit bleibt konstant, aber die Richtung ändert sich.
108
7 Relativistische Dynamik
Statt (7.9) gilt
G F
m0
1 v
2
/c
1 2 2
G dv dt
(7.10)
Der letzte Term ist jetzt die Zentripetalbeschleunigung, ihren Betrag haben wir in Kap. 1 zu v2/r abgeleitet; die Größe r ist der Radius der Kreisbahn.
FN
m0
Fz
1 v
2
/ c2
v2 r
(7.11)
Im allgemeinen Fall der krummlinigen Bewegung können wir die Beschleunigung zerlegen in die Tangentialbeschleunigung aT und die Normalbeschleunigung aN = v2/r. Die Kraftkomponenten entlang der Tangente und senkrecht zur Bahn sind nach (7.10) und (7.11)
FT
m0
1 v
2
/c
3 2 2
aT
FN
m0
1 v
2
/c
1 2 2
aN
(7.12, 13)
Damit folgt für die resultierende Kraft unter Berücksichtigung von
G F
FT eˆT FN eˆN
G F
J 3 m0 a ®
° v 2 § v 2 · ½° eˆ ¨1 2 ¸ eˆN ¾ 2 T °¯ c © c ¹ °¿
(7.14)
Das gleiche Resultat erhalten wir durch direkte Ausführung von (7.8).
FT r F
aT r a
aN
Abb. 7.3: Bei Geschwindigkeiten v/c d 1 fällt die Richtung der Beschleunigung eines Teilchens nicht mehr mit der Richtung der Kraft zusammen
7 Relativistische Dynamik
109
Da die Koeffizienten, mit denen aT bzw. aN bzw. eˆT und eˆN multipliziert sind, unterschiedlich sind, ist die Kraft nicht mehr parallel zur Beschleunigung (Abb. 7.3). Die Gleichung G G G G F ma gilt also nicht mehr, weiterhin aber F dp / dt .
7.3
Kinetische Energie, Gesamtenergie, Masse-Energie-Äquivalenz
Auf Grund der veränderten relativistischen Bewegungsgleichung ist anzunehmen, dass sich auch der klassische Ausdruck für die kinetische Energie, mv2/2, bei hohen Geschwindigkeiten ändert. Wir wollen einen solchen Ausdruck ableiten. Wir gehen genau so vor wie früher (s. Kap. 3). Es gilt nach (7.8)
G F
· m0 v d§ ¨ ¸ . dt © 1 v 2 / c 2 ¹
(7.8)
G Die Kraft verrichtet längs des Wegelementes dr die Arbeit
G G Fdr
dW G denn dr
m0
G d§ v ¨ dt © 1 v 2 / c 2
G § v m0 d ¨ 2 2 © 1 v / c
· G ¸ dr ¹
·G ¸v , ¹
(7.15)
G v dt . v
G G Fdr ³
Ekin
0
G · v G § m0 ³ v d ¨ ¸. 2 2 0 © 1 v / c ¹ v
(7.16)
Durch partielle Integration ergibt sich nach einer kleinen Umformung
Ekin
m0
2
G v
v
v2 1 v / c
2
m0 c ³
2
c v
0
2
G dv
(7.17a)
Aus einer Formelsammlung entnehmen wir für diesen Integraltyp x
³ 0
xdx 2
a x
2
^
`
a2 x2 a ,
(8.17b)
So dass sich ergibt
Ekin
m c 2 m0 c 2 .
(7.18)
110
7 Relativistische Dynamik
Für kleine Geschwindigkeiten, v << c, lässt sich die Wurzel wieder in eine binomische Reihe entwickeln, und es ergibt sich unter Vernachlässigung von v2 gegenüber c4
Ekin (v c) m0 v 2 / 2 .
(7.19)
Das ist aber gerade die Newtonsche kinetische Energie. Die Größe
E
Ekin m0 c 2
mc 2
(7.20)
wollen wir die relativistische Gesamtenergie nennen, m0c2 heißt Ruheenergie, da sie die Energie E für v = 0 darstellt. Die Gesamtenergie des Teilchens ist nach obiger Definition die Summe aus kinetischer Energie und Ruheenergie; die potentielle Energie ist in ihr nicht enthalten. Die Gesamtenergie ist eine Erhaltungsgröße, unabhängig vom Bezugssystem. (7.20) zeigt, dass jedem Körper der Masse m eine Energie zugeordnet werden kann.
E
mc 2 .
(7.21)
Nach (7.18) kann die Zunahme an kinetischer Energie als Massenzuwachs angesehen werden. Da verschiedene Energieformen ineinander umwandelbar sind, lässt sich die Beziehung dahingehend erweitern, dass jeder Energie 'E einer Massenänderung entspricht.
'E
( 'm) c 2 .
(7.22)
Dieser Ausdruck spielt in der Kernphysik eine bedeutende Rolle. Relativistische Gesamtenergie und relativistischer Impuls sind durch eine wichtige Beziehung miteinander verknüpft, die wir zum Abschluss noch ableiten wollen. Dazu bilden wir den Quotienten aus den beiden Größen und erhalten für v
E
G v cp
c2 G p E
(7.23)
Gl. (7.20) kann damit geschrieben werden (Abb. 7.4)
m0 c2 Abb. 7.4: Relativistische Gesamtenergie und Impuls eines Teilchens der Ruhemasse m0, das G sich mit der Geschwindigkeit v bewegt
E
m0 c 2 c4 p2 1 2 2 E c E 2 c2 p2
o 1
m0 c 2
m0 c 2 E 2 c2 p2
;
(7.24)
7 Relativistische Dynamik
E
111
c m02 c 2 p 2 .
(7.25)
Bei sehr hohen Geschwindigkeiten, v | c, können wir in (7.23) v durch c ersetzen. Es ergibt sich
E cp .
(7.26)
Das gleiche Ergebnis folgt aus (7.259 für ein Teilchen mit der Ruhemasse Null:
E
cp .
Die Geschwindigkeit eines solchen Teilchens ist dann nach (7.23) v = c. Ein Teilchen mit der Ruhemasse null kann sich nur mit Lichtgeschwindigkeit bewegen. Photonen besitzen also keine Ruhemasse. Erst kürzlich wurde nachgewiesen, dass Neutrinos (ungeladene Elementarteilchen) eine sehr geringe Masse besitzen.
Zusammenfassung x In der Newtonschen Mechanik ist der Impuls eines Teilchens definiert als Produkt aus G der Masse m0 und der Geschwindigkeit v . Die Masse ist unabhängig von der Geschwindigkeit gleich der Ruhemasse.
G p
G m0 v .
Dieser Ausdruck muss bei hohen Geschwindigkeiten ersetzt werden durch
G p
G mv ;
m wird als relativistische Masse bezeichnet und ist definiert als
m:
m0 1 v2 / c2
.
112
7 Relativistische Dynamik
x Die Kraft ist wie in der Newtonschen Mechanik definiert als
G F
G dp , dt
G aber sie ist nicht mehr parallel zur Beschleunigung gerichtet. Die Beziehung F bei hohen Geschwindigkeiten nicht mehr.
G ma gilt
x Anstelle der Newtonschen kinetischen Energie eines Teilchens, Ekin = mv2/2, gilt bei hohen Geschwindigkeiten
Ekin
(m m0 ) c 2 .
Jedem Teilchen der Masse m ist eine relativistische Gesamtenergie zugeordnet
E
Ekin m0 c 2
mc 2
Jeder Änderung der Energie entspricht einer Änderung der Masse. Die Geschwindigkeit eines Teilchens als Funktion des Impulses und der Gesamtenergie kann ausgedrückt werden als
G v
c2 G p. E
Daraus folgt: Zwischen der relativistischen Gesamtenergie und dem relativistischen Impuls besteht die Verknüpfung
E
c m02 c 2 p 2 .
x Bei sehr hohen Geschwindigkeiten
E
(v | c) folgt daraus
cp .
Für ein Teilchen der Ruhemasse null gilt dieser Zusammenhang unabhängig von seiner jeweiligen Energie. Ein solches Teilchen bewegt sich mit Lichtgeschwindigkeit
7 Relativistische Dynamik
113
Übungsaufgaben 1. Berechnen Sie die Energie, die aufgebracht werden muss, um ein Proton und ein Elektron zu beschleunigen von a) 0 auf 0,50 c; c) 0,90 c auf 0,95 c;
b) 0,50 c auf 0,90 c; d) 0,95c auf 0,99 c.
2. Wie groß ist die Geschwindigkeit eines Elektrons maximal, wenn seine kinetische Energie durch den Term (1/2)m0v2 beschrieben werden kann, ohne einen Fehler von 2% zu überschreiten? 3. Bestimmen Sie die Gesamtenergie und die Geschwindigkeit eines Elektrons, das einen Impuls von 0,70 MeV/c hat. Wie lautet das Ergebnis für ein Proton? 4. Ein Proton mit der kinetischen Energie von 8 109 eV stößt mit einem ruhenden Proton zusammen. Bestimmen Sie a) den Gesamtimpuls und die Gesamtenergie des Systems im Laborsystem b) die kinetische Energie der beiden Teilchen im Schwerpunktsystem. 5. Wie groß ist die Energieausbeute pro kg Kernbrennstoff a) bei dem Spaltungsprozess 235 92
94 U n o140 58 Ce 40 Zr 2n 'E
b) bei der Fusion 212 D o24 He 'E
8
Beschleunigte Bezugssysteme
Wir haben bereits früher gesehen, dass wir zur Durchführung quantitativer Messungen ein Bezugssystem benötigen. Damit Beobachter in zwei verschiedenen Bezugssystemen zum gleichen Ergebnis kommen, sollten diese Inertialsysteme sein, d.h. sie sollten sich relativ zueinander mit nach Richtung und Betrag konstanter Geschwindigkeit bewegen. Die Problematik wurde bereits in Kap. 2.1 erläutert. Wir wollen jetzt den Fall betrachten, dass einer der Beobachter sich beschleunigt bewegt. Er möge sich etwa in einem Bus befinden. Beim Anfahren und Abbremsen verspürt er eine Kraft, die der ursprünglichen beschleunigenden Kraft entgegen gerichtet ist. Steht er von seinem Sitz auf und versucht zum Fahrer zu gelangen, wenn der Bus gerade eine Kurve durchfährt, so wirken auch seitliche Kräfte auf ihn ein. Wir wollen solche Situationen näher untersuchen.
8.1
Geradlinig beschleunigte Bewegung
Zunächst möge die beschleunigte Bewegung geradlinig erfolgen. Zur Demonstration denken wir uns einen Wagen, auf dem starr mit diesem verbunden ein Tisch steht; auf dessen waagerechter Platte liege reibungsfrei eine Kugel der Masse m (Abb. 8.1). Der Wagen erhält G eine Beschleunigung a nach rechts. Wie beschreiben ein im raumfesten Koordinam S r tensystem S ruhender Beobachter sowie ¢ S ˆ a = ae x einer auf dem Wagen mitbewegter (S´) den Sachverhalt? Für Ersteren bleibt die Kugel liegen, der Tisch bewegt sich unter ihr weg. Ein mitbewegter Beobachter misst G Abb. 8.1: Anordnung zur Demonstration der dagegen eine Beschleunigung a der Trägheitskraft bei geradlinig beschleunigter Kugel. Er schließt daraus, dass auf die Bewegung für einen Beobachter in S´ Kugel eine Kraft
G G F c ma
(8.1)
wirkt. Dieser Kraft liegt kein Kraftgesetz zu Grunde, sondern ihr Verhalten liegt in ihrer Trägheit begründet, charakterisiert durch die träge Masse. Wir nennen sie daher Trägheitskraft. Wir fordern nun, dass die Newtonschen Axiome auch für den beschleunigten Beobachter gelten sollen. Um das zu erreichen, muss dieser obige Trägheitskraft zur beschleunigenden Kraft hinzufügen.
G G ma F c 0
(8.2)
116
8.2
8 Beschleunigte Bezugssysteme
Gleichförmig gegeneinander rotierende Bezugssysteme
8.2.1 Zentrifugalkraft Wir betrachten einen Körper A, der mittels einer Feder auf einer Scheibe gehalten wird (Abb. 8.2). Die Scheibe möge mit konstanter Winkelgeschwindigkeit Z rotieren. Für einen neben der Scheibe stehenden Beobachter bewegt sich der Körper auf einer Kreisbahn, y und zwar deshalb, weil die Feder eine zum Zentrum gerichtete Kraft ausübt. So argumeny¢ S r tieren auch wir; die Kraft nennen er und wir A x¢ G r Zentripetalkraft FZp .
x
S¢
G FF
G FZp
G mZ 2 r
(8.3)
Für einen Beobachter auf der Scheibe bleibt der Körper A liegen. Der Beobachter realisiert, dass die gedehnte Feder eine zum Mittelpunkt Abb. 8.2: Zur Demonstration der Zentrigerichtete Kraft ausübt. Daraus schließt er, fugalkraft für einen in S´ befindlichen dass der Federkraft eine zusätzliche Kraft Beobachter entgegen wirkt. Er nennt sie Zentrifugalkraft G FZc f . Die beiden Kräfte halten sich das Gleichgewicht. Durch genaue Messungen stellt er fest, G G G dass FZc f umso größer ist, desto größer Z und der Abstandsvektor r sind.
G Fres
G G FF FZc f
G G Dxc mZ 2 xc 0.
(8.4)
Der letzte Term lässt sich allgemein schreiben als
G FZfc
G G G mZ u (Z u r ) .
(8.5)
8.2.2 Corioliskraft Die Spiralfeder werde entfernt, so dass sich der Körper auf der rotierenden Scheibe frei bewegen kann. Auf ein raumfestes Koordinatensystem bezogen, bewege er sich mit konstanter Geschwindigkeit, d.h. es wirkt auf ihn keine Kraft ein. Für einen Beobachter in diesem System ist die Bahn also geradlinig. Zu welcher Aussage kommt der Beobachter auf der Scheibe? Für ihn ist die Bahn gekrümmt. Er zieht daraus den Schluss, dass auf den Körper eine seitliche G Kraft FCc einwirken muss. Er nennt sie Corioliskraft (G. G. Coriolis, 1792-1843).
8 Beschleunigte Bezugssysteme
117
Wie lässt sich diese Kraft formulieren? Dazu betrachten wir wieder ein Experiment. Wir G G wählen den speziellen Fall v ' A Z (Gestrichene Größen beziehen sich auf das mit der rotierenden Scheibe fest verbundene Koordinatensystem). Der auf der Scheibe sich aufhaltende G Beobachter erteilt dem Körper im Abstand r1 vom Mittelpunkt eine Geschwindigkeit v' in radialer Richtung. Der Körper erfährt eine seitliche Ablenkung; statt in P anzukommen, erreicht er den äußeren Rand (Radius r2) im Punkt P c (Abb. 8.3). Der ruhende P Beobachter erklärt den Sachverhalt so: P¢ v 2 = w r2 Zum Durchlaufen der Strecke (r2 r1 ) benötigt der Körper die Zeit v =wr r P 1
t
r2 r1 . v'
v¢
1
(8.6)
w
0
r1 r2
S¢
S
Während dieser Zeit hat sich der Punkt P0 um die Strecke Z r2 t nach links bis zum Abb. 8.3: Zur Demonstration und Berechnung Punkt P bewegt. Da der Körper auf dem der Corioliskraft für einen in S´ befindlichen Kreis mit dem Radius r bereits die Beobachter Geschwindigkeit v1 Z r1 hatte, bewegt er sich nur bis zu einem Punkt P c ; die Abweichung beträgt demnach
PP ' Z r2t Z r1t
Z (r2 r1 ) 2 v'
(8.7)
Für den mitrotierenden Beobachter ist die Rechtsablenkung:
PP '
1 aC t 2 2
1 FC' 2 t 2 m
(8.8)
Die Zeitmessung ist für beide Beobachter gleich; beide akzeptieren (8.6). Also lässt sich (8.8) schreiben
PP '
1 FCc § r2 r1 · ¨ ¸ 2 m © v' ¹
2
(8.9)
Einsetzen des Ausdruckes für PP ' aus (8.7) ergibt für FCc
FCc
2m v 'Z
G G Wie bereits vermerkt, gilt dieser Ausdruck für die Corioliskraft für den Fall v ' A Z .
(8.10)
118
8 Beschleunigte Bezugssysteme
Für den allgemeinen Fall ergibt sich (s. die Ergänzung am Ende des Kapitels)
G FCc
G G 2m (Z u vc)
(8.11)
Zentrifugal- und Corioliskraft sind wie der unter Kap. 8.1 besprochene Fall Trägheitskräfte. Während der Beobachter im Ruhesystem eine Kraft entsprechend der Newtonschen Grundgleichung misst, muss der Beobachter im rotierenden Bezugssystem für den G gleichen Vorgang die Zentrifugalkraft und gegebenenfalls ( v ' z 0 ) die Corioliskraft hinzufügen, damit die Newtonschen Gesetze ihre Gültigkeit behalten.
8.2.3 Anwendungsbeispiele 8.2.3.1 Erdbeschleunigung unter dem Einfluss der Zentrifugalkraft Die Erde ist selbst ein rotierendes Bezugssystem. Trägheitskräfte sind allerdings wegen der langsamen Drehung klein. Betrachten wir zunächst den Einfluss der Zentrifugalkraft. Genaue Messungen haben ergeben, dass sich die Erdbeschleunigung in Abhängigkeit von der geograr phischen Breite M (Abb. 8.4) ändert. Der Radius des w aR zugehörigen Breitenkreises ist r R cos M . Damit azf r beträgt die Zentrifugalbeschleunigung aZ = FC/m
R
j
Abb. 8.4: Auf Grund der Zentrifugalkraft ist die Erdbeschleunigung ein wenig geringer als bei ruhender Erde
aZ
Z 2 r Z 2 R cos M
0.03cos M m/s 2
(8.12)
Die Richtung von aZ weist nach außen, entgegen der Richtung der Fallbeschleunigung g0. Also muss Letztere infolge der Erddrehung ein wenig kleiner sein als auf einer ruhenden Erde,
gM
g 0 0.03cos 2 M ª¬ m/s 2 º¼
(8.13)
Dabei haben wir aber nicht berücksichtigt, dass die Erde infolge der Zentrifugalkraft elastisch verformt ist. Sie ist ein wenig abgeplattet; ihre NS-Achse ist um 0.03% kürzer als der ÄquatorDurchmesser. Die Messungen ergeben gM
(9,832 0, 052 cos 2 M ) ª¬ m / s 2 º¼ .
(8.14)
Am größten ist demnach die Abweichung von g0 am Äquator, sie ist null an den Polen.
8 Beschleunigte Bezugssysteme
119
8.2.3.2 Beispiele für Corioliskräfte
Einige Beispiele für Corioliskräfte seien hier ebenfalls genannt. Als Erstes besprechen wir das Foucaultsche Pendel (J. B. L. Foucault, 1819-1843). Es bestand aus einer 28 kg schweren Kupferkugel, die an einem 67 m langen Draht hing. Die Schwingungsdauer betrug 16,4 s. Diese Zeit ist ausreichend, um die kleine Richtungsänderung der Bahn (auf der Nordhalbkugel nach rechts) sichtbar zu machen. Zur Berechnung der Abweichung zerlegen wir die Winkelgeschwindigkeit der Erde an einem Ort der geografischen Breite M in eine dem Erdradius parallele, vertikale Komponente und in eine dazu senkrechte horizontale Komponente. Für obigen Pendelversuch benötigen wir die vertikale Komponente
Zvert
Z0 sin M ;
Zvert
2S sin M 1 s 24 60 60
(8.15)
Für Konstanz mit der geografischen Breite von M = 47.6° resultiert in einer Stunde eine Drehung der Schwingungsebene von
D Zvert t
360 2S sin 47,6q 60 60 11.1q / h . 2S 24 60 60
Bereits eine Abweichung von 2° lässt sich im großen Hörsaal nachweisen. Weitere Beispiele finden sich im Bereich der Geophysik. Die Ablenkung des Golfstromes und der Gezeitenströmungen, auf der Nordhalbkugel wiederum nach rechts, sind Folgen der Corioliskraft. Der Wind bläst nicht in Richtung des Druckgefälles (vom Ort hohen Luftdruckes zu einem solchen niedrigen Luftdruckes), sondern er wird seitlich abgelenkt, auf der Nordhalbkugel nach rechts, auf der südlichen Hemisphäre nach links. Wir alle kennen die spiraligen Wolkenströmungen eines Tiefs von der Wetterkarte her. Nur am Äquator weht der Wind genau in der Richtung des Druckgefälles.
Ergänzung: Ableitung von Zentrifugal- und Corioliskraft In diesem Anhang wird eine Ableitung der weiter oben bereits angeführten allgemein gültigen Ausdrücke für Zentrifugal- und Corioliskraft gegeben. Wir betrachten also eine mit konstanter G Winkelgeschwindigkeit Z rotierende Kreisscheibe. Mit ihr ist ein Koordinatensystem ´ S´(x , y´, z´) fest verbunden. Die z´-Achse befinde sich im Zentrum der Scheibe und stehe senkrecht auf ihr. Ein Beobachter außerhalb der Scheibe beobachtet Vorgänge auf der Scheibe von einem Inertialsystem S (x, y, z,) aus; z- und z´-Achse mögen zusammen fallen. Alle Geschwindigkeiten seien klein gegenüber der Lichtgeschwindigkeit.
120
8 Beschleunigte Bezugssysteme
G Im System S bewegt sich ein Massenpunkt P( r ), der fest mit der Scheibe und damit mit S´ verbunden ist, gemäß
G G G v Zur
(8A.1)
G Ist v' die Geschwindigkeit des Massenpunktes P relativ zur Scheibe (zu S´), so gilt für die Geschwindigkeit des Punktes in S
G G G v ' Z u r
G v
(8A.2)
G G Die Geschwindigkeiten v und v' schreiben sich mit Hilfe des Ortsvektors
G dr dt
G v
G bzw. v '
G d 'r . dt
(8A.3)
Hierin bedeutet d´/dt die zeitliche Ableitung eines Vektors bezogen auf die Koordinaten von S´. Setzen wir diese Ausdrücke in (8A.2) ein, so erhalten wir
G dr dt
G d 'r G G Zur . dt
(8A.4)
G Diese Gleichung setzt die zeitliche Ableitung eines Vektors r im System S in Beziehung zu der im System S´. Formal lautet die Differentiationsvorschrift also
d ... dt
d '... Z u ... dt
(8A.5)
Differenzieren wir (8A.4) noch einmal nach dieser Vorschrift und multiplizieren auf beiden Seiten mit m, so ergibt sich eine Beziehung für die Kräfte
m
G dv dt
G G G § d 'r G G · d ' § d 'r G G · Z Z r m u u Zur ¸ ¨ ¸ ¨ dt © dt ¹ © dt ¹ G 2 G G d 'r G G G d 'r m 2 2mZ u mZ u (Z u r ). dt dt
m
G d 2r m 2 dt
Auflösen nach m
G d2 'r m 2 dt
(8A.6)
G d 2 'r und Umordnen der Terme liefert schließlich dt 2
G G G G G G d 2r m 2 mZ u (Z u r ) 2mZ u v '. dt
(8A.7)
8 Beschleunigte Bezugssysteme
121
Vom rotierenden Koordinatensystem aus betrachtet erfährt ein Massenpunkt in jedem Fall die G Zentrifugalkraft FZ und, falls er sich mit der Geschwindigkeit v' relativ zu S´ bewegt, eine Corioliskraft FC.
G FZ G FC
G G G mZ u (Z u r ) G G 2mZ u v '.
(8A.8)
G G Falls der Ortsvektor r senkrecht auf dem Vektor Z steht, gilt
G
G G
G G
Z u (Z u r ) Z u v P
G Z 2 r
(8A.9)
und die Zentrifugalkraft wird
G FZ
G mZ 2 r .
(8A.10)
G G Wenn der Geschwindigkeitsvektor v ' senkrecht auf Z steht, gilt
FC
2m Z r .
(8A.11)
Beide Ausdrücke sind in Übereinstimmung mit denen der spezielleren Ableitungen in Kap. 8.3.
122
8 Beschleunigte Bezugssysteme
Zusammenfassung x Ein Beobachter befinde sich relativ zu einem Beobachter in einem Inertialsystem in einem beschleunigten Bezugssystem. Er stellt fest, dass auf ihn je nach Art der Bewegung unterschiedliche Kräfte wirken, die für den ruhenden Beobachter nicht existieren. Damit auch für Ersteren die Newtonschen Axiome gelten, muss er diese Kräfte in seiner Kraftbilanz berücksichtigen. Es ist dies
- bei geradlinig beschleunigter Bewegung die Trägheitskraft
G G F c ma , - bei gleichförmig beschleunigter Bewegung die Zentripetalkraft als Trägheitskraft
G FZc f
G G G mZ u (Z u r ) ,
sofern der Beobachter ein statisches Experiment durchführt. - bei gleichförmig beschleunigter Bewegung die Corioliskraft als Trägheitskraft
G FCc
G G 2m (Z u vc) ,
G wenn der Versuchsgegenstand sich mit der Geschwindigkeit vc bewegt.
Übungsaufgaben 1. Ein an einer Schnur befestigter Körper der Masse m wird in einer horizontalen Ebene in Rotation versetzt. Bestimmen Sie in Abhängigkeit der Winkelgeschwindigkeit Z den Winkel der Schnur mit der Vertikalen. 2. Die Schwerelosigkeit in einer Raumstation ist bei vielen Verrichtungen lästig. Im Prinzip lässt sich ihr durch eine Eigenrotation der Raumstation entgegenwirken. Wie könnte eine solche Station realisiert werden? Welche Kräfte treten dabei auf? Von welchen Parametern der Station hängen sie ab? Was für Konsequenzen ergeben sich daraus? 3. Woher rührt die spiralförmige Struktur der Wolken in Hoch- und Tiefdruckgebieten? Welche Wolkenformation beobachtet ein Beobachter in einem Inertialsystem? 4. Sie befinden sich in einer Passagiermaschine, die mit 800 km/h längs des Äquators nach Osten fliegt. Wie groß ist die Coriolisbeschleunigung und wie wirkt sich diese aus?
9
Eigenschaften realer Festkörper
In diesem und dem folgenden Kapitel wollen wir die grundlegenden Eigenschaften realer Festkörper, Flüssigkeiten und Gase phänomenologisch behandeln.
9.1 Atomare Kräfte und Aggregatzustände Auf Grund der Verformbarkeit wurde Materie schon früh in verschiedene Aggregatzustände eingeteilt. Die Stärke der zwischenatomaren Kräfte und die Temperatur bestimmen, zu welcher Kategorie ein Stoff gehört. Im festen Zustand können die Atome nach Art eines Gitters regelmäßig angeordnet sein oder nur eine näherungsweise Ordnung in der Nähe eines herausgegriffenen Atoms aufweisen, auf größere Entfernung aber unregelmäßig aufgebaut sein (amorphe Festkörper). In jedem Fall besitzen sie feste Lagebeziehungen zueinander. Es gibt 14 verschiedene Grundgitter-Typen. Ein solches Gitter lässt sich durch ein Modell starrer Kugeln bestimmter Masse veranschaulichen, die durch Federn miteinander verknüpft sind. Als Folge der Kopplung schwingen die Atome bei niedrigen Temperaturen korreliert um ihre Ruhelage; diese Oszillationen werden als Gitterschwingungen bezeichnet. Ihre mittlere kinetische Energie ist Ekin k BT / 2 pro Freiheitsgrad (s. Kap. 14). Erhöhen wir die Temperatur, so dass sie sich dem Schmelzpunkt nähert, wird die kinetische Energie von der Größenordnung der Bindungsenergie. Oberhalb der Schmelztemperatur ist die kinetische Energie so groß, dass die Atome nicht mehr an ihre Gleichgewichtslagen gebunden sind, sondern leicht verschoben werden können. Auch in diesem flüssigen Zustand sind die Atome dicht gepackt. Eine Momentaufnahme zeigt eine ähnliche Struktur wie die eines amorphen Festkörpers. Bei weiterer Erhöhung der Temperatur wird schließlich die mittlere kinetische Energie der Atome bzw. Moleküle groß gegenüber der Bindungsenergie. Die Teilchen können sich frei bewegen. Dieser Aggregatzustand heißt gasförmig. Erhöhen wir die Temperatur immer weiter (T t 1500 K), so kann das Gas in positive Ionen und Elektronen aufgespalten werden, die miteinander rekombinieren und dabei Licht aussenden. Ein solches Medium heißt Plasma (L 9.1). Wir kennen diesen Zustand von Funken, Blitzen oder Gasentladungslampen. Diese Einteilung ist allerdings nicht vollständig, z.B. werden flüssige Kristalle durch sie nicht erfasst. Neben dem Begriff des Aggregatzustandes existiert der der thermodynamischen Phase. Unter ihr verstehen wir einen Zustand eines Stoffes von gleicher makroskopischer physikalischer Beschaffenheit. Die beiden Begriffe können identisch sein. Beispielsweise können H2O-Moleküle eine flüssige, gasförmige oder feste Phase bilden. Phase und Aggregatzustand sind in diesem Fall identisch. Andererseits kann etwa Eisen als Festkörper eine ferromagnetische oder eine paramagnetische Phase bilden. – Die Atome in festem Phosphor oder Schwefel bilden unterschiedliche Strukturen (Modifikationen). Jede dieser Modifikationen ist als eine Phase anzusehen. – Bei sehr tiefen Temperaturen (T < 1 µK) kann ein Gas in einen Zustand kondensieren, in dem die Atome den gleichen quantenmechanischen Zustand einnehmen (Bose-Einstein-Kondensation, L9.2). In diesem Zustand können sich die Atome ohne Reibung bewegen.
124
9.2
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Deformierbare Festkörper
Wir geben die bisher vorausgesetzte absolute Starrheit der Körper auf, betrachten Letztere aber als ein Kontinuum. Die atomistische Struktur soll also vernachlässigt werden, die Materie sei kontinuierlich und zunächst isotrop verteilt. Durch diese Spezialisierung werden Komplikationen umgangen, die mit einer möglichen Anisotropie der Eigenschaften einkristalliner Stoffe einhergehen. Die Erweiterung auf einen solchen Fall nehmen wir in Kap. 9.4 vor. Der Einfachheit halber beschränken wir uns ferner zunächst im Wesentlichen auf den zweidimensionalen Fall. Bei der Verformung fester Stoffe lassen sich drei Grundtypen unterscheiden. Es sind dies
x x x
Kompression, Dehnung bzw. Stauchung, Scherung.
Im Folgenden setzen wir voraus, dass die am Festkörper angreifenden Kräfte so klein sind, dass er nach deren Wegnahme immer wieder in seinen Ausgangszustand zurückkehrt (Hookesches Gesetz, s. unten).
9.2.1 Kompression
A Fn
Auf den Körper wirke von allen Seiten eine Kraft gleichen Betrages ein, wodurch sein Volumen verkleinert (Abb. 9.1) wird. Das Experiment zeigt, dass die Volumenänderung proportional zum angewandten Druck ist.
Abb. 9.1: Allseitige Normalkraft auf einen Körper
'V V
1 'p : N 'p; 'p K
Fn A
(9.1)
K bezeichnen wir als Kompressionsmodul, N als Kompressibilität.
125
9 Eigenschaften fester Körper, Flüssigkeiten und Gase
9.2.2 Dehnung bzw. Stauchung Lassen wir eine Kraft nur längs einer Koordinate wirken, so ändert sich die Länge des Körpers; je nach Vorzeichen der Kraft sprechen wir von Dehnung oder Stauchung (Abb. 9.2). Wir finden bei hinreichend kleinen Kräften experimentell für die relative Längenänderung H
s
Plastizitätsbereich
Fließbereich Elastizitätsgrenze
l
A
Proportionalitätsgrenze
r Fn
Abb. 9.2: Dehnung bzw. Stauchung eines Körpers durch Anwendung einseitigen Zuges bzw. Druckes
H: V
Zerreißpunkt
'l 1 Fn 1 : V l E A E r EH für r V ! 0
e
Abb. 9.3: Spannungs-Dehnungs-Diagramm
Hookesches Gesetz .
(9.2)
Die pro Querschnittsfläche A wirkende Normalkraft Fn/A bezeichnen wir als Spannung. In Abb. 9.3 ist die Dehnung als Funktion der Spannung dargestellt. Bei kleinen Spannungen sind Dehnung und Spannung einander proportional. Ein solches Verhalten wird als Hookesches Gesetz (R. Hooke, 1635-1703) bezeichnet. Nehmen wir die Spannung weg, so geht der Körper wieder in seinen Ausgangszustand zurück. Wir bezeichnen diese Eigenschaft als elastisch. Erhöhen wir die Spannung weiter, so wächst die Dehnung stärker als die Spannung. Der Körper zeigt aber weiterhin Elastizität. Der Übergang zwischen den beiden Gebieten heißt Proportionalitätsgrenze. Das Ende des elastischen Bereiches wird Elastizitätsgrenze genannt. Oberhalb dieser verhält sich der Körper plastisch; beim Zurücknehmen der Spannung bleibt eine kleine Verformung zurück. Bei noch stärkerer Spannungsbeanspruchung beginnt der Körper zu fließen. Während sich bis an das Ende des plastischen Bereiches die Längenänderung entsprechend der einwirkenden Spannung momentan einstellt, braucht es dazu jetzt eine längere Zeit. Oberhalb einer kritischen Spannung zerreißt der Körper. Die Dehnung verursacht eine Querkontraktion (Abb. 9.4).
'd d
P
'l l
P trägt den Namen Querkontraktionszahl oder Poisson-Zahl.
(9.3)
126
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Ein Stab mit quadratischem Querschnitt erfährt durch eine Zugspannung eine Volumenänderung
'V
(d 'd ) 2 (l 'l ) d 2l d 2 'l 2ld 'd (l 'd 2 2d 'd 'l 'l 'd 2 )
d - Dd
(9.4a)
l d
Die letzten drei Terme können bei kleinen Verformungen vernachlässigt werden, so dass folgt
'V 'l 'd | 2 V l d Fn Abb. 9.4: Querkontraktion eines Körpers bei einseitiger Zugbeanspruchung
(9.4b)
oder mit H und P aus (9.2) und (9.3)
'V | H (1 2P ) V
(9.4c)
'V / V ist bei Zug positiv, also folgt für die PoissonZahl P < 0,5. Für einseitigen Druck ist in (9.6) H durch - H zu ersetzen. Häufig treten Dehnung und Stauchung gleichzeitig auf, so etwa bei der Biegung eines G horizontal gelagerten Balkens durch eine äußere Kraft F . Wir wollen diesen Fall etwas näher betrachten. Der Balken habe den Querschnitt a b und sei einseitig eingespannt. (Abb. 9.5). Bei der Biegung wird der obere Bereich gedehnt, während der untere Teil gestaucht wird. Die Mittelschicht wird als neutrale Faser bezeichnet, da sie ihre Länge beibehält. Greifen wir ein Teilstück der Länge l´ heraus. Die maximale Deformation beträgt jeweils a / 2r . Im Mittel ergibt sich also für jeden Bereich die Hälfte dieses Wertes. Wir wollen den Krümmungsradius r abschätzen. Kraft und Deformation sind verknüpft durch die Beziehung
F|E
a ab . 4r 2
(9.5)
Da sich Dehnung und Stauchung durch das Vorzeichen unterscheiden, wirkt auf den Querschnitt ein Kräftepaar, das ein rücktreibendes Drehmoment zur Folge hat. Es beträgt
T
F
a Ea 3b . | 2 16r
127
9 Eigenschaften fester Körper, Flüssigkeiten und Gase Im Abstand x vom Angriffspunkt der Kraft greift ein Drehmoment D F x an. Im Gleichgewicht verschwindet die Summe der Drehmomente, T D 0 . Daraus folgt
al/2r l´
x
Ea 3b r| . 16 Fx
(9.6)
r
Am kleinsten ist der Krümmungsradius an der Einspannstelle. Dort bricht der Balken, wenn die Belastung zu groß wird. Die durch die Dehnung in den oberen bzw. unteren Schichten des Balkens hervorgerufene Spannung ist V Ea / 2r . Damit folgt für die maximale Belastung
Fmax |
2V a 2b 16l
(9.7)
F
Abb. 9.5: Zur Balkenbiegung
9.2.3 Scherung Wir betrachten nun einen Körper, dessen Unterseite fest gehalten wird, während tangential zur Oberseite eine Kraft angreift (Abb. 9.5). Letztere bezeichnen wir in Analogie zur Normalspannung als Scherspannung. Wir stellen fest, dass der Körper um den Winkel J geschert wird. Es gilt
J | tan J
J
1 W G
'l d
1 Ft 1 W : G A G
Dl d
Ft d
g
l
(9.8)
Abb. 9.6: Scherung eines Körpers bei Anwendung einer tangential angreifenden Kraft (Schubkraft)
Die Größe G heißt Schub- oder Schermodul. Auch die Verdrillung eines Drahtes oder Stabes gehört zu dieser Art von Verformung. Die Materialkonstante G wird dann üblicherweise als Torsionsmodul bezeichnet. Ein Anwendungsbeispiel haben wir bereits in Gestalt der Eötvösschen Drehwaage kennen gelernt (Kap. 6.2).
128
9.3
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Reibungskräfte zwischen Festkörpern
Reibungskräfte begegnen uns im täglichen Leben “auf Schritt und Tritt”. Meistens empfinden wir sie als störend, z.B. wenn ein schweres Möbelstück zu verrücken ist oder ein Getriebe schwergängig geworden ist. Die Reibungskräfte verbrauchen einen Teil der zur Bewegung erforderlichen Energie. Auf der anderen Seite könnten wir uns ohne sie nicht fortbewegen, weder könnten wir gehen noch Fahrrad oder Auto fahren. Als Ausweg böte sich der Rückstoß (Raketen!) an. bei der heutigen Verkehrsdichte kein besonders sympathischer Gedanke! Reibung entsteht durch Kräfte zwischen den Atomen bzw. Molekülen an den Oberflächen zweier sich berührender Körper. Bestehen sie aus identischen Materialien, so sprechen wir von Kohäsion, anderenfalls von Adhäsion. In ersterem Fall sind Reibungskräfte besonders stark, wenn die Oberflächen glatt sind. Z. B. haften zwei polierte Glasplatten besonders fest aneinander. In einem solchen Fall sind die atomaren Abstände der sich berührenden Oberflächen sehr ähnlich, sie “passen” gut aufeinander, ihre Wechselwirkungen sind daher besonders groß. Im Einzelnen sind Reibungsphänomene so kompliziert, dass wir nicht näher auf sie eingehen können. Von unserer Erfahrung ausgehend, lassen sich aber die verschiedenen makroskopischen Reibungstypen klassifizieren. Wir unterscheiden dabei zwischen statischer und kinetischer Reibung. Erstere definiert die Kraft, die nötig ist, um einen Körper aus dem Ruhezustand in Bewegung zu versetzen. Unter den zweiten Typ fallen Gleit- und Rollreibung.
9.3.1 Haftreibung Wir betrachten einen Quader, der sich auf einer ebenen Tischplatte befindet (Abb. 9.7). Wir wollen messen, welche Kraft benötigt wird, um den Körper in Bewegung zu versetzen. Dazu ist an ihm seitlich eine Schnur befestigt, die über eine Rolle mit einer Federwaage verbunden ist. Hängt die Kraft, die den Körper zum Gleiten bringt, von der Auflagefläche ab? Zur Klärung stellen wir den Körper auf seine drei unterschiedlichen Seiten und messen die Kraft, die ihn aus der Ruhelage bewegt. r Die senkrecht auf die Unterlage wirkende Normalr FN = mg kraft, die Gewichtskraft, ist dabei in allen drei Fällen r F gleich groß. Das Ergebnis der Messungen zeigt, dass keinerlei Abhängigkeit von der Größe der AuflageAbb. 9.7: Anordnung zur Messung fläche existiert. Beschweren wir jetzt den Quader des Haftreibungskoeffizienten nacheinander mit verschiedenen Gewichten, so finden wir, dass die zum Gleiten erforderliche Kraft proportional zur Gesamtgewichtskraft ist. Für die Beträge der Kräfte gilt
FH
P H FN .
(9.9)
Der Proportionalitätsfaktor hängt von den Materialeigenschaften der beiden Körper ab (Material, Rauhigkeit der Oberfläche). Er trägt den Namen Haftreibungskoeffizient.
129
9 Eigenschaften fester Körper, Flüssigkeiten und Gase
9.3.2 Gleitreibung Ist die Haftreibung überwunden, so bewegt sich der Körper entsprechend der Grundgleichung der Mechanik beschleunigt (Abb. 9.8). Soll sich seine Geschwindigkeit auf einen konstanten Wert einstellen, müssen wir die Kraft erniedrigen. Es zeigt sich, dass diese ebenfalls proportional zur Normalkraft ist, die der Körper auf seine Unterlage r F ausübt.
FGl
PGl FN
(9.10)
Der Proportionalitätsfaktor µGl wird als Gleitreibungskoeffizient bezeichnet. Er ist ebenfalls von den Stoffeigenschaften und den Oberflächen der einander berührenden Körper abhängig, außerdem von der Geschwindigkeit des gleitenden Körpers.
a r FN
a
r r FG = mg
Abb. 9.8: Anordnung zur Messung des Gleitreibungskoeffizienten
9.3.3 Rollreibung Bei runden Körpern, also etwa einem Rad oder einer Kugel, tritt an die Stelle der gleitenden Bewegung die Rollbewegung als bevorzugte Bewegungsart. Damit der Körper eine geradlinige Bewegung mit konstanter Winkelgeschwindigkeit ausführt, wird ein Drehmoment benötigt, welches das der Rollreibung DR gerade überkompensiert. Analog der vorangegangenen Diskussion zeigt sich, dass dieses Drehmoment proportional zur Normalkraft FN ist.
DR
P R FN .
(9.11)
Die Größe µR heißt Rollreibungskoeffizient; er hat die Dimension einer Länge. Die Rollreibungskraft ist also proportional zu µR/r, wobei r der Abstand von der Drehachse zur Berührungslinie des Rades mit der Unterlage ist. Zur Messung des Rollreibungskoeffizienten wie auch des Gleitreibungskoeffizienten lässt sich die Bewegung auf der schiefen Ebene heranziehen. Damit sich ein Zylinder auf einer solchen mit Winkel D gegen die Horizontale in Bewegung setzt, r r muss gelten (Abb. 9.9) F
r
DR
P R FN
P R mg cos D
P R mgr sin D R (9.12)
Auf der rechten Seite steht der Betrag des Drehmomentes, das die Gewichtskraft erzeugt. Der Rollreibungskoeffizient ergibt sich also aus der Bestimmung von D ;
PR
r tan D .
(9.13)
a
r FN r r FG = mg a
Abb. 9.9: Zur Messung des Rollreibungskoeffizienten µR
130
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Ein Vergleich des Rollreibungskoeffizienten mit den beiden anderen Reibungskoeffizienten ist schwierig, weil ersterer dimensionsbehaftet ist. Wir können jedoch die Kräfte vergleichen, die beispielsweise zum Ziehen eines Schlittens und eines Wagens erforderlich sind. Wir setzen voraus, dass die Gewichtskraft, also die Normalkraft, in beiden Fällen gleich ist. Die Kraft zum Ziehen des Schlittens ist mindestens
FSchl
PG FN .
(9.14)
Die Kraft zum Ziehen eines Wagens mit Rädern des Radius r ist mindestens
FW a
DW a r
PR
FN . r
(9.15)
Das Verhältnis ergibt sich zu
FWa FSchl
1 PR . r PG
(9.16)
Das Verhältnis wird also für den Wagen umso günstiger, desto größer die Räder werden
9.4
Zur Mechanik deformierbarer fester Körper – Allgemeine Behandlung
9.4.1 Der Deformationstensor Wir wollen jetzt die im ersten Teil dieses Kapitels gewonnenen Erkenntnisse auf drei Dimensionen verallgemeinern (Abb. 9.10). Von der atomistischen Struktur sehen wir weiterhin ab, die Materie sei kontinuierlich über den Körper verteilt. Die Voraussetzung der Isotropie lassen wir aber fallen. Einen Punkt im undeformierten Zustand bezeichnen wir mit dem G G Ortsvektor a (a1 , a2 , a3 ) , einen solchen im deformierten Zustand mit r ( x1 , x2 , x3 ) . Der G Abstandssvektor zweier solcher zugehöriger Punkte heißt Verschiebungsvektor u .
G u
G G r a .
(9.17)
Er besitzt die Komponenten
ui
xi ai ; (i 1 3)
(9.18)
131
9 Eigenschaften fester Körper, Flüssigkeiten und Gase
G G G Aus dem Vergleich zweier Nachbarpunkte im ungestörten Zustand, a und a da , sowie im G G G deformierten Zustand, r und r dr , ergibt ich für die Komponenten
dxi
dxi ¦
dai dui
k
wui dak . wxk (9.19)
Diese Formulierung ist möglich, da das G Verschiebungsfeld u eine eindeutige G Funktion von a ist. Der Tensor wui / wak heißt Verschiebungstensor. Den Abstand G ds zweier deformierter Nachbarpunkte r G G und r dr erhalten wir aus
ds 2
2
¦ (dx ) ¦ (G i
i
ik
2H ik ) dai dxk ,
i ,k
r P (a)
r · ds (0)
r a
r r a + da
r r
r P (r) r · ds
r r r + dr
0
Abb. 9.10: Zur Deformation eines Körpers; links: Ausgangszustand
(9.20) worin sich der Tensor H ik mit Hilfe von (9.19) ergibt zu
2H ik
§ wui wuk wu wul · ¦ l ¨ ¸. © wak wai i , k wak wai ¹
(9.21)
Analoges gilt für den Abstand ds (0) zweier undeformierter Nachbarpunkte. Im Folgenden interessieren wir uns für kleine Deformationen, so dass wir den nichtlinearen Term in (9.21) vernachlässigen können. Der Deformationstensor H ik ist der symmetrische Teil des Verschiebungstensors wui / wak :
wui wak
1 § wui wuk ¨ 2 © wak wai
· 1 § wui wuk · ¸ ¨ ¸ H ik Dik . ¹ 2 © wak wai ¹
(9.22)
Um die Bedeutung des antisymmetrischen Teils des Verschiebungstensors zu erkennen, erinnern wir an Anhang 1.5. Dort wird gezeigt, dass ein antisymmetrischer Tensor gleichbedeutend mit einem axialen Vektor ist, also einer Drehung um eine ausgezeichnete Richtung entspricht. Um dies im vorliegenden Fall zu verifizieren, ordnen wir Dik einen Vektor zu:
Dl
1 H lki Dik 2
wui 1 § wui wuk · 1 H lki ¨ . ¸ H lki 4 © wak wai ¹ 2 wak
(9.23)
132
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Das lässt sich auch schreiben als
G D
1 G rot u . 2
(9.24)
G Bilden wir den Vektor du mit den Komponenten
dui
Dik dak
G du
G G D u da
H ikl Dl dak ,
(9.25a)
also
1 G G rot u u da , 2
(9.25b)
G G G so erkennen wir, dass der Vektor du senkrecht auf den Vektoren rot u und da steht. Folglich G G beschreibt er eine infinitesimale Drehung von da um die Achse der Richtung rot u durch den G Endpunkt des Vektors a .
9.4.2 Lineare Dehnung G G G Wie oben seien zwei eng benachbarte Punkte durch die Ortsvektoren a und a da gegeben. G (0) G Der Abstandsvektor ds möge in Richtung von a1 liegen, so dass dx2 und dx3 verschwinden. Damit wird (9.20) zu
ds 2
¦ (1 2H
11
) da12
(9.26)
i ,k
Das Längenverhältnis ergibt sich daraus zu
ds
(1 2H11 ) da1 .
Analoge Ausdrücke gelten für die beiden anderen Komponenten dx2 und dx3.
(9.27)
133
9 Eigenschaften fester Körper, Flüssigkeiten und Gase
9.4.3 Winkeländerungen Wir betrachten jetzt zwei infinitesimale Vektoren G G a (a1 , 0, 0) und b (0, b2 , 0) (Abb. 9.11). Nach (9.26) werden daraus durch Deformation die Vektoren
G r1 G r2
§ wu wu wu · a ¨1 1 , 2 , 3 ¸ © wa1 wa1 wa1 ¹
r r2
§ wu wu wu · b ¨ 1 ,1 2 , 3 ¸ . wa2 wa2 ¹ © wa2
r x3 r1
(9.28)
×
G G Während der Winkel zwischen a und b natürlich 90° beträgt, ändert sich dieser Wert durch Deformation. Wir berechnen ihn mit Hilfe des skalaren Produktes.
GG ab
x2 r b b 2
r a a 1 x1
Abb. 9.11: Änderung des von zwei
G
G
Vektoren a und b eingeschlossenen Winkels bei Deformation ausge
ab cos§ wu wu wu wu wu wu wu wu · ab ¨ 1 2 1 1 2 2 3 3 ¸ { abH12 . © wa2 wa1 wa1 wa2 wa1 wa2 wa1 wa2 ¹
(9.29)
G G Die Beträge von a bzw. b folgen gemäß (9.27) zu a
(1 2H11 ) a1 ;
b
(1 2H 22 ) b2 .
(9.30)
Damit ergibt sich cos- zu
cos-
H12 (1 2H11 ) (1 2H 22 )
| H12 .
(9.31)
9.4.4 Volumenänderungen Mit den bis hierher erworbenen Kenntnissen lassen sich in der linearen Näherung VolumenG G dilatationen bzw. -kompressionen berechnen. Fügen wir zu den Vektoren a und b den Vektor G c 0, 0, c3 hinzu, so ist das von den drei Vektoren aufgespannte Volumen
dW (0)
abc .
(9.32)
134
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Durch Deformation ändert sich dieses in
1 dW
G G G ªa, b , c º ¬ ¼
dW (0)
wu1 wa1
wu1 wa2
wu3 wa1
wu2 wa1 1
wu1 wa3
wu3 wa2
wu2 wa2
wu2 wa3
1
.
(9.33)
wu3 wa3
Berücksichtigen wir bei der Entwicklung der Determinante nur die linearen Glieder, so ergibt sich
dW
G dW (0) 1 di v u .
(9.34)
Daraus folgt also die relative Volumendilatation zu
4
dW dW (0) dW (0)
G di v u
wui
¦ wx i
.
(9.35)
i
Die Volumendilatation ist gleich der Summe der Diagonalelemente (der Spur) des Deformationstensors. Diese wiederum ist gleich der Divergenz des Verschiebungstensors.
9.4.5 Aufspaltung des Deformationstensors Der Deformationstensor lässt sich in zwei Anteile aufspalten. Dazu schreiben wir ihn in der Form
H ik
1 3
1 3
H ik H iiG ik H iiG ik
1 3
H ik z i 4G ik .
(9.36)
Die Spur des ersten Terms ist null, d.h. er verursacht keine Volumenänderung. Er bewirkt vielmehr eine volumentreue Gestaltänderung, die als Scherung bzw. im Fall eines verdrillten Zylinders als Torsion bezeichnet wird. Der zweite Anteil besitzt dagegen nur Koeffizienten in der Hauptdiagonalen. Jeder von ihnen hat den Wert 4 / 3 . Es treten daher keine Winkeländerungen zwischen den Koordinatenrichtungen auf. Der zweite Term beschreibt eine gestalttreue Volumenänderung.
135
9 Eigenschaften fester Körper, Flüssigkeiten und Gase
9.4.6 Spannungstensor Betrachten wir ein Volumenelement, dessen Kanten parallel zu den von den rechtwinkligen Koordinatenachsen aufgespannten Ebenen liegen (Abb. 9.12). Die Kräfte, die auf das Volumenelement wirken, werden durch den Spannungstensor W beschrieben. Zur Wiederholung: Die Kraft pro Fläche in Richtung der Flächennormale heißt Normalspannung, die tangential an ihr angreifende Tangentialspannung. Fassen wir die Flächen dx2 dx3 ins Auge. Auf sie wirkt die Kraft W 11dx2 dx3 nach außen, wenn W11 > 0 ist. Wir nennen sie Zugspannung. Tangential greifen an den Flächen folgende Kräfte an:
x2
t 23 t 32 t 33
Abb. 9.12: Definition der Normalund Tangentialspannung
t 31
t 22 t 21
x3
t 12 dx 2 t 13
t 11 x1
dx 3 dx1 Auf diese Weise entstehen zwei Kräftepaare
rW 12 dx2 dx3 in r x2-Richtung
und
rW 12 dx2 dx3 dx1 um die x3-Achse und
rW 13 dx2 dx3 in r x3-Richtung. rW 13 dx2 dx3 dx1 um die x2-Achse.
Diese werden im Gleichgewicht durch die entsprechenden Kräfte an den gegenüber liegenden Flächen kompensiert. Der Spannungstensor ist folglich symmetrisch, W 13 W 31 usw.
9.4.7 Hookesches Gesetz Wir benötigen nun wie im zweidimensionalen Fall eine Beziehung, welche die Spannungen W ik mit den durch sie hervorgerufenen (kleinen) Verformungen H PQ verknüpft. Dies leistet wie oben das Hookesche Gesetz. In seiner allgemeinsten Form lautet es
W ik
c PQ H PQ . ¦ PQ ik
,
(9.37)
136
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Jeder der vier Indizes kann die Werte 1-3 annehmen. Daher hat ein solcher Tensor vierter Stufe cikPQ 34 = 81 Koeffizienten. Im vorliegenden Fall lässt sich dieser Wert erfreulicher Weise erheblich reduzieren, da W ik W ki und H PQ HQP symmetrische Tensoren sind. Jedes Indexpaar kann daher nur die folgenden sechs Werte annehmen: (ik )
(11), (12), (13), (22), (23), (33)
Es bleiben nur 62 = 36 Koeffizienten übrig. Da sich auch bei Vertauschung des oberen und unteren Indexpaares die Koeffizienten nicht ändern, reichen zur Beschreibung 21 elastische Koeffizienten aus. Der Beweis lässt sich über die Existenz einer potentiellen Energie der elastischen Deformation erbringen (L9A). Je nach Symmetrie des betreffenden Kristallgitters reduzieren sich die Koeffizienten bis auf zwei im Fall eines isotropen Körpers. Das elastische Verhalten eines kubischen Kristalls ist durch drei elastische Konstanten charakterisiert.
Zusammenfassung x Festkörper erweisen sich bei der Einwirkung hinreichend kleiner Kräfte als elastisch; sie gehorchen dem Hookeschen Gesetz. Das elastische Verhalten wird durch die elastischen Konstanten charakterisiert. Ihre Anzahl hängt von der Struktur ab. Bei Kompression eines isotropen (amorphen) Körpers gilt
'V V
1 'p : N 'p ; K heißt Kompressionsmodul, N Kompressibilität. K
x Bei einseitiger, senkrechter Krafteinwirkung (Zugspannung V : FN / A ) gilt für die relative Längenänderung H 'l / l
H
1 V; E
E heißt Elastizitätsmodul bezeichnet. Gleichzeitig tritt eine Querkontraktion 'd / d auf.
'd d
P
'l ; l
P heißt Poisson-Zahl.
Ein Stab mit quadratischem Querschnitt erfährt durch eine Zugspannung eine VolumenÄnderung
'V V
H (1 2P ) .
9 Eigenschaften fester Körper, Flüssigkeiten und Gase
137
x Für die Scherung eines Körpers unter der Einwirkung der tangential an der Fläche angreifenden Scherkraft um den Winkel J gilt mit dem Schermodul G
J
1 Ft G A
1 W G
x Haftreibung: Ein Körper haftet auf seiner Unterlage, wenn die Beziehung gilt FH
P H FN
P H ist eine Materialkonstante. x Gleitreibung: Um eine gleichförmige Bewegung eines Körpers relativ zu seiner Unterlage zu gewährleisten, wird die Kraft benötigt
FGl
PGl FN
PGl ist ebenfalls eine Materialkonstante. x Zur Erzielung einer Rollbewegung mit konstanter Winkelgeschwindigkeit wird ein Drehmoment benötigt
DR
P R FN ;
P R ist eine Materialkonstante.
138
9 Eigenschaften realer Körper, Flüssigkeiten und Gase
Übungsaufgaben 1. Zwei Drähte mit den Elastizitätsmodulen H1 = 2,4 Nm-2 und H2 = 1,6 Nm-2 haben im unbelasteten Zustand die Querschnitte A1 = 1 mm2 und A2 = 2 mm2. An ihnen ist ein Balken, der als gewichtslos anzusehen ist, aufgehängt (s. Skizze). An welche Stelle x muss ein Körper der Masse m = 50 kg angehängt werden, damit a) beide Drähte gleich viel gedehnt werden? b) beide Drähte gleiche Spannung haben?
L 1
l
2
x m
2. Ein Schwebebalken der Länge l für den Turnsport hat einen rechteckigen Querschnitt. Begründen Sie die Form und geben Sie an, welches Seitenverhältnis optimal ist. – Angenommen ein solcher Balken überspannt einen Graben. Wie stark kann er belastet werden, damit er nicht bricht? 3. Ein als Vollzylinder ausgebildeter Pfeiler der Länge l und des Durchmessers 2r sei mit einem Ende bis zu einer Länge a leicht schief im Boden verankert. Schätzen Sie seine Tragfähigkeit ab. Wie kommt es, dass die Belastbarkeit eines Hohlzylinders mit nicht zu geringer Wandstärke, aber sonst gleichen Abmessungen nur um wenige Prozent geringer ist?
10
Eigenschaften flüssiger und gasförmiger Materie
10.1 Ruhende Flüssigkeiten 10.1.1 Verschiebbarkeit der Flüssigkeitsteilchen Es wurde bereits darauf hingewiesen, dass die Kräfte zwischen den Molekülen einer Flüssigkeit um Größenordnungen kleiner sind als zwischen den Atomen und Molekülen eines Festkörpers. Das hat zur Folge, dass sie nicht mehr um wohldefinierte Ruhelagen Schwingungen ausführen, sondern sich „leicht“ verschieben lassen. Die dazu aufzuwendende Energie ist umso kleiner, je langsamer die Gestaltänderung abläuft. Die Moleküle diffundieren regellos durch den ihnen vorgegebenen Raum. Dies ist etwa an der Brownschen Molekularbewegung zu erkennen. Dabei werden unter dem Lichtmikroskop gerade noch sichtbare Teilchen, die in einer Flüssigkeit schweben, beobachtet. Diese führen auf Grund der Stöße der eigentlichen Flüssigkeitsmoleküle eine Zitterbewegung aus (R. Brown, 1773-1858). Betrachten wir die Moleküle als Ganzes, so folgt aus ihrer leichten Verschiebbarkeit, dass keine Schubspannungen auftreten können; anderenfalls würden die Flüssigkeitsmoleküle solange verschoben, bis diese verschwänden. Die Oberfläche einer Flüssigkeit steht daher bei Vernachlässigung von Oberflächeneffekten und Reibung (“ideale Flüssigkeit”) immer senkrecht auf der die Lage der die Flüssigkeitsoberfläche bestimmenden resultierenden Kraft (z.B. der Schwerkraft). Zur Demonstration betrachten wir ein rotierendes Glas (Abb. 10.1), in dem sich eine Flüssigkeit befindet. In diesem Fall stellt sich die Oberfläche so ein, dass die Resultierende aus
r
w r F1
Abb. 10.1: Die Oberfläche einer Flüssigkeit steht immer senkrecht auf der ihre Lage bestimmenden resultierenden Kraft
r r F= mg
r a F2
r Fres
Schwerkraft und Zentrifugalkraft senkrecht zur Oberfläche zeigt. Für den Winkel zwischen den beiden Kräften gilt
tan D
G FZ f G FS
mZ 2 r mg
(10.1)
Andererseits ist tan D gleich der Steigung der Oberflächen-Kurve, tan D gilt
dz
Z 2r g
dr
o z (r )
Z2 g
³ rdr
Z2 r2 g 2
C
dz / dr . Folglich
(10.2)
140
10 Eigenschaften flüssiger und gasförmiger Materie
Mit den Randbedingungen, r = 0, z (0): = z0 , folgt für die Oberfläche
Z2
z (r )
2g
r 2 z0
(10.3)
Die Flüssigkeitsoberfläche hat die Form eines Rotationsparaboloids.
10.1.2 Statischer Druck und Auftrieb Im Inneren einer Flüssigkeit herrscht ein Druck, der von der Flüssigkeitstiefe abhängt. Betrachten wir eine Wassersäule der Höhe h und des Querschnittes A. Da die Dichte U des Wassers überall gleich ist, ergibt sich durch die Schwerkraft der Druck zu
p
F A
mg A
U ghA A
U gh .
(10.4)
Der Wasserdruck nimmt proportional mit der Tiefe zu. Er ist unabhängig von der Form des Behälters. Es ist also egal, welches Gefäß in Abb. 10.2 wir ins Auge fassen. Während sich das Gesamtgewicht des Wassers in den einzelnen Behältern voneinander unter-
h
h
a)
b)
Abb. 10.2: Hydrostatisches Paradoxon: Bei gleicher Füllhöhe h ist der Druck auf die Bodenfläche in allen Gefäßen gleich, unabhängig von ihrer Form
scheidet, ist der Bodendruck bei gleicher Wassertiefe immer gleich groß. Wir können uns davon überzeugen, indem wir alle Gefäße mittels einer Röhre verbinden. Der Wasserpegel ist überall gleich hoch. Infolge der leichten Verschiebbarkeit der Flüssigkeitsmoleküle ist der Druck auch über den gesamten Querschnitt eines Gefäßes gleich. Tauchen wir etwa einen festen Körper in eine Flüssigkeit bis zur Tiefe h0 ein (Abb. 10.3), so ist der Druck auf dem Boden gleich U Fl gh0 . Der Druck im Inneren einer Flüssigkeit wirkt in alle Richtungen.
10 Eigenschaften flüssiger und gasförmiger Materie
h0
Abb. 10.3: Der Druck eines bis zur Tiefe h0 in eine Flüssigkeit getauchten Zylinders ist gleich p = Ug h0
141
h1 h2
Abb. 10.4: Zur Berechnung des Auftriebs
Mit dieser Erkenntnis können wir auch den statischen Auftrieb von Körpern in einer Flüssigkeit verstehen. Betrachten wir der Einfachheit halber einen in eine Flüssigkeit getauchten flachen Zylinder (Abb. 10.4). Gegen die obere Zylinderfläche drückt eine nach unten gerichtete Kraft F1 p1 A h1 U gA , gegen die untere eine aufwärts gerichtete Kraft F2 U gh2 A . Die Kräfte auf die Seitenflächen heben sich paarweise auf. Die resultierende, nach oben gerichtete Kraft ist FA
U Fl gA(h2 h1 ) ;
(10.5)
U ist die Dichte der Flüssigkeit. Da auf der rechten Seite die Gewichtskraft einer Flüssigkeit vom Volumen des eingetauchten Körpers steht, können wir den Sachverhalt folgendermaßen beschreiben: Die Auftriebskraft eines eingetauchten festen Körpers ist gleich dem Gewicht der verdrängten Flüssigkeitsmenge (Archimedisches Prinzip, ca. 2000 Jahre v. h.u. Zeitrechnung). Ist das Gewicht G des Körpers größer als seine Auftriebskraft, so sinkt er auf den Boden des Behälters. Sind G und FA gleich groß, so schwebt der Körper. Ist schließlich G < FA , so schwimmt er.
142
10 Eigenschaften flüssiger und gasförmiger Materie
10.1.3 Anwendungen Um die Lage eines schwimmenden Körpers (Schiffes) stabil zu halten, muss dafür gesorgt werden, dass bei einer Kippung immer ein rücktreibendes Drehmoment existiert, das dafür sorgt, dass der Körper wieder in seine Vertikallage zurückgebracht wird. Anderenfalls kippt er um. Wir wollen uns das näher ansehen (Abb. 10.5). An einem schräg im Wasser liegenden Körper greifen r zwei Kräfte an. Der Angriffspunkt der Schwerkraft ist der FA Schwerpunkt des Körpers SK , der der Auftriebskraft der Schwerpunkt der verdrängten Flüssigkeitsmenge SFl . Wir M wollen durch diesen Punkt eine vertikale Gerade legen. Der Schnittpunkt mit der punktiert dargestellten MittelSK S Fl linie des Körpers heißt Metazentrum M. Dieses muss stets oberhalb von SK liegen, denn dann treibt das Drehr G G G GK moment D r u GK den Körper wieder in seine Gleichgewichtslage zurück. Abb. 10.5: Damit ein schwimBei bekannter Dichte der Flüssigkeit kann aus dem mender Körper eine stabile Gewichtsverlust eines festen Stoffes die Dichte des Lage einnimmt, muss das Meuntergetauchten Körpers ermittelt werden. Umgekehrt tazentrum M oberhalb des kann aus der Eintauchtiefe eines Körpers bekannter Schwerpunktes S liegen Dichte auf die Dichte der Flüssigkeit geschlossen werden. Auf diesem Prinzip basiert das Aräometer, z.B. zur Bestimmung der Öchslegrade von Wein. Das Archimedische Prinzip gilt auch für Gase. Als Beispiel betrachten wir einen Heißluftballon. Er habe einen Durchmesser 2R von 12 m und weise in seinem Inneren eine Dichte von 70 % der Dichte außerhalb des Ballons auf. Letztere betrage 1,3 kg/m3. Welche Last kann der Ballon tragen? Die Masse der vom Ballon verdrängten Luft ist
mL
4 3
4 3
U L S R 3 1,3 S 63 1176, 21
(10.6)
Die Auftriebskraft auf den Ballon ist
FA
mL g
(10.7)
Der Ballon schwebt, wenn er einschließlich Beladung das gleiche Gewicht hat wie das von ihm verdrängte Luftvolumen.
mL g mB
0,70mL g mB g 352,86 kg
(10.8a) (10.8b)
10 Eigenschaften flüssiger und gasförmiger Materie
10.2
143
Flüssigkeitsgrenzflächen
10.2.1 Oberflächen- und Grenzflächenspannung Im Inneren einer Flüssigkeit wirken die Kräfte zwischen einem herausgegriffenen Molekül und seinen Nachbarmolekülen in alle Richtungen. Das ändert sich, wenn wir ein Molekül in der unmittelbaren Nähe der Oberfläche betrachten. Hier fehlen einige Moleküle an der Oberseite und damit die entsprechenden Kräfte. Als Folge r resultiert eine Kraft in die Flüssigkeit hinein. Daraus F ergeben sich Oberflächeneffekte, die wir bisher vernachlässigt haben. Das gleiche gilt für Effekte an der Grenzfläche von Flüssigkeiten und anderen festen b oder flüssigen Materialien, z.B. Glas. Wir besprechen zunächst die Oberflächenspannung. In Abb. 10.6 ist ein Gefäß mit Wasser dargestellt. Tauchen wir einen Drahtbügel in die Flüssigkeit und ziehen ihn dann langsam heraus, so bildet sich an dem Bügel eine Flüssigkeitslamelle. Wir messen die dazu erforderliche Kraft und stellen fest, dass diese beim Herausziehen konstant bleibt. Dagegen ist sie umso größer, Abb. 10.6: Bestimmung der Oberje breiter der Bügel ist. Wir erhalten damit flächenspannung von Wasser durch Messung der Kraft, die zum HerausF 2V b ; V H 2O 0,073 N/m (10.9) ziehen des Bügels erforderlich ist aaa Den Proportionalitätsfaktor bezeichnen wir als Koeffizienten der Oberflächenspannung oder auch kurz als Oberflächenspannung. Der Faktor 2 rührt davon her, dass die Lamelle eine vordere und eine hintere Oberfläche besitzt. Der Wert von V hängt empfindlich von Verunreinigungen ab. Außerdem sinkt er mit wachsender Temperatur. Wir können das in (10.9) ausgedrückte Ergebnis auch folgendermaßen ausdrücken: Soll die Lamelle um den Betrag 's vergrößert werden, müssen also weitere Moleküle an die Oberfläche gebracht werden, so benötigen wir dazu eine konstante Kraft. Dabei wird die Fläche der Lamelle um den Betrag 'A vergrößert. Bilden wir das Produkt aus F und 's , so erhalten wir als aufgewandte Energie
'W
F 's : H 'A .
(10.10)
Die Größe H nennen wir spezifische Oberflächenenergie. Sie ist identisch mit dem Koeffizienten der Oberflächenspannung, denn es gilt
H
'W 'A
F 's 2b 's
F 2b
V.
(10.11)
144
10 Eigenschaften flüssiger und gasförmiger Materie
Die Natur strebt immer den Zustand kleinster Oberflächenenergie an. Das zeigt sich etwa an der Kugelform von Seifenblasen. Die Kugel hat bei gegebenem Volumen die kleinste Oberfläche; folglich ist die zur Erzeugung der Seifenblase erforderliche Energie minimal. Die Oberflächenspannung wird ausgenutzt bei der Dosierung von flüssigen Medikamenten mittels einer Pipette. Ein Tropfen hängt an der Pipette, bis er unter seinem Gewicht abreißt. Die Kraft, die am Rohrumfang angreift, ist F 2S rV , die Gewichtskraft beträgt V U Fl g . Also folgt
V
2S rV Ug
(10.12)
Bei einem Durchmesser von 3 mm ergibt sich für Wasser V 0, 065cm3 . Die Abhängigkeit der Oberflächenspannung von Verunreinigungen wird für Reinigungszwecke ausgenutzt. Detergenzien erniedrigen die Oberflächenspannung von Wasser, so dass diese unter die Fettmoleküle kriechen können. Auch die Tatsache, dass Wasserläufer und ähnliche Tierchen, wie der Name sagt, auf dem Wasser laufen können, beruht auf der Oberflächenspannung. Innerhalb gewisser Grenzen wird die Oberfläche beim Betreten lediglich verformt, reißt also nicht. Bisher haben wir nur die Oberflächenspannung diskutiert, die sich streng genommen nur auf die Phasengrenze flüssiges Medium-Vakuum bezieht. Im Allgemeinen gelten die Überlegungen auch für die Phasengrenze flüssig-gasförmig. Wir wenden uns jetzt den Grenzflächenspannungen zu, speziell der Phasengrenze flüssig-fest. Betrachten wir etwa die Gestalt der Flüssigkeitsoberfläche in der Nähe des Randes des Gefäßes genauer, so stellen wir fest, dass sie gekrümmt ist. Um diese Krümmung, die konkav oder konvex sein kann, zu verstehen, müssen wir die Kräfte zwischen den Flüssigkeitsmolekülen und den Atomen der Wand in unsere Überlegungen mit einbeziehen. Wir wollen den Randwinkel berechnen, den die Oberfläche der Flüssigkeit mit der Gefäßwand bildet (s. Abb. 10.7). b)
a)
(1)
c)
(1)
s 1,3
(3) s 1,3 s 2,3 ff (2)
(3)
f s 1,2 s1.2
(2)
s1.2
s 1,2 (2)
(1) s 1,3
s1,3
(3) s 2,3
(1)
f=0 (2)
Abb. 10.7: In der Nähe einer Wand ist die Flüssigkeitsoberfläche gekrümmt. Der Randwinkel ist gegeben durch die Grenzflächenspannungen; a) konkave Flüssigkeitsoberfläche für Wasser-Glas V1,3 ! V1,2 b) konvexe Oberfläche für Hg-Glas V1,3 V1,2 c) vollständige Benetzung bei V1,3 V1,2 ! V 2,3
10 Eigenschaften flüssiger und gasförmiger Materie
145
Die einzelnen Phasen seien mit 1 (fest), 2 (flüssig) und 3 (gasförmig) bezeichnet. An einem Linienelement der Länge dl senkrecht zur Zeichenebene greifen die Kräfte V 12 , V 13 , V 23 an. Im Gleichgewichtsfall gilt für die Berührlinie Flüssigkeit-Wand
V 12 V 23 cos I V 13
0.
(10.13)
Daraus ergibt sich für den Randwinkel
cos I
V 13 V 12 . V 23
(10.14)
Da 1 d cos I d 1 ist, hat I nur einen bestimmten Wert für
V 13 V 12 d V 23 .
(10.15)
Wir unterscheiden demnach folgende Fälle:
V 13 ! V 12 , also cos I ! 0, I 90q ; Die Flüssigkeit bildet mit der Wand eine konkav gekrümmte Oberfläche, die mit der Wand einen spitzen Randwinkel bildet. Die Wand wird also von der Flüssigkeit benetzt. Beispiel: Wasser - Glas - Luft.
V 13 V 12 , also cos I 0, I ! 90q Die Flüssigkeit bildet mit der Wand eine konvex gekrümmte Oberfläche, die mit der Wand einen stumpfen Randwinkel bildet. Beispiel: Hg - Glas - Luft.
V 13 V 12 ! V 23 Dieser Fall ist für keinen Winkel I erfüllbar. Die Ungleichung zeigt, dass eine resultierende Kraft F13 übrig bleibt. Infolgedessen überzieht sich die (3) ganze Festkörperseite mit einer dünnen Flüssigkeitshaut. Auch die Form von Flüssigkeitstropfen auf einer ebenen Unterlage oder auf einer anderen Flüssigkeit hängt von der Größe des bzw. der Randwinkel ab. Die Gleichgewichtsbedingung für die Bildung eines Tropfens auf einer Flüssigkeit lautet (Abb. 10.8)
V
V 23 cos I2 V 12 cos I1
(10.15)
f2 f1
(2) (1)
Abb. 10.8: Form eines Fetttropfens auf Wasser
146
10 Eigenschaften flüssiger und gasförmiger Materie
Gleichgewicht ist nur möglich, wenn gilt
V 13 V 23 V 12 .
(10.16)
Anderenfalls zerfließt der Tropfen zu einer dünnen Schicht auf der Flüssigkeit 1. Beispiele: Wassertropfen auf einer Vogelfeder, Öltropfen auf Wasser.
10.2.2 Kapillarität Tauchen wir eine gründlich gereinigte Glaskapillare senkrecht in Wasser, so steigt dieses in ihr hoch und zwar umso mehr, desto kleiner der Durchmesser der Kapillare ist. Ersetzen wir das Wasser durch Quecksilber, so beobachten wir eine Erniedrigung des Flüssigkeitspegels. In beiden Fällen ist die Oberfläche gekrümmt. Betrachten wir den ersten Fall. Wasser benetzt die Kapillare vollständig; das Innere der Kapillare ist mit einem dünnen Wasserfilm überzogen. Dazu ist eine relativ große Oberflächenenergie erforderlich. Um sie zu verkleinern, steigt das Wasser in der Kapillaren hoch (Abb. 10.9). Die Kraft, mit der sich die Oberfläche zu verkleinern sucht, ist
F
2S rV
(10.17)
d(x) x
y
h
Abb- 12-14
Abb. 10.9: Steighöhe einer benetzenden Flüssigkeit in einer Kapillaren
x Abb. 10.10: Abhängigkeit der Steighöhe einer benetzenden Flüssigkeit vom Wandabstand eines keilförmigen Gefäßes, y ~ 1/d
Es herrscht Gleichgewicht, wenn die Gewichtskraft FG der Flüssigkeit der Dichte Ugleich dieser Kraft ist.
FG
S r 2 hU g
(10.18)
10 Eigenschaften flüssiger und gasförmiger Materie
147
Also ergibt sich für die Steighöhe
h
2V . rU g
(10.19)
Die Steighöhe ist umgekehrt proportional zum Radius der Kapillare. Je kleiner nämlich der Radius, desto kleiner wird die Oberflächenenergie. Die Abhängigkeit der Steighöhe vom Abstand der Begrenzungsflächen lässt sich gut mit einem Flüssigkeitskeil zwischen zwei leicht gegeneinander gekippten Glasplatten demonstrieren (Abb. 10.10). Entsprechend (10.19) steigt die Flüssigkeit mit abnehmendem Plattenabstand proportional zu 1/d an. In der Natur dient die Kapillarität dazu, Pflanzen, z.B. Bäume, bis in die oberen Spitzen mit Wasser zu versorgen. Auch verschiedene technische Anwendungen beruhen auf diesem Phänomen (Füllfederhalter, Löschpapier, Entlöten von elektrischen Verbindungen.
10.3
Gase
10.3.1 Gasdruck als Folge der ungeordneten Bewegung der Moleküle Aus einem früheren Kapitel wissen wir schon, dass die Kräfte zwischen den Gasmolekülen so klein sind, dass sie sich im Raum nahezu frei hin und her bewegen können. Sperren wir ein Gas bei Zimmertemperatur in einen Kasten ein, so prallen die einzelnen Moleküle in unregelmäßiger Folge gegen die Wände und erzeugen so auf diese einen Druck. Der Ursprung des Gasdruckes ist also ein völlig anderer als der durch die Gewichtskraft und die fast freie Verschiebbarkeit der Flüssigkeitsmoleküle erzeugte Flüssigkeitsdruck. Wir betrachten N Moleküle der Masse m. welche die gleiche mittlere Geschwindigkeit haben mögen. Da der als kubisch angenommene Kasten sechs Begrenzungsflächen (Seitenlänge d) hat, fliegen jeweils 1/6 der Moleküle in Richtung einer der Wände. Sie sollen dort senkrecht aufprallen und anschließend reflektiert werden. Die gesamte Impulsänderung pro Zeit 't d / v beträgt
Nv N m v2 . (2m v) 6d 3d
'p 't
(10.20)
Die linke Seite ist nach dem Grundgesetz der Mechanik gleich der Kraft, welche die Kastenwand auf das Gasmolekül ausübt. Nach dem dritten Newtonschen Axiom ist sie gleich der negativen Gegenkraft, mit der das Gas gegen die Kastenwand drückt. Also folgt für den Druck
p
'p / 't d2
N m v2 . 3d 3
(10.21)
148
10 Eigenschaften flüssiger und gasförmiger Materie
In Wirklichkeit bewegen sich die Moleküle mit einer thermischen Verteilung ihrer Geschwindigkeiten im Kasten regellos hin und her. Ihre mittleren Geschwindigkeitsquadrate entlang den Raumrichtungen sind
v 2x
1 N (vx ) v 2x dv x ³ N
v 2y
v 2z
1 2 v . 3
Für den Druck ergibt sich damit analog zu (10.21), wenn wir noch berücksichtigen, dass d3 das Volumen ist
p
n m v2 . 3
(10.22)
10.3.2 Barometrische Höhenformel Die Lufthülle unserer Erde kann auf Grund der gravitativen Anziehung nicht entweichen. Die mittlere Geschwindigkeit der Moleküle ( v = 0,480 km/s bei Raumtemperatur) ist zum Verlassen der Erdatmosphäre (11,2 km/s) viel zu klein. In einer Flüssigkeit nimmt der Druck mit zunehmender Tiefe linear zu, nach oben also entsprechend ab. Wir haben gesehen, dass dies daran liegt, dass die Moleküle dicht gepackt sind. Sie können durch darüber liegende Schichten nicht weiter zusammen gedrückt werden. In Gasen liegen die Verhältnisse ganz anders. Wegen der großen Abstände und der kleinen Kräfte der Gasmoleküle werden die unteren Schichten durch die darüber liegenden etwas zusammengedrückt. Wie groß ist dieser Effekt, d.h. wie groß ist der Luftdruck in Abhängigkeit von der Höhe oberhalb des Erdbodens? Darüber gibt uns die barometrische Höhenformel Auskunft. Wir betrachten eine Gassäule, aus der wir uns eine infinitesimal dünne Schicht der Dicke dh herausgreifen. Ihr Beitrag zum Druck ist dp
(10.23)
U g dh
Hierin ersetzen wir die Dichte U mit Hilfe des Boyle-Mariotteschen Gesetzes (pV = p0V0).
U U0
p p0
o U
U0
p . p0
(10.24a)
Dabei ist U 0 die Dichte des Gases bei Normaldruck p0 . Der relative Beitrag dp jeder Gasschicht zum Gesamtdruck p wird damit
10 Eigenschaften flüssiger und gasförmiger Materie
dp p
U0 p0
g dh
(10.24b)
Der Gesamtdruck ergibt sich durch Integration zu
p
bzw.
p p0
149
1,0
p0 e U0 gh / p0 e 0,127 h ( km ) .
p/p 0
(10.25)
Der Verlauf ist in Abb. 10.11 dargestellt. Als Einheit N des Drucks wählen wir > p @ Pascal (Pa) . m2 100 Pa = 1 hPa (Hektopascal). (B. Pascal, 1623-1662)
0,5
0,0 0
10
20 h/km
Abb. 10.11: Relativer Luftdruck in Abhängigkeit von der Höhe aa
10.3.3 Diffusion Wir haben bereits die Diffusion von Flüssigkeitsmolekülen kennen gelernt, die sich z.B. in der Brownschen Molekularbewegung äußert. Da Gasmoleküle eine größere Geschwindigkeit besitzen und sie sich im Mittel in größerer Entfernung voneinander befinden, diffundieren sie erheblich schneller als Flüssigkeitsmoleküle. Wir wollen jetzt ein Gesetz formulieren, das die Diffusion quantitativ fasst. Dazu betrachten wir einen Zylinder mit Querschnitt A, in dem sich zu Beginn, durch einen Schieber getrennt, zwei Gase befinden (Abb. 10.12). Öffnen wir den Schieber, so S gelangen die Gase zu beiden Seiten in den jeweils anderen Teil des Zylinders und durchmischen sich dabei. (2) (1) A Wir konzentrieren uns zunächst auf eine der beiden x Gassorten, für die andere gelten analoge Überlegungen. Die Zahl der in der Zeit t durch den Querschnitt A Abb. 10.12: Zur Diffusion hindurch diffundierenden Moleküle, also deren Teilchenzweier Gase stromdichte jx , ist proportional dem Konzentrationsgefälle dn/dx der in Richtung der Zylinderachse verlaufenden positiven x-Achse. Da die Konzentration des betrachteten Gases in positiver x-Richtung abnimmt, ist dn/dx negativ. Folglich gilt
jx
D
dn . dx
(10.26)
150
10 Eigenschaften flüssiger und gasförmiger Materie
Der Proportionalitätsfaktor heißt Diffusionskoeffizient; er hat die Dimension l2/t. Die Beziehung trägt den Namen 1. Ficksches Gesetz (A.E. Fick, 1829-1901). Für den allgemeinen Fall eines beliebig gerichteten Konzentrations-Gradienten ist Gl (10.43) zu erweitern zu
j
10.4
D grad n .
(10.27)
Strömende Flüssigkeiten und Gase
10.4.1 Grundbegriffe Bisher haben wir uns mit ruhenden Flüssigkeiten und Gasen befasst. Die Moleküle führten zwar regellose Fluktuationen innerhalb des ihnen zur Verfügung stehenden Volumens aus, aber sie bewegen sich nicht als Ganzes in eine bestimmte Richtung. Mit solchen makroskopischen Strömungen wollen wir uns in diesem Teilkapitel beschäftigen. Wir werden uns vor allem auf Flüssigkeiten beziehen; sie können in guter Näherung als inkompressibel angesehen werden, was die Berechnungen wesentlich erleichtert. Wie wir sehen werden, kommt es bei Gasen sehr auf deren Geschwindigkeit an. Die Bewegungsgleichung für ein Massenelement 'm U 'V einer strömenden Flüssigkeit ist
G G G Fp FG FR
'm
G G d v( r , t ) . dt
(10.28)
G Hierin ist Fp die resultierende Kraft auf die Querschnittsflächen der Flüssigkeit (Druckkraft),
a)
b)
Abb. 10.13: a) Erzeugung einer laminaren Strömung um eine Kugel als Hindernis; b) Ausbildung einer turbulenten Strömung hinter einem scharfkantigen Hindernis: es entsteht eine Wirbelstraße.
G G FG die Gewichtskraft und FR die Reibungskraft zwischen den einzelnen Flüssigkeitsschichten,
Wie in (10.28) angedeutet, ist die Geschwindigkeit eines Massenelements im allgemeinen Fall orts- und zeitabhängig. Die Bewegung der Flüssigkeit nennen wir stationär, wenn sich ihr G G Bewegungsmuster an jedem Ort zeitlich nicht ändert; von Ort zu Ort kann v(r ) durchaus variieren. Die Bahnkurve, die ein Flüssigkeitselement während der Zeit t durchläuft, wird als
10 Eigenschaften flüssiger und gasförmiger Materie
151
Stromlinie bezeichnet. Die Stromliniendichte ist ein Maß für die Flussdichte. Letztere ist definiert als das Volumen der strömenden Flüssigkeit, die pro Zeiteinheit durch die Fläche A fließt. Unter Bezug auf die einzelnen Kräfte treffen wir nun folgende Fallunterscheidungen: Wir sprechen von idealen Flüssigkeiten, wenn die Reibungskraft gegenüber den anderen Kräften in (10.28) vernachlässigbar klein ist. Beispiele sind strömendes Wasser oder Alkohol. Überwiegt dagegen die Reibungskraft, so reden wir von zähen oder viskosen Flüssigkeiten, wie es z.B. Honig oder Sirup sind. Weiter bezeichnen wir Strömungen als laminar, wenn sich die einzelnen Stromlinien nicht überschneiden (Abb. 10.13a). Anderenfalls nennen wir sie turbulent (Abb. 10.13b). Solche Strömungen kommen durch Reibung zwischen den Randschichten zustande. Experimentell können Stromlinien sichtbar gemacht werden, indem man in einen flachen Glasbehälter durch Löcher oder Schlitze zuerst klares Wasser und anschließend Tinte strömen lässt. Der Übergang von laminarer zu turbulenter Strömung wird durch den Wert der Reynoldsschen Zahl (O. Reynolds, 1842-1912) bestimmt. Darunter wollen wir das Verhältnis von kinetischer Energie zu Reibungsenergie verstehen:
Re : l U v / K .
(10.29)
Hierin ist l eine die Größe des Hindernisses bestimmende Länge, v die Geschwindigkeit der strömenden Flüssigkeit relativ zum Hindernis, U die Dichte der Flüssigkeit und K die Viskosität (s. Kap.10.7.3 ). Für ideale Flüssigkeiten (K = 0) ist Re = f , bei hinreichend kleinen Reynolds-Zahlen, E ER , liegt laminare Strömung vor. Oberhalb eines kritischen Wertes, der für Wasserströmungen in Rohren bei etwa Re = 2300 liegt, wird die Strömung turbulent. Die Ableitung von (10.29) ist schwierig; wir beschränken uns daher auf eine Dimensionsbetrachtung: Die kinetische Energie ist E mv 2 / 2 l 3 U v 2 ; die Reibungsenergie ist ER
F l K A vl K l 2 v . Division der beiden Ausdrücke ergibt die Reynolds-Zahl.
10.4.2 Strömungen idealer Flüssigkeiten 10.4.2.1 Eulersche Gleichung Die Grundgleichung für strömende ideale Flüssigkeiten ist die Eulersche Gleichung der Hydrodynamik. Zu ihrer Ableitung gehen wir von der Newtonschen Bewegungsgleichung aus. Die Kraft auf ein Volumenelement der Masse m ist
G F
G d 2r m 2 grad p dV , dt
(10.30)
152
10 Eigenschaften flüssiger und gasförmiger Materie
G wobei der letzte Term von der Druckkraft Fp grad p dV herrührt. Im Schwerefeld der Erde G ist der erste Term durch die Schwerkraft mg zu ersetzen, so dass wir für die Beschleunigung eines Volumenelements erhalten
G a
G 1 g grad p .
(10.31)
U
Die Beschleunigung setzt sich aus zwei Anteilen zusammen, denn die Geschwindigkeit kann sich nicht nur zeitlich ändern, sondern auch längs des zurückgelegten Weges. Für diesen Teil haben wir also zu schreiben
G wv wt
G § wr ·G ¨ grad ¸ v © wt ¹
G G v grad v .
(10.32)
Damit wird die Gesamtbeschleunigung (auch als substantielle Beschleunigung bezeichnet)
G a
G wv G G (v grad ) v wt
G 1 g grad p .
U
(10.33)
Dies ist die bereits 1755 von Euler abgeleitete Grundgleichung für strömende ideale Flüssigkeiten oder Gase. Zu ihr tritt als zweite Grundgleichung die Kontinuitätsgleichung, die im nächsten Abschnitt angesprochen wird.
10.4.2.2 Kontinuitätsgleichung Zunächst wollen wir eine Flüssigkeit ins Auge fassen, die durch eine Röhre unterschiedlichen Durchmessers strömt (Abb. 10.14). Auf die linke StirnG fläche wirke senkrecht von außen eine Kraft F1 , auf die G rechte Stirnfläche der verengten Röhre eine Kraft F2 . Wir r r v1 v2 setzen voraus, dass die Flüssigkeit inkompressibel ist; ihre Dichte ist also überall gleich. Durch den Querschnitt A1 strömt pro Zeiteinheit Flüssigkeit der Masse Abb. 10.14: Bei einer Verengung des Rohrquerschnitts erhöht sich dm dx U A1 U A1 v1 (10.34) die Strömungsgeschwindigkeit dt dt
10 Eigenschaften flüssiger und gasförmiger Materie
153
und durch den Querschnitt A2 der verengten Röhre
dm dt
U A2
dx dt
U A2 v 2 .
(10.35)
Durch die Fläche A1 muss die gleiche Flüssigkeitsmenge strömen wie durch A2; also erhalten wir
U A1 v1 A1 v1
U A2 v2 A2 v 2 , Kontinuitätsgleichung .
(10.36) (10.37)
Diese Beziehung heißt Kontinuitätsgleichung für stationäre Strömungen. Ist das Volumen beliebig geformt, so ist die austretende Flüssigkeitsmenge pro Zeit (S = Oberfläche)
G
G
v³ U v dS .
(10.38)
S
Da sich innerhalb des Volumens keine Quelle oder Senke befinden soll, muss diese Menge gleich der Abnahme der in diesem Volumen befindlichen Flüssigkeit sein. Das liefert
G
G
v³ U v dS S
w U dV . wt V³
(10.39)
Das Oberflächenintegral formen wir mit Hilfe des Gaußschen Satzes (Anhang) in ein Volumenintegral um. Die Kontinuitätsgleichung erhält dann die Form
wU G di v U v . wt
(10.40)
Handelt es sich wie oben um eine inkompressible Flüssigkeit, so vereinfacht sich dieser Ausdruck zu
div v 0 .
(10.41)
154
10 Eigenschaften flüssiger und gasförmiger Materie
10.4.2.3 Bernoulli-Gleichung Strömt eine ideale, inkompressible Flüssigkeit durch eine Röhre veränderlichen Querschnitts, so ändert sich nach der Kontinuitätsgleichung seine Geschwindigkeit und damit seine kinetische Energie. Damit verknüpft ist eine Änderung des Druckes in der Flüssigkeit. Das ist eine Folge des Energieerhaltungssatzes. Dies lässt sich folgendermaßen einsehen: In der Zeit 't tritt durch den Querschnitt des weiten Rohrabschnittes das Volumen
'V
A1
'x1 . 't
(10.42)
Dabei leistet der dort herrschende Druck p1 die Arbeit
'W1
p1 A1 'x1
p1 'V
(10.43)
Das gleiche Volumen muss in der gleichen Zeit auch durch die Engstelle treten. Dabei leistet der dort herrschende Druck die Arbeit
'W2
p2 A2 'x2
p2 'V .
(10.44)
Durch diese Arbeit ändert sich die potentielle Energie. Die kinetische Energie eines Volumenelementes 'V ist
Ekin
1 'm v 2 2
1 U 'V v 2 2
(10.45)
Für reibungsfreie Flüssigkeiten in einem waagerecht (10.44) - (10.46) der Energieerhaltungssatz in der Form
p1 'V
1 2 U v1 'V 2
1 p2 'V U v 22 'V 2
p1
1 U v12 2
1 p2 U v 22 2
p
1 U v2 2
p0
const.
p0
Bernoulli-Gleichung.
liegenden
Rohr
gilt
mit
(10.46)
(10.47)
(10.48)
Die drei Drücke haben etwas verwirrende Namen, die historisch bedingt sind. Der konstante Druck p0 heißt Gesamtdruck, er wird gemessen an Stellen, an denen v = 0 gilt. Der Druck U v 2 / 2 heißt Staudruck, während p der statische Druck der strömenden Flüssigkeit ist. Die Änderung des statischen Druckes kann mittels senkrecht auf die Flüssigkeitsröhre aufgesetzten
10 Eigenschaften flüssiger und gasförmiger Materie
155
Glasröhren demonstriert werden. Die Höhe des Flüssigkeitspegels ist ein Maß für den statischen Druck (Abb. 10. 15)
p
U gh .
(10.49)
Alle in der Bernoulli-Gleichung (D. Bernoulli, 1700-1782) vorkommenden Drücke lassen sich mit geeigneten Drucksonden messen. Den statischen Druck können wir analog Abb. 10.16 mit einer Drucksonde, die seitliche Öffnungen aufweist, ermitteln (10.16a). Zur Messung des Gesamtdruckes wird das Pitot-Rohr (Abb. 10.16b) verwendet, das eine Öffnung am Kopf besitzt; dort ist v = 0. Den Staudruck erhalten wir nach (10.65) aus der Differenz von Gesamtdruck und statischem Druck mit dem Prandtl-Rohr (L. Prandtl, 18751953) (Abb. 10.16c). a)
b)
h1
h2
h3
Abb. 10.15: Messung des statischen Druckes mittels auf den Rohren angebrachter Glasröhrchen
c)
1 2 rv 2 Abb. 10.16: a) Messung des statischen Druckes p mit einer Drucksonde; b) Messung des Gesamtdruckes p0 mittels eines Pitot-Rohres; c) Ermittlung des Staudruckes mit dem Prandtleschen Staurohr Liegen die Rohre nicht waagerecht, sondern sind gegenüber der Horizontalen geneigt, so muss noch die unterschiedliche potentielle Energie 'm g h U g h 'V im Energieerhaltungssatz berücksichtigt werden. Die Bernoulli-Gleichung lautet dann
p U g h( x )
1 U v 2 ( x) const. 2
(10.50)
Die Bernoulli-Gleichung gilt näherungsweise auch für Gase, wenn die Strömungsgeschwindigkeiten klein gegenüber der Schallgeschwindigkeit sind. Wählen wir als Beispiel Luft ( U = 1,293 kg/m3) mit einer Geschwindigkeit von v = 100 m/s, so ergibt sich p = 0,935 p0 und damit eine Dichteänderung von nur 6,5%. Erreicht die Strömung dagegen Schallgeschwindigkeit, so beträgt die Dichteänderung 74%, die Kompression kann dann nicht mehr vernachlässigt werden.
156
10 Eigenschaften flüssiger und gasförmiger Materie
10.4.2.4 Anwendungsbeispiele Wir demonstrieren zunächst die Bernoulli-Gleichung an einem Phänomen, das hyrodynamisches Paradoxon genannt wird. Die Versuchsanordnung (Abb. 10.17a/b) besteht aus zwei kreisförmigen Metallplatten A und B, von denen eine, A, in der Mitte ein Loch aufweist. Dort ist ein Rohr von einigen mm Durchmesser senkrecht eingepasst, durch das Pressluft eintreten kann. Nähern wir die andere Scheibe, B, der ersten, so wird sie von dieser von einer bestimmten Entfernung an nicht etwa abgestoßen, sondern angezogen! Dieses “Paradoxon” erklärt sich folgendermaßen: Die Geschwindigkeit der Luftmoleküle ist nach ihrem Austritt hoch, nimmt aber in radialer Richtung ab, so dass am Rand nur der Luftdruck des Außenraumes wirkt. Infolge des verringerten statischen Druckes in der Nähe der Austrittsöffnung ergibt sich also eine resultierende Kraft, welche die Scheiben zusammendrückt. Auf der Bernoulli-Gleichung beruhen v1 , p1 viele Anwendungen. Sinnvolle Beispiele sind Wasserstrahlpumpe, Bunsenbrenner, v2 , p2 Zerstäuber (Abb. 10.18) und Schiffsentlüfter. Weniger nützlich ist das Abdecken von Hausdächern durch Sturm. Die Geschwindigkeit der Luftmoleküle in der Nähe eines Abb. 10.17: Hydrodynamisches Paradoxon Hausdaches kann durch das Zusammenpressen der Stromlinien erheblich größere Werte annehmen als weit oberhalb desselben, so dass eine resultierende Kraft nach oben entsteht (Abb. 10.19).
r F
r r v 2 >> v1
r v1
Abb. 10.18: Prinzip der Wasserstrahlpumpe
Abb. 10.19: Abdecken eines Hausdaches bei Sturm durch den entstehenden Unterdruck
10 Eigenschaften flüssiger und gasförmiger Materie
157
Strömungen unterschiedlicher Geschwindigkeiten spielen auch eine wichtige Rolle beim Auftrieb. Das Profil der Tragflächen eines Flugzeuges muss unsymmetrisch aufgebaut sein, so dass die Luft oberhalb des Flügels schneller strömt als unterhalb der Tragfläche. Dies hat einen Unterdruck oberhalb des Flügels zur Folge und damit eine nach oben gerichtete resultierende Kraft (aerodynamischer Auftrieb, Abb. 10.20).
Fres
1 U A (v 22 v12 ) 2 | U A (v 2 v1 ) .
A( p2 p1 )
(10.51)
Diese Beziehung trägt den Namen “Gesetz von Kutta-Joukowski” (M. W. Kutta, 1867-1944 und N. E. Joukowski, 1847-1921). Beim Aufprall der Luft auf den Flügel und vor allem beim Zusammentreffen der Strömungen hinter ihm treten zusätzlich Wirbel auf, die auf die hier vernachlässigte Reibung zurückzuführen sind. Solchen Phänomenen wenden wir uns jetzt zu. r FA r v1 Abb. 10.20: Aerodynamischer Auftrieb einer Tragfläche infolge unterschiedlicher Geschwindigkeiten auf der Unterr und Oberseite v2
10.4.3 Innere Reibung Wir lassen die Voraussetzung einer idealen Flüssigkeit fallen und untersuchen die Konsequenzen bzgl. strömender Flüssigkeiten und Gase. Die auftretende innere Reibung zwischen den Flüssigkeits- und Gasschichten, wenn diese sich relativ zueinander bewegen wird durch intermolekulare Kräfte verursacht. Beispielsweise bedarf es einer Kraft, um einen Löffel mit konstanter Geschwindigkeit durch ein Glas mit Sirup zu führen.
10.4.3.1 Allgemeiner Ausdruck für die Reibungskraft Um einen quantitativen Ausdruck für die Reibungskraft zu finden, betrachten wir die in Abb. 10.21 skizzierte Anordnung. Sie zeigt eine Platte der Gesamtfläche A, die vollständig in eine Flüssigkeit taucht. An den Wandungen soll die Flüssigkeit haften. Um die Platte entlang der x-Richtung mit konstanter Geschwindigkeit durch die Flüssigkeit zu führen, benötigt es einer Kraft. Experimentell finden wir
F
K A
dv . dz
(10.52)
158
10 Eigenschaften flüssiger und gasförmiger Materie
z
r v = (v z , 0, 0)
z
z 0 + dz z0
r F
z 0 - dz
A
-z
r r v(z 0 + dz) r v(z 0 )
v(z 0 - dz) x
y Abb. 10.21: Geschwindigkeitsprofil beim Hindurchführen einer ebenen Platte durch eine viskose Flüssigkeit G Nach dem dritten Newtonschen Gesetz ist sie entgegengesetzt gleich zur Reibungskraft FR
FR
K A
dv . dz
(10.53)
Den Proportionalitätsfaktor nennen wir dynamische Viskosität. Sie hat die Dimension
>K @
Ns / m 2
Pa s .
(10.54)
Zur Ermittlung der Viskosität sind spezielle Messverfahren entwickelt worden, z.B. das unten besprochene Kugelfallviskometer. Zwei häufiger verwendete Gerätetypen sind Kapillar- und Rotationsviskosimeter. Für Wasser ergibt sich bei T = 20° C die Viskosität zu K = 1,002 mPas, für Glyzerin finden wir K = 1480,0 mPas. Für den späteren Gebrauch wollen wir (10.40) noch auf den Fall erweitern, dass ein beliebiger Geschwindigkeitsgradient vorliegt. Wir betrachten vorerst wieder eine Strömung in x-Richtung.
grad v x
§ wvx wvx wvx · , , ¨ ¸. © wx wy wz ¹
Zunächst sei wieder nur die letzte Komponente ungleich null. Die Geschwindigkeit entwickeln wir in eine Taylor-Reihe, wobei Terme 2. und höherer Ordnung vernachlässigt werden sollen.
v x ( z0 dz )
v x ( z0 )
w vx dz ... . wz
(10.55)
10 Eigenschaften flüssiger und gasförmiger Materie
159
Eine herausgegriffene Flüssigkeitsschicht der Dicke dz erfährt durch die benachbarten Schichten auf der einen Seite tangential eine bremsende Kraft und auf der anderen eine beschleunigende Kraft (Abb. 21b). Die resultierende Kraft pro Flächenelement d xd y ist
dFR( res )
dFR ( z0 dz ) dFR ( z0 ) °§ w v x · ¸ °¯© wz ¹ z
K dxdy ®¨
z0 dz
§ wv · ¨ x ¸ © wz ¹ z
½° ¾. z0 ° ¿
(10.56)
Bildung der Ableitungen in (10.55) und Einsetzen in (10.56) ergibt für die Reibungskraft auf ein Volumenelement dV dxdydz
dFR( res ) K dV
w2vx . wz 2
(10.57)
Ein analoger Ausdruck gilt für eine Geschwindigkeitsänderung in y-Richtung. In Richtung der Strömungsrichtung kann ein Geschwindigkeitsgradient nur bei kompressiblen Medien, etwa Gasen, auftreten. Unter Einschluss dieses Falles erhalten wir also
§ w2 v w2v w2v · dFR( res ) K dV ¨ 2x 2x 2x ¸ K 'v x dV . wy wz ¹ © wx G Für eine beliebige Strömungsrichtung v
(10.58)
(v x , v y , v z ) ist das Ergebnis zu erweitern in
G G dFR( res ) K ' v dV
(10.59)
10.4.3.2 Stokessches Reibungsgesetz, Kugelfallviskosimeter Eine gerade erwähnte Möglichkeit, die Viskosität zu messen, bietet das Kugelfallviskosimeter. Die Methode basiert auf dem Stokesschen Reibungsgesetz (G. G. Stokes, 1819-1903). Die Viskosität wird aus der Geschwindigkeit einer Kugel (Radius r) bestimmt, die durch die betreffende Flüssigkeit gleitet. Die Versuchsanordnung besteht aus einem senkrecht aufgestellten Rohr, in dem sich die Flüssigkeit befindet. Lassen wir eine Kugel in die Flüssigkeit fallen, so nimmt sie auf Grund der Reibung bald eine konstante Geschwindigkeit an. In diesem Zustand hält die Gewichtskraft der Summe aus Auftriebskraft und Reibungskraft das Gleichgewicht. Nach Stokes ist die Reibungskraft
G FR
G 6SK r v 0
(10.60)
160
10 Eigenschaften flüssiger und gasförmiger Materie
Die Kräftebilanz ergibt (der Index 0 bezieht sich auf die Kugel):
m0 V0 U Fl . 6S r0 v0
K
4r 2r
r v
r v
r v
(10.61) Das Stokessche Reibungsgesetz kann aus der im übernächsten Abschnitt behandelten Navier-StokesGleichung unter der Voraussetzung, dass die GeschwinG digkeit v so klein ist, dass der nichtlineare Term G G (v grad ) v vernachlässigt werden darf, abgeleitet werden. Wir beschränken uns hier auf eine Abschätzung (Abb. 10.22). Damit die Kugel sich mit konstanter Geschwindigkeit v 0 bewegt, bedarf es der Kraft F K A v 0 / d ; die Fläche ist A 4S r 2 . Nach dem Vorhergesagten ist d die Strecke, auf der die Geschwindigkeit auf null abfällt; wir setzen näherungsweise d rKugel .
Einsetzen ergibt Abb. 10.22: Geschwindigkeitsprofil in einer viskosen Flüssigkeit, wenn durch diese von oben eine Kugel hindurch fällt
F | K 4S r 2
v0 r
4SK r v 0
(10.62)
Das Ergebnis ist bis auf einen Zahlenfaktor 1,5 korrekt.
10.4.3.3 Laminare Strömungen durch Rohre
Als einfachstem Fall nicht-idealer Flüssigkeitsströmungen wenden wir uns nun laminaren Strömungen (durch Rohre) zu, die sich in vielen Bereichen der Natur und Technik (Wasserleitungen, Öl- und Gaspipelines) finden. Ein Ausdruck für die zeitliche Durchflussmenge wurde zuerst von G. Hagen (1797-1884) und unabhängig von diesem von S. D. Poiseuille hergeleitet. Zur Ableitung betrachten wir der Einfachheit halber ein horizontal liegendes Rohr der Länge l und des Radius R (Abb. 10.23). Um eine stationäre Strömung aufrechtzuerhalten, G G muss die Reibungskraft FR wieder durch eine äußere Kraft Fa kompensiert werden.
p1
2R
2r
G Fa p2
Abb. 10.23: Geschwindigkeitsprofil einer laminaren Strömung
G FR
(10.63)
Die Reibungskraft auf einen konzentrischen Teilzylinder mit Radius r ist nach (10.53)
FR
K 2S rl
dv . dr
(10.64)
10 Eigenschaften flüssiger und gasförmiger Materie
161
Die äußere Kraft ist gegeben durch die resultierende Druckkraft auf die Stirnflächen des Rohres
Fa
S r 2 ( p1 p2 ) .
(10.65)
Gleichsetzen und Auflösen nach v ergeben
v
³
p1 p2 rdr C . 2K l
(10.66)
Die Integrationskonstante lässt sich aus der Haftbedingung für r = R, nämlich v = 0, bestimmen. Wir erhalten ein parabolisches Geschwindigkeitsprofil:
v
p1 p2 2 (R r 2 ) . 4K l
(10.67)
Die über den Rohrquerschnitt gemittelte Geschwindigkeit wird
v
1 v(r ) dAr A³
pR 2 . 8K l
(10.68)
Damit folgt für das pro Zeit durch den Querschnitt A strömende Flüssigkeitsvolumen
V t
S R2 v
S R4 ( p1 p2 ) . 8K l
(10.69)
Bemerkenswert ist an diesem Ausdruck die starke Abhängigkeit vom Radius des Rohres. Diese nutzt z. B. unser Körper aus, um durch Änderung des Durchmessers der Adern die Durchflussmenge des Blutes zu regeln. Das Hagen-Poiseuillesche Gesetz lässt sich ebenfalls zur Messung der Viskosität heranziehen (Kapillarviskosimeter). Allerdings wirkt sich die unterschiedliche Scherrate dv/dr in manchen Fällen ungünstig aus. Die Viskosität kann nämlich scherratenabhängig sein; wir sprechen in diesem Fall von nicht-newtonscher Viskosität. Dieser Nachteil wird beim Rotationsviskosimeter vermieden. Während bei der Festkörperreibung die Kraft nahezu unabhängig von der Geschwindigkeit ist, ist sie innerhalb der Flüssigkeit proportional zu dieser.
162
10 Eigenschaften flüssiger und gasförmiger Materie
10.4.3.4 Navier-Stokes-Gleichung
In einer laminaren Flüssigkeit bewegen sich die Flüssigkeitselemente in den einzelnen Stromfäden alle in eine Richtung. Es treten keine Wirbel auf. Bei genügend kleinen ReynoldsZahlen können sich die Richtungen einzelner Stromfäden ändern, wobei sich Wirbel bilden. Die Gleichung, mit der im Prinzip solche Strömungsverläufe beschrieben werden können, ist die Navier-Stokes-Gleichung, die wir jetzt aufstellen wollen. Dazu müssen wir zu den in idealen Flüssigkeiten (bzw. in der Eulerschen Gleichung) auftretenden Kräfte, die natürlich auch in Strömungen viskoser Flüssigkeiten existieren, die oben abgeleitete Reibungskraft (10.59) hinzufügen. Das ergibt pro Volumenelement
G §w ·G (v grad ) ¸ v © wt ¹
U¨
G
G
U g grad p K 'v
Navier-Stokes-Gleichung
(10.70)
Die Navier-Stokes-Gleichung ist wie die Eulersche Gleichung (10,33) eine nichtlineare Gleichung. Im Unterschied von dieser ist sie aber von 2. Ordnung und damit schwieriger zu lösen. Als einfaches Beispiel wollen wir die Hagen-Poiseuille-Beziehung, die wir im letzten Abschnitt bereits kennen gelernt haben, ableiten. Wir setzen eine in x-Richtung horizontal verlaufende stationäre Strömung einer inkompressiblen Flüssigkeit voraus.
G v
^v x
G wv wt
v( y, z ),0,0` .
(10.71)
G F
G div v 0;
0;
G
U g 0;
Die Inkompressibilitätsbedingung vereinfacht sich damit zu w v x / wx wird zu
G
G
G
U (v grad ) v grad p K 'v .
(10.72) w v / wx
0 und (10.70)
(10.73a)
In Komponentendarstellung schreibt sich dies als
0
§ w2 v w2v · wp K ¨ 2 2 ¸; wx wz ¹ ©wy
wp ; wy wp 0 . wz 0
(10.73b)
10 Eigenschaften flüssiger und gasförmiger Materie
163
Die Gleichungen besagen, dass der Druck nur von x abhängt, er ist also über den Querschnitt des Rohres konstant. Explizit lautet die erste Teilgleichung also
§ w 2 v( y , z ) w 2 v( y , z ) · dp ( x) K¨ ¸. 2 wz 2 ¹ dx © wy Da die linke Seite der Gleichung nur von x abhängt und die rechte Seite nur von y,z, müssen beide Seiten gleich einer gemeinsamen Konstante sein. Mithin zerfällt die Gleichung in
dp( x) a; dx § w 2 v( y, z ) w 2 v( y, z ) · K¨ ¸ a. 2 wz 2 ¹ © wy
(10.73c)
Die Integration der ersten Gleichung ergibt
p( x) mx b ;
m a.
(10.74)
Die Steigung dieser „Geraden“ bedeutet also das Druckgefälle und die additive Konstante den Druck am Rohranfang: Bezeichnen wir
p( x 0)
p1 ;
b
m
p( x l )
p2 .
(10.75)
so folgt
p1 ;
p2 p1 . l
(10.76)
Zur Lösung der zweiten Gleichung gehen wir zu ebenen Polarkoordinaten über:
y
r cos M ,
x
r sin M .
(10.77)
Die Geschwindigkeit hängt wegen des kreisförmigen Rohrquerschnittes nicht von M ab, sondern nur vom Radius r.
v( y, z )
v(r )
v
x2 z 2
Damit wird
G 'v
w2 v w2v wy 2 wz 2
d 2 v 1 dv dr 2 r dr
1 d § dv · ¨r ¸. r dr © dr ¹
164
10 Eigenschaften flüssiger und gasförmiger Materie
Setzen wir dies in die untere der Gln. (10.73c) ein, so erhalten wir
d § dv· a r. ¨r ¸ dr © dr ¹ K Durch zweimalige Integration ergibt sich für die Geschwindigkeit
a 2 r C1 ln r C2 4K
v(r )
Der zweite Term muss verschwinden, da sonst für r = 0 die Geschwindigkeit unendlich groß würde. Folglich ist C1 0 . Zur Bestimmung der zweiten Integrationskonstante nutzen wir die Randbedingung v(r = R) = 0 aus:
v( R )
a 2 R C2 4K
0 o C2
a 2 R . 4K
Durch Einsetzen von C2 in obige Beziehung für v ergibt sich das schon bekannte parabolische Geschwindigkeitsprofil, Gl. 10.6, und damit das Hagen-Poiseuillesche Gesetz.
10.4.3.5 Entstehung und Charakterisierung von Wirbeln
Die räumliche Änderung der Geschwindigkeit, die das zweite Glied der Navier-StokesGleichung beschreibt, wird durch Betrag und Richtung festgelegt. Es ist daher zweckmäßig, den Term entsprechend zu zerlegen. Das gelingt mit Hilfe einer Relation der Vektoranalysis, die für unseren Fall lautet
G
G
v grad v
1 G G grad v 2 v u rot v . 2
(10.78)
Der erste Term der rechten Seite gibt den Betrag der räumlichen Änderung an und der zweite die Änderung der Richtung. Letzterer führt zu Wirbeln, denen wir uns jetzt zuwenden wollen. Wie in Abschnitt 10.4.2.4 bereits erwähnt, finden sich Wirbel bevorzugt hinter Hindernissen wie etwa den Flügeln von Flugzeugen (Abb. 10.20), wo stärkere Geschwindigkeitsunterschiede in der Strömung auftreten. Solche Wirbel können sich ablösen, wodurch es zur Ausbildung einer Wirbelstraße kommt. Ein solcher Wirbel ist gekennzeichnet durch einen Wirbelvektor
G :
1 G rot v . 2
(10.79)
10 Eigenschaften flüssiger und gasförmiger Materie
165
Dieser Vektor beschreibt die Winkelgeschwindigkeit des Wirbels. Betrachten wir einen G beliebigen Punkt Pi (r ) einer strömenden Flüssigkeit, der sich mit der konstanten WinkelG geschwindigkeit Z um den Ursprung O dreht. Der Ursprung selbst soll sich mit der GeschwinG digkeit u0 bewegen können.
G G G v0 (Z u ri ) .
G vi
(10.80)
G Bilden wir rot vi , so erhalten wir zunächst
G rot vi
G G G G rot (Z u ri )ZG rot (Z u ri ) rG .
Wegen der Konstanz der Winkelgeschwindigkeit für jeden Punkt des Körpers reduziert sich dies auf
G rot vi
G G rot (Z u ri )ZG .
(10.81)
G G Die Ausrechnung ergibt unmittelbar das Ergebnis (10.79) mit : Z .
Als Wirbelstärke Z einer Strömung durch eine Querschnittsfläche A bezeichnen wir die sogenannte Zirkulation
Z:
G G
v³ vds .
(10.82)
C
Sie ist mit (10.79) über den Stokesschen Satz (s. Anhang A1.2) verknüpft und lautet in der hier G G gewählten Formulierung dr o ds
G G
G G
v³ vds ³ rot vdA . C
A
Hierin ist also das Linienintegral über die Berandung der Fläche A zu führen. Für einen rotationssymmetrischen Wirbel ist die Zirkulation im Abstand r vom Zentrum
Z
G G
v³ v ds
2S r v .
C
Soll Z unabhängig von r sein, so erfordert das v ~ 1/r. Das kann aber nicht allgemein so sein, denn mit r o 0 müsste v o f streben. Abgesehen von der Singularität bei r = 0 ist das auf Grund der Reibungskräfte unmöglich. Es zeigt sich, dass entweder der innere Teil des Wirbels aus einem sog. Wirbelkern, der wie ein starrer Körper rotiert, besteht oder aus einem Luftschlauch, wie wir ihn bei einem Wirbel im Abflussbereich einer Badewanne finden.
166
10 Eigenschaften flüssiger und gasförmiger Materie
Für eine ideale Flüssigkeit (K = 0) hat H. L. F. von Helmholtz (1821-1849) bestimmte Erhaltungssätze aufgestellt, die als Helmholtzsche Wirbelsätze bekannt sind. Zur Ableitung wenden wir unter Vernachlässigung der Schwerkraft auf (10.70) den Operator rot an, wobei sich wegen rot grad p 0 und rot grad v 2 0 ergibt
G w: wt
G G rot (v u :) .
(10.83)
G G Das ist eine Bewegungsgleichung, aus der bei gegebenen v (t0 ) und : (t0 ) die zeitliche G Entwicklung dieser Größen folgt. Für den Spezialfall : (t0 ) 0 folgt
G w: wt
0,
(10.84)
d.h. eine einmal wirbellose Strömung bleibt für alle Zeiten wirbelfrei. Eine solche Strömung heißt auch Potentialströmung. – Ein existierender Wirbel ist quellenfrei, d.h. die Wirbellinien sind geschlossene Kurven oder enden an den Begrenzungsflächen der Flüssigkeit. Ferner gilt:
wZ wt
0;
(10.85)
Um dies zu sehen, wählen wir den Weg in (10.82) so, dass er sich mit der Flüssigkeit mitbewegt. Den Ort eines Teilchens auf C können wir durch einen Parameter O festlegen, G G r r (t , O ) mit 0 O d 1 . Wir schreiben also Z
Z
G G v³ v ds C
G G wr v ³0 wO d O . 1
(10.86)
Die Gleichung differenzieren wir substantiell nach t (s. (10.48) ff.). Da O zeitunabhängig ist, dürfen wir diese Differentiation und die Integration nach O vertauschen.
dZ dt
G G G d v dr G w v ½ ³0 ®¯ dt d O v wO ¾¿ d O 1
G 1 dv G w § v2 · vC³ dt ds ³0 d O wO ¨© 2 ¸¹ .
(10.87)
Da für eine ideale Flüssigkeit mit g = 0 die Eulersche Bewegungsgleichung (10.50) gilt,
G dv dt
1
U
grad p ,
10 Eigenschaften flüssiger und gasförmiger Materie
167
verschwindet der erste Term; das gilt auch für den zweiten Term, weil (1/ 2) v 2 eine eindeutige Funktion des Ortes ist und das Integral über eine geschlossene Kurve null ist. Damit ist der Beweis von (10.85) erbracht. In einer idealen Flüssigkeit ist die Wirbelstärke Z zeitlich konstant; Wirbel können weder entstehen noch zerfallen.
Wir kehren jetzt zu einer realen Flüssigkeit zurück, lassen also innere Reibung zu. Wie wir gesehen haben, darf diese jedoch nicht zu groß sein, sonst wird die Strömung laminar. Große Reibungskräfte bedingen in einem solchen Fall nach (10.70) große Geschwindigkeitsgradienten. Solche treten bei einer Strömung in grenznahen Schichten von Hindernissen auf Grund der Haftreibung auf, wie z.B. bei Brückenpfeilern, bei Schiffsrümpfen und Flugzeugflügeln. Betrachten wir als Beispiel die Strömung um einen Zylinder. Abb. 10.24 zeigt einen
r v max
y
r v
B A
(¶ v / ¶y ) y = 0 > 0
C
(¶ v / ¶y ) y = 0 = 0
D (¶ v / ¶y ) y = 0 < 0
x
Zylinderabschnitt Abb. 10.24: Strömung in unmittelbarer Nähe eines Zylinders (schematisch (L10.1)) Teil des Zylinders. Die gekrümmte Koordinate längs der Oberfläche sei mit x bezeichnet; die yRichtung stehe dazu senkrecht. Die Stromlinien rücken bis zum Punkt C immer mehr zusammen. An diesem Punkt wird die Geschwindigkeit maximal und fällt danach wieder ab. Der Geschwindigkeitsgradient wu / w x ist also zunächst positiv und daher der Druck nach (10.65) minimal. Der Druckgradient ist folglich negativ. Die Druckkraft auf ein Flüssigkeitselement weist bis zum Punkt C in Richtung der positiven x-Achse. Jenseits dieses Punktes nimmt der Druck wieder zu, so dass die Druckkraft ihr Vorzeichen ändert, also der Strömung entgegengerichtet ist. In unmittelbarer Nähe der Wandung wird die Flüssigkeit daher am Stagnationspunkt D bis auf null abgebremst und fließt schließlich in die entgegengesetzte Richtung, da sich der Punkt mit v = 0 bei weiterer Aufweitung der Stromfäden in Richtung der positiven y-Achse verschiebt. Das führt zur Wirbelbildung. Solche Wirbel bilden sich auch bei Flugzeugflügeln. Allerdings sind dort wegen der niedrigen Symmetrie die Verhältnisse komplizierter. Die Lage des Stagnationspunktes im oberen hinteren Bereich des Flügels, an dem v = 0 wird, ist beim Start zunächst nicht stabil.
168
10 Eigenschaften flüssiger und gasförmiger Materie
Das ist vielmehr erst dann der Fall, wenn er sich durch den auftretenden Wirbel an die hintere Kante verschiebt. Der untere Wirbel kann durch geeignete Formgebung des Flügels zu Gunsten einer den ganzen Flügel umfassenden Zirkulationsströmung unterdrückt werden. Deren Umlaufsinn stellt sich so ein, dass der resultierende Gesamtdrehimpuls – wie in weiter Entfernung – null ist. Wie aus Abb. 10.25 ersichtlich, vergrößert sich dadurch auf der Oberseite des Flügels die Geschwindigkeit der Strömung und damit der aerodynamische Auftrieb.
Abb. 10.25: Entstehung von Wirbeln und resultierende Auftriebsverstärkung bei einem Flugzeugflügel
10 Eigenschaften flüssiger und gasförmiger Materie
169
Zusammenfassung x Ruhende Flüssigkeiten sind frei verschiebbar. x Auf Grund der geringen Deformation einer Flüssigkeit gilt für den Druck in einer Tiefe h
p
U gh ,
wobei U die Dichte der Flüssigkeit und g die Erdbeschleunigung sind. x Die Auftriebskraft eines eingetauchten festen Körpers ist gleich dem Gewicht der verdrängten Flüssigkeitsmenge (Archimedisches Prinzip). x An der Grenzfläche einer Flüssigkeit mit anderen Materialien treten Kräfte auf; die zur Vergrößerung der Flüssigkeitsoberfläche (Grenzfläche Flüssigkeit-Luft) in der Form einer Lamelle der Breite b und der zusätzlichen Fläche 'A erforderliche Kraft ist
F
2V b ,
wobei V die Oberflächenspannung ist. Die nötige Energie ist
'W
H 'A; H V .
x Der Randwinkel, den eine Flüssigkeit mit der Gefäßwand bildet, ergibt sich zu ((1) = Fester Körper, (2) = Flüssigkeit, (3) = Luft (Vakuum))
cos M
V 13 V 12 , V 23
woraus je nach Größe der Grenzflächenspannung eine konvexe oder konkave Flüssigkeitskrümmung resultiert. Zwischen einem Festkörper und seiner Unterlage treten Reibungskräfte auf; sie sind proportional der Normalkraft FN des Festkörpers auf seine Unterlage. x Der Gasdruck p in einem Behälter wird durch den Aufprall der Moleküle auf die Wände erzeugt. Es gilt das Boyle-Mariottesche Gesetz
pV
2 mges v 3 2
2
2 Ekin 3
const.
wobei V das Volumen, m ges die Gesamtmasse des Gases sowie v 2 das mittlere Geschwindigkeitsquadrat sind.
170
10 Eigenschaften flüssiger und gasförmiger Materie
x Der Druck eines Gases in Abhängigkeit von der Höhe h oberhalb des Erdbodens ist durch die barometrische Höhenformel gegeben
p
p0e U0 gh / p0 .
Hierin sind U0 , p0 Dichte bzw. Druck des Gases am Erdboden. x Unter Diffusion verstehen wir einen Nettotransport aus einem Gebiet höherer in ein Gebiet niedrigerer Konzentration. Für die Teilchenstromdichte jx auf Grund eines Konzentrationsgefälles in x-Richtung gilt
jx
D
dn . dx
D heißt Diffusionskoeffizient x Wir unterscheiden zwischen idealen und realen Flüssigkeiten. In einer idealen Flüssigkeit sind Reibungskräfte zu vernachlässigen. Die zugehörigen Bewegungsgleichungen sind die Eulersche bzw. die Navier-Stokes Gleichung. Die Druckverhältnisse in einer idealen Flüssigkeit werden durch die Bernoulli-Gleichung bestimmt.
p
1 U v2 2
p0
const.
Der konstante Druck p0 heißt Gesamtdruck, der Ausdruck (1/ 2) U v 2 Staudruck, während p den statischen Druck bedeutet. x In realen Flüssigkeits- und Gasströmungen existieren Reibungskräfte; um eine Platte der Fläche A im Abstand d von einer zweiten Platte mit konstanter Geschwindigkeit durch die Flüssigkeit zu ziehen, ist die Kraft erforderlich
G FR
G dv K A . dz
K wird als dynamische Viskosität bezeichnet
x Eine Flüssigkeit ströme laminar durch ein Rohr der Länge l und des Radius R. Das Flüssigkeitsvolumen V, das unter dem Überdruck (p1 - p2) pro Sekunde durch das Rohr strömt, ist gegeben durch das Hagen-Poiseuillesche Gesetz
V t
S R4 ( p1 p2 ) . 8K l
10 Eigenschaften flüssiger und gasförmiger Materie
171
Übungsaufgaben 1. Ein Holzzylinder (U = 0,7 10-3 kg m-3) hat einen Durchmesser d = 10 cm und eine Höhe h = 5 cm. Er schwimmt im Wasser mit der Achse senkrecht zur Wasseroberfläche (UWasser = 10-3 kg m-3). a) Wie tief taucht der Zylinder ein? b) Wird der Zylinder aus der Gleichgewichtslage angehoben, vollführt er harmonische Schwingungen senkrecht zur Flüssigkeitsoberfläche aus. Von welcher Art sind diese Schwingungen und wie groß ist die Schwingungsfrequenz, wenn Reibungskräfte vernachlässigt werden? c) Warum legt sich ein langer Zylinder (h >> d) parallel zur Wasseroberfläche? d) Warum vollführt diese Anordnung keine harmonischen Schwingungen? 2. Wie groß ist der Durchmesser von Kapillaren in Baumstämmen, damit durch die Kapillarwirkung das Wasser 20 m hochgezogen wird (V = 0,0729 N/m)? 3. Ein zylindrisches Gefäß ist 2 m hoch mit Wasser gefüllt. Es hat in der Höhe h1 über dem Boden eine Öffnung. In welcher Höhe z muss eine zweite Öffnung angebracht werden, damit sich beide Strahlen im Punkt P treffen? Wo liegt dieser Punkt? z
h1
4. Durch den oberen Teil (Querschnitt A1 = 2 cm2) einer Wasserstrahlpumpe strömt Wasser mit der Geschwindigkeit x v1 und dem Druck p1 = 4 bar. Das Rohr verengt sich dann auf einen Querschnitt A2 = 0,5 cm, aus dem das Wasser mit der Geschwindigkeit v2 austritt. An dieser Stelle herrscht ein Druck p2 = 0 bar. Der Dampfdruck des Wassers, das als inkompressible, reibungsfreie Flüssigkeit angenommen wird, werde vernachlässigt. a) Wie groß sind v1 und v2? b) Der Wasserstrahl tritt letztendlich in die Austrittsdüse ein und erweitert sich darin auf den Querschnitt A3, aus dem er in die Atmosphäre mit dem Druck p3 = 1 bar austritt. Bestimmen Sie die Größe von A3. 1
PP
5. Ein zylindrisches Fass mit der Grundfläche A = 1 m2 ist bis zur Höhe h = 1 m mit Wasser (als ideale Flüssigkeit angenommen) gefüllt. Im Boden befindet sich ein Loch mit der Fläche AB = 1 cm2. Wie lange dauert es, bis das Fass leer ist?
11
Mechanische Schwingungen und Wellen
Schwingungen sind zeitlich periodische Bewegungen einer physikalischen Größe um ihre Ruhelage. Ein einfaches Beispiel ist ein Körper der Masse m, der am unteren Ende einer Feder der Federkonstante D befestigt ist. Wird er aus seiner Ruhelage etwas ausgelenkt, so führt er D / m aus (Abb. 11.1). Schwingungen mit der Frequenz Z0 Beispiele schwingender Objekte finden sich in vielen Bereichen des täglichen Lebens, etwa in Gestalt einer Schaukel, eines Uhrenpendels oder eines Musikinstrumentes. Die Atome in Molekülen und festen Körpern schwingen um ihre Ruhelage, z.B. in einem Quarzkristall einer Armbanduhr. Die Elektronen in Sende- und Empfangsantennen vollführen elektromagnetische Schwingungen hoher Frequenz. Ähnlich häufig sind Wellenbewegungen. Unter ihnen verstehen wir die räumliche und zeitliche Ausbreitung von m Schwingungsbewegungen. Wasserwellen können uns am Meer erfreuen, akustische Wellen bei einem Konzert. Elektromagnetische Wellen „begegnen“ uns im wahrsten Sinn des Wortes Abb. 11.1: Federpendel fast überall. Radio, Fernseher, Handy oder Mikrowellenofen – was wären wir ohne sie!! Es ist zweckmäßig, Schwingungen (und Wellen) nach Art des Mediums zu unterscheiden: a) Periodische Vorgänge, die an ein materielles Medium gebunden sind: elastische Schwingungen und Wellen, b) Periodische Vorgänge, die an kein elastisches Medium gebunden sind: Elektromagnetische Schwingungen und Wellen. Bei einer elastischen Welle können die Teilchen entweder senkrecht oder parallel zur Ausbreitungsrichtung schwingen; es existieren Transversal- und Longitudinalwellen. Elektromagnetische Wellen sind Transversalwellen. Hier sollen die Gesetzmäßigkeiten elastischer (mechanischer) Schwingungen und Wellen dargelegt werden. Periodische elektromagnetische Vorgänge werden später besprochen.
11.1
Lineares Kraftgesetz und harmonische Schwingungen
Wir gehen vom Hookeschen Gesetz aus, d.h. die an einem Körper angreifende Kraft F sei proportional zur Auslenkung aus der Ruhelage. Für eine gestreckte Feder in obigem Beispiel gilt
G F
D xeˆx .
(11.1)
Wir lassen im Folgenden die Vektorzeichen weg. Die Newtonsche Bewegungsgleichung (Grundgleichung der Mechanik) für einen Körper der Masse m lautet damit
174
11 Mechanische Schwingungen und Wellen
m
d2x Dx 0 , oder dt 2
d2x D x 0. dt 2 m
(11.2a)
(11.2b)
Die Masse der Feder wurde dabei vernachlässigt. Da uns die Erfahrung (Experiment) lehrt, dass der Körper eine periodische Bewegung ausführt, versuchen wir den Lösungsansatz
x
x0 cos Z0t .
(11.3)
wobei x0 die konstante Amplitude und Z0 die Frequenz bedeuten; von der Reibung sehen wir ab: Zweimaliges Differenzieren und Einsetzen in die Bewegungsgleichung ergibt nach Division von x0 und cos Zt
Z02
D m
Z0
D . m
0;
(11.4)
(11.5)
Einsetzen von Z0 in den Lösungsansatz zeigt, dass das Federpendel bei Vernachlässigung der Reibung erwartungsgemäß freie periodische Schwingungen mit der Frequenz Z0 ausführt. Dieser Schwingungstyp wird harmonisch genannt, weil ein solcher Oszillator bei hörbaren Frequenzen einen sog. reinen Ton erzeugt. Wir sprechen von ”freien Schwingungen”, weil keine äußere Kraft auf das schwingende System einwirkt.
11.2 Freie gedämpfte Schwingungen Wir wollen jetzt berücksichtigen, dass bei allen Schwingungsbewegungen die Amplitude langsam abnimmt; d.h. die Schwingung ist gedämpft. Die Erfahrung zeigt, dass die Reibungskraft in den meisten Fällen proportional zur Geschwindigkeit des Körpers ist; die Proportionalitätskonstante heißt Reibungskonstante R.
G F
R
G dr . dt
(11.6)
11 Mechanische Schwingungen und Wellen
175
Die Newtonsche Bewegungsgleichung lautet dann
d2x dx 2G Z02 x 0 ; 2 dt dt
G:
R . 2m
(11.7)
Die Größe G wird als Dämpfungskonstante bezeichnet. Wir benutzen in der Folge die komplexe Zahlenebene; dann können wir die unübersichtlichen trigonometrischen Additionstheoreme vermeiden. Aus der Eulerschen Formel eix
cos x i sin x ,
folgt
x
Re ( x0 eOt )
(11.8)
mit O = iZ0. Wir bilden die Ableitungen
dx dt
d2x dt 2
O x0 eOt ,
O 2 x0 eOt .
(11.9)
Einsetzen in die Bewegungsgleichung ergibt die sog. charakteristische Gleichung
O 2 2G O Z02
0.
(11.10)
Die Lösung dieser quadratischen Gleichung ist
G r G 2 Z02 .
O1,2
(11.11)
Jeder Wurzel entspricht eine partikuläre Lösung der Differentialgleichung. Die allgemeine Lösung ist
x
x0 cos Zt x0 sin Zt { x0 cos(Zt M ) ,
wobei M der Phasenwinkel ist. Wie aus (11.11) ersichtlich, sind drei Fälle zu unterscheiden:
1. G Z0 2. G ! Z0 3. G
Z0
(11.12)
176
11 Mechanische Schwingungen und Wellen
Wir betrachten zuerst den 1. Fall
O1,2
G r iZ ;
Z02 G 2 .
Z
(11.13)
Die Lösung ergibt sich hiermit zu
x C1e( O iZ ) t C2 e( O iZ ) t ;
(11.14)
die Konstanten C1,2 lassen sich aus den Randbedingungen gewinnen. Sei für t = 0: x = x0, dx/dt = 0, so folgt
x C1 C2 dx dt
x0
C1O1 C2 O2
½ ° ¾ o C1 0° ¿
O2 O2 O1
;
C2
O1 O2 O1
(11.15/16)
Einsetzen in die Lösungsfunktion, Gl. (11.14), ergibt
x
x0 O2eO1t O1eO2t O2 O1
(11.17a)
x
x0 ª G iZ e( G iZ ) t G iZ e( G iZ ) t º¼ 2iZ ¬
(11.17b)
x
§ eiZt e iZt G eiZt e iZt · x0 eG t ¨ ¸ 2 2i Z © ¹
(11.17c)
x
T
x x : e -d t
G § · x0 e G t ¨ cos Zt sin Zt ¸ Z © ¹
(11.17d)
-
Die Amplitude x0e
t
Abb. 11.2: Exponentiell gedämpfte Schwingung
G t
der Schwingung nimmt
exponentiell mit der Zeit ab (Abb. 11.2). Nach der Zeit 1/ G ist sie bis auf den e-ten Teil des Anfangswertes abgeklungen. Die Dämpfung wird umso stärker, je größer G und damit R wird. Das Verhältnis zweier aufeinander folgender Schwingungsamplituden ist
x2 x1
x0 eG ( t T ) x0 e G t
e G T .
( 11.18)
11 Mechanische Schwingungen und Wellen
177
Der natürliche Logarithmus des inversen Verhältnisses heißt logarithmisches Dekrement / .
/ : ln
x1 x2
GT .
(11.19)
Die Frequenz Z der gedämpften Schwingung ist gegenüber der der ungedämpften Schwingung ( Z0 ) erniedrigt. Die Verschiebung wächst mit der Größe der Dämpfungskonstante G .
2. Fall, G ! Z0 : In diesem Fall ist
O1,2
G r i (G 2 Z02 )
G B G 2 Z02 ,
(11.20)
d.h. O1,2 sind reell.
x
x0 O2 eO1t O1eO2t ; O2 O1
wobei O2 O1
2 G 2 Z02 .
(11.21)
(11.22)
Die Lösungsfunktion x kann höchstens ein Maximum haben und klingt dann exponentiell ab. Dieser Fall trägt auch den Namen Kriechfall, weil die Auslenkung nur sehr langsam auf null zurückgeht. Abb. 11.3 zeigt x(t) für die unter Fall 1 festgelegten Randbedingungen (Obere Kurve).
3. Aperiodischer Grenzfall, G
Z0 :
Der aperiodische Grenzfall trennt den Schwingungsbereich vom Kriechbereich (Abb. 11.3, untere Kurve). Aus (11.20) ergibt sich jetzt nur eine Lösung. Um die zweite unabhängige Lösung zu finden, können wir bei Kenntnis der Anfangsbedingungen erst den Fall wenig verschiedener O -Werte behandeln und dann zum Grenzfall O1 O2 übergehen. Legen wir wieder die Anfangsbedingungen wie unter Fall 1 und 2 zu Grunde, t = 0: x = x0, dx/dt = 0, so ergibt sich
x
x0 e G t 1 G t .
(11.23)
178
11 Mechanische Schwingungen und Wellen Bew.: Für G o Z0 lässt sich Gl. (11.17b) schreiben als
x
x
§ eiZt e iZt · x0 e G t ¨1 iG lim ¸ Z o0 2Z © ¹
(11.24)
Für den Grenzwert ergibt sich
d > w0
eiZt e iZt Z o0 2Z lim
d = w0 t Abb. 11.3: Aperiodischer Grenzfall und Kriechfall
i lim
Z o0
sin Zt
Z
it ,
(11.25)
womit (11.23) hergeleitet ist. Im aperiodischen Grenzfall fällt die Funktion von allen drei Fällen am schnellsten auf null ab. Das ist z.B. bei der Konstruktion von Dämpfungselementen zu beachten.
11.3 Erzwungene Schwingungen Wirkt auf ein schwingungsfähiges System eine äußere periodische Kraft ein, etwa indem wir den Aufhängepunkt eines Federpendels periodisch auf- und abwärts bewegen, so werden in ihm periodische Schwingungen erzwungen. Beispiele sind die Unruhe in mechanischen Armbanduhren oder das Pendel einer Standuhr. Elektrische Schwingungskreise in Radio- oder Fernsehgeräten werden durch äußere periodische Spannungen (elektromagnetische Wellen) zu erzwungenen Schwingungen angeregt. In der Molekül- und Festkörperphysik sind erzwungene Schwingungen eine wichtige Modellvorstellung, z.B. zur Erklärung der optischen Eigenschaften. Wir wollen hier die erzwungene Schwingung nicht wie bisher am linearen Federpendel, sondern am Beispiel eines Drehpendels besprechen, da mit Sie sehen, dass mechanische Schwingungen keineswegs nur bei ersterem Typ auftreten. Die Ergebnisse können mit Hilfe von Tab. (6.1) leicht auf translaatorische Schwingungen übertragen werden. Der Oszillator soll aus einer Scheibe mit dem Trägheitsmoment I bestehen, die starr auf einer gelagerten Drehachse (z-Richtung) sitzt, und einer Spiralfeder, deren eines Ende starr mit der Achse verbunden ist. Auf das andere Ende wirkt ein periodisches Drehmoment (Abb. 11.4). Das erzwingende Drehmoment (die Richtung soll festliegen) ist
D
D0 cos(Ze t ) bzw. D
D0 eiZet .
(11.26)
Abb. 11.4: Drehpendel
11 Mechanische Schwingungen und Wellen
179
Die Bewegungsgleichung ergibt sich aus dem Drehimpulssatz, Gl. (5.28)
Dz
I
dlz . dt
d 2D dD R D D dt 2 dt
Dza .
(11.27a)
Der zweite bzw. dritte Term berücksichtigt die Dämpfung infolge Reibungsverlusten bzw. das rücktreibende Drehmoment. Auf der rechten Seite steht das äußere Drehmoment. Es ist zweckmäßig, die Gleichung noch durch I zu dividieren:
d 2D R dD D 2 D 2 I dt dt 2 I
Dza , I
(11.27b)
Das schreiben wir als
d 2D dD 2G Z02 D dt 2 dt
Dza , I
(11.27c)
wobei G und Z wie folgt definiert sind.
G :
R ; 2I
Z0 :
D . I
(11.28)
Die Bewegungsgleichung ist also völlig analog zu (11.7) aufgebaut. Wir suchen nach der Lösung im eingeschwungenen Zustand. Dazu machen wir den Lösungsansatz
D D 0 ei (Z t M ) ;
(11.29)
e
M ist der Phasenwinkel zwischen dem erregenden Drehmoment und der Auslenkung des schwingenden Systems. Wir bilden die 1. und 2. Ableitung und setzen sie in die Bewegungsgleichung ein:
dD D 0iZe ei (Zet M ) dt d 2D D 0Ze2 ei (Zet M ) 2 dt D 0Ze2 ei (Zet M ) 2G D 0iZe ei (Zet M ) Z02 x0 ei (Zet M )
(11.30)
D0 iZet e , I
(11.31)
180
11 Mechanische Schwingungen und Wellen
I (Ze2 Z02 ) 2iG Ze
D0 iM e ID 0
D0 (cos M i sin M ). ID 0
(11.32)
Diese Gleichung muss für alle Zeiten t erfüllt sein. Das ist nur möglich, wenn die Gleichungen für den Realteil und den Imaginärteil separat erfüllt sind.
I (Ze2 Z02 )
D0 cos M ; 2G Ze ID 0
D0 sin M ID 0
(11.33)
Quadrieren und Addieren ergibt 2
(Z02 Ze2 ) 2 (2G Ze ) 2
D0
§ D0 · ¨ ¸ ; © ID 0 ¹
D0 / I (Z02 Ze2 ) 2 (2ZeG ) 2
; tan M
(11.34)
2G Ze ; Z02 Ze2
.
(11.35/36)
Die relative Amplitude D 0 /( D0 / I ) (die Resonanzkurve) und der Phasenwinkel M sind in Abb. 11.5 und Abb. 11.6 als Funktion der relativen Erregerfrequenz aufgetragen.
a0 D0 / l 1.6
j
-p d/w = 0,01 d/w = 0,02 d/w = 0,1
1.2
-p /2
0.8 0
0.4 0.0
0
0
1
w / w0
Abb. 11.5: Resonanzkurve der gedämpften Schwingung für verschiedene Dämpfungen
1
2
3 w / w0
Abb. 11.6: Phasenverlauf bei der erzwungenen Schwingung für die in Abb. 11.5 angegebenen Dämpfungsfaktoren drei
11 Mechanische Schwingungen und Wellen
181
Die Resonanzkurve hat bei der Frequenz Ze o 0 den Wert D 0 /( D0 / I ) o 1 ; sie durchläuft bei nicht zu starker Dämpfung ein Maximum und klingt für große Ze / Z0 auf null ab. Für G o 0 strebt die Amplitude gegen beliebig große Werte; bei endlicher Dämpfung liegt das Maximum bei
Ze
Z02 2G 2 ,
(11.37)
die Frequenz ist also kleiner als die Resonanzfrequenz Z0 bei verschwindender Dämpfung. Es ist zu beachten, dass (11.37) nicht mit (11.13) für gedämpfte Schwingungen übereinstimmt. Die Phasenverschiebung M strebt mit wachsender Erregerfrequenz gegen den Wert - S , d.h. die Auslenkungen von Erreger und erregtem System werden gegenläufig. Bei (Ze / Z0 ) 1 ist der Phasenwinkel stets - S / 2 , unabhängig von der Dämpfung des Systems.
11.4
Energiebilanz bei der linearen Schwingung
Wir schließen hier an unsere Ergebnisse in Kap. 11.1 an, betrachten also die freie harmonische Schwingung eines linearen Federpendels. Wir wollen die in einer Schwingung gespeicherte Energie berechnen. Zunächst mögen Reibungsverluste vernachlässigt werden. Die kinetische Energie des harmonischen Oszillators ist entsprechend (3.35a)
Ekin
1 § dx · m¨ ¸ 2 © dt ¹
2
1 2 2 2 mx0 Z0 sin Z0t . 2
(11.38)
Die kinetische Energie schwankt periodisch zwischen den Werten 0 und mx02Z02 / 2 . Für den Mittelwert über eine Schwingungsperiode T erhalten wir T
Ekin
2
1 1 § dx · m ¨ ¸ dt T ³0 2 © dt ¹
T
1 1 2 2 2 mx0 Z0 sin (Z0t ) dt T ³0 2
1 2 2 mx0 Z0 4
(11.39)
Für die potentielle Energie ergibt sich
E pot
1 2 Dx 2
1 2 Dx0 cos 2 Z0 t 2
1 2 2 mx0 Z0 cos 2 Z0 t . 2
(11.40)
Entsprechend dem experimentellen Befund wird die potentielle Energie dann maximal, wenn die kinetische Energie minimal ist und umgekehrt. Der Mittelwert ergibt sich zu
182
11 Mechanische Schwingungen und Wellen T
E pot
1 1 2 2 mx0 Z0 cos 2 Z0t ³ T 02
(11.41)
1 2 2 mx0 Z0 4 Die Gesamtenergie ist konstant:
E
1 2 2 mx0 Z0 (sin 2 Z0t cos 2 Z0 t ) const. 2
Ekin (t ) E pot (t )
(11.42)
Wir dehnen jetzt unsere Überlegungen auf den Fall endlicher Dämpfung aus. Ein Teil der mechanischen Energie wird in Wärme umgewandelt. Wir sehen dies, indem wir die Bewegungsgleichung mit dx/dt multiplizieren. Es ergibt sich 2
m
d 2 x dx dx § dx · R ¨ ¸ Dx 2 dt dt dt © dt ¹
0.
(11.43)
Das lässt sich schreiben als 2 d ª m § dx · D 2 º « ¨ ¸ x » 2 »¼ dt «¬ 2 © dt ¹
§ dx · R ¨ ¸ © dt ¹
2
2
R § dx · 2G m ¨ ¸ ; G : . 2m © dt ¹
(11.44)
In der Klammer steht die Summe aus kinetischer und potentieller Energie; der Term auf der rechten Seite bedeutet die zeitliche Änderung der Wärmeenergie Q. Die pro Schwingungsperiode T in Q umgewandelte mechanische Schwingungsenergie wird T
Q
2
§ dx · 2G m ³ ¨ ¸ dt . dt ¹ 0©
(11.45)
Die Lösungsfunktion von Gl. (11.44) ist (s. Gl. (11.17d))
x
x0 eG t (cos Zt
G sin Zt ) { x0 e G t cos(Zt M ) ; Z
(11.17)
Als Anfangsbedingungen legen wir fest:
t
0: x
x0 ; dx / dt
v0 .
(11.46)
11 Mechanische Schwingungen und Wellen
183
Damit werden die Lösungsfunktion und deren Ableitung
x0 eG t cos Zt ;
x dx dt
x0G eG t cos Zt x0 eG t ( Z sin Zt ) ;
Für t = 0 folgt v 0
dx dt
(11.47) (11.48)
x0G . Also wird die 1. Ableitung
v 0 e G t (cos Zt
Z sin Zt ) . G
(11.49)
Wir setzen diesen Ausdruck in (11.45) ein, woraus für die Wärmeenergie folgt T
Q
2G mx02 ³ e 2G t (G cos Zt Z sin Zt ) 2 dt ;
(11.50a)
0
Q
m 2 2 x0 (Z0 G 2 )(e2G T 1) . 2
(11.50b)
Für schwache Dämpfung ( G Z0 ) lässt sich der Ausdruck vereinfachen. Es ist dann G T 1 und e 2G T | 1 2G T . Die Wärmeenergie wird damit
Q | mx02 (Z02 G 2 )G T .
(11.51)
Die Verluste durch Reibung in Form von Wärme nehmen proportional zum Reibungskoeffizienten zu; für G t Z0 ergibt sich eine Vergrößerung proportional G 3 . Als letzten Fall betrachten wir die Energieverhältnisse bei der erzwungenen Schwingung. Wir multiplizieren die Bewegungsgleichung, (11.27a), wieder mit dx / dt bzw. mit dD / dt :
I
d 2D dD dD D D 2 dt dt dt
2
dD § dD · . R ¨ ¸ Da (t ) dt © dt ¹
(11.52a)
Die Gleichung kann geschrieben werden als
d ª I § dD · « ¨ ¸ dt «¬ 2 © dt ¹
2
º d ª D 2 º » « D » »¼ dt ¬ 2 ¼
2
dD § dD · . R ¨ ¸ Da (t ) dt © dt ¹
(11.52b)
184
11 Mechanische Schwingungen und Wellen
Auf der linken Seite der Gleichung steht die Änderung der mechanischen Energie des Oszillators. Sie wird entsprechend dem (-)-Zeichen durch die Reibungsenergie verringert. Die von außen hineingesteckte Energie vergrößert die Energie des Systems. Im stationären Zustand ist die Gesamtenergie konstant,
E
Ekin E pot
const.
(11.53)
Die Reibungsenergie wird dann durch die von außen zugeführte Energie kompensiert. Die vom Oszillator während einer Schwingungsperiode durch das äußere Drehmoment aufgenommene Energie ist in diesem Fall T
W
W
2
T
§ dD · ³0 R ¨© dt ¸¹ dt
1 2 2 R Ze D 0 T 2
R Ze2D 02 ³ cos 2 (Ze t M ) dt
(11.54)
0
G I Ze2 D 02 T ,
(11.55)
sie ist also proportional zu G und D 02 . Die aufgenommene Leistung ist
P
dW dT
G I Ze2 D 02 .
(11.56) Einsetzen der Amplitude aus (11.35) ergibt
P D02 /I
P
4 d/w = 0,01 d/w = 0,04 d/w = 0,1
D02 / I 2 IG Z (Z 02 Z e2 ) 2 (2Z eG ) 2
2 e
(11.57)
2
Die Leistung wird maximal bei Ze 0
0
1.0
we / w0
Abb. 11.7: Die bei einer erzwungenen Schwingung aufgenommene Leistung
bei Ze
P
Z0 (nicht
Z02 G 2 ) (Abb. 11.7). Ihr Wert ist
D02 / I 4G
(11.58)
11 Mechanische Schwingungen und Wellen
11.5
185
Gekoppelte Oszillatoren
Häufig haben wir es nicht nur mit einem Oszillator zu tun, sondern mit mehreren. Beispiele sind etwa elektrische Schwingungskreise in Radio- oder Fernsehgeräten, die so nahe beieinander angeordnet sind, dass die Energie aus einem in den anderen Schwingungskreis übertragen werden kann. In diesem Fall sind es im Allgemeinen zwei schwingungsfähige Systeme, die miteinander gekoppelt sind. Es können aber auch sehr viele Oszillatoren sein wie in kristallinen Festkörpern, in denen die Atome ein Gitter bilden; jedes Atom kann Schwingungen ausführen. Solche Gitterschwingungen können sich dann in Form von Wellen durch den Kristall ausbreiten. D1,2 Hier wollen wir nur den einfachsten Fall zweier mechanisch gekoppelter Oszillatoren besprechen. Unser Modellsystem soll aus zwei identischen, frei aufgehängten dünnen Stangen bestehen, die am unteren Ende zwei Körper (Massenpunkte) mit den Massen m1 und m2 tragen Abb. 11.8: Zwei mittels (Abb. 11.8). Die Masse der Stangen soll diesen gegenüber einer Feder (D1,2) gekopvernachlässigbar sein. Die Einzelpendel seien durch eine pelte Pendel Feder der Federkonstante D1, 2 verbunden. Reibungsverluste werden vernachlässigt. Zur Formulierung der Bewegungsgleichungen stellen wir zunächst die auf die beiden Pendel wirkenden Kräfte zusammen. Durch die Schwerkraft erfahren die Einzelpendel die rücktreibende Kraft
mg sin M | mgM |
mg x : D0 x . r
Also wirken insgesamt auf Körper 1 die Kräfte
D0 x1
Schwerkraftkomponente
D1,2 ( x1 x2 )
Federkraft
und auf Körper 2
D0 x2
Schwerkraftkomponente
D1,2 ( x2 x1 )
Federkraft (entspr. actio = reactio).
(11.59)
186
11 Mechanische Schwingungen und Wellen
Folglich lauten die Bewegungsgleichungen
d 2 x1 D0 x1 D1,2 ( x1 x2 ) 0 dt 2 d2x m 22 D0 x2 D1,2 ( x1 x2 ) 0. dt m
(11.60/61)
Die Gleichungen stellen ein gekoppeltes System aus zwei Differentialgleichungen dar, denn jede der Beziehungen enthält x1 und x2. Sie lassen sich durch den Übergang zu anderen Variablen entkoppeln. Wir erreichen dies durch Addition und Subtraktion der beiden Gleichungen. Es entstehen zwei ungekoppelte Gleichungen in den neuen Koordinaten
u
1 ( x1 x2 ) und 2
1 ( x1 x2 ) . 2
u
(11.62)
§ d2x d 2x · m ¨ 21 22 ¸ D0 ( x1 x2 ) dt ¹ © dt § d2x d2x · m ¨ 21 22 ¸ D0 ( x1 x2 ) 2 D1,2 ( x1 x2 ) dt ¹ © dt
(11.63)
Wir können demnach schreiben
d 2u dt 2 d 2u m 2 dt m
D0 u .
( D0 2 D1,2 )u
(11.64)
Die Lösungen dieser beiden Gleichungen kennen wir bereits (vgl. (11.2b)). Es sind harmonische Schwingungen mit den Frequenzen Z1 und Z2 :
u u
u0(1) cos(Z1 t M1 ); u
(2) 0
cos(Z2 t M2 );
Z12 Z
2 2
D0 m ( D0 2 D12 ) m
2D (Z 12 ) m
(11.65)
2 1
Die harmonischen Schwingungen des entkoppelten Systems heißen Normalschwingungen, die zugehörigen Koordinaten Normalkoordinaten. Wir wollen sie an unserem Doppelpendel demonstrieren.
11 Mechanische Schwingungen und Wellen
187
In Abb. 11.9 sind die Normalschwingungen dargestellt. Die erste Normalschwingung mit der Frequenz Z1 liegt vor, wenn beide Pendel in Phase schwingen. Nur dann wird die Feder nicht
Abb. 11.9: Die beiden Normalschwingungen eines Systems aus zwei gekoppelten Pendeln
D1,2 m1
D1,2 m2
m1
m2
beansprucht. Die gegenphasige Normalschwingung besitzt wegen der zusätzlich wirkenden Federkraft F1 const 2 D1 2 die größere Frequenz Z2 . Für den allgemeinen Fall lassen sich die realen Auslenkungen x1, x2 der beiden Pendel durch Rücktransformation gewinnen:
x1
u u
und
x2
u u .
(11.66)
Das Ergebnis ist
x1
x0 cos(Z1t M1 ) cos(Z2 t M2 )
x2
x0 cos(Z1t M1 ) cos(Z2t M2 )
(11.67)
Für den Fall, dass D0 >> D12 ist, erhalten wir als Funktion der Zeit für x1, x2 sogenannte Schwebungskurven. Wir sehen das am besten, wenn wir die Auslenkungen schreiben als
x1 x2
M M2 · M M2 · § Z Z2 § Z1 Z2 t 1 t 1 2 x0 cos ¨ 1 ¸ cos ¨ ¸ 2 2 2 2 ¹ © ¹ © M M2 · M M2 · § Z Z2 § Z1 Z2 t 1 t 1 2 x0 sin ¨ 1 ¸ sin ¨ ¸ 2 ¹ 2 ¹ © 2 © 2
(11.68/69)
Für den Fall D0 = 8,53D12 sind die Auslenkungen aus Abb. 11.10 zu ersehen. Die in einem Pendel gespeicherte Energie wird in einer halben Periode auf das zweite Pendel übertragen und nach einer weiteren halben Periode wieder zurück auf das erste Pendel. Bei t = T/4 tritt ein Phasensprung S auf. Die Dauer einer Schwebungsperiode beträgt
T
4S . Z1 Z2
(11.69a)
188
11 Mechanische Schwingungen und Wellen
x
Abb. 11.10: Überlagerung zweier ungedämpfter Schwingungen mit nahe benachbarten Frequenzen zu einer Schwebungskurve
0
t
11.6
Mechanische Wellen
Bisher haben wir nur zeitlich periodische Vorgänge besprochen. Schwingungen können sich räumlich ausbreiten. Wir sprechen dann von der Fortpflanzung in Form von Wellen. Beispiele sind Seilwellen, Wasser- und Schallwellen, Licht- und Radiowellen und Röntgenstrahlen. Auch zeitlich nichtperiodische Vorgänge können sich ausbreiten. Lenken wir etwa ein an dem einen Ende befestigtes Seil am anderen Ende kurz vertikal aus der Ruhelage aus, so breitet sich die Störung längs des Seiles aus. Zur weiteren Charakterisierung kann das Polarisationsverhalten dienen: wir unterscheiden Transversal- und Longitudinalwellen. In Gasen existieren nur Longitudinalwellen. Elektromagnetische Wellen sind Transversalwellen. Wie bei der vorangegangenen Diskussion der verschiedenen Schwingungen unterteilen wir die Entstehung und Ausbreitung von Wellen in elastische (mechanische) und elektromagnetische Wellen. Im Folgenden diskutieren wir die Eigenschaften mechanischer Wellen.
11.7
Fortschreitende Wellen, Wellengleichung
y (x,t)
y (x,t)
x
x-vt
Abb. 11.11: Ausbreitung einer Seilwelle
Die Eigenschaften einer Schwingung sind durch eine Bewegungsgleichung festgelegt. Das gilt auch für die Eigenschaften einer Welle. Wir werden die Bewegungsgleichung weiter unten ableiten. Zunächst betrachten wir die allgemeinste Form einer eindimensionalen fortschreitenden Welle. Denken wir uns ein an seinen beiden Enden befestigtes Seil (Abb. 11.11). In der Nähe eines Endes geben wir ihm einen kurzen Schlag. Die entstandene Störung breitet sich über das Seil aus. Dabei sehen wir von einer möglichen Formänderung zunächst ab. Die Auslenkung zur Zeit t = 0 sei < ( x, 0) . Nach einer gewissen Zeit t sei die Störung um den Betrag vt nach rechts gewandert. Die Größe (x - vt) bezeichnen wir als Phase der Welle, v ist ihre Phasengeschwindigkeit. Entsprechendes gilt für \ f ( x vt ) .
11 Mechanische Schwingungen und Wellen
189
Die Bewegungsgleichung für eine eindimensionale Welle ist (s. 11.76)
w 2\ ( x, t ) wt 2
v 2ph
w 2\ ( x, t ) . wx 2
(11.70)
(Die partielle Ableitung bedeutet Ableitung nur nach t bzw. nur nach x). Durch Ausführung der Differentiation von \ ( x, t ) können Sie sich davon überzeugen, dass \ ( x, t ) der Bewegungsgleichung genügt. Im Folgenden wollen wir sie Wellengleichung nennen. Die Phasengeschwindigkeit vph kann für jede Art der Welle berechnet werden. Z.B. ergibt sich für eine Seilwelle
v ph
V , U
(11.71)
wobei U die Dichte des Seils bedeutet und V die Zugspannung. Letztere haben wir definiert als rücktreibende Kraft pro Querschnittsfläche (Kap. 12 ). Wir leiten jetzt die Wellengleichung am Beispiel der schwingenden Saite ab. Abb. 11.12 zeigt ein Massenelement m der vertikal ausgelenkten Saite. Die resultierende rücktreibende Kraft auf dieses ist
F\ ( x dx) F\ ( x) .
(11.72)
a die Auslenkungen klein sein sollen, können wir sin D durch tan D ersetzen,
sin D | tan D
F\
F
w\ wt
und damit
w\ . wt
(11.73)
y
r Fy ( x+dx ) a¢
Auf das Massenelement wirkt also die Kraft
F ( x dx) F ( x) w 2\ F 2 dx wx
wF\ wx
s
dx .
(11.74)
a
s
r Fy (x )
x Abb. 11.12: Zur Ableitung der Wellengleichung
190
11 Mechanische Schwingungen und Wellen
Die Newtonsche Bewegungsgleichung ergibt damit unter Benutzung von (11.73)
m Da F
w 2\ wt 2
F
w 2\ wx 2
(11.75)
V A , folgt für die Wellengleichung
w 2\ wt 2
V w 2\ . U wx 2
(11.76)
Diese Gleichung entspricht (11.70), wobei die Phasengeschwindigkeit
v ph
V / U ist.
(11.77)
Es soll noch einmal betont werden, dass (11.76) für den Fall abgeleitet wurde, dass sich die Form der Welle während der Ausbreitung nicht ändert. Es sind zweierlei Verformungen denkbar: a) die Amplitude der Welle kann sich bei Beibehaltung ihrer Form ändern und b) die Welle kann ihre Struktur ändern. Eine Amplitudenänderung, also ein Abklingen der Welle kommt durch Dämpfung zustande. Den analogen Fall einer gedämpften Schwingung haben wir bereits oben kennen gelernt. Eine Formänderung tritt in dispergierenden Medien auf, d.h. die Phasengeschwindigkeit hängt von der Wellenlänge ab. Die Dispersion ist z.B. bei elektromagnetischen Wellen von großer Bedeutung.
11.7.1 Harmonische Wellen Von besonderer Bedeutung sind harmonische Wellen, d.h. \ ist eine sich periodisch wiederholende, harmonische Funktion. Wir sprechen von eindimensionalen Wellen, wenn die Ausbreitung nur in einer Richtung, etwa in x-Richtung erfolgt. Wir fügen also dem Argument des Ausdruckes, der eine harmonische Schwingung darstellt, einen entsprechenden Term hinzu, welcher der räumlichen Periodizität Rechnung trägt.
§ t x ·½ ¸¾ . © T O ¹¿
\ \ 0 cos ®2S ¨ ¯
(11.78)
Die Größe
k : 2S / O
(11.79)
wird als Wellenzahl bezeichnet. k ist also die Zahl der Wellenlängen pro Entfernung 2 S .
11 Mechanische Schwingungen und Wellen
191
Manchmal ist es nützlich, Gl. (11.79) umzuschreiben in die Form
° § ¨ °¯ ©
\ ( x, t ) \ 0 cos ®Z ¨ t
x v ph
· ½° ¸¸ ¾ . ¹ °¿
(11.80)
wobei vph wieder die Phasengeschwindigkeit ist. Die doppelte Periodizität einer Welle lässt sich mit Hilfe einer „Wellenmaschine“ demonstrieren. Stellen wir uns eine Vielzahl von Pendeln vor, die längs einer linearen Kette angeordnet und durch eine
Abb. 11. 13: Darstellung einer linearen harmonischen Welle mit Hilfe der Wellenmaschine. Eine auf einem Einzelpendel angeregte Torsionsschwingung breitet sich wellenförmig aus und wird am Ende reflektiert Gummifeder miteinander verbunden sind. Das erste Pendel werde zu einer Torsionsschwingung angeregt. Dieser Schwingungszustand breitet sich über die ganze Kette aus (Abb. 11.13), wobei jedes Pendel eine zeitlich periodische Schwingung um seine Ruhelage ausführt. Die Gesamtheit der Pendel weist zu einem bestimmten Zeitpunkt eine räumlich periodische Verteilung auf. Es tritt also kein Massentransport auf.
11.8
Stehende Wellen
Bisher haben wir die Eigenschaften laufender Wellen untersucht. Sie können sich vom Ausgangspunkt der erfolgten Störung bis ins Unendliche ausbreiten. In vielen Fällen ist eine Welle aber auf einen begrenzten Raum beschränkt. l /2 Denken wir an eine an beiden Enden fest eingespannte Saite eines Musikinstrumentes oder an ein Seil, das nur mittels eines Fadens an einer Wand befestigt sein soll. Im ersteren Fall wird die etwa durch Anstreichen erzeugte Welle an den Enden reflektiert. Einfallende und reflektierte Welle überlagern sich. Bei bestimmter Länge bzw. Spannung der Saite bildet sich ein räumlich stationäres Schwingungsmuster aus. Diese Muster werden als stehende Wellen bezeichnet. Sie finden Abb. 11.14: Zur Entstehung einer sich auch in zwei- und dreidimensionalen Schallgebern stehenden Welle wie bei Membranen und Glocken.
192
11 Mechanische Schwingungen und Wellen
Wir wollen uns hier der Einfachheit halber auf eindimensionale Wellen beschränken. Eine harmonische Welle laufe von links auf eine feste Wand zu, an der sie mit gleicher Amplitude reflektiert werde (Abb. 11.14). Die Gesamtauslenkung ergibt sich aus der Addition von einlaufender und reflektierter Welle;
\ \ 0 cos(Zt kx) \ 0 cos(Zt kx M ) .
(11.81)
M berücksichtigt einen eventuellen Phasensprung bei der Reflexion. Anwendung des Additionstheorems für die Kosinusfunktion ergibt
\ \ 0 ^cos Zt cos kx sin Zt sin kx cos Zt cos(kx M ) sin Zt sin(kx M )` (11.82a)
\
\ 0 ^cos Zt (cos kx cos(kx M )) sin Zt (sin kx sin( kx M ))`
(11.82b)
M M M M ½ 2\ 0 ®cos Zt cos(kx )cos( ) sin Zt sin( ) cos(kx ) ¾ 2 2 2 2 ¿ ¯
(11.82c)
2\ 0 cos (kx
M
M
) cos (Z t ) . 2 2
(11.83)
Dies ist eine „Welle“, bei der Orts- und Zeitabhängigkeit getrennt sind. Wir haben eine Schwingung vor uns, deren Amplitude periodisch mit dem Ort variiert. An den Orten
x
O ^(2n 1)S M` ; n 0,1, 2... 4S
(11.84)
bleibt die Amplitude null; wir bezeichnen diese Stellen als Schwingungsknoten. Für
x
O ^(4n 1)S M` 4S
(11.85)
wird die Amplitude maximal. Diese Stellen x nennt man Schwingungsbäuche. Da also Schwingungsknoten und Bäuche auf der Saite eine feste Lage haben, unabhängig von t, heißen sie stehende Wellen. Wie im einzelnen Fall das Schwingungsbild aussieht, hängt von den Randbedingungen ab. Wie schon eingangs vermerkt, sind zwei Grenzfälle zu unterscheiden:
11 Mechanische Schwingungen und Wellen
193
Reflexion am festen Ende (eingespannte Saite), M S.
(11.86)
Die stehende Welle (11.83d) ist also gegeben durch (Abb. (11.14))
Faden
Seil
Abb. 11.15: Am losen Ende wird eine Welle unter 180 ° reflektiert
x
2\ 0 sin kx sin Zt .
\
(11.87)
Reflexion am freien Ende (an einem Faden befestigtes, frei bewegliches Seil) \ ( x 0) 2\ 0 o M 0 .
(11.88)
Die stehende Welle ist dann gegeben durch (Abb. 11.15)
2\ 0 cos k x cos Z t .
\
(11.89)
Stehende Wellen auf einer an beiden Enden eingespannten Saite können wir als deren Eigenschwingungen ansehen. Da an den Enden die Auslenkungen null sein müssen, sind alle Wellenlängen möglich, für die gilt
O 2L / n
(11.90)
Da die Phasengeschwindigkeit gegeben ist durch v ph Q O , folgt für die möglichen Eigenfrequenzen mit (11.76)
Q
v ph
O
n Fsp ; 2L P
n 1, 2,3...
bzw.
Z
nS L
Fsp
P
.
(11.91/92)
Die kleinste Eigenfrequenz ergibt sich für n = 1,
Abb. 11.16: Grund- und Oberschwingungen einer beidseitig eingespannten Saite
194
11 Mechanische Schwingungen und Wellen
sie bildet die Grundschwingung. Die höheren Frequenzen für n > 1 heißen Obertöne (Abb. 11.16). Stehende Wellen lassen sich etwa durch die Kundtschen Staubfiguren sichtbar machen (A. Kundt, 1839-1894). Die Anordnung besteht aus einem einseitig geschlossenen, mit Gas gefüllten Rohr. Vom anderen Ende wird ein in der Mitte eingespannter Stab in das Rohr eingeführt. Dieser kann durch Reiben zu longitudinalen Schwingungen angeregt werden. Es lässt sich dazu auch ein Piezokristall verwenden. (Abb. 11.17). Auf dem Boden des Rohres befindet sich feines Korkpulver, das durch die entstehenden stehenden Wellen am Ort der Schwingungsbäuche aufgewirbelt wird. An den Knoten bleibt es liegen. Die Wellenlänge der im Stab erzeugten stehenden Welle ist gleich der doppelten Länge des Stabes. Ist also die Schallgeschwindigkeit der Welle im Stab Schwingungsmaxima bekannt, so kann man die Schallgeschwindigkeit der Rohrwelle aus dem Abb. 11.17: Demonstration stehender Wellen Abstand zweier Schwingungsbäuche durch an den Orten der Schwingungsmaxima ermitteln. aufgewirbelte feine Korkteilchen (Kundtsche Weitere Möglichkeiten, stehende WelStaubfiguren) len sichtbar zu machen, bieten das Rubenssche Flammenrohr (H. Rubens, 1865-1922) (Abb. 11.18) oder das Quinckesche Resonanzrohr (G.H. Quincke, 1838-1916) (Abb. 11.19). Ersteres besteht aus einem einseitig verschlossenen Rohr, das auf der Oberseite entlang einer geraden Linie viele feine Öffnungen besitzt. In das Rohr wird von rechts ein brennbares Gas geleitet. Das aus den Düsen tretende Gas wird angezündet, so dass die Flammen alle gleich hoch brennen. Innerhalb des Rohres ist an dessen Stirnfläche ein Lautsprecher angebracht, der an einen Sinusgenerator angeschlossen ist. Bei geeigneter Frequenz bilden sich im Gas stehende Wellen aus. Die Höhenänderung der Flammen folgt der Funktion sin x . An den Orten maximaler Druckänderung brennen die Flammen besonders hoch, an den Druckknoten nur schwach. Dabei ist zu beachten, dass die Druckknoten den Schwingungsbäuchen entsprechen und die Druckbäuche den Schwingungsknoten. Zu beiden Seiten eines Schwingungsknotens einer stehenden Welle schwingen ja die Gasmoleküle in entgegengesetzten Richtungen. Das Resonanzrohr wird aus einem in Wasser getauchten Rohr gebildet, dessen Länge l oberhalb des Wasserspiegels kontinuierlich variiert werden kann. In dem Rohr werden mittels eines Lautsprechers wiederum stehende Wellen erzeugt. An der Wasseroberfläche bildet sich ein Schwingungsknoten (Druckbauch) aus. Ist das Rohr oben offen, so entsteht dort ein Schwingungsbauch (Druckknoten), wenn die Länge der Luftsäule
l
(2n 1)
O 4
, n = 0, 1, 2, 3…
beträgt. Bei diesen Längen tritt eine deutlich wahrnehmbare Verstärkung der Schallwelle auf.
11 Mechanische Schwingungen und Wellen
195
Die Frequenz der schwingenden Luftsäule wird also in diesem Fall
vn
(2n 1)
v ph 4l
.
Wird das obere Ende des Rohres mit einem festen Deckel verschlossen, so tritt auch dort ein Schwingungsknoten auf und für die Resonanzfrequenz gilt analog zu dem Fall der beidseitig eingespannten Saite
vn
(n 1)
v ph 2l
.
Der Einfachheit halber haben wir uns bei den vorangegangenen Diskussionen auf eindimensionale Wellen beschränkt. Deshalb soll hier am Schluss des Kapitels noch die dreidimensionale Wellengleichung nachgetragen werden. Sie ergibt sich ganz analog zu
l
Gas Druckmaxima Abb. 11.18: Demonstration stehender Wellen mittels des Flammenrohres nach Rubens
'\
1 w 2\ , v 2ph wt 2
Abb. 11.19: Quinkesches Resonanzrohr
(11.93)
wobei ' w 2 /(wx 2 ) w 2 /(wy 2 ) w 2 /(wz 2 ) der Laplace-Operator ist. Die allgemeinste Lösung lautet analog der von (11.71)
GG
\ \ 0 f (kr Zt ) .
(11.94)
196
11 Mechanische Schwingungen und Wellen
11.9 Überlagerung von Wellen – Dispersion In Kap. 11.5 haben wir die Überlagerung zweier Schwingungen mit nahe benachbarten Frequenzen besprochen. Als resultierendes Schwingungsbild ergab sich eine Schwebungskurve. Wir wollen jetzt die Überlagerung zweier ebener Wellen gleicher Amplitude mit Frequenzen betrachten, die sich wie oben um einen geringen Betrag unterscheiden.
\ 1 \ 0 cos (Z1 t k1 x) \ 2 \ 0 cos (Z2 t k2 x)
(11.95)
Die Superposition der Teilwellen ergibt als Einhüllende eine Schwebungswelle mit der Mittenfrequenz Zm und der mittleren Wellenzahl km.
Zm
1 (Z1 Z2 ) ; 2
\ \ 1 \ 2
km
1 (k1 k2 ) . 2
1 1 ½ 2\ 0 cos ® (Z1 Z2 )t (k1 k2 ) x ¾ cos(Zm t km x) . 2 2 ¯ ¿
(11.96)
Ein beliebiger Punkt der Welle bewegt sich mit der Phasengeschwindigkeit vph fort, während die Einhüllende mit der Gruppengeschwindigkeit vg fortschreitet. Durch Vergleich mit (11.81c) folgt die Phasengeschwindigkeit zu
v ph
Zm km
.
(11.97)
Entsprechend ergibt sich die Gruppengeschwindigkeit aus (11.97) zu (vgl. Abb. 11.19)
vg
Z1 Z2 k1 k2
o vg
dZ . dk
(11.98)
Phasen- und Gruppengeschwindigkeit sind miteinander verknüpft durch die Beziehung
vg
v ph O
dv ph dO
.
(11.99)
Dies ergibt sich durch Einsetzen von Z = vph k in (11.97) und anschließendes Differenzieren:
11 Mechanische Schwingungen und Wellen
vg
dZ dk v ph
197
d (v ph k ) dk dv ph dk k dk dk
(11.100)
Mit k = 2S/O, dk = - (2S/O2) dO folgt daraus unmittelbar Gl. (11.99). Nur wenn die Frequenzen der Einzelwellen nicht von der Wellenlänge abhängen, wenn also keinerlei Dispersion vorliegt, stimmen Phasen- und Gruppengeschwindigkeit miteinander überein. Die Schwebungswelle behält dann ihre Form bei. Der behandelte Fall der Überlagerung zweier Wellen zeichnet sich durch große Einfachheit aus. Er hat aber den Nachteil, nicht eigentlich eine Wellengruppe zu beschreiben, denn die Schwebungskurve ist periodisch in Zeit und Ort. Um eine begrenzte Wellengruppe, ein sog. Wellenpaket, zu erzeugen, müssen viele Wellen mit etwas verschiedenen Frequenzen miteinander überlagert werden (s. Teil III). In komplexer Schreibweise ergibt sich Z 'Z / 2
\ ( x, t )
³Z
\ 0 (Z )ei (Zt kx ) d Z .
(11.101)
Z ' / 2
11.10
Der Dopplereffekt
11.10.1 Dopplereffekt bei Wellen, die an ein Medium gebunden sind Bei den vorausgegangenen Diskussionen haben wir stillschweigend angenommen, dass die erzeugten Wellen von einer ruhenden Quelle ausgesandt und von einem ruhenden Beobachter empfangen wurden. Sind diese Voraussetzungen nicht mehr erfüllt, so beobachten wir Veränderungen der Tonhöhe. Bewegen sich beispielsweise Schallsender und Empfänger aufeinander zu, so erhöht sich die Frequenz des Tones; bewegen sie sich voneinander weg, erniedrigt sie sich. Wir alle kennen diesen Effekt z.B. von einem vorbei fahrenden laut hupenden „Hochzeitsauto“. Die Frequenzverschiebung ist leicht unterschiedlich, wenn sich der Empfänger relativ zur ruhenden Quelle bewegt. Wir wollen das im Einzelnen untersuchen. Betrachten wir zunächst die Verhältnisse bei bewegter Schallquelle. Der Beobachter empfängt eine Schallwelle mit der Wellenlänge O0 . Setzt sich der Wagen in Richtung des Beobachters in Bewegung und erreicht eine konstante Geschwindigkeit vQ, so verringert sich die Wellenlänge vor dem hupenden Wagen um den Betrag vQ T . Hierin ist T die Schwingungsdauer. Dementsprechend erhöht sich die Frequenz der Welle:
v
vS
O
v0
1 . 1 vQ / v S
(11.102)
198
11 Mechanische Schwingungen und Wellen
Bewegt sich die Quelle vom Beobachter weg, so ergibt sich analog
v
v0
1 . 1 vQ / v S
(11.103)
Der Effekt heißt nach seinem Entdecker Doppler-Effekt (C. Doppler, 1803-1853). Es ist zweckmäßig, sich ein Bild von den Wellenfronten zu machen, die sich in Abhängigkeit des Quotienten vQ / v S ergeben (Abb. 11.20). c)
b)
a)
d)
vQ
l
vQ
vQ
vQ = 0
v Q = vS
v Q < vS
v Q > vS
Abb. 11.20: Dopplereffekt bei großen Geschwindigkeiten: Entstehung des Mach-Kegels Breitet sich die Welle unter einem Winkel D gegen die Bewegungsrichtung der Quelle aus (Abb. 11.21), so gilt allgemein für die Wellenlänge
O (D ) T (v S vQ cos D ) . (11.104) Wellenfront
Erreicht die Geschwindigkeit der Quelle, vQ, die Schallgeschwindigkeit, so wird die Wellenlänge für D 0 a b r gleich null. Die zu unterschiedlichen vt Zeiten ausgesandten Wellen überlagern Q (T) Q (0) sich in diesem Fall mit ihren WellenAbb. 11.21: Zur Berechnung des Winkels des fronten phasengleich, d.h. es entsteht Mach-Kegels eine Welle mit großer Amplitude (Kopfwelle, Abb. 11.20c). Wächst die Geschwindigkeit der Schallquelle weiter, so dass vQ > vS, so wird die Wellenlänge in Abhängigkeit von D gleich null, wenn l0
vS vQ
cos D .
(11.105)
11 Mechanische Schwingungen und Wellen
199
d.h., dass sich Wellen nur innerhalb eines Machschen Kegels (E. Mach, 1838-1916) mit dem Öffnungswinkel E 90q D ausbreiten können, für den gilt
sin E
vS . vQ
(11.106)
Alle Kugelwellen sind auf diesem Kegelmantel in Phase (Abb. 11.20d). Das Verhältnis vQ/vS wird als Machzahl bezeichnet. Machsche Kegel lassen sich als Bugwellenfronten von Schiffen beobachten, wenn die Geschwindigkeit des Schiffes größer wird als die Geschwindigkeit der Oberflächenwellen des Wassers. Unangenehm machen sich die Kopfwellen (auch Stoßwellen genannt) bemerkbar, die von einem mit Überschallgeschwindigkeit fliegenden Flugzeug ausgehen. Es werden zwei Knallwellen wahrgenommen, die von der Bug- und der Heckwelle herrühren. Als zweiten Fall betrachten wir eine ruhende Quelle, die eine Welle der Frequenz Q 0 aussendet (vgl. Abb. 11.20a). Wir fragen nach der Frequenz, die ein sich in Richtung der Quelle bewegender Beobachter wahrnimmt. Da er sich in einer Schwingungsperiode T um die Strecke 'x v B T bewegt, misst er eine zusätzliche Zahl von Schwingungen. Die von ihm gemessene Frequenz liegt also um 'Q 'N / T höher. Sie ergibt sich zu
Ȟ
Ȟ 0 'N Ȟ 0
v
§ v · v0 ¨1 B ¸ . © vS ¹
§ 'x T Ȟ 0 ¨1 O0 T ©
· ¸, ¹
(11.107a)
(11.107b)
Entfernt er sich von der Schallquelle, so erniedrigt sich die Frequenz; es folgt
v
§ v · v0 ¨1 B ¸ . © vS ¹
(11.108)
Bewegen sich sowohl Sender und Empfänger aufeinander zu bzw. voneinander weg, so ergibt sich durch Ersetzung von Q 0 in (11.102) bzw. (11.103) durch (11.107b) bzw. (11.108)
v
v0
1 r vB / vS . 1 B vQ / v S
(11.109)
200
11 Mechanische Schwingungen und Wellen
11.10.2 Dopplereffekt bei elektromagnetischen Wellen Eigenschaften elektromagnetischer Wellen werden in den Kap. 18 und 19 ausführlich besprochen. Um einen direkten Vergleich mit dem Dopplereffekt mechanischer Wellen zu ermöglichen, wollen wir aber jetzt schon den entsprechenden Effekt bei elektromagnetischen Wellen besprechen. Im Gegensatz zu dem oben behandelten Dopplereffekt tritt bei elektromagnetischen Wellen auch ein transversaler Dopplereffekt auf. Deswegen wählen wir eine allgemeinere Ausgangsposition. Quelle bzw. Beobachter sollen sich in x-Richtung so bewegen, dass zwischen den verlängerten x-Achsen ein bestimmter Abstand voneinander besteht (Abb. 11.22). Ein Beobachter B in einem Inertialsystem S, in dem die Quelle verankert ist, beschreibe G z eine ebene Welle mit Wellenvektor k durch S z´ B
Q
vx
x
B´
y
GG
G
\ ( r , t ) \ 0 e i ( k r Z t ) .
S´
x´ y´
Abb. 11.22: Zur Geometrie beim Dopplereffekt elektromagnetischer Wellen
(11.110a)
Ein anderer Beobachter B´ in einem Bezugssystem S´, das sich mit konstanter Geschwindigkeit v in x-Richtung des Ersteren bewegt, beschreibt die gleiche Welle durch eine analoge Beziehung GG
G
\ (r c, t c) \ 0c ei ( k c r cZ ct c)
(11.110b)
Die beiden Beobachter mögen nun einen bestimmten Punkt der Welle ins Auge fassen, etwa das Maximum eines bestimmten Wellenberges. Ein solches beschreibt B dadurch, dass er den Klammerausdruck in (11.103a) gleich einem ganzzahligen Vielfachen von 2S setzt. Der Beobachter B´ argumentiert analog. Auf Grund des Relativitätsprinzips müssen die beiden Exponenten gleich sein:
k x x k y y k z z Zt
k xc xc k yc yc k zc z c Z ct c .
(11.111)
Wellenvektor-Komponenten und Frequenz auf der rechten Seite sind mittels der Lorentztransformation mit denen auf der linken Seite verknüpft durch
k xc
k zc
kx Z v / c2 1 (v / c) 2
Z k Z´ z
Z kx v / c Z´ 1 (v / c) 2
1 (v / c) 2 kz ; Zc 1 (v / c)k x
kx v / c ; k yc 1 (v / c)k x
Z kx v 1 (v / c) 2
Z k Z´ y
kx v k c . Z 1 (v / c) 2
1 (v / c) 2 ky ; 1 (v / c)k x
1
(11.112a-d)
11 Mechanische Schwingungen und Wellen
201
Der Beobachter in S´ empfängt erwartungsgemäß ebenfalls eine ebene Welle, die aber gegenüber der in S beobachteten eine andere Ausbreitungsrichtung und andere Frequenz besitzt. Es ist zu beachten, dass (11.105/106) nicht explizit die Geschwindigkeit der Quelle bzw. des Beobachters enthalten, sondern nur die Relativgeschwindigkeit von Sender und Empfänger. Darin drückt sich die Tatsache aus, dass elektromagnetische Wellen zur Ausbreitung kein Medium benötigen. Wir betrachten nun die beiden Grenzfälle und wenden uns als erstes dem longitudinalen Dopplereffekt zu, d.h. die Quelle in S und der Beobachter in S´ sollen sich in x-Richtung aufeinander zu- bzw. voneinander wegbewegen. In diesem Fall erreicht den Beobachter eine Welle der Frequenz
Zc Z
1 v / c 1 (v / c)
Z
2
1 v / c . 1 v / c
(11.113)
Im Fall des transversalen Dopplereffekts, bei dem sich S und S´ nebeneinander befinden, registriert der Beobachter eine Welle mit der Frequenz
Zc Z
1 1 (v / c) 2
.
(11.114)
Zusammenfassung x Unter einer (mechanischen) Schwingung verstehen wir die zeitlich periodische Ausbreitung einer physikalischen Störung. Die Bewegungsgleichung einer eindimensionalen, gedämpften harmonischen Schwingung eines Körpers der Masse m lautet
d 2x dx 2G Z02 x 2 dt dt
Fa . m
Ist die äußere Kraft Fa gleich null, so geht die Beziehung in die Bewegungsgleichung für die freie gedämpfte Schwingung über. Verschwindet auch der Dämpfungsterm G R / 2m , so liefert die Lösung der Bewegungsgleichung eine freie ungedämpfte Schwingung mit der Eigenfrequenz Z0 D/m . x Sind mehrere gleichartige schwingungsfähige Systeme miteinander gekoppelt, so führt das zu gekoppelten Schwingungen. Durch Entkopplung der Bewegungsgleichungen lassen sich die Normalschwingungen des Systems berechnen. Zwei schwach gekoppelte Oszillatoren können Schwebungen ausführen. Darunter verstehen wir Schwingungen, deren Amplituden mit der halben Differenz der Eigenschwingungen der Einzelsysteme periodisch variieren.
202
11 Mechanische Schwingungen und Wellen
x Unter einer harmonischen Welle verstehen wir die räumliche und zeitliche Ausbreitung einer sinusförmigen Störung. Die ihr zu Grunde liegende Bewegungsgleichung heißt Wellengleichung. Die Welle ist charakterisiert durch ihre Eigenfrequenz Z und den G Wellenvektor k . Im einfachsten Fall einer ebenen Welle gilt
w 2\ wt 2
v ph
w 2\ ; wx 2
v ph = Phasengeschwindigkeit der Welle.
Wir unterscheiden transversal und longitudinal polarisierte Wellen. x Unter einer stehenden Welle verstehen wir einen periodischen Vorgang, bei dem Zeitund Ortsabhängigkeit getrennt sind. Sie kommt durch Reflexion einer laufenden Welle zustande. x Unter dem Dopplereffekt verstehen wir die Frequenz- bzw. Wellenlängenänderung einer Welle, wenn sich der Schallgeber bzw. der Empfänger relativ zueinander bewegen.
Übungsaufgaben 1. Ein Uhrenpendel (als mathematisches Pendel angenommen) hat die Schwingungsdauer T = 2s. Die Erdbeschleunigung betrage 9,81 ms-2. a) Wie lang ist das Pendel? b) Der maximale Auslenkwinkel zur Zeit t = 0 betrage 15°. Geben Sie die Geschwindigkeit des Pendels als Funktion der Zeit an. c) Wie viele Sekunden wird die Uhr in 24 Std. nachgehen, wenn das Pendel um 1 mm verlängert wird? d) An einem anderen Standort beträgt g = 9,75 ms-2. Wie wirkt sich dies auf die Uhr aus (quantitativ)? Welche Länge muss jetzt das Pendel haben, damit die Uhr exakt geht? 2. Von der Decke eines Fahrstuhls hängt ein 1 m langes mathematisches Pendel herab. Wie hängt die Schwingungsdauer des Pendels von der Größe und Richtung der Beschleunigung des Fahrstuhls ab? Berechnen Sie die Schwingungsdauer für den Fall, dass der Fahrstuhl bei Abwärtsfahrt auf einer Strecke von 3 m von der Geschwindigkeit 5m/s auf Stillstand bei konstanter Verzögerung abgebremst wird. (Gl. 6.1) 3. Eine Person (idealisiert als M.P. der Masse M) schaukle in einer masselos angenommenen Schiffsschaukel. Der Abstand des M.P. vom Drehpunkt sei mit R bezeichnet. Die Person verhalte sich zunächst ruhig. Die Amplitude der Schwingung nehme während n Schwingungsperioden um 25% ab. a) Berechnen Sie die Dämpfungskonstante der Schwingung und das logarithmische Dekrement. b) Wie groß ist der relative Verlust an Energie nach n Schwingungsperioden?
11 Mechanische Schwingungen und Wellen
203
c) Nun soll die Person das Schaukeln aktiv unterstützen. Sie tut das, indem sie in Punkten maximaler Auslenkung in die Hocke geht (Verschiebung des M.P. um 'R nach außen) und sich beim Nulldurchgang wieder aufrichtet. Schätzen Sie ab, wie groß 'R sein muss, um einen stationären Zustand zu erreichen. 4. Berechnen Sie die Eigenschwingungen (Normalkoordinaten) der einatomigen und der zweiatomigen linearen Kette
Ein- und zweiatomige lineare Kette 5. Die Straßenbahnwagen der Linie 9 verkehren genau alle 10 min in nördlicher Richtung und ebenso in Gegenrichtung. Glauben Sie Jemandem, der Ihnen erzählt, er habe, ohne dass etwas Besonderes passiert sei, alle 5 min einen Wagen der Linie 9 in nördlicher Richtung vorbeifahren sehen? 6. Ein notorischer Linksfahrer blockiert mit Tempo 80 km/h die Überholspur der Autobahn. Ein herannahender Sportwagen (v = 180 km/h) versucht ihn durch Hupsignale (Q = 250 Hz) zum Fahrbahnwechsel zu bewegen. Welche Tonhöhe vernimmt der Linksfahrer? Nach dem Überholvorgang sendet der Überholte dem Sportwagen einen Hupton nach (Q = 250 Hz). Welche Tonhöhe hört der Sportwagenfahrer? 7.a) Am Abend erscheint die Sonne manchmal als gelb-rote (O = 670 nm) Scheibe (warum?). Wie schnell muss sich ein Beobachter auf die Sonne zu bewegen, damit er sie grün (O = 520 nm) leuchten sieht? b) Wie groß ist die Wellenlängenverschiebung 'O / O des Lichtes eines Fixsterns, wenn seine relative Fluchtgeschwindigkeit v/c = 0,8 beträgt?
12
Analytische Mechanik
Die Mechanik, wie sie im Vorhergehenden entwickelt wurde, basiert auf den Newtonschen Postulaten. Die Grundgröße ist die auf den Massenpunkt wirkende Kraft. Das 2. Newtonsche Axiom ist zugleich die Bewegungsgleichung für das zu lösende Problem. Der Energie-Begriff ist eine mittels einiger zweckmäßiger Definitionen abgeleitete Größe. Die Anwendung auf die Dynamik eines oder mehrer Massenpunkte setzt voraus, dass die wirkenden Kräfte bekannt sind. Das ist aber nicht immer der Fall. Stattdessen bestimmen oft geometrische Bedingungen, als Zwangsbedingungen bezeichnet, den Bewegungsablauf. Hinzu kommt, dass mit zunehmender Anzahl der M.P. die Bewegungsgleichungen sehr unübersichtlich werden, so dass sie nur mühsam zu behandeln sind. Es ist daher wünschenswert, eine Methode zu besitzen, die ohne Kenntnis der Kräfte auskommt. Vor allem J. L. de Lagrange (1736-1813), C. G. J. Jacobi (1804-1851) und W. R. Hamilton (1877-1954) haben solche Theorien entwickelt. An die Stelle der Newtonschen Axiome tritt das Hamiltonsche Prinzip. Aus ihm folgen als neue Bewegungsgleichungen die Lagrangeschen Gleichungen. Ein dritter Ansatz beruht auf dem sogenanten Hamiltonformalismus. In diesem Kapitel sollen diese Wege in ihren Grundzügen beschrieben und durch einige Beispiele erläutert werden.
12.1
Das Hamiltonsche Prinzip und die Lagrangesche Form der Mechanik
12.1.1 Das Hamiltonsche Prinzip Wir wollen ein System ins Auge fassen, das sich in einer vorgegebenen Zeit von einem Punkt zu einem anderen Punkt bewegen kann. Das Hamiltonsche Prinzip sagt dann aus, dass das System denjenigen Weg wählt, der das Zeitintegral der Lagrange-Funktion extremal macht. Wir ordnen einer beliebigen Bahnkurve das Funktional S zu, gegeben als t2
S
³ L( x , x , t )dt . i
i
(12.1)
t1
Die Größe wird als Wirkung bezeichnet. Die Funktion L ist die Lagrange-Funktion, die gleich erläutert wird. Die Parameter xi (t ) bzw. xi sind die Koordinaten bzw. Geschwindigkeiten des betreffenden Systems. Von allen möglichen Wegen, längs denen sich ein System in einer vorgegebenen Zeit von einem Punkt zu einem anderen bewegen kann, wählt es denjenigen, der das Zeitintegral der Lagrange-Funktion extremal macht:
206
12 Analytische Mechanik t2
G S G ³ L( xi , xi , t ) dt 0
(12.2)
t1
Bei der Variation sollen Anfangs- und Endpunkte festgehalten werden. Die Eulerschen Gleichungen (s. Mathematischer Anhang) des Problems sind
wL d wL wxi dt wxi
0.
(12.3)
Die Beziehungen werden als Euler-Lagrangesche oder einfach als Lagrange-Gleichungen bezeichnet. Es erhebt sich die Frage, was unter der Lagrange-Funktion zu verstehen und wie sie zu bestimmen ist. Wir werden sehen, dass sie als die Differenz von kinetischer und potentieller Energie definiert ist.
L( xk , xk , t )
Ekin ( xk ) V ( xk , t ) .
(12.4)
Zum Beweis gehen wir von der Newtonschen Bewegungsgleichung aus:
mxk
Fk ( xl , xl , t ) ;
k, l = 1, 2, 3.
(12.5)
Die kinetische Energie hängt nur von den Geschwindigkeitskomponenten ab. Differentiation nach der Zeit ergibt
Ekin
¦ k
mxk2 2
o
dEkin dxk
mxk
(12.6)
Benutzen wir diese Ableitung in (12.5), so folgt
d dEkin dt dxk
Fk ( xl , xl , t ) .
(12.7)
Beschränken wir uns auf geschwindigkeitsunabhängige Kräfte Fk ( xl , t ) , die sich aus einem Potential V ( xl , t ) herleiten lassen,
Fk ( xl , t )
dV ( xl , t ) , dxk
(12.8)
12 Analytische Mechanik
207
so können wir (12.7) schreiben als
d dEkin dt dxk
dV ( xl , t ) . dxk
(12.9)
Wir definieren nun eine neue Funktion L dergestalt, dass
L( xk , xk , t )
Ekin ( xk ) V ( xk , t ) .
(12.10)
Wegen der Unabhängigkeit der kinetischen Energie von xk und der Unabhängigkeit der potentiellen Energie von xk folgt
wL d wL wxk dt wxk
0.
(12.11)
Damit ist die Lagrange-Funktion erklärt und gleichzeitig die Äquivalenz der Euler-LagrangeGleichungen mit dem 2. Newtonschen Postulat gezeigt. Weiter zeigt der Vergleich von (12.11) und (12.3), dass das Hamiltonsche Prinzip äquivalent zu den Euler-Lagrange-Gleichungen ist.
12.1.2 Verallgemeinerte Koordinaten Zur Beschreibung von Lage bzw. Bewegung eines oder mehrerer Massenpunkte haben wir bisher kartesische Koordinaten benutzt. Das ist zweckmäßig, solange keine Nebenbedingungen vorliegen, welche die Unabhängigkeit der Koordinaten voneinander einschränken. Sind solche zusätzlichen Bedingungen vorhanden, werden die Rechnungen oft erheblich schwieriger. Das lässt sich vermeiden, wenn zur Beschreibung der Bewegung des Punktsystems nicht die 3n kartesiz schen Koordinaten, sondern entsprechend der Zahl r der Freiheitsgrade des Systems neue Koordinaten qk (k = 1, 2,…, r) eingeführt werden. Existieren m J Nebenbedingungen, so hat das System l r = 3n - m Freiheitsgrade
(12.12)
Ein sehr einfaches Beispiel stellt ein mathematisches Pendel (Abb. 12.1) der Länge l dar. Es gilt in diesem Fall in kartesischen Koordinaten die Nebenbedingung
f ( x, z )
x2 z 2 l 2
0.
(12.13)
Ist eine der beiden Koordinaten ermittelt, so ergibt sich
MP x Abb. 12.1: Ebenes mathematisches Pendel
208
12 Analytische Mechanik
die andere durch Einsetzen in (12.13). Das Pendel hat also einen Freiheitsgrad, (r = 1). Wir können seine Bewegung durch eine neue Koordinate beschreiben, als die sich die Auslenkung - aus der Ruhelage als zweckmäßig erweist. Die Nebenbedingung ist durch diese Wahl quasi automatisch erfüllt, denn es gelten zwischen alten und neuen Koordinaten die Relationen
x l sin - ; z
l cos -.
(12.14)
Wir wollen die Euler-Lagrangeschen Gleichungen jetzt in verallgemeinerten Koordinaten formulieren. Gemäß (12.14) schreiben wir die neuen Koordinaten als Funktion der kartesischen durch
qi
qi ( x1 ,...xn , t ) { qi ( xk , t ) .
(12.15)
Diese sollen nach den kartesischen Koordinaten aufzulösen sein:
xk
xk ( q1 ,...qn , t ) { xk (qi , t ) .
(12.16)
Bilden wir die erste Ableitung, so folgt als Zusammenhang zwischen den Geschwindigkeiten xk und qi
xk
n wxk wx ¦ k qi . wt i 1 wqi
(12.17)
Einsetzen in die Lagrange-Funktion ergibt L( xi , xi , t )
L '(qk , qk , t )
L xi (qk , t ), xi (qk , q k , t ), t .
(12.18)
Unser Ziel ist es, die Gültigkeit der Gleichung
wLc d wLc wqi dt wqi
0
(12.19)
zu zeigen. Dazu beschaffen wir uns jetzt die beiden obigen Ableitungen. Unter Verwendung von (12.18) folgt
wLc wqi
§ wL wxl wL wxl · ¸ ; (12.20a) © l wqi wxl wqi ¹
¦ ¨ wx l
wLc wqi
§ wL wxl © l wqi
¦ ¨ wx l
· ¸. ¹
(12.20b)
Jetzt benötigen wir noch die zeitliche Ableitung der rechts in (12.19) stehenden Beziehung.
12 Analytische Mechanik
209
Wir erhalten mit Hilfe von (12.17)
wxl wqi
wxl wqi
d wxl dt wqi
o
wxl . wqi
(12.21)
Damit können wir den rechts stehenden Term in (12.19) bilden. Setzen wir ihn zusammen mit (12.20a) in (12.19) ein, so erhalten wir
wLc d wLc wqi dt wqi
° wL wxl wL wxl d § wL wxl · ½° ¨ ¸¾ ¯° l wqi wxl wqi dt © wxl wqi ¹ °¿
¦ ® wx l
° wxl § wL
¦ ® wq ¨ wx l
°¯
i
©
l
d wL · wL § wxl d wxl · ½° ¸ ¨ ¸¾ dt wxl ¹ wxl © wqi dt wqi ¹ °¿
Der letzte Klammerausdruck verschwindet identisch, der erste stellt die Euler-Lagrangesche Gleichung in kartesischen Koordinaten dar und ist folglich ebenfalls null. Damit ist die Gültigkeit von (12.19) gezeigt. Die Lagrangefunktion L ist im Allgemeinen eine Funktion aller verallgemeinerten Koordinaten und Geschwindigkeiten sowie der Zeit. Es kommen jedoch Fälle vor, in denen L unabhängig von einer dieser Variablen ist. Hängt L nicht explizit von der Zeit ab, so bleibt die Gesamtenergie erhalten, hängt L nicht von den Geschwindigkeitskoordinaten ab, so ist der Impuls konstant. Wir betrachten hier exemplarisch den zweiten Fall. Zunächst zur Definition des Impulses. In kartesischen Koordinaten ist
wL wxi
wEkin wV wxi wxi mi xi pi x
wEkin w wxi wxi
mi
¦ 2 x i
2 i
yi2 zi2
(12.22)
In Übereinstimmung damit wird der verallgemeinerte Impuls definiert als
pi
wL . wqi
(12.23)
pi und qi werden als zueinander kanonisch konjugierte Größen bezeichnet. Ist
wL wqi
0,
o
pi
const.
(12.24)
Allgemein werden solche Variable, von denen die Lagrangefunktion nicht explizit abhängt, zyklische Variable genannt.
210
12 Analytische Mechanik
Die Zweckmäßigkeit der Euler-Lagrangeschen Gleichung in verallgemeinerten Koordinaten sei an einem Beispiel demonstriert. Wir betrachten einen Massenpunkt, der im Inneren eines Hohlkegels reibungsfrei auf einem Kreiskegel gleitet (Abb. 12.2). Zuerst haben wir die verallgemeinerten Koordinaten festzulegen. Der Massenpunkt unterliegt der Nebenbedingung
x 2 y 2 z 2 tan 2 E
g ( x, y , z )
(12.25)
Die Anzahl der Freiheitsgrade reduziert sich durch die Nebenbedingung auf zwei. Das führt auf zwei unabhängige verallgemeinerte Koordinaten. Bei ihrer Festlegung ist es wie im Falle des Kreispendels zweckmäßig, sie der Symmetrie des Problems anzupassen. Dieser Forderung genügen beispielsweise Zylinderkoordinaten. Wir wollen hier neben dem Winkel M den Abstand r des Massenpunktes vom Ursprung des Bezugssystems benutzen. Ist ß der Öffnungswinkel des Kegels, so lauten die Transformationsgleichungen
r
b
0.
r
Abb. 12.2: Bewegung eines MP auf einem Kegelmantel unter dem Einfluss der Gravitation
x y z
x(r ,M ) r sin E cos M , y ( r ,M ) r sin E sin M , z (r ,M ) r cos E .
(12.26a)
Als Nächstes bestimmen wir die Lagrange-Funktion. Dazu benötigen wir Ausdrücke für die kinetische und potentielle Energie in den neuen Koordinaten. Zu diesem Zweck berechnen wir die Geschwindigkeitskomponenten
x y z
x (r ,M , r,M ) r sin E cos M r sin E sin M M , y (r ,M , r,M ) r sin E sin M r sin E cos M M , z (r) r cos E .
(12.26b)
Die Energie-Ausdrücke nehmen damit die Form an
Ekin E pot
m 2 m 2 x y 2 z 2 r r 2M 2 sin 2 E ; 2 2 mg z mg r cos E .
(12.27)
Damit ergibt sich die Lagrange-Funktion L zu
L(r , r, M )
Ekin E pot
m 2 r r 2M 2 sin 2 E mgr cos E 2
.
(12.28)
12 Analytische Mechanik
211
Die Bewegungsgleichungen sind
d dt d dt
dL wL dr wr dL wL dM wM
mr mrM 2 sin 2 E mg cos E
0; (12.29)
d mr 2 M sin 2 E 0. dt
In diesen Gleichungen kommt M nicht explizit vor. Daher folgt aus der zweiten Gleichung, dass der Drehimpuls des Systems l = lz konstant ist.
mr 2M sin 2 E
l
const.
(12.30)
Eliminieren wir mit Hilfe dieser Beziehung M aus der E.-Lagrange-Gleichung, so erhalten wir die Bewegungsgleichung für unser Problem:
mr
l2 mg cos E mr 3 sin 2 E
0 .
(12.31)
Das ist eine nichtlineare Differentialgleichung. Um ihren physikalischen Inhalt zu erkennen, brauchen wir sie nicht zu lösen. Wir ziehen stattdessen den Energieerhaltungssatz mit heran. Da weder Ekin noch Epot von der Zeit abhängt, gilt
E
Ekin V
m 2 2 2 2 r r M sin E mgr cos E 2
const.
(12.32)
Darin lässt sich M durch (12.30) ausdrücken:
E Veff
m 2 r Veff 2 l2 mgr cos E 2mr 2 sin 2 E
(12.33)
Das Minimum des effektiven Potentials liegt bei 1/ 3
r0
§ · l2 ¨ 2 ¸ . 2 © m g sin E cos E ¹
(12.34)
Dies ist der Radius einer stabilen Kreisbahn, auf der ein Massenpunkt bei gegebenem Drehimpuls umlaufen kann. Die erste Ableitung r ist null und die Energie des MP ist gleich Veff (r0).
212
12 Analytische Mechanik
Für Energien, die nur wenig größer sind, kann Veff entwickelt werden:
Veff
V
r r0
w 2Veff 1 ( r r0 ) 2 wr 2 2
... .
(12.35)
r r0
Einsetzen in die Bewegungsgleichung (12.31) ergibt formal die Gleichung des harmonischen Oszillators.
U Z02 U 0 , nämlich
Veff E
r
V0
rU2
r0
rU1 r
Abb. 12.3: Effektives Potential
2 (r r0 ) w Veff wr 2 m
0.
(12.36)
r r0
Der Massenpunkt gleitet auf dem Kegel in Form einer Wellenlinie zwischen zwei horizontalen Kreisen mit Radien rmin und rmax periodisch hinauf und herunter (Abb. 12.3). Die quadrierte Frequenz ergibt sich als Quotient aus der Krümmung des effektiven Potentials bei r = r0 und der Masse.
Existieren in einer Aufgabenstellung, wie im vorherigen Fall, Nebenbedingungen, so ist es oft zweckmäßig, von den um die Lagrange-MultiplikatorenO erweiterten Lagrange-Gleichungen (A1.146) auszugehen. Die Herleitung der Bewegungsgleichung ist für unser Beispiel recht einfach, so dass sie hier noch gezeigt werden soll. Die Gleichungen lauten
d dt d dt d dt
wg dL wL 0 O dr wr dr dL wL wg 0 O dM wM wM dL wL wg 0 O dz wz wz g (r ,M , z ) 0.
(12.37)
Die Nebenbedingung lässt sich schreiben
r 2 sin 2 E z 2 tan 2 E
0.
(12.37a)
Wegen der Symmetrie des Problems ist sie unabhängig von M . Zudem hängt die LagrangeFunktion nicht von z ab, so dass aus der Letzten der Gleichungen J sofort O = 0 folgt. Damit sind die beiden ersten Lagrange-Gleichungen identisch mit den Gln. (12.29)!
12 Analytische Mechanik
12.1.3
213
Verallgemeinerte Kräfte
Die Gültigkeit der Lagrange-Gleichungen in der bisherigen Form ist auf konservative Kräfte beschränkt, d.h. die Kräfte müssen aus einem Potential ableitbar sein. Es gibt aber Fälle, bei der diese Prämisse, wie bei geschwindigkeitsabhängigen Kräften, nicht gilt. Es erhebt sich also die Frage, ob wir die Gleichungen so erweitern können, dass sie auch für solche Anwendungen gelten. Es wird sich zeigen, dass an die Stelle der Gleichungen (12.3) die Beziehungen
wL d wL wqi dt wqi
(12.38)
)ci
treten. Hierin ist ) ci der Beitrag der „verallgemeinerten Kräfte“, die sich nicht aus einem Potential ableiten lassen. Wir wollen jetzt diese neue Gleichung ableiten. Es sei ein System von G n Massenpunkten mit den Koordinaten rD gegeben. Wie im Abschnitt 12.2.3 bereits eingeführt, sollen diese Funktionen der verallgemeinerten Koordinaten sein:
G rD
G rD (q1 ,..., q3n ), (D 1,..., n) .
(12.39)
G rD
G wrD ¦i wq qi i
(12.40)
G Ist FD die auf einen Massenpunkt D wirkende Kraft, so ist die von diesen Kräften längs einer Verschiebung
G drD
G wrD ¦i wq dqi i
(12.41)
am System verrichtete Arbeit
dW
G G ¦ FD drD n
D 1
G wrGD FD dqi { ¦ ) i dqi . ¦¦ wqi D i i
(12.42)
Die hier eingeführten Größen
)i
G wrGD FD , (i 1,...,3n) ¦ wqi D
(12.43)
heißen verallgemeinerte Kräfte. Wir kommen gleich auf sie zurück. Zunächst multiplizieren
G
wir die Newtonsche Bewegungsgleichung FD
G G mD rD mit wrD / wqi :
214
12 Analytische Mechanik
G wrGD FD wqi
G G wrD mrD wqi
G G G d wrD d § G wrD · . ¨ mrD ¸ mrD dt © dt wqi wqi ¹
(12.44)
Summieren wir über alle D , so erhalten wir mit
G d wrD dt wqi
G wrD wqi
G wrGD F ¦ D wqi D
)i
G § G wrD · d G mr ¨ D ¸ ¦ mrD ¦ wqi ¹ D dt D ©
G wrD . wqi
(12.45)
Zur Umformung der rechten Seite gehen wir wie in Abschnitt 12.1.2 vor. Die kinetische Energie schreibt sich in verallgemeinerten Koordinaten
Ekin
1
G G
mD rD rD , ¦ 2 D
(12.46)
und die erste Ableitung nach qi bzw. qi ist:
G G drD ; mD rD ¦ dqi D
dEkin dqi
dEkin dqi
G G drD ; mD rD ¦ dqi D
(12.47a/b)
lässt sich mit (12.40) schreiben, wenn wir noch die zeitliche Ableitung bilden
d dEkin dt dqi
G d G drD m r ¦ D D dq , dt D i
(12.48)
Die Differenz von (12.48) und (12.47a) ist gleich der rechten Seite von (12.45). Folglich gilt
wEkin d wEkin wqi dt wqi
) i .
(12.49)
Setzen sich die verallgemeinerten Kräfte aus einem konservativen und einem nicht-konservativen Anteil zusammen,
)i
so erhalten wir
wV )ci , wqi
(12.50)
12 Analytische Mechanik
wEkin wV d wEkin wqi wqi dt wqi
215
)ci .
(12.51)
In diese Gleichung lässt sich die Lagrange-Funktion einführen,
L
Ekin V .
Da V wieder nicht von q abhängt, ergibt sich
wL d wL wqi dt wqi
)ci .
(12.52)
Dies ist die auf nicht-konservative Kräfte erweiterte Lagrange-Gleichung, oft als LagrangeGleichungen 2. Art bezeichnet.
12.2
Hamiltonsche Theorie
12.2.1 Grundlagen Die Hamiltonsche Theorie (W. R. Hamilton, 1805-1865) stellt eine weitere Möglichkeit zur Formulierung der Mechanik dar. Neben ihrer Nützlichkeit bei der Lösung von Problemen in der Mechanik ermöglicht sie einen guten Einstieg in die statistische Mechanik und Quantenmechanik. – Im Lagrange-Formalismus sind die unabhängigen Variablen die verallgemeinerten Koordinaten (qi , qi , t ) , im Hamiltonformalismus treten an die Stelle der Geschwindigkeiten die verallgemeinerten Impulse
pi
wL(qi , qi , t ) . wqi
(12.53)
Wir lösen die n Gleichungen nach den n Größen qk auf
qk
qk (q, p, t ) ,
(12.54)
wobei zur Abkürzung
q (q1 ,..., qn ), q ( q1 ,...qn ), geschrieben wurde.
p ( p1 ,... pn )
(12.55)
216
12 Analytische Mechanik
Wir definieren nun die sog. Hamiltonfunktion H (q, p, t ) als
¦ p q (q, p, t ) L(q, q (q, p, t ) t ) .
H ( q, p, t )
i
i
(12.56)
i
Zur Bildung der Hamiltonfunktion haben wir also die Lagrange-Funktion zu bilden und anschließend die verallgemeinerten Geschwindigkeiten durch die Impulse auszudrücken. Dies sei am Beispiel der ebenen Bewegung eines freien Massenpunktes gezeigt. Die Lagrange-Funktion lautet in Polarkoordinaten
m 2 ( U U 2M 2 ) . 2
L( U , U ,M )
pU
wL wU
pM
wL wM
m U
o U 2
m U M
o M
(12.57)
pM
; m pM
mU 2
(12.58)
.
Damit ergibt sich die Hamiltonfunktion entsprechend (12.56) zu
H ( U , pU , pM )
U pU M pM L
pU2 2m
pM2
2m U 2
.
(12.59)
Kehren wir wieder zur Definitionsgleichung von H zurück und berechnen deren partielle Ableitungen.
wH wqk
wqi
n
¦ wq i 1
pi
k
n wL wL wqi ¦ wqk i 1 wqi wqk
(12.60)
wL wqk n
wqi
wH wpk
¦ wp
wH wt
¦ wt
i 1 n
i 1
d § wL · ¨ ¸ p k dt © wqk ¹
k
wqi
wL wqi wqi wpk
qk
wL wqi wL wqi wt wt
n
pi qk ¦ i 1
n
pi ¦ i 1
wL wt
(12.61)
(12.62)
12 Analytische Mechanik
217
Zusammengefasst haben wir die drei Gleichungen gewonnen:
qk
wH ; ( k 1,..., n) wpk
p k
wH ; (k 1,..., n) wqk
wL wt
(12.60a/61a)
wH wt
(12.62a)
Die ersten beiden Gleichungen werden als die Hamiltonschen (oder kanonischen) Bewegungsgleichungen bezeichnet. Sie stellen 2n gekoppelte Differentialgleichungen 1. Ordnung zur Bestimmung der pk und qk dar und sind daher den Euler-Lagrange-Gleichungen, die aus n Differentialgleichungen 2. Ordnung bestehen, gleichwertig. Als Beispiel leiten wir die Hamiltonschen Gleichungen für die Bewegung eines Teilchens in einem Potential ab. Die Lagrange-Funktion ist in kartesischen Koordinaten
L
G mr 2 G V (r , t ) 2 m 2 x y 2 z 2 V ( x, y, z, t ) 2
(12.63)
Die verallgemeinerten Impulse berechnen sich daraus zu
px
wL wx
mx ;
py
wL wy
my ;
wL wz
pz
mz .
(12.64)
Damit erhalten wir für die Hamiltonfunktion
H ( x, y , z , p x , p y , p z )
px2 p y2 pz2 2m
V ( x, y , z , t )
Daraus folgen die Hamiltonschen Gleichungen zu
G p2 G V (r , t ) 2m
(12.65)
218
12 Analytische Mechanik
px
wH wx
wV ; wx
x
wH wpx
px ; m
py
wH wy
wV ; wy
y
wH wp y
py
pz
wH wz
wV ; wz
z
wH wpz
pz . m
m
;
(12.66)
In Vektorform schreiben sie sich als
G p
G grad V ( r ),
G r
G p . m
(12.67)
Hängt die Hamiltonfunktion nicht explizit von der Zeit ab, so ist sie selbst Erhaltungsgröße. Um das zu zeigen, berechnen wir die totale zeitliche Ableitung von H
dH dt
· d § n wL wL qi L ¸ ¨¦ dt © i 1 wqi wt ¹
wH . wt
(12.68)
Im Klammerausdruck wurde (12.53 benutzt; das letzte Gleichheitszeichen folgt mit (12.62a). Nach der Behauptung ist wH / wt 0 o H const. Sind die Potentiale geschwindigkeitsunabhängig, so wird der erste Term des Klammerausdrucks mit (12.56) und der Definitionsgleichung von L,
§ wL · ¸ qi © i¹
¦ ¨ wq
2 Ekin
(12.69)
und die Hamiltonfunktion wird gleich der Gesamtenergie des Systems.
H ( p, q )
Ekin V .
(12.70)
In der Quantenmechanik wird die Hamiltonfunktion (12.70) zum Hamiltonoperator zur Berechnung der Energiezustände von Atomen und Molekülen.
12 Analytische Mechanik
219
12.2.2 Kanonische Transformationen In Kap. 12.1.3 hatten wir gesehen, dass die Gültigkeit der Lagrangeschen Bewegungsgleichungen nicht auf kartesische Koordinaten beschränkt ist, sondern auf beliebige Koordinaten ausgeweitet werden kann. Besondere Bedeutung kam der Transformation auf zyklische Koordinaten zu, durch welche die Lösung eines Problems erheblich erleichtert wird. Hängt z. B. die Lagrange-Funktion nicht explizit von der Koordinate qi ab, so folgt, dass der Impuls pi konstant ist,
wL wqi
0,
o p i
0,
o pi
const .
(12.71)
Es erhebt sich die Frage, ob derart definierte zyklische Koordinaten auch in der Hamiltonfunktion zyklisch sind. Das ist tatsächlich der Fall, denn aus (12.61a) ergibt sich, dass eine Impulskomponente pk erhalten ist, wenn die Hamiltonfunktion nicht explizit von der Koordinate qk abhängt.
wH wqk
0,
o p k
0,
o pk
Dk
const .
(12.72)
Sind alle Koordinaten qk zyklisch, so hängt die Hamiltonfunktion nur von den pk ab:
H
H ( p1 ,..., pn ) .
(12.73)
In diesem Fall lässt sich die Integration der Hamiltonschen Gleichungen vollständig durchführen. Zunächst folgt analog zu (12.72) aus (12.61a) für alle qk
pk
Dk
const .
(12.74)
Damit ergibt sich aus (12.60a)
qk
wH wpk
Zk ,
(12.75)
wobei die Zk ebenfalls zeitunabhängige Größen sind. Durch Integration erhalten wir
qk (t ) Zk t E k .
(12.76)
Darin sind die ßk wiederum unabhängig von der Zeit. Die Hamiltonschen Gleichungen sind damit im Prinzip gelöst. Allerdings ist es häufig nicht möglich, eine solche exakte Lösung zu finden. Wir wollen uns daher jetzt der Frage zuwenden, ob wir im Hamiltonschen Formalismus von den pi und qi zu neuen Koordinaten Qi und Impulsen Pi übergehen können, welche die
220
12 Analytische Mechanik
Bewegungsgleichungen vereinfachen. Deren Form darf sich dabei natürlich nicht ändern, d. h. wir haben zu fordern
wH c ; wPi
Q i
Pi
wH c ; wQi
(12.77)
Wir untersuchen eine Transformation
Qi
Qi (q, p, t );
Pi
Pi ( q, p, t ) ;
(12.78)
Zur Lösung der Fragestellung benötigen wir eine Formulierung der Hamiltonschen Gleichungen in der Form einer Variationsaufgabe. Um eine solche zu gewinnen, drücken wir zunächst im Hamiltonschen Prinzip, Gln. (12.2), die Lagrange-Funktion durch die HamiltonFunktion aus. Das ergibt t2
§
·
G S (q ) G ³ ¨ ¦ pi qi H ( q, p,t ) ¸ dt 0 . t1
©
(12.79)
¹
i
Darin sollen die qi als Funktionen von qi und pi ausdrückbar sein. Wir fassen daher S als Funktional der 2n unabhängigen Funktionen q(t) und p(t) auf. Zunächst folgt t2
§
¦ ³ ¨ q G p
G S (qi , pi )
i
t1
©
i
i
piG qi
· wH wH G qi G pi ¸ dt wqi wpi ¹
0.
(12.80)
Partielle Integration des 2. Terms ergibt t2
³
t2
piG qi dt
t1
³ t1
pi
d G qi dt dt
piG qi
t2 t1
t2
³ p iG qi dt .
Der erste Term auf der rechten Seite verschwindet, da G qi (t1 ) G qi (t2 ) Setzen wir (12.81) in (12.80) ein, so erhalten wir t2
°§
¦ ³ ®¨ q i
t1
°¯©
i
(12.81)
t1
§ wH · wH · °½ ¸ G pi ¨ p i ¸ G qi ¾ dt wpi ¹ wqi ¹ °¿ ©
0.
0.
(12.82)
Die G pi und G qi sind voneinander unabhängig. Daher kann (12.82) nur erfüllt werden, wenn die beiden Klammerausdrücke einzeln verschwinden. Das Resultat sind also die Hamiltonschen Gleichungen (12.60a/61a). Das Variationsproblem (12.79) ist diesen äquivalent. Das muss auch für die neuen Variablen gelten.
12 Analytische Mechanik
221
Das bedeutet, dass die Gleichungen t2
§
·
G S (q ) G ³ ¨ ¦ pi qi H ( q, p,t ) ¸ dt 0 t1
©
(12.83)
¹
i
und t2
§
·
G S (Q, P ) G ³ ¨ ¦ Pi Q i H c(Q, P,t ) ¸ dt 0 t1
©
(12.84)
¹
i
gleichzeitig erfüllt sein müssen. Das wiederum heißt, dass sich die beiden Integranden höchstens um die totale Zeitableitung einer beliebigen Funktion
F
F ( p, q, P, Q, t )
(12.85)
unterscheiden können.
¦ p q i
i
¦ P Q H c(Q, P, t )
H (q, p,t )
i
i
i
i
dF . dt
(12.86)
Die Integration dieser Gleichung liefert t2
½ ³t ®¯¦i pi qi H (q, p,t ) ¾¿dt 1
t2
½
³ ®¯¦ P Q H c(Q, P, t )¾¿dt F i
i
i
t1
t2 t1
.
(12.87)
Bei der vorzunehmenden Variation verschwindet der Term ganz rechts, da die Variablen an den Endpunkten nicht variiert werden. Die Gültigkeit der Gln. (12.83) und (12.84) ist also gewährleistet. Die Funktion F heißt Erzeugende Funktion der Transformation, denn wie im Folgenden gezeigt wird, legen sie die Transformationsgleichungen (12.78) fest. Nach (12.85) ist F eine beliebige Funktion der insgesamt 4n ursprünglichen und neuen Variablen sowie der Zeit. Von diesen können 2n Variable durch die Verknüpfungen (12.78) eliminiert werden, so dass 2n unabhängige Variable verbleiben. Es gibt 4 Typen von erzeugenden Funktionen:
F (q, Q, t ), F (q, P, t ), F ( p, Q, t ), F ( p, P, t ) .
(12.88a-d)
Wählen wir zunächst die erste Funktion. Setzen wir sie in (12.86) ein, so ergibt sich
¦ p q i
i
i
H
wF
wF
¦ P Q H c ¦ wq q ¦ wQ Q i
i
i
i
i
i
i
i
i
wF wt
(12.89)
222
12 Analytische Mechanik
und durch Umordnen
§
§ wF · wF ¸ qi ¦ ¨ Pi wQi i © i ¹
¦ ¨ p wq i
i
©
· § wF · ¸ Qi ¨ H c H ¸ 0. wt ¹ © ¹
(12.90)
Die Gleichung lässt sich erfüllen, wenn die drei Klammerausdrücke null sind. Es muss also gelten
pi
wF wF wF ; Pi ; Hc H . wqi wQi wt
(12.91a-c)
Das Ergebnis bedeutet Folgendes: Nach Wahl einer beliebigen Funktion F (q, Q, t ) ergeben sich die pi durch Differentiation nach der Vorschrift (12.91a). Diese Beziehungen werden nach den Qi Qi (q, p, t ) aufgelöst. Damit haben wir die ersten n Transformationsgleichungen (12.78) gewonnen. Gl. (12.91b) liefert die Pi (q, Q, t ) . In diesen lassen sich die Qi wieder durch (p,q,t) ersetzen, so dass wir die Pi (q, p, t ) gewinnen. Das sind die zweiten n Transformationsgleichungen (12.78). Als Nächstes besprechen wir die Funktion (12.88b). Durch Einsetzen in (12.122) erhalten wir jetzt als Bedingungsgleichungen:
pi
wF ; Qi wqi
wF wF ; Hc H . wPi wt
(12.92a-c)
Analog zum Vorgehen im Fall der Funktion (12.88a) ergeben sich wiederum 2n Transformationsgleichungen. Für den Fall (12.88c) sind die Bedingungsgleichungen
qi
wF wF ; Pi ; Hc wpi wQi
H
wF , wt
und für die Funktion (12.88d) ergibt sich
qi
wF ; Qi wpi
wF wF ; Hc H wPi wt
(12.93)
12 Analytische Mechanik
223
12.2.3 Hamilton-Jacobische Gleichung Es erhebt sich nun die Frage, ob es spezielle kanonische Transformationen gibt, durch welche die Hamiltonschen Gleichungen in eine Form gebracht werden können, in der sie leicht zu integrieren sind. Wir haben bereits erläutert, dass dies sicher dann der Fall ist, wenn die neuen Variablen alle zyklisch sind, d.h. wenn H´ als
Hc
H c( P1 ,..., Pn , t )
(12.94)
gegeben ist. Am einfachsten werden aber die Rechnungen, wenn es eine kanonische Transformation gibt, welche die Hamiltonfunktion H ( pi , qi , t ) in die Form
H c( Pi , Qi , t ) 0
(12.95)
überführt. Die Bewegungsgleichungen lauten in diesem Fall
Q k
wH c wPk
Pk
0;
wH c wQk
0.
(12.96)
Integration dieser Gleichungen ergibt sofort
Pi
const.
Qi
const.
(12.97)
Im Folgenden bezeichnen wir die erzeugende Funktion, welche dies leistet, mit dem Buchstaben S und nennen sie Wirkungsfunktion. Sie möge als Funktion der qi und Pi angenommen werden.
S
S (qi , Pi , t ) .
(12.98)
Diese Wahl entspricht der Funktion (12.88b). Mit F = S werden aus den Gln. (12.92b,c)
pi
wS ; wqi
Hc
H (qi , pi , t )
wS . wt
(12.99)
Wegen der Forderung (12.95) muss H´ verschwinden
Hc
H (qi , pi , t )
wS wt
0.
(12.100)
Damit H von den gleichen Variablen wie S abhängt, drücken wir die pi durch (12.99) aus. Das Ergebnis ist die Hamilton-Jacobische Differentialgleichung
224
12 Analytische Mechanik
§ wS · wS ,t ¸ H ¨ qi , © wqi ¹ wt
0 .
(12.101)
An die Stelle der Hamiltonschen Gleichungen ist also eine nichtlineare partielle Differentialgleichung 1. Ordnung zur Ermittlung der Wirkungsfunktion getreten. Da sie n + 1 Unbekannte qi und t aufweist, enthält die Lösung n + 1 Integrationskonstanten. Wir bezeichnen sie mit (D1,…, Dn + 1). Da aber in (12.101) S nicht explizit auftritt, sondern nur ihre partiellen Ableitungen, ist neben S auch S + D eine Lösung. Dabei ist D eine der n + 1 Konstanten, die in der Lösung auftreten. Diese hat jedoch keinerlei physikalische Bedeutung, da sie in den Transformationsformeln nicht explizit auftritt. Die vollständige Lösung kann also geschrieben werden als
S
S (qi ,..., qn ,D1 ,...,D n , t ) .
(12.102)
Darin können wir die n Integrationskonstanten mit den neuen kanonischen Impulsen Pi gleichsetzen.
Pi
Di
const.
(12.103)
Für die ursprünglichen Impulse folgt damit nach (12.92) mit (12.99)
pi
wS wqi
(12.104)
und für die neuen konstanten Koordinaten ergibt sich
Qi
wS wPi
wS wD i
Qi (qi ,D i , t ) { E i
const.
(12.105)
Lösen wir diese Gleichungen nach den qi auf, so erhalten wir
qi
qi (D i , E i , t )
(12.106)
Mit den beiden Gleichungen (12.104) und (12.106) haben wir die Koordinaten als Funktion der Zeit ausgedrückt. Die auftretenden 2n Integrationskonstanten DI, Ei ergeben sich aus den Anfangsbedingungen. In den meisten Fällen ist die Hamilton-Jacobische Gleichung kaum leichter zu lösen als die ursprünglichen Hamiltonschen Gleichungen. Sie ist aber abgesehen davon wie diese im Hinblick auf die Zusammenhänge zwischen Mechanik und Quantenmechanik von Bedeutung.
12 Analytische Mechanik
225
12.2.4 Behandlung des eindimensionalen harmonischen Oszillators im Hamiltonformalismus Als einfaches Beispiel für die Behandlung einer Bewegungsaufgabe besprechen wir den eindimensionalen Oszillator. Zunächst stellen wir die Hamiltonschen Bewegungsgleichungen auf, anschließend behandeln wir den Fall mit der Methode der Hamilton-Jacobi-Theorie. Zur Bestimmung der Hamiltonfunktion H benötigen wir die kinetische und die potentielle Energie. Es ist
Ekin px
m 2 m 2 D 2 x q ; E pot x 2 2 2 wL 1 p mq o q p. wq m
D 2 q ; 2
(12.107)
Damit ergibt sich H zu
H
1 2 D 2 p q 2m 2
und die Bewegungsgleichungen werden
wH wp
1 p m
q ;
wH wq
Dq
p
(12.108)
Zur Überprüfung formen wir die Gleichungen in die Newtonsche Bewegungsgleichung um. Dazu differenzieren wir die linke Beziehung nach der Zeit und eliminieren aus dieser und der zweiten Gleichung (12.108) p . Es entsteht
mq D q
0.
(12.109)
Mit q = x ist das die bekannte Newtonsche Bewegungsgleichung. Nun behandeln wir die Fragestellung mit Hilfe der Hamilton-Jacobischen Differentialgleichung (12.101). Unter Benutzung von (12.104) lautet sie 2
1 § wS · 1 wS 2 ¨ ¸ Dq wt 2m © wq ¹ 2
0.
(12.110)
Da die beiden ersten Terme nur von q abhängen und der dritte Term nur von t, machen wir einen Separationsansatz.
226
12 Analytische Mechanik
S ( q , D , t ) W ( q ) f (t ) ,
(12.111)
mit dem sich ergibt 2
1 § wW · 1 2 ¨ ¸ Dq 2m © wq ¹ 2
wf . wt
(12.112)
Da die linke Seite nur von q abhängt und die rechte nur von t, müssen beide Seiten gleich einer gemeinsamen Konstanten D sein.
f (t ) D ;
(12.113) 2
1 § wW · 1 2 ¨ ¸ Dq 2m © wq ¹ 2
D .
(12.114)
Die Lösung der letzten Gleichung ist 1/ 2
W ( q, D )
1 § · 2m ³ dq ¨ D Dq 2 ¸ 2 © ¹
.
(12.115)
Einsetzen von f(t) = D und W(q, D) in (12.111) liefert 1/ 2
S ( q, D , t )
1 § · 2m ³ dq ¨ D Dq 2 ¸ 2 © ¹
Dt .
(12.116)
Mit diesem Resultat gehen wir in (12.105) ein, womit wir als implizite Lösung erhalten:
E
wS wD
2m ³
dq 1/ 2
§ Dq 2 · 2 ¨D ¸ 2 ¹ ©
t .
(12.117)
Addition von t und Ausführung der Integration führen zu
ßt
§ m D · arc cos ¨¨ q ¸¸ . D © 2D ¹
(12.118)
12 Analytische Mechanik
227
Drücken wir im ersten Faktor
D durch Z m aus, so ergibt sich für q
2D cos Z (t ß) . D
q (t )
(12.119)
Hierin sind die Integrationskonstanten wie üblich durch die Anfangsbedingungen bestimmt. Wählen wir für t = 0 die Auslenkung zu q0 und den Impuls zu p0 = 0, so lautet (12.110) für t=0 2
1 § wS · 1 2 ¨ ¸ Dq0 D 2m © wq ¹0 2
0 .
(12.120)
Mit (12.105) gilt
wS wq
0.
p0
(12.121)
0
Das ergibt für D
D
1 Dq02 . 2
(12.122)
Mit (12.122) wird (12.119)
q(t ) q0 cos Z (t ß) .
(12.123)
Damit für t = 0 q = q0 ist, muss ß = 0 sein. Das ergibt das bekannte Endergebnis
q(t ) q0 cos(Z t ) .
(12.124)
Der harmonische Oszillator ist ein Beispiel für ein konservatives System. Wie wir schon weiter oben gefunden haben, gilt dann
H
Ekin V
E
const.
In einem solchen Fall lässt sich die Hamilton-Jacobische Gleichung vereinfachen. Setzen wir nämlich H in (12.101) ein, so erhalten wir
§ wS H ¨ qi , © wqi
· wS ¸ ¹ wt
E
wS wt
0.
(12.125)
228
12 Analytische Mechanik
Da H nicht von der Zeit abhängt, muss die Wirkungsfunktion S eine in t lineare Funktion sein. Dies folgt aus dem linken Teil der Gleichung. Aus dem rechten Teil ergibt sich die Zeitabhängigkeit zu
S v Et .
(12.126)
Folglich hat die Wirkungsfunktion die Form
S (qi ,D i , t )
S c(qi ,D i ) Et .
(12.127)
S´ wird verkürzte Wirkungsfunktion oder Hamiltonsche charakteristische Funktion genannt. Einsetzen der Lösung in (12.125) ergibt die verkürzte Hamilton-Jacobi-Gleichung
§ wS c · H ¨ qi , ¸ © wqi ¹
E .
(12.128)
12.2.5 Die Poissonklammer Zum Abschluss unseres Exkurses in die Theoretische Mechanik wollen wir die PoissonKlammer einführen. Ihr Wert liegt darin, dass sie gegenüber kanonischen Transformationen invariant ist. Auf Grund dieser Eigenschaft können die Bewegungsgleichungen in neuer Form dargestellt werden. Beim Übergang zur Quantenmechanik geht die Poissonklammer in den Kommutator über. Zur Definition der Poissonklammer betrachten wir ein System, das durch die Koordinaten qi und die Impulse pi beschrieben wird. Eine physikalische Größe dieses Systems kann nur von diesen Variablen und der Zeit t abhängen. Es mögen zwei solcher Größen F und K gegeben sein:
f
f (q1 ,..., q f , p1 ,..., p f , t ) { f (q, p, t ),
g
g (q1 ,..., q f , p1 ,..., p f , t ) { g (q, p, t )
(12.129)
Die Größe
§ wf wg wf wg · ¸ { ^ f , g` © k wpk wpk wqk ¹
¦ ¨ wq k
(12.130)
wird als Poissonklammer der Größen f und g bezeichnet und wie ersichtlich als geschrieben.
^ f , g`
12 Analytische Mechanik
229
Zunächst seien einige Eigenschaften und spezielle Poissonklammern genannt. Aus der Definition (12.130) ersehen wir unmittelbar, dass
^ f , g`
^ g , f ` und
^f, f`
0.
(12.131)
Wir wollen nun g durch die pk und qk im Hamiltonformalismus austauschen. Dazu notieren wir uns zunächst, dass wegen der Unabhängigkeit der Variablen pk , qk , t gilt
wpi wq j
0;
wpi wp j
wqi G ij ; wq j
wqi wp j
G ij ;
wpi wt
0;
0;
wqi wt
0.
(12.132)
Damit erhalten wir aus (12.130)
wf wp j
wf wq j
^ fi , q j ` ;
^ f , p `. i
(12.133)
j
Setzen wir auch f = qi oder f = pi , so ergibt sich
§
i
wp j
©
k
wpk
^q , p ` ¦ ¨ wwqq i
j
k
wqi wp j · ¸ wpk wqk ¹
¦G
ik
G jk
G ij .
(12.134)
k
Weiter finden wir
^p , p ` i
j
^q , q `
0;
i
j
0.
(12.135)
Diese Klammern, in denen f und g die pk und qk selbst sind, werden fundamentale Klammern genannt. Die in (12.134/135) niedergelegten Eigenschaften von qi und pi können auf alle kanonischen Variablen Qi und Pi übertragen werden. Um das zu zeigen, gehen wir z.B. von der zeitlichen Ableitung von Pi aus. Unter Benutzung der Hamiltonschen Gleichungen folgt
Pi
§ wPi
¦ ¨ wq k
©
qk
k
· wPi p k ¸ wpk ¹
§ wPi wH wPi wH · ¸ . © k wpk wpk wqk ¹
¦ ¨ wq k
(12.136)
Da
wH wpk
§ wH wPj
¦ ¨¨ wP j
©
j
wpk
wH wQ j · wH ¸ und wQ j wpk ¹ wqk
§ wH wPj
¦ ¨¨ wP j
©
j
wqk
wH wQ j · ¸ (12.137) wQ j wqk ¹
230
12 Analytische Mechanik
wird (12.136) zu
°§ wPi wPj wPi wPj ¯°© k wpk wpk wqk
· wH § wPi wQ j wPi wQ j · wH °½ ¨ ¾ ¸ ¸ k, j ¹ wPj © wqk wpk wpk wqk ¹ wQ j ¿° wH wH ¦j ^Pi , Pj ` wP ¦j ^Pi , Q j ` wQ . j j
Pi
¦ ®¨ wq
(12.138)
Aus dem Vergleich mit den kanonisch transformierten Hamilton-Gleichungen (12.78) ergeben sich zwei der behaupteten Beziehungen.
^P , P ` i
j
0
^P , Q `
und
i
G ij .
j
Der Beweis der noch fehlenden Relation ^Qi , Q j `
(12.139) 0 lässt sich durch eine analoge Rechnung
für Q erbringen. Die Poissonklammern (12.134/135) gelten also unabhängig von der speziellen Wahl der kanonischen Variablen. Wir schreiben dies in der Form
^qk , pl `P ,Q ^qk , pl ` p ,q G kl
usw.
(12.140)
Unter Benutzung der Poissonklammern können wir nun die eingangs aufgestellte These, dass die Klammern gegenüber kanonischen Transformationen invariant sind, beweisen. Wenn also ( p, q ) o ( P, Q) eine kanonische Transformation ist, so soll gelten
^ f , g ` P ,Q ^ f , g ` p , q .
(12.141)
Wir formen die linke Klammer wie folgt um:
§ wf wg wf wg · ¸ © i wPi wPi wQi ¹
^ f , g ` P ,Q ¦ ¨ wQ i
wf § wg wqk wg wpk · wf § wg wqk wg wpk · °½ ¸ ¨ ¸¾ ¯ i © k wPi wpk wPi ¹ wPi © wqk wQi wpk wQi ¹ °¿
¦ ® wQ ¨ wq i ,k
wg
§ wf wqk wf wqk © i wPi wPi wQi
¦ ® wq ¦ ¨ wQ k
¯
k
i
wg ¦ wq ^ f , q ` k
k
k
P ,Q
¦ k
· ½° wg § wf wpk wf wpk ¸¾ ¦ ® ¦¨ ¹ ¿° k ¯ wpk i © w Qi wPi wPi wQi
wg ^ f , pk `P ,Q . wpk
· ½° ¸¾ ¹ ¿°
(12.142)
12 Analytische Mechanik
231
Setzen wir hierin f { ql , so folgt mit (12.141)
wg
wg
^ f , g`P ,Q ¦ ^ql , qk ` p ,q ¦ ^ql , pk ` p ,q wq wp k
k
k
k
und unter Verwendung von (12.133)
^ql , g`P ,Q
wg wpl
^ql , g` p ,q
.
(12.143)
Analog ergibt sich mit f { pl in (12.142)
^ pl , g`P ,Q ^ pl , g` p ,q .
(12.144)
Die Gleichungen (12.143) und (12.144) setzen wir in (12.142) ein. Berücksichtigen wir ferner (12.133), so erhalten wir
ª wg § wf · wg wf º ¨ ¸ » ¬« k © wpk ¹ wpk wqk ¼
^ f , g ` P ,Q ¦ « wq k
^ f , g` p , q
.
(12.141)
Dies war zu beweisen. Wir wollen uns nun der Zeitabhängigkeit der Funktionen f(q,p,t) (und g(q,p,t)) zuwenden. Es gilt für ein beliebiges f
df dt
§ wf · wf wf qk p k ¸ ¦¨ wt wpk k © wqk ¹
Unter Beachtung der Hamiltonschen Gleichungen (12.60a/61a) wird daraus
df dt
wf ^ f , H` . wt
(12.145)
Die Größe f könnte z.B. der Drehimpuls oder die Energie des Systems sein. Aus (12.145) folgt, dass eine Größe f Konstante der Bewegung ist, wenn ihre Poissonklammer mit H verschwindet. So erhalten wir für f = H die bereits aus (12.68) bekannte Beziehung
dH dt
wH . wt
232
12 Analytische Mechanik
Ist wH / wt 0 , so folgt H = const. Sind zwei Konstanten der Bewegung bekannt, so lässt sich eine neue Konstante der Bewegung finden. Dieses Ergebnis folgt mit Hilfe der sog. Jacobi-Identität. Sie lautet
^u,^v, w`` ^v,^w, u`` ^w,^u, v``
0.
(12.146)
Hierin sind u, v, w drei differenzierbare Funktionen der (p, q). Der Ausdruck lässt sich durch Ausrechnen der Klammern überprüfen. Sind nun u und v zwei Konstanten der Bewegung und wird w durch die Hamiltonfunktion ersetzt, so verschwinden die beiden ersten Terme und es bleibt
^H ,^u, v``
0.
(12.147)
Die Poisson-Klammer zweier Konstanten der Bewegung mit H ist wieder Konstante der Bewegung. Setzen wir in (12.145) f = pi bzw. f = qi, so erhalten wir die Hamiltonschen Bewegungsgleichungen in der neuen Form
^ p , H` j
wH wq j
^q , H `
p j ;
j
wH wp j
q j .
(12.148)
Beispiel: Drehimpulserhaltungssatz . Wir betrachten einen Massenpunkt, der sich unter dem Einfluss einer Zentralkraft bewegt. Wir setzen voraus, dass die Bahnkurve in einer Ebene liegt, als die wir die xy-Ebene wählen. Der Drehimpuls ist also in kartesischen Koordinaten
G L
G G m ª¬ r u r º¼
eˆ1 eˆ2 m x x
y y
eˆ3 0 0
m( xy yx ) eˆ3 .
(12.149)
Führen wir hier die verallgemeinerten Impulse ein, so wird daraus
G L ( xPy yPx ) eˆ3 .
(12.150)
G Die zeitliche Änderung des Betrages von L ist durch die Poisson-Gleichung
> L, H @ gegeben.
wH wL wH wL wH wL wH wL wq1 wp1 wq2 wp2 wp1 wq1 wp2 wq2
(12.151)
12 Analytische Mechanik
233
Entsprechend dem speziellen Problem ersetzen wir p1,2 und q1,2 durch Px,y und x,y:
wH wL wH wL wH wL wH wL . wx wPx wy wPy wPx wx wPy wy
> L, H @
(12.152)
Einsetzen von (b) ergibt
> L, H @
Px
wH wH wH wH . Py x y wPy wPx wy wx
(12.153)
Die Hamiltonfunktion lautet nach (12.70)
H
1 Px2 Py2 V ( x, y ) 2m
E.
(12.154)
Damit folgt aus (12.153)
> L, H @
x
wV wV . y wy wx
(12.155)
Das Potential ist von der Form
V
V (r ) .
(12.156)
Es ist daher zweckmäßig, in (12.155) zu Polarkoordinaten überzugehen.
x
r cos M ,
y
r sin M .
(12.157)
Bildung der in (12.155) auftretenden Ableitungen ergibt
wV wx
dV wr dr wx
x dV , r dr
wV wy
dV wr dr wy
y dV , r dr
(12.158)
womit aus (12.155) folgt, dass
> L, H @
0
(12.159)
ist. Der Drehimpuls ist also dem Betrage nach konstant.
L const.
(12.160)
234
12 Analytische Mechanik
Da die Bewegung des Massenpunktes in einer Ebene erfolgt, weist der Drehimpuls immer in die gleiche Richtung, in unserem Beispiel in die z-Richtung, Gl. (12.150). Folglich gilt
G L
const eˆz .
(12.161)
Das ist der Drehimpulserhaltungssatz.
Zusammenfassung x Die Euler-Lagrange-Gleichungen lauten
wf d wf wyi dx wyic
Oj
wg j wyi
g j ( yi , x) 0
;
i 1,..., n j 1,..., m
x Die Lagrange-Funktion ist definiert als Differenz von kinetischer und potentieller Energie
L( xk , xk , t ) x
Ekin ( xk ) V ( xk , t )
Sind qi und pi die verallgemeinerten Koordinaten und Impulse, so gilt per Definition
pi
wL . wqi
pi und qi werden als zueinander kanonisch konjugierte Größen bezeichnet. Ist
wL wqi
0,
o pi
const.
Allgemein werden Variable, von denen die Lagrangefunktion nicht explizit abhängt, zyklische Variable genannt. x
Die um die Kräfte ) ci erweiterte Euler-Lagrange-Gleichung lautet
wL d wL wqi dt wqi
)ci .
12 Analytische Mechanik
235
x Die Hamiltonfunktion ist definiert als
¦ p q (q, p, t ) L(q, q (q, p, t ) t )
H ( q , p, t )
i
i
i
x Die Hamilton-Gleichungen lauten
qk
wH ; (k 1,..., n) wpk
p k
wH ; (k 1,..., n) wqk
x Hängt H nicht explizit von der Zeit ab, so gilt mit E als Gesamtenergie des Systems
H ( p, q )
Ekin V
E.
x Die erzeugende Funktion, welche die Hamiltonfunktion H ( pi , qi , t ) in die Form H c( Pi , Qi , t ) 0 überführt, sei mit S S (qi , Pi , t ) bezeichnet. Mit ihr gilt die HamiltonJacobi Differentialgleichung
§ wS · wS ,t ¸ H ¨ qi , © wqi ¹ wt
0.
x Die Poisson-Klammer zu zwei Größen und f (q, p, t ) und g (q, p, t ) ist definiert als
§ wf wg wf wg · ¸. © k wpk wpk wqk ¹
^ f , g` : ¦ ¨ wq k
x Die Zeitabhängigkeit einer Funktion f (q, p, t) ist gegeben durch
df dt
wf ^ f , H` . wt
Daraus folgt, dass f Konstante der Bewegung ist, wenn die Poissonklammer verschwindet. Die Hamiltonschen Gleichungen schreiben sich unter Verwendung der Poissonklammern als
^ p , H` j
wH wq j
p j ;
^q , H ` j
wH wp j
q j .
236
12 Analytische Mechanik
Übungsaufgaben
y
x1
x2 x
l1 m1
y1
l2
y2
1. Stellen Sie die Bewegungsgleichungen des ebenen Doppelpendels (s. Skizze.) in verallgemeinerten Koordinaten mit Hilfe der Lagrangefunktion auf. Wieso ist dieses Verfahren einfacher als die direkte Aufstellung der Gleichungen ?
m2 2. Stellen Sie mit Hilfe der Lagrange-Gleichungen die Bewegungsgleichungen für eine doppelte Atwoodsche Fallmaschine auf. (Skizze) Berechnen Sie die Beschleunigungen der vier Massenpunkte m1, m2, m3, m4 und diskutieren Sie insbesondere den Spezialfall m2 = m3 = m; m4 = 2m; m1 = 4m.
m2
g m1
m3 m4
3. Suchen Sie diejenige in einer senkrecht angeordneten (x,y)-Ebene liegende Kurve zwischen einem gegebenen Anfangspunkt (x1,y1) und einem ebenfalls gegebenen, tiefer gelegenen Endpunkt (x2,y2), auf der ein Massenpunkt die kürzeste Zeit braucht, um vom Anfangspunkt aus zum Endpunkt hin zu fallen (Brachystochrone).
II Thermodynamik Die Energieformen der Mechanik, potentielle und kinetische Energie, werden in der Thermodynamik durch die der thermischen Energie erweitert. In der Mechanik macht sich diese etwa bei Reibungseffekten bemerkbar; dazu gehört auch die Dämpfung von Schwingungsvorgängen. Das sind häufig störende Effekte. Deswegen haben wir sie oft durch die Idealisierung der physikalischen Systeme aus den Überlegungen ausgeschlossen oder uns lediglich auf die mechanischen Vorgänge und deren Beschreibung beschränkt. Andererseits hätte sich Leben ohne genügend thermische Energie in den uns bekannten Formen nicht entwickeln können. Wir sollten dabei unser Denken und Handeln so ausrichten, dass nicht der gegenteilige Effekt eintritt, nämlich eine zu große Erwärmung, wie sie jetzt mahnend vor uns steht. Wir wollen uns jetzt mit dieser Energieform vom Standpunkt der Physik näher beschäftigen. Prinzipiell gibt es zwei Möglichkeiten, uns Kenntnisse anzueignen, nämlich mit den Methoden der phänomenologischen Thermodynamik und der Statistischen Mechanik. Erstere lässt sich auf vier Erfahrungssätzen als Postulaten aufbauen. Sie werden als Hauptsätze bezeichnet. Dabei wird der Zustand eines Systems durch einige wenige Parameter beschrieben, die durch „Zustandsgleichungen“ miteinander verknüpft sind. Die statistische Mechanik geht von der atomaren Struktur der Materie aus und behandelt die Eigenschaften des Vielteilchensystems mit den Methoden der statistischen Physik. In Erweiterung der phänomenologischen Beschreibungsweise liefert sie auch alle Materialgrößen wie etwa die spezifische Wärmekapazität sowie den Temperaturverlauf dieser Größen. Wir werden hier vor allem phänomenologisch vorgehen. Die statistische Behandlungsweise kann nur in ihrer einfachsten Form der kinetischen Gastheorie entwickelt werden, da die physikalischen und die mathematischen Voraussetzungen noch fehlen. Dementsprechend beginnen wir mit der phänomenologischen Beschreibung.
13
Phänomenologische Wärmelehre
13.1
Grundgröße Temperatur
Um quantitative Aussagen über den Wärmeinhalt eines Stoffes machen zu können, benötigen wir eine Möglichkeit, diesen zu messen. Dazu führen wir eine vierte Grundgröße ein, die Temperatur. Eine grobe Temperaturskala ist uns von der Natur bereits in den Sensoren unserer Haut gegeben, mit denen wir zwischen heiß, warm und kalt unterscheiden können. Allerdings ist diese Skala relativ und subjektiv. Sind wir etwa selbst ausgekühlt und kommen in ein beheiztes Zimmer, so empfinden wir dieses im Allgemeinen als wärmer als jemand, der sich darin schon länger aufgehalten hat. Eine objektive Temperaturmessung basiert auf dem nullten Hauptsatz. Er setzt die Kenntnis des Begriffes „thermisches Gleichgewicht“ voraus. Unter dem thermischen Gleichgewicht verstehen wir den Zustand eines abgeschlossenen Systems, der sich nach hinreichend langer Zeit von selbst einstellt und in dem sich die Größen, die den Zustand des makroskopischen Systems charakterisieren, zeitlich nicht mehr ändern. Der auf der Erfahrung beruhende nullte Hauptsatz der Wärmelehre lautet damit:
238
13 Phänomenologische Wärmelehre
Alle Systeme, die mit einem gegebenen System im thermischen Gleichgewicht stehen, befinden sich auch untereinander im thermischen Gleichgewicht. Sie haben also eine Eigenschaft gemeinsam, die wir als Temperatur bezeichnen. Zur Temperaturmessung geeignete Eigenschaften sind u. a. 1. Die thermische Ausdehnung von festen, flüssigen und gasförmigen Stoffen; praktische Ausführungen in der obigen Reihenfolge sind z. B. das Bimetall-Thermometer, das Quecksilber- oder das Alkohol-Thermometer, das Gasthermometer. 2. Das Thermoelement, bei dem sich die sog. Kontaktspannung zwischen zwei sich berührenden unterschiedlichen Metallen mit der Temperatur ändert. 3. Das Widerstandsthermometer, das auf der Änderung des elektrischen Widerstandes eines Metalls oder Halbleiters beruht. 4. Das Strahlungsthermometer (Pyrometer), das auf der Zunahme der Strahlungsleistung eines heißen Körpers mit der Temperatur basiert. Zur Festlegung einer Temperaturskala werden Fixpunkte benötigt. Diese wurden historisch auf unterschiedliche Weise festgelegt. Wir besprechen kurz die Celsius-Skala und die Fahrenheit-Skala. Die Celsius-Skala geht auf den Astronomen gleichen Namens zurück (A. Celsius, 17011744). Nach ihm wird die Temperatur durch die Ausdehnung einer Quecksilber-Säule gemessen. Als Fixpunkte dienten ursprünglich der Schmelzpunkt von Eis (0 °C) sowie der Siedepunkt von Wasser unter Normaldruck (100 °C). Der Bereich zwischen diesen beiden Fixpunkten wurde gleichmäßig in 100 Teile geteilt. Heutzutage wird statt des Eispunktes der Tripelpunkt von Wasser bei 0.01 °C verwendet. Beim Tripelpunkt stehen feste, flüssige und gasförmige Phase miteinander im Gleichgewicht. Die Fahrenheit-Skala ist nach D. G. Fahrenheit (1686-1736) benannt. Er benutzte als unteren Fixpunkt (T = 0 °F) den Schmelzpunkt einer bestimmten Eis-Wasser-AmmoniumchloridKältemischung (TC = -17.8 °C). Als oberer Fixpunkt diente ihm die (leicht erhöhte) Körpertemperatur von T = 37.7 °C. Sie wurde zu 100° F festgesetzt. Die Verknüpfung dieser Skala mit der Celsius-Skala ist also gegeben durch
TC TF
5 (TF (q F ) 32) qC 9 9 ( TC (qC ) 32) q F 5
Die Fahrenheit-Skala ist auch heute noch in den USA gebräuchlich.
(13.1)
13 Phänomenologische Wärmelehre
239
Ein Nachteil des Flüssigkeitsthermometers besteht darin, dass sich Flüssigkeiten verschieden stark ausdehnen. Für ein Alkohol-Thermometer ergibt sich eine andere Temperaturskala als für ein Quecksilberthermometer (Abb. 13.1). Außerdem ist die thermische Ausdehnung über den gesamten Temperaturbereich im Allgemeinen nicht konstant. Zur genaueren Messung
Abb. 13.1: Die Skalen eines Hg-Thermometers und eines Alkohol-Thermometers unterscheiden sich infolge ungleichmäßiger Ausdehnung der Flüssigkeiten voneinander
Hg
100° 90 80 70 60 50 40 30 20 10 0° Alkohol
benötigen wir Thermometer mit einer gleichmäßigen Temperaturskala. Dazu bietet sich z.B. die Änderung des Druckes eines Gases bei konstantem Volumen an. Ein solches Instrument heißt Gasthermometer. Es setzt das Modell eines idealen Gases und damit die Gültigkeit der idealen Gasgleichung voraus. Die Gasteilchen werden als elastische Kugeln betrachtet, deren Abstände groß gegenüber ihrem Durchmesser sind. Mit dem Thermometer können Temperaturen bis hinunter zu ca. 2,5 K gemessen werden. Wir besprechen es weiter unten. Bei noch tieferen Temperaturen treten zu starke Abweichungen vom idealen Gasgesetz auf. Für solche Temperaturen bis zu etwa 1 mK kann das elektrische Rauschen eines stromdurchflossenen Widerstandes zur Messung herangezogen werden (L13.1). Im Bereich weniger mK bis hinab in den µK-Bereich werden nukleare Suszeptibilitätsthermometer verwendet (s. Kap. 19 und L13.1). Dabei erhebt sich natürlich die Frage, warum es erstrebenswert ist, solche niedrigen Temperaturen zu erzeugen und mit welchen Methoden sie erzielt werden können. Diese Fragen lassen sich erst später beantworten. Es sei aber vorweg genommen, dass es sich dabei ebenfalls um spannende Physik handelt. Wir besprechen hier zunächst quantitativ die thermische Ausdehnung fester und flüssiger Körper. Betrachten wir die Länge l eines Stabes. Mit zunehmender Temperatur dehnt er sich aus. Experimentell finden wir
l (tC ) l (0)(1 D tC ) ;
(13.2a)
Die Größe D bezeichnet den linearen Ausdehnungskoeffizienten. Er gibt die relative Längenänderung pro Grad Temperaturänderung an:
D
l (tC ) l (0) . l (0) tC
(13.2b)
240
13 Phänomenologische Wärmelehre
Die Wärmeausdehnung kommt dadurch zustande, dass die Atome mit zunehmender Temperatur stärker ausgelenkt werden. Festkörper
Aluminium Eisen Kupfer Germanium Diamant Invar
Linearer Ausdehnungskoeff. D/(10-6.K-1) 23,8 12 16,8 6 1,3 1,5
Flüssigkeiten
Äthylalkohol Benzol Toluol Glyzerin Quecksilber Wasser
Räumlicher Ausdehnungskoeff. J/(10-4 K-1) 11,0 10,6 11,1 48 1,8 2,07
Tab. 13.1: Thermischer Ausdehnungskoeffizient einiger Festkörper und Flüssigkeiten zwischen 0 und 100 °C Wegen ihrer abstoßenden Wechselwirkung erfolgt die Auslenkung aber nicht mehr symmetrisch bez. der Gleichgewichtslage, sondern ein Atom hält sich länger im kernferneren Bereich des Nachbaratoms auf. Im zeitlichen Mittel verschiebt sich der Abstand zu größeren Werten. In Tab. 13.1 sind die Werte von D für einige feste Stoffe zusammengestellt. Der Ausdehnungskoeffizient hängt leicht von der Temperatur ab.
D (tC ) D (0 qC) ßtC .
(13.3a)
Damit ändert sich die Länge entsprechend
l (t ) l0 (1 D 0tC E tC2 )
(3.3b)
Hierin wurden l(0) bzw. D (0) vereinfacht geschrieben als l0 bzw. D 0 . Abb. 13.2a: Bimetall-ThermoWerden zwei Metallstreifen, die einen unterschiedmeter lichen thermischen Ausdehnungskoeffizienten besitzen, bei einer bestimmten Temperatur miteinander fest verbunden, so wird sich ein solcher Bimetallstreifen bei Änderung der Temperatur krümmen. Diese Krümmung ist in guter Näherung proportional zur Temperaturänderung. Wird sie mittels eines Zeigers auf einer Skala sichtbar gemacht, so stellt die Anordnung ein Thermometer dar (Abb. 13.2a). Wir gehen nun zu Gasen über. Das Volumen eines idealen Gases vergrößert sich proportional zur Temperatur.
13 Phänomenologische Wärmelehre
241
V (tC ) V0 (1 J tC ) , Gas
J/(10-3 Grad-1)
Ideales Gas He Ne Ar O2 CO2
3,661 3,661 3,662 3,671 3,672 3,726
Tab. 13.2: Thermischer Ausdehnungskoeffizient einiger Gase
(13.4a)
wobei V0 V (tC 0q) ist. Der Ausdehnungskoeffizient ist analog zu oben definiert als die relative Volumenänderung pro Grad Celsius Temperaturänderung:
J
V (tC ) V0 . V0 tC
(13.4b)
In Tab. 13.2 ist der Ausdehnungskoeffizient für einige Gase aufgelistet. Das Gas, das dem idealem Gas am nächsten kommt, ist Helium. Der Ausdehnungskoeffizient ergibt sich experimentell zu J 1/(273,15 qC) . Für den Gasdruck bei konstantem Volumen liefern
Experimente analog
p
p0 (1 J tC ) .
(13.5)
Diese Beziehung ist unter dem Namen Gay-Lussac-Gesetz (J. L. Gay-Lussac, 1778-1850) bekannt. Die Erhöhung des Druckes mit der Temperatur bei konstantem Volumen wird beim Gasthermometer ausgenutzt. Es besteht aus einem mit Helium gefüllten VKap Behälter als Messsonde (Abb. 13.2b). Er ist über ein Rohr mit einem U-Rohr-Manometer verbunden, dessen H mittlerer Teil aus einem flexiblen Schlauch besteht. Die Höhe des Quecksilberpegels im linken Schenkel wird so eingestellt, dass er genau eine innerhalb des Rohres angebrachte Spitze berührt. Bei Temperaturänderung hat p,V P,p, V V das Gas die Tendenz, sein Volumen zu verändern. Um es konstant zu halten, wird die Höhe des rechten U-Rohr-Schenkels entsprechend verändert. Der jeweilige Druck ergibt sich aus der Höhendifferenz der beiden Quecksilberkuppen; bei offenem Rohr kommt noch der Luftdruck hinzu. Bei sehr genauen Messungen Abb. 13.2b: Gasthermometer muss auch die Ausdehnung des Gasgefäßes berücksichtigt werden. Gasthermometer können in einem weiten Temperaturbereich eingesetzt werden. Es gibt Anordnungen, die, wie bereits erwähnt, Messungen bis hinab zu ca. -270 °C gestatten. Die obere Grenze ist durch die Erweichungstemperatur des Gasbehälters gegeben und liegt damit bei etwa 1000 °C.
242
13 Phänomenologische Wärmelehre
Bisher haben wir zwei Temperaturskalen, nämlich die Celsius-Skala und die FahrenheitSkala, kennen gelernt. In der Physik wird keine der beiden Skalen benutzt, sondern ausschließlich die Kelvin-Skala (W. Thomson (Lord Kelvin), 1824-1907). Sie entsteht durch Verschiebung des Nullpunktes der Celsius-Skala um -273.15 °. Der neue Nullpunkt heißt absoluter Nullpunkt, weil hier nach (13.6) und (13.8) das extrapolierte Volumen und der extrapolierte Druck null werden. Die absolute Temperatur wird mit dem Buchstaben T bezeichnet; ihre Einheit ist das Kelvin (K). Die Skala ist unabhängig vom benutzten Gas des Gasthermometers, vorausgesetzt, es kann als ideales Gas betrachtet werden. Eine vom Arbeitsstoff unabhängige Temperaturskala liefert der zweite Hauptsatz, den wir in Kap.13.6 kennen lernen werden. Sie ist mit der absoluten T-Skala identisch.
13.2
Wärmemenge und spezifische Wärme
Wird einem Körper Energie zugeführt, so steigt im Allgemeinen seine Temperatur. Die Temperaturerhöhung ist proportional zur zugeführten Energie. Der Proportionalitätsfaktor ist die Wärmekapazität C des erwärmten Körpers.
'W
C 'T
c m 'T
(13.6)
Darunter verstehen wir das Produkt aus der spezifischen Wärme c und der Masse m des erwärmten Körpers. Die spez. Wärme ist in unserem Beispiel die zur Erwärmung von 1 kg Wasser von 14,5 °C auf 15,5 °C erforderliche Wärmemenge. Diese Wärmemenge wurde früher als eine große Kalorie definiert. Zur Umrechnung von Wärmeenergie (kcal) in mechanische Energie (Joule) musste das sog. „mechanische Wärmeäquivalent“ bekannt sein. Das Experiment ergibt M. Wäquiv.:
'Q(kcal ) 'Wmech ( J )
4,186 .
(13.7)
Heute wird, wie schon erwähnt, als Einheit der Energie 1 Joule verwendet. Sie ist uns aus der Mechanik wohlbekannt. Die Einheit der spez. Wärme ist Joule/(kgK). Von der Richtigkeit der Beziehung (13.9) können wir uns überzeugen durch Erwärmung von Wasser mit Hilfe eines thermisch isolierten elektrischen Wasserkochers. Die zugeführte elektrische Energie ist durch das Produkt aus elektrischer Spannung, elektrischem Strom und der Zeit gegeben,
'W
U I 't .
Die spez. Wärme eines Körpers cK kann mit Hilfe eines Mischungskalorimeters bestimmt werden. Es besteht aus einem wärmeisolierten doppelwandigen verspiegelten Glasgefäß, dessen Hohlraum evakuiert ist (Abb. 13.3a). Dieser „Dewar“ ist z. T. mit Wasser der Masse m1 und der Temperatur T1 gefüllt. Der interessierende Körper wird zunächst auf eine Temperatur T2 gebracht, die oberhalb T1 liegt. Bringen wir ihn anschließend in das Dewar, so steigt die Temperatur des Wassers bis zur Mischungstemperatur TM, bei der sich die Temperaturen
13 Phänomenologische Wärmelehre
243
angeglichen haben. Von diesem Zeitpunkt an beginnt die Temperatur infolge von Wärmeverlusten langsam zu sinken (Abb. 13.3b).
a)
b)
Rührer
Abb. 13.3a: Kalorimeter zur Bestimmung der spezifischen Wärme eines Stoffes
T TM
13.3b: Temperaturverlauf vor und nach dem Einbringen des Thermometers in das Kalori- T 1 meter
A2
T - Abfall durch
Wärmeverluste
A1 t
Die vom Körper K abgegebene und die vom Wasser und dem Dewar-Gefäß D aufgenommene Wärmemenge sind gleich. Damit ergibt sich die spezifische Wärme zu
cK
(mW cW CD )(TM T1 ) . mK (T2 TM )
(13.8)
Die Wärmekapazität des Dewars wird bestimmt, indem zwei Wassermengen der Massen m1W und m2W mit den Temperaturen T1 und T2 miteinander gemischt werden und wie oben die Mischungstemperatur ermittelt wird. In Tab. 13.3 sind die spezifischen Wärmen einiger Stoffe zusammengestellt. Den größten Wert aller flüssigen und festen Stoffe besitzt Wasser. Dieses ist daher ein guter Wärmespeicher. Das wirkt sich auch beim Klima aus; die großen Wassermengen der Weltmeere verhindern große Temperaturschwankungen zwischen Tag und Nacht und zwischen den Jahreszeiten. – Für reine Metalle ergibt sich bei Zimmertemperatur oder etwas darüber ein einheitlicher Wert von cV = 3R (Regel von P. L. Dulong (1785-1838) und A. T. Petit (1791-1820)). Der Index „V“ bedeutet, dass bei der Messung das Volumen konstant zu halten ist, wohingegen bei cp der Druck festgehalten wird. Der Unterschied wird weiter unten erklärt, bei Festkörpern ist er klein. Anders dagegen bei Gasen. Am leichtesten ist die spez. Wärme bei konstantem Druck zu messen. Die spez. Wärme aller Stoffe ist am absoluten Nullpunkt null. Der Temperaturverlauf kann quantitativ mit Hilfe der Quantenstatistik erfasst werden.
244
13.3
13 Phänomenologische Wärmelehre
Wärmeleitung
Die Wärmeleitung ist wie die elektrische Leitung und die bereits behandelte Diffusion ein Transportphänomen. Im Unterschied zu den letztgenannten Vorgängen, die mit einem Massetransport verbunden sind, handelt es sich dabei um einen reinen Energietransport. Diesen Fall wollen wir hier etwas näher untersuchen.
13.3.1 Wärmeleitung in festen Stoffen In festen Stoffen nehmen die Atome im Idealkristall feste Gitterpositionen ein. In amorphen Körpern sind sie dagegen regellos angeordnet. In vielen Fällen liegt das Material polykristallin vor, besteht also aus regellos nebeneinander liegenden winzigen Kriställchen. Die Wärmeleitung hat ihren Ursprung in den kollektiven Schwingungen der Atome und in elektrisch leitenden Stoffen auch in der Energieübertragung durch die beweglichen Elektronen. In einem Einkristall kann die Wärmeleitung wie andere Festkörpereigenschaften richtungsabhängig werden. Diesen Fall wollen wir hier ausschließen. Es kann natürlich nicht auf die mikroskopischen Mechanismen für die Wärmeleitung eingegangen werden; dazu werden detaillierte Kenntnisse über Festkörperphysik benötigt. Wir wollen hier vielmehr eine Gleichung ableiten, die es gestattet, bei gegebener Wärmeleitung die entstehende Temperaturverteilung zu berechnen. Wir gehen in zwei Stufen vor. Zunächst sei ein homogener Stab vorgegeben, dessen Enden durch Kontakt mit Wärmereservoirs auf den Temperaturen T1 und T2 < T1 gehalten werden. Dadurch stellt sich nach einer bestimmten Zeit ein stationärer Zustand ein, der durch ein Temperaturgefälle dT/dx charakterisiert ist. Es hängt von der gewählten Temperaturdifferenz der Reservoirs, der Länge des Stabes l und dessen Querschnitt A, sowie einer Materialkonstante O ab, die Wärmeleitzahl heißt. Die durch den Stab fließende Wärmemenge ist
dQ dT
O A
dT . dx
(13.9)
Dieser Zusammenhang entspricht der Diffusionsgleichung (10.43). Infolge der Homogenität des Stabes kann die Gleichung sofort integriert werden. Dadurch ergibt sich die Temperatur an der Stelle x des Stabes zu
T ( x)
dQ / dx x const . OA
(13.10a)
Zur Bestimmung der Konstante und des Differentialkoeffizienten dQ/dx ziehen wir die Randbedingungen T(0) = T1 und T(l) = T2 heran. Damit ergibt sich
T ( x)
T1 T2 x T1 . l
(13.10b)
13 Phänomenologische Wärmelehre
245
Wir wollen jetzt zum allgemeinen Fall einer nichtstationären Wärmeleitung durch inhomogene Körper mit unterschiedlichem Querschnitt übergehen (Abb. 13.4). Dazu betrachten wir ein Volumenelement zwischen den Ebenen x = x1 und x = x2 mit dem Querschnitt TUmgeb A. Existiert nur ein T-Gefälle längs der dQ V x-Richtung, so ist die durch den Körper dt bei x = x1 zu einem bestimmten Zeitpunkt t fließende Wärmemenge T(x 2 ) T(x1 ) analog (13.9)
dQ dT
O A
dQ 2 dt
dQ1 dt
wT . wx
Die partielle Ableitung bringt zum Ausdruck, dass T = T(x,t) ist. Am Ort der Ebene x2 = x1 + dx ist die Temperatur
dQ V dt x1
dx
x2
x
Abb. 13.4: Zur Ableitung der Wärmeleitungsgleichung
wT T ( x2 ) T ( x1 ) dx . wx
Die dort pro Zeiteinheit hindurchtretende Wärmemenge wird damit
dQ2 dt
O A
w § wT · dx ¸ . ¨T wx © wx ¹
Ist die Temperatur bei x1 größer als bei x2, so strömt in das Volumen dV = A dx pro Zeiteinheit die Wärmemenge dQ1/dt hinein und die Wärmemenge dQ2 wieder heraus. Die Energiezunahme in dV beträgt folglich
dQ dt
dQ1 dQ2 dt dt 2 wT O 2 dV . wx
O
w 2T Adx wx 2
Dadurch steigt die Temperatur nach (13.6) um dT = (1/c) dQ, also um
wT wt
O w 2T , U c wx 2
(13.11a)
wobei U die spez. Dichte des Materials ist. Wärmeverluste im Stab durch Abgabe an die Umgebung sind dabei ebenso vernachlässigt wie in (13.10a). Sie können durch einen Verlustterm L = dQV/dt empirisch berücksichtigt werden:
246
13 Phänomenologische Wärmelehre
wT wt
O w 2T L(T TUmgeb ) . U c wx 2
(13.11b)
Im allgemeinsten Fall, in dem die Temperatur auch von y und z abhängt, tritt an Stelle der Ableitung nach x der Laplace-Operator ':
wT wt
O 'T Uc
(13.11c)
Die Beziehung wird als Wärmeleitungsgleichung bezeichnet. In Tab. 13.3 sind die Wärmeleitzahlen einiger Stoffe zusammengestellt.
Stoff
O/W/mK
Aluminium Blei Gold Magnesium Kupfer Silber
236 35 322 157 401 428
Chlorwasserstoff Kohlendioxid Azeton Benzol Essigsäure Glyzerin Olivenöl
0,189 0,087 0,162 0,146 0.161 0,285 0,17
Helium Argon Wasserstoff Sauerstoff
143 103 16 “ 171 “ 24 “
Mörtel Normalbeton Styropor
0,9-1,4 2,1 0,03- 0,045
T/°C 0 0 0 0 0 0 20 20 20 20 20 20 20 0 0 0 0 10 10 20
Tab. 13.3: Wärmeleitzahlen einiger Stoffe
13 Phänomenologische Wärmelehre
247
13.3.2 Wärmeleitung in Flüssigkeiten und Gasen In Flüssigkeiten ist die Kopplung benachbarter Atome erheblich kleiner als in Festkörpern, in Gasen existiert eine solche überhaupt nicht; Als Folge davon gibt es keine Scherkräfte. Damit kann sich eine lokale Überhitzung nur in Form von Longitudinalwellen ausbreiten. Die Wärmeleitung in nicht elektrisch leitenden Flüssigkeiten und Gasen ist daher im Allgemeinen kleiner. Bei Gasen bewirkt deren geringe Dichte eine weitere Reduzierung. Bei elektrisch leitenden Flüssigkeiten wie in Quecksilber und geschmolzenen Metallen dominieren die nahezu freien Elektronen die Wärmeleitung. Der Beitrag der Ionen kann daher wegen ihrer großen Masse vernachlässigt werden. Neben der Wärmeleitung kann eine Energieübertragung auch durch Konvektion auftreten. Diese wächst umgekehrt proportional zur Wurzel aus der Masse. Das kann im Experiment qualitativ durch Anlegung einer Spannung an einen Wolfram-Draht gezeigt werden, der zwei hintereinander angeordnete Glaszylinder mit unterschiedlichen Molekülen unter gleichem Druck durchzieht. Je größer der Massenunterschied ist, desto unterschiedlich hell glüht der Faden in den beiden Zylindern.
13.4
Zustandsgrößen und Zustandsgleichungen
In Kap. 13.1 hatten wir thermisches Gleichgewicht definiert. Unter diesem verstehen wir den Zustand eines abgeschlossenen Systems, in dem sich die Größen, die den Zustand des makroskopischen Systems charakterisieren, zeitlich konstant sind. Ein solches System heißt stationär. Die betreffenden Größen zur Charakterisierung des Systems werden als Zustandsgrößen bezeichnet. Wir unterscheiden extensive und intensive Zustandsgrößen (Quantitätsund Qualitätsgrößen). Erstere addieren sich bei der Zusammensetzung von Systemen, sie sind mengenproportional; intensive Zustandsgrößen sind mengenunabhängig. Betrachten wir etwa ein abgeschlossenes System eines idealen Gases. Der Gleichgewichtszustand wird durch die extensitiven Zustandsgrößen Volumen V, Druck p und Temperatur T festgelegt. Das Produkt aus Volumen V und Druck p ist proportional zur absoluten Temperatur T. Die Proportionalitätskonstante wird mit R bezeichnet und heißt allgemeine Gaskonstante. A. Avogadro (1776-1856) hat zum ersten Mal die Hypothese aufgestellt, dass R nur von der Zahl und nicht von der Art des Gases abhängt. Für ein Mol eines Gases hat sie den Wert R = 8,31 Joule/Grad (ein Mol ist die Menge eines Gases in Gramm, welche das Molekulargewicht angibt). Die so entstandene Beziehung heißt Zustandsgleichung des idealen Gases oder kurz allgemeine Gasgleichung. Sie lautet für 1 Mol bzw. Q Mole
pV
RT
pV Q RT
(13.12)
und ist in Abb. 13.5 dargestellt. Der Faktor Q ist ein Beispiel für eine intensive Zustandsgröße.
248
13 Phänomenologische Wärmelehre
p/bar 90
p
T=320 K Tkr=304.2 K
70
T=285 K
T2
50
T1
A B T=273.15 K
30 V Abb. 13.5: Isothermen im pV-Diagramm pV-Diagramm
1.0
3.0
5.0 V/ (10-4
m3 mol
)
Abb. 13.6: Van der Waals Isothermen im
Auch für reale Gase gibt es eine Zustandsgleichung. CO2 ist z.B. ein solches Gas. Wird es bei konstanter Temperatur komprimiert, so verhält sich der Druck zunächst ähnlich wie für ein ideales Gas. Bei weiterer Volumenverkleinerung verflüssigt sich das Gas, der Druck bleibt konstant. Nach Abschluss der Verflüssigung steigt er wegen der geringen Komprimierbarkeit von Flüssigkeiten steil an. Die Messergebnisse werden gut durch die van-der-Waalssche Zustandsgleichung wiedergegeben (J. D. van der Waals, 1837-1923). Sie lautet
(p
Q 2a V2
) (V Q b) Q RT
(13.13a)
Die Größen a und b sind Konstanten, die von dem betreffenden Gas abhängen. Der erste Term heißt Binnendruck; er berücksichtigt die kurzreichweitigen Kräfte zwischen den Atomen bzw. Molekülen. Da durch sie die Moleküle eine anziehende Kraft erfahren, wirkt der Term wie ein zusätzlicher äußerer Druck. Die Konstante b berücksichtigt das Eigenvolumen va der NA Moleküle eines Mols. Sie ergibt sich zu b 4 N A va . Stellen wir die Gleichung grafisch dar, so erhalten wir den in Abb. 13.6 skizzierten Verlauf. Er gibt den Druck als Funktion des Volumens in der rein gasförmigen wie in der rein flüssigen Phase gut wieder. Dagegen nimmt sie zwischen diesen Phasen einen wellenförmigen Verlauf, beschreibt also nicht die Koexistenz von gasförmiger und flüssiger Phase, die experimentell durch eine Gerade AB (p = const.) wiedergegeben wird. Wir werden weiter unten sehen, dass die Gerade so verläuft, dass die beiden schraffierten Bereiche die gleiche Fläche haben (Maxwell-Gerade). Wir benötigen dazu den ersten und zweiten Hauptsatz. Am kritischen Punkt verschwinden die beiden Extrema gerade. Wird die Temperatur immer weiter erhöht, so wird der Bereich, in dem gasförmige und flüssige Phase nebeneinander existieren, immer kleiner, bis bei einer kritischen Temperatur Tk eine Verflüssigung nicht mehr möglich ist. Der Grund liegt in der hohen kinetischen Energie
13 Phänomenologische Wärmelehre
249
der Gasmoleküle, welche über die anziehende Wechselwirkung zwischen den Molekülen dominiert. Die van-der-Waals-Gleichung weist statt eines Minimums eine horizontale Wendetangente auf, d.h. es gilt
§ wp · ¨ ¸ © wV ¹Tk ,Vk
§ w2 p · 0 und ¨ 2 ¸ © wV ¹Tk ,Vk
0.
(13.14)
Mit Hilfe dieser Bedingungen lassen sich die Konstanten a, b auf messbare Größen zurückführen.
a 3 pkVk2 ; und b
1 Vk . 3
(13.15)
Übersättigung und Siedeverzug Kleine Stücke der van-der-Waalsschen „S“-Kurve können bei geeigneten Versuchsbedingungen durchaus durchlaufen werden. Die Kondensation des Gases bei B benötigt Keime, an denen sie beginnen kann. Fehlen solche auf Grund großer Reinheit des Gases, so wird die Kondensation verzögert; der Druck steigt weiter an, das Gas ist übersättigt. Gibt man Kondensationskeime in das übersättigte Gas, so tritt die Kondensation schlagartig ein. Dieses Phänomen wird bei der Wilsonschen Nebelkammer ausgenutzt. Die sog. Kondensstreifen hoch fliegender Flugzeuge beruhen ebenfalls auf dem plötzlichen Einsetzen der Kondensation des unterkühlten Wasserdampfes. Eine Übersättigung kann auch entstehen, wenn die Temperatur eines reinen Gases an der Grenze des Koexistenzbereiches kontinuierlich abgesenkt wird. Wir sprechen von einer Unterkühlung des Gases. Analoge Phänomene treten am Punkt A des Zustandsdiagramms auf. Fehlen Erstarrungskerne, so lässt sich z.B. Wasser bis ca. 10° C unter den Gefrierpunkt abkühlen, ohne dass es zu Eis wird. In Wolken sind Unterkühlungstemperaturen bis zu ca. –80° C gemessen worden. Durch die Einführung reduzierter Größen pred = p/pk, Vred = V/Vk und Tred = T/Tk lässt sich die van-der-Waals-Gleichung in einer Form schreiben, die keine Materialkonstanten mehr enthält und daher für alle Substanzen gelten sollte.
§ 3 ¨ pred 2 Vred ©
· ¸ (3Vred 1) 8Q Tred . ¹
(13.13b)
Befinden sich zwei Substanzen in Zuständen mit den gleichen (pred, Vred und Tred) –Werten, so werden diese korrespondierende Zustände genannt. Die van-der-Waals-Gleichung stellt also zur Beschreibung realer Gase eine wesentliche Verbesserung gegenüber der idealen Zustandsgleichung dar, wenn sie auch durch die MaxwellGerade korrigiert werden muss. Für nicht zu hohe Drucke lässt sich (13.13a) ersetzen durch die Beziehung
250
13 Phänomenologische Wärmelehre
pV
RT B (T ) p; mit
B (T ) b
a ; RT
(13.13c)
Diese Gleichung ist ein Spezialfall einer Reihenentwicklung nach der Teilchendichte N/V, die sich aus der Taylorentwicklung von U(p,V,N)/N und p(T,V,N) nach N/V ableiten lässt.
p
N k BT V
2 ° ½° §N· §N· ®1 B1 ¨ ¸ B2 ¨ ¸ ...¾ . ©V ¹ ©V ¹ °¯ °¿
(13.16)
Die Größen Bi heißen Virialkoeffizienten; sie drücken die Abweichung vom Verhalten des idealen Gases aus. Wir beschränken uns hier auf die Verifikation von (13.13c). Dazu schreiben wir die auf 1 Mol bezogene van-der-Waals-Gleichung in der Form
§ a ·§ b· pv ¨1 1 ¸ 2 ¸¨ pV ¹ © V ¹ ©
RT ;
Daraus folgt für kleine Dichten
pV
§ a ·§ b· 1 ¸ ¨1 2 ¸¨ pV ¹ © V ¹ © § a ·1½ RT ®1 ¨ b ¸ ¾ RT ¹ V ¿ ¯ ©
a § RT ¨ b RT ©
· ¸ p. ¹
Terme, die proportional p2 sind, wurden vernachlässigt.
13.5 Einbeziehung der Wärmeenergie in den Energieerhaltungssatz: Der erste Hauptsatz Die phänomenologische Thermodynamik basiert auf vier Hauptsätzen. Das sind wie die Newtonschen Axiome Erfahrungssätze, die sich also nicht beweisen lassen. Der nullte Hauptsatz wurde später eingeführt als die anderen. Da er die Grundlage zur TemperaturMessung darstellt, die zu Anfang der Wärmelehre eingeführt werden muss, erhielt er zwangsläufig die Nummer „null“. Der erste Hauptsatz erweitert den Energiesatz der Mechanik durch die Einbeziehung der Wärmeenergie. Zunächst ordnen wir jedem thermodynamischen System eine innere Energie U zu. Ein solches geschlossenes System kann mit der Umgebung mechanische Energie oder Wärmeenergie austauschen. Für offene Systeme ist ferner eine Teilchenänderung möglich, womit eine zusätzliche Energieänderung verbunden ist (Teilchenzufuhr-Energie, z.B. Änderung der Bindungsenergie). Wir vereinbaren, dass vom System aufgenommene Energien
13 Phänomenologische Wärmelehre
251
positiv gezählt werden, abgegebene negativ. Der erste Hauptsatz lautet dann für offene Systeme
'U
'Q 'W 'EN
(13.17)
Die Zunahme der inneren Energie eines Systems ist gleich der Summe der ihm von außen zugeführten Wärmeenergie, der an ihm verrichteten Arbeit sowie der Teilchenzufuhr-Energie. Da der erste Hauptsatz „nur“ ein Erfahrungssatz ist, hat es immer wieder Menschen gegeben, die versucht haben, eine periodisch arbeitende Maschine zu konstruieren, die mehr Energie liefert, als sie verbraucht. Ein solches perpetuum mobile erster Art ist aber unmöglich, da es den Energieerhaltungssatz verletzt.
13.6 Anwendungen des ersten Hauptsatzes auf einphasige Einkomponentensysteme (ideale Gase) Wir wollen nun den ersten Hauptsatz auf ideale Gase anwenden. Dazu ist es zweckmäßig, von endlich großen Energiebeträgen auf infinitesimale Größen überzugehen. Es gilt
dU
D
G Q G W ¦ Pi dN i
(13.18)
i 1
Hierin bedeutet µi das chemische Potential. Das ist die Energie, die bei G W G Q 0 benötigt wird, um dem System ein zusätzliches Teilchen der Sorte i hinzuzufügen. Die innere Energie ist eine Zustandsgröße; denken wir uns einen beliebigen Prozess im pV-Diagramm aus, der schließlich wieder auf den ursprünglichen Zustand zurückführt (und deswegen als Kreisprozess bezeichnet wird) (Abb. 13.7), so gilt 2
1
³ dU ³ dU v³ dU 1
2
0.
(13.19a)
C
Damit ist dU ein totales Differential:
dU
§ wU · § wU · ¨ ¸ dp ¨ ¸ dV . © wV ¹ p © wp ¹V
(13.19b)
Das Linienintegral von dU über eine geschlossene Kurve C ist null. Der benutzte Weg ist dabei völlig beliebig. Dagegen sind Q und W vom durchlaufenen Weg abhängig. Führen wir einem
252
13 Phänomenologische Wärmelehre
System etwa eine bestimmte Wärmemenge zu, so kann diese auf unterschiedliche Weise zur Arbeitsverrichtung und zur Erhöhung der inneren Energie verwendet werden. Der Zustand des Systems ist also nicht eindeutig p festgelegt. Q und W sind demnach keine P2 Zustandsgrößen, deswegen benutzen wir zur (1) Darstellung infinitesimal kleiner Beträge den Buchstaben „ G “. (2) Es seien zunächst geschlossene Systeme vorausgesetzt. Wir wollen vier Typen von Zustandsänderungen mit einem idealen Gas P1 beschreiben. Dazu stellen wir uns eine VerV suchsanordnung vor, die aus einem zylinAbb. 13.7: Kreisprozess im pV-Diagramm, drischen Behälter besteht, der oben mit einem bestehend aus den Teilwegen (1) von P1 beweglichen Kolben abgeschlossen ist. In dem nach P2 und (2) von P2 zurück nach P1 Behälter möge sich 1 Mol Gas befinden.
13.6.1 Isochore Prozesse (V = const.) Wir arretieren den Kolben, so dass das Volumen konstant bleibt. Es folgt dann aus (13.6) und (13.18)
G Q dU
cmol ,V dT .
(13.20)
Die gesamte zugeführte Wärme wird zur Vergrößerung der inneren Energie verwendet. Die molare Wärmekapazität lässt sich damit schreiben als
Cmol ,V
§ wU · ¨ ¸ . © wT ¹V
(13.21)
13.6.2 Isobare Prozesse (p = const.) Wird der Druck konstant gehalten, so wird sich das Gas ausdehnen, d.h. es verrichtet Arbeit.
GW
pdV .
(13.22)
Setzen wir das in den ersten Hauptsatz ein, so erhalten wir
G Q dU pdV
Cmol , p dT .
(13.23)
13 Phänomenologische Wärmelehre
253
Wir führen eine neue Größe ein, die Enthalpie H:
H : U pV .
(13.24)
Differentiation ergibt
dH
dU pdV V dp .
(13.25)
In den ersten Hauptsatz eingeführt, liefert für isobare Prozesse (dp = 0)
dH
dU pdV
GQ .
(13.26)
Bei isobaren Prozessen ist die von außen zugeführte Wärme gleich der Enthalpiezunahme des idealen Gases. Die molare Wärmekapazität wird
§ wH · ¨ ¸ . © wT ¹ p
Cmol , p
(13.27)
Sie ist größer als Cmol,V, da die zugeführte Wärme nicht nur zur Erhöhung der inneren Energie und damit zur Temperaturerhöhung benutzt werden kann, sondern auch zur Arbeitsverrichtung benötigt wird. Das zeigt auch eine andere oft benutzte Beziehung zwischen Cmol,p und Cmol,V, die wir jetzt ableiten wollen. Dazu ersetzen wir in (13.26) dU durch Cmol ,V dT und erhalten
Cmol , p dT
Cmol ,V dT pdV .
(13.28)
Ausklammern von dT und Benutzung der allgemeinen Gasgleichung ergibt
Cmol , p Cmol ,V
R.
(13.29)
13.6.3 Isotherme Prozesse (T = const.) Die innere Energie eines idealen Gases hängt per definitionem nur von der Temperatur ab, nicht aber vom Druck, unter dem es steht, und dem Volumen, das es einnimmt. Experimentell wird das durch den sog. Überströmungsversuch von Gay-Lussac sichergestellt. Daraus folgt
dU
0,
(13.30)
und damit aus Gl. (13.18)
GQ
pdV .
(13.31)
254
13 Phänomenologische Wärmelehre
Die gesamte zugeführte Wärme wird in Arbeit verwandelt, die nach außen abgegeben wird. Die Zustandsgleichung des idealen Gases geht in das Boyle-Mariottesche Gesetz (Boyle, R. 1627-1691; Mariotte, E. 1620-1684) über.
const.
p V
(13.32)
Wie schon früher ausgeführt, bilden in einem pV-Diagramm die Kurven konstanter Temperatur Hyperbeln. Sie heißen Isothermen. Für praktische Zwecke müssen wir von der infinitesimal kleinen Arbeitsleistung des Gases zu der Arbeit übergehen, die das Gas bei der Volumenvergrößerung von V1 zu V2 verrichtet. Diese ergibt sich durch Integration zu V2
W
³
V2
dV V V1
p dV
R T ³
V1
R T ln
V2 V!
R T ln
V1 V2
(13.33)
13.6.4 Adiabatische Prozesse (GQ = 0) Unter adiabatischen Prozessen verstehen wir Zustandsänderungen ohne Wärmeaustausch mit der Umgebung. Entweder muss also das System gut Wärme isoliert sein oder die Prozesse müssen so schnell verlaufen, dass keine Wärme ausgetauscht werden kann. Beispiele sind Fahrrad-Luftpumpe oder Kühlschrank. Auch Luftströmungen in der Erdatmosphäre verlaufen häufig adiabatisch. Mit G Q = 0 lautet der 1. Hauptsatz
0 dU pdV
Cmol ,V dT
RT dV V
(13.34)
Sortieren nach T und V ergibt die Beziehung
Cmol ,V
dT T
R
dV . V
(13.35)
Deren Integration führt auf
Cmol ,V ln T
§ CR ln T ln ¨ V mol ,V ¨ © wobei R
R ln V const.
· § CR ¸ const o ln ¨ TV mol ,V ¸ ¨ ¹ ©
Cmol , p Cmol ,V benutzt wurde.
(13.36)
· ¸ const o TV ¸ ¹
Cmol , p Cmol ,V Cmol ,V
const . (13.37/38)
13 Phänomenologische Wärmelehre
255
Den Exponenten bezeichnen wir mit N , so dass sich ergibt
TV N 1
const.
N:
Cmol , p
cp
Cmol ,V
cV
.
(13.39a)
Durch Anwendung der allgemeinen Gasgleichung lässt sich T durch p ersetzen.
pV N
const. .
(13.39b)
Eine weitere Beziehung folgt für das Variablen-Paar p,T: 1
Tp
N
1
const. .
(13.39c)
Die drei Gleichungen heißen Poisson-Gleichungen (D. Poisson, 1781-1840) oder Adiabatengleichungen. Vergleichen wir die zweite Gleichung mit dem Boyle-Mariotteschen Gesetz, so erkennen wir, dass die Adiabaten steiler als die Isothermen verlaufen (Abb. 13.8); die Größe „ N “ ist stets positiv.
p
pV= const pV 5/3 = const V Abb. 13.8: Verlauf einer Adiabate und einer Isotherme im pV-Diagramm
Abb. 13.9: Aufbau zum Beweis der Unabhängigkeit der inneren Energie vom Volumen bei einem idealen Gas aa
Zum Schluss erläutern wir den Versuch von Gay-Lussac. Die Versuchsanordnung besteht aus zwei thermisch isolierten Gefäßen (z.B. Stahlflaschen), die durch ein Rohr, das zunächst in der Mitte durch einen Absperrhahn verschlossen ist, miteinander verbunden sind (Abb. 13.9). Das linke Gefäß ist mit einem dem idealen Gas nahekommenden Gas, z.B. Argon, gefüllt; der andere Behälter ist evakuiert. Wird der Hahn geöffnet, strömt Gas aus dem linken in den rechten Behälter. Da dort der Druck null ist, leistet das Gas insgesamt keine Arbeit. Zwar entsteht Beschleunigungsarbeit, die kinetische Energie wird aber im rechten Behälter durch
256
13 Phänomenologische Wärmelehre
Stöße an den Wänden zurückgewonnen. Die zur Expansion notwendige Energie entnimmt das Gas den Wänden des linken Behälters, die Temperatur sinkt um 'T1 ; rechts steigt sie um 'T2 . Experimentell ergibt sich 'T1 'T2 . Insgesamt hat das Gas also keine thermische Energie aufgenommen. Da sowohl G W als auch G Q null sind, folgt aus dem ersten Hauptsatz, dass die innere Energie des Gases nach dem Überströmungsvorgang die Gleiche ist wie die vor Beginn des Versuches; wir können also schließen, dass die innere Energie unabhängig vom Volumen ist.
§ wU · ¨ ¸ © wV ¹T
13.7
0.
(13.40)
Verwandelbarkeit von Wärme in Arbeit: Der zweite Hauptsatz
13.7.1 Reversible und irreversible Prozesse Der erste Hauptsatz erweitert den Energieerhaltungssatz der Mechanik um die Wärmeenergie. Während potentielle und kinetische Energie beliebig ineinander umgewandelt werden können, ist eine uneingeschränkte Verwandelbarkeit von Wärme in andere Energieformen nicht möglich. Es gibt “sogar” Prozesse, die nach unserer Erfahrung nur in einer Richtung verlaufen. Beispielsweise kann potentielle Energie in Wärme (und Verformungsenergie) umgewandelt werden (etwa wenn ein Ziegel vom Dach fällt), aber der umgekehrte Vorgang, also die Anhebung des Ziegels unter der alleinigen Abkühlung des Erdbodens ist nie beobachtet worden. Ein anderes Beispiel wäre die Abkühlung eines Pendels, das sich dadurch in Schwingung versetzte. Der umgekehrte Vorgang ist ganz alltäglich: Ein Federpendel verliert durch Reibung an mechanischer Energie und erwärmt dabei die Feder. Schließlich sei noch an die Wärmeleitung in einem Stab erinnert, die stets vom wärmeren zum kühleren Ende hin erfolgt. Niemals ist der umgekehrte Prozess beobachtet worden, also die alleinige Abkühlung eines Stabendes und der Erwärmung des anderen Endes. Dies ist bedauerlich, denn anderenfalls könnten wir eine periodisch arbeitende Maschine konstruieren (perpetuum mobile zweiter Art), die nichts anderes bewirkt als die Leistung mechanischer Arbeit unter alleiniger Abkühlung eines Wärmereservoirs (Weltmeere). Nicht umkehrbare Prozesse werden irreversibel genannt, wohin gegen umkehrbare reversibel heißen. Letztere sind nur als Idealisierung irreversibler Prozesse anzusehen. Trotzdem sind sie als Gedanken-Experiment von großer Wichtigkeit, wie wir gleich sehen werden. Ein reversibler Prozess wäre etwa der Schwingungsvorgang eines ungedämpften Pendels.
13 Phänomenologische Wärmelehre
257
13.7.2 Der Carnotsche Kreisprozess Ein weiterer reversibler Prozess ist der Carnotsche Kreisprozess. Er bildet die Grundlage einer idealisierten Wärmekraftmaschine. Der Kreisprozess ist aus dem in Abb. 13.10 dargestellten pV-Diagramm ersichtlich. Er möge mit 1 Mol eines idealen Gases geführt werden. Ist der Motor in Betrieb, so ändert sich das Gasvolumen periodisch. Im Zustand (p1,V1) ist das Gas in thermischem Kontakt mit einem Wärmebad der Temperatur T1. Das Volumen vergrößert sich isotherm von V1 auf V2. Dabei fließt die Wärmemenge Q1 aus dem Wärmebad in das Gas. Im p Zustand (p2,V2) wird die Wärmezufuhr unterbrochen. Das Gas dehnt sich adiabatisch weiter aus bis zum 1 Zustand (p3,V3); es kühlt sich dabei von T1 auf T2 ab. Jetzt wird es in thermischen Kontakt mit einem 2 Kühlbad der Temperatur T2 gebracht (T2 < T1) und isotherm von V3 auf V4 komprimiert. Dabei strömt die 4 Wärmemenge Q2 aus dem Gas in das Kühlbad. Im 3 Zustand (p4,V4) wird der Kontakt zum Kühlbad gelöst und das Gas in einem vierten Schritt adiabatisch in V den Ausgangszustand zurückgebracht. Die pro Zyklus gewonnene Arbeit ist durch die Fläche zwischen den Abb. 13.10: Carnotscher Kreisbeiden Isothermen und Adiabaten gegeben. prozess
W
v³
pdV .
(13.41)
1o1
Den Quotienten aus der abgegebenen Arbeit (W < 0) und der dem Wärmebad entnommenen Wärmemenge Q1 (Q1 > 0) wird als Wirkungsgrad K des Kreisprozesses bezeichnet.
K
W . Q1
(13.42)
Zur Berechnung des Wirkungsgrades benötigen wir die verrichtete Arbeit. Für die isotherme Zustandsänderung V1 o V2 wird diese V2
W1o2
³
V2
pdV
V1
dV V V1
RT1 ³
RT1 ln
V2 . V1
(13.43)
Entsprechend finden wir für die isotherme Zustandsänderung V3 o V4
W3o4
RT2 ln
V4 . V3
(13.44)
258
13 Phänomenologische Wärmelehre
Die Arbeitsanteile entlang der Adiabaten sind entgegengesetzt gleich und liefern daher keinen Nettobeitrag zur Arbeit des Kreisprozesses:
W2o3
cmol ,V (T1 T2 ) W4o1
cmol ,V (T1 T2 ) .
(13.45)
Also ergibt sich für die vom Kreisprozess verrichtete Arbeit
W
W1o2 W3o4
RT1 ln
V2 V RT2 ln 4 . V1 V3
(13.46)
Für die adiabatischen Prozesse 2 o 3 und 4 o 1 gilt N 1 TV T2V3N 1 1 2
(13.47)
N 1 TV T2V4N 1 . 1 1
Durch Division der beiden Gleichungen folgt
V1 V2
V4 V o ln 1 V3 V2
ln
V4 . V3
(13.48)
Einsetzen in (13.46) ergibt unter Berücksichtigung von ln (V1 / V2 )
W
R (T2 T1 ) ln
V2 . V1
ln (V2 / V1 )
(13.49)
Da T2 < T1, ist dieser Ausdruck kleiner null; die Maschine verrichtet Arbeit. Die dem System zugeführte Wärmemenge folgt aus dem ersten Hauptsatz zu
G Q1
dU pdV
Cmol ,V dT pdV .
(13.50)
Die Temperatur längs der Isothermen 1 o 2 ist konstant; daher folgt durch Ausdrücken von p durch die allgemeine Gasgleichung
RT1 dV . V
G Q1
(13.51)
Damit erhalten wir für den Wirkungsgrad K
K
W Q1
R (T2 T1 ) ln V2 / V1 RT1 ln V2 / V
1
T2 . T1
13 Phänomenologische Wärmelehre
K 1
259
T2 . T1
(13.52)
Der Wirkungsgrad des Carnotschen Kreisprozesses hängt nur von der Temperatur der beiden Wärmebäder ab. K wird umso größer, je höher die Temperatur T1 desjenigen Wärmebades gewählt werden kann, aus dem der Kreisprozess Wärme bezieht und je kleiner die Temperatur T2 des Kühlbades ist, in das Wärme abgegeben wird. Es ist aber unmöglich, die gesamte aufgenommene Wärmemenge in Arbeit zu verwandeln. Dafür steht nur der Bruchteil T1 T2 / T1 zur Verfügung. Z.B. beträgt der Wirkungsgrad einer Carnot-Maschine, die mit Wärmereservoirs von Wasser bei 0 °C und 10 °C arbeitet, nur 27 %. Der Carnot-Prozess kann auch umgekehrt durchlaufen werden. Wir können Arbeit von außen in das System hineinstecken, indem wir das Schwungrad des Motors in Drehung versetzen. Dabei kühlt sich das Kühlbad ab und das Wärmebad wird aufgeheizt. Nutzen wir den Kühleffekt aus, so führt das zum Prinzip der Kältemaschine, nutzen wir den Erwärmungseffekt aus, so bringt uns das zum Prinzip der Wärmepumpe. Der Wirkungsgrad des Carnot-Prozesses ist T1 unabhängig von der Arbeitssubstanz. Das lässt sich bereits aus der alleinigen Temperaturabhängigkeit von K folgern, es kann aber auch ganz allgemein Q 1A - Q1B gezeigt werden: Gegeben seien zwei Carnot-Maschinen, die zwischen zwei gemeinsamen WärmeWB speichern laufen (Abb. 13.11). Die ArbeitssubstanA B - (WA - WB ) zen seien verschieden. Angenommen, sie hätten verschiedene Wirkungsgrade, z.B. Maschine A hätte den größeren Wirkungsgrad. Wir betreiben A als - Q2A Q2B Kraftmaschine und B als Kältemaschine. A entnimmt bei jedem Zyklus die Wärmemenge Q1A aus dem Wärmebad 1. Sie erzeugt die Arbeit T2 < T1 - WA K A Q1 A und gibt die Wärmemenge - Q2 A an das Bad 2 ab. B entnimmt Q2B aus Bad 2, nimmt die Arbeit WB auf und liefert die Wärmemenge Abb. 13.11: Zum Beweis der UnmögQ1B WB / K B an Bad 1 ab. Q1B und Q1A seien so lichkeit eines perpetuum mobile zweidosiert, dass sie gleich sind. Da K A ! K B ist, ist die ter Art Arbeit WB, die B verbraucht, kleiner als die Arbeit WA, die A erzeugt. Das Fazit ist, dass allein der Wärmespeicher 2 abgekühlt wird. Das aber wäre ein perpetuum mobile 2. Art, das es nicht gibt. Folglich ist die oben aufgestellte Hypothese, dass der Wirkungsgrad von der Arbeitssubstanz abhängt, falsch. Q 1A
260
13 Phänomenologische Wärmelehre
13.7.3 Der Otto-Motor In Abb. 13.12 ist die Wirkungsweise eines Viertakt-Benzin-Motors dargestellt. Wie aus Abb. 13.12a zu ersehen ist, bewegt sich der Kolben während eines Zyklus zweimal nach unten und nach oben, daher der Name. Während der Phase (a) wird das Benzin-Luftgemisch durch das Ansaugventil in den Zylinder gezogen und in der Phase (b) adiabatisch komprimiert. Im Zustand der höchsten Verdichtung (c) erfolgt die Zündung. Dadurch steigt der Druck nahezu instantan an. Das Gas wird anschließend adiabatisch expandiert (d) und während der Phase (e) durch das geöffnete Auslassventil aus dem Zylinder gedrückt, wobei der Druck schnell abfällt. Das pV-Diagramm des Kreisprozesses ist in Abb. 13.12b gezeigt. Der Wirkungsgrad des Motors ergibt sich aus
K
W . Qab
(13.53)
Darin ist W die vom Motor während eines Zyklus geleistete Arbeit (W < 0). Qab ist die vom Gasgemisch freigesetzte Verbrennungswärme. W setzt sich aus zwei Beiträgen zusammen: V1
W
W12 W34
V2
pdV
³
V2
³ pdV .
(13.54
V1
Der Druck lässt sich mittels (13.39b) eliminieren. Es ergibt sich
W
p V ° § V · b 1 ®1 ¨ 1 ¸ N 1 ° © V2 ¹ ¯
N 1
½° p V ° § V ·N 1 ½° a 1 1 ¾ ®1 ¨ ¸ ¾ N 1 V ¿° ¯° © 2 ¹ ¿° N 1
( p pa )V1 ° § V1 · b ®1 ¨ ¸ N 1 ° © V2 ¹ ¯
½° ¾ °¿
(13.55a)
Mit Hilfe der allgemeinen Zustandsgleichung und der Definition von R lässt sich dies umschreiben in
W
R (Tb Ta ) (c p cV ) / cV
° § V ·N 1 ½° ° § V ·N 1 ½° 1 1 ®1 ¨ ¸ ¾ CV (Tb Ta ) ®1 ¨ ¸ ¾ V V °¯ © 2 ¹ °¿ °¯ © 2 ¹ °¿
(13.55b)
Die Verbrennungswärme ist
Qab
CV (Tb Ta ) .
(13.56)
13 Phänomenologische Wärmelehre
261
Einlass des Benzin-LuftGemischs
Kompression
Zündung
Expansion des heißen Gases
Entleeren des Zylinders
ef
fa
a
bc
cd
p
b a c e V2
f
Abb. 13.12: Funktionsweise des ViertaktOtto-Motors
d
V1 V
Damit erhalten wir für den Wirkungsgrad N 1
§V · K 1 ¨ 1 ¸ © V2 ¹
.
(13.57)
Der Wirkungsgrad ist also umso höher, desto größer das Kompressionsverhältnis ist. Wählen wir als Beispiel V1/V2 = 8/1, so folgt K = 0,56. Es muss aber einschränkend gesagt werden, dass die praktisch erreichbaren Wirkungsgrade wegen der auftretenden Verluste nur etwa halb so groß sind wie nach (13.57) zu erwarten ist.
262
13 Phänomenologische Wärmelehre
13.7.4 Der zweite Hauptsatz Es gibt verschiedene gleichwertige Formulierungen des zweiten Hauptsatzes. Eine haben wir in Gestalt der Unmöglichkeit des perpetuum mobiles 2. Art bereits kennen gelernt: Als Fazit der Kältemaschine erhalten wir Es ist unmöglich, eine periodisch arbeitende Maschine zu bauen, die lediglich dauernd einem Körper Wärme entzieht und diese vollständig in mechanische Arbeit umwandelt, ohne dass weitere Prozesse ablaufen.
Wärme geht nie von selbst, d.h. ohne Arbeitsaufwand, vom kälteren zum wärmeren Körper über, sondern stets umgekehrt.
13.7.5 Entropie Zur quantitativen Fassung des 1. Hauptsatzes hatten wir die innere Energie U eingeführt. Sie beschreibt den Zustand eines Systems im thermischen Gleichgewicht. Es ist zweckmäßig, auch dem 2. Hauptsatz eine Zustandsgröße zuzuordnen. Dies ist die Entropie. Zu ihrer Einführung wollen wir zunächst den Carnotschen Kreisprozess auf einen beliebigen Kreisprozess erweitern. In Abb. 13.13a ist ein Ausschnitt aus einem solchen gezeigt. Jeder Kurvenverlauf im pV-Diagramm lässt sich, wie angedeutet, durch beliebig viele Carnot-Prozesse mit beliebig
p p
A
B
C'
(1) C D (3)
(2) F Abb. 13.13a: Ausschnitt aus einen beliebigen reversiblen Kreisprozess durch sukzessiv durchlaufene isotherme und adiabatische Prozesse
E C''
Abb. 13.13b: Zur Definition der Entropieänderung bei einem reversiblen Kreisprozess aa
13 Phänomenologische Wärmelehre
263
vielen Wärmebädern annähern. Wir beschränken uns im Folgenden vorerst auf den in Abb. 13.13b gezeigten Kreisprozess, der entlang dreier Isothermen und dreier Adiabaten von A über B, C, D, E, nach F führt und von dort wieder nach A zurück. Er entspricht der Summe der Kreisprozesse (1) + (2) + (3). Bei der Berechnung der Energiebilanz fallen die Beiträge auf der gestrichelten Isotherme bzw. Adiabate heraus, da sie von den betreffenden Kreisprozessen gegensinnig durchlaufen werden. Wärmemengen sind positive Größen. Abgabe von Wärme drücken wir durch ein (-)-Zeichen aus. Die aufgewandten bzw. abgegebenen Wärmemengen sind längs AB : Q1 ; längs EC '' : Q3' längs CC ' : Q2' ; längs C '' F : Q3'' längs CD : Q2
Durch Addition der relevanten Wärmemengen folgt für die drei Kreisprozesse
Q1 Q2' T1 T2
0
Q2 Q3' T2 T3
0
Q2' Q3'' T2 T3
0
(13.58a)
Der Quotient Q/T heißt reduzierte Wärmemenge. Addition ergibt
Q1 Q2 Q3' Q3'' T1 T2 T3 T3
0.
(13.58b)
Mit Q3' Q3'' : Q3 führt das zu
Q1 Q2 Q3 T1 T2 T3
0,
(13.58c)
wobei wir für Q3 formal Q3 geschrieben haben. Diese Schreibweise hat den Vorteil, dass wir (13.58c) schreiben können als 3
Qi
¦T i 1
0.
(13.58d)
i
Zur Verallgemeinerung auf N Carnot-Prozesse haben wir auf der linken Seite von (13.57) die Summe der reduzierten Wärmen zu bilden. Für einen beliebigen Kreisprozess, zerlegt in N Carnot-Prozesse, folgt also N
Qi , rev
i 1
Ti
¦
0,
(13.58e)
264
13 Phänomenologische Wärmelehre
wobei abgegebene Wärmemengen negativ zu rechnen sind. Zur Kennzeichnung, dass es sich um reversible Prozesse handelt, haben wir den Index “rev” angefügt. Wir wollen uns jetzt den Kreisprozess in zwei Teilprozesse zerlegt denken. Gemäß Abb. 13.14 führe er im pV-Diagramm vom Punkt P1 auf einem beliebigen Weg I p zum Punkt P2 und von dort auf einem beliebigen Weg II P2 zum Punkt A zurück. II
I
N
Qi , rev
9;i 1
Ti
¦
P1
B
A
i, A
i,B
Weg I ¦ Qi , rev Weg II ¦ Qi , rev
0, (13.59)
V
Abb. 13.14: Kreisprozess im pV-Diagramm
B
Qi , rev
i, A
Ti
I¦
B
Qi , rev
i, A
Ti
II ¦
.
(13.60)
Die Summe der reduzierten Wärmen ist auf beiden Wegen gleich, unabhängig vom Weg. Sie hängt nur vom Anfangs- und Endpunkt ab und ist deswegen eine Zustandsgröße. Wir definieren nun den Wert der Zustandsgröße zwischen den Zuständen A und B als Entropiedifferenz SA - SB, B
Qi , rev
i, A
Ti
¦
: SB S A .
(13.61)
Die bisherige Darstellung hat noch einen Schönheitsfehler. Der durch N Carnot-Prozesse ersetzte Kreisprozess besitzt, wie in Abb. 13.13a angedeutet, Zacken und Ecken, die von der Anzahl N der Teilprozesse abhängt. Je größer N, desto besser die Übereinstimmung, d.h. wir müssen zum Integral übergehen. Für eine infinitesimal kleine Zustandsänderung gilt
G Qrev T
: dS B
SB S A
³
A
(13.62)
G Qrev T
Wenden wir diese Definition auf einen Kreisprozess an, so ergibt sich: Bei einem reversiblen Kreisprozess bleibt die Entropie konstant.
(13.63)
13 Phänomenologische Wärmelehre
265
Um uns eine Vorstellung zu verschaffen über die Entropieänderungen bei reversiblen Zustandsänderungen, wenden wir auf die Wärmeenergie den ersten Hauptsatz an. Es wird
GQ
dS
dU pdV . T
T
(13.64)
Für ein Mol eines idealen Gases gilt dU = Cmol,V dT. Benutzen wir weiter die allgemeine Gasgleichung, so erhalten wir für isobare Prozesse
dS
dT dV R . T V
Cmol ,V
(13.65)
Bei der Integration setzen wir voraus, dass die molare Wärmekapazität in dem betrachteten Temperaturintervall konstant ist. Die Entropie-Änderung ergibt sich zu
'S
Cmol ,V ln
T2 V R ln 2 . T1 V1
(13.66)
Ein analoger Ausdruck resultiert für isochore Prozesse. Bisher haben wir nur reversible Prozesse betrachtet. Wir wollen jetzt nach der EntropieÄnderung bei irreversiblen Prozessen fragen. In einem irreversiblen Carnot-Prozess ist die von dem betreffenden System verrichtete Arbeit bei gleichen Temperaturen der Wärmebäder stets kleiner als in einem reversiblen Prozess. Sei die zugeführte Wärmemenge Q1 in beiden Fällen die gleiche, so wird bei irreversibler Prozessführung, etwa durch die Entstehung von Wirbeln im Arbeitszylinder, mehr Wärme Q2 an das zweite Wärmebad abgegeben. Es gilt also allgemein
v³ o v³
G Qirr T
G Qirr T
v³
G Qrev T
0.
(13.67)
0.
(13.68)
Der Kreis im Integralzeichen bedeutet, dass es sich um einen geschlossenen Umlauf handelt. Wir teilen den Kreisprozess nun auf in einen von A nach B irreversibel geführten Übergang und einen von B nach A reversibel durchlaufenen Weg.
v³
v³
G Qirr T
G Qirr T
B
³
A
G Qirr T
A
³ B
G Qrev T
( S A SB ) 0 ;
0,
(13.69)
(13.70)
266
13 Phänomenologische Wärmelehre B
³
G Qirr
A
T
SB S A
(13.71)
Die Beziehung ist von besonderer Wichtigkeit für abgeschlossene Systeme. Diese haben keinen Arbeits- und Wärmeaustausch mit der Umgebung. Es gilt also
SB S A t 0
(13.72)
Das obere Zeichen gilt für irreversible Prozesse, das untere für reversible Prozesse. In einem abgeschlossenen System nimmt die Entropie bei irreversiblen Prozessen zu bei reversiblen Prozessen bleibt sie konstant. Beispiel:
A T1
T2 < T1
L
Abb. 13.15: Beispiel eines irreversiblen Prozesses: Wärmeleitung in einem Stab
Wir betrachten die Wärmeleitung in einem Metallstab. Der Stab habe die Länge L und den Querschnitt A (Abb. 13.15). Seine beiden Enden befinden sich in Kontakt mit zwei Wärmebädern der Temperaturen T1 und T2, wobei angenommen wird, dass T1 > T2. Nach entsprechender Zeit hat sich ein stationärer Zustand eingestellt, bei dem im Stab ein Temperaturgefälle
dT / dx (T1 T2 ) /( x1 x2 ) herrscht. Pro Zeiteinheit strömt durch den Stab die Wärmemenge
'Q 't
O A
T1 T2 , x1 x2
(13.73)
wobei O das Wärmeleitvermögen des betreffenden Stabmaterials ist. Wir berechnen die Entropieänderung. Die am ersten Endpunkt (1) vom Stab aufgenommene Wärmemenge Q1 ist dem Betrage nach gleich der am anderen Endpunkt (2) abgegebenen Wärmemenge Q2. Wir lassen daher den Index weg. Die Entropieänderung wird
'S
Q Q T2 T1
Q
T1 T2 . T1 T2
Da T1 > T2 ist, hat die Entropie in der Tat zugenommen.
(13.74)
13 Phänomenologische Wärmelehre
267
13.7.6 Thermodynamische Temperaturskala In Kapitel 13.1 haben wir die Grundgröße Temperatur eingeführt. Eine saubere Definition konnte aber bisher nicht gegeben werden. Wir haben zwar verschiedene Methoden zur Temperaturmessung diskutiert, wobei wir das Gasthermometer als besonders genau kennen gelernt haben. Aber dieses setzt voraus, das sich das Gas als ideales Gas verhält. Diese Voraussetzung ist umso weniger gut erfüllt, je tiefer die zu messende Temperatur wird. Deswegen ist es zweckmäßig, die Temperatur unabhängig vom Arbeitsstoff zu definieren. Eine solche Möglichkeit bietet der zweite Hauptsatz in Gestalt einer reversibel arbeitenden CarnotMaschine. Bedeuten wie oben Qrev,1 und Qrev,2 die bei den Temperaturen T1 bzw. T2 entnommenen bzw. abgegebenen Wärmemengen, so gilt
T1 T2
Qrev ,1 Qrev ,2
.
(13.75)
Wird eine der beiden Temperaturen, z.B. T1, durch irgendeine Messvorschrift festgelegt, und werden die entnommenen und abgegebenen Wärmemengen gemessen, so ist dadurch die Temperatur T2 definiert. Die so gewonnene Temperaturskala wird als thermodynamische Temperaturskala bezeichnet.
13.7.7 Ableitung der Maxwell-Geraden Bei der Einführung der van der Waalsschen Zustandsgleichung wurde die gasförmige und die flüssige Phase im pV-Diagramm durch eine horizontale Gerade verbunden, die dadurch bestimmt war, dass die Flächen oberhalb und unterhalb von ihr gleich waren. Dies können wir jetzt mit Hilfe des ersten und zweiten Hauptsatzes beweisen. Wir betrachten dazu einen isothermen Kreisprozess, der aus folgenden Schritten besteht (Abb. 13.16): 1. Verflüssigung auf dem Weg A B C; 2. Rückkehr in den gasförmigen Zustand auf dem Weg C E B D A. Nach dem ersten Hauptsatz gilt
¦ (Q W ) i
i
0,
D
p C
B
A
(13.19)
9,i
und nach dem zweiten Hauptsatz
Qi ¦ 9 , i Ti
E V
0
Abb. 13.16: Zur Berechnung der Maxwell-Geraden
268
13 Phänomenologische Wärmelehre
Da TI = const, folgt
¦Q
i
9,i
0 o ¦Wi
0.
(13.76)
9,i
Also erhalten wir
WCEB
WADB , d.h. Fläche ADB = Fläche BEC.
Vorstehende Ableitung setzt voraus, dass der Kurvenzug von A über D und E nach C stetig durchlaufen wird. Auf diesem Weg treten jedoch Instabilitäten auf, so dass der Beweis nicht ganz korrekt ist.
13.7.8 Der Joule-Thomson-Versuch Der Joule-Thomson-Versuch bringt eine erhebliche Steigerung der Genauigkeit des GayLussac-Versuches. Er bildet zudem die Grundlage für die Verflüssigung von (realen) Gasen.
Drosselstelle K2
K1
P1, V1
P2, V2
Abb. 13.17: Joule-Thomson-Effekt: Adiabatische Expansion durch ein Drosselventil ohne äußere Arbeitsleistung
Wärmeisolation Die Anordnung besteht aus einem Wärme- isolierten Zylinder, der in der Mitte mit einem Drosselventil ausgestattet ist (Abb. 13.17). Die Druckverhältnisse sind durch zwei bewegliche Kolben K1 und K2 symbolisiert. Ein Gas werde unter konstantem Druck p1 durch das Drosselventil gedrückt; nach der Drosselung besitze das Gas den kleineren Druck p2. Auf Grund der thermischen Isolierung verläuft der Prozess adiabatisch, G Q 0 . Die gesamte vom Gas geleistete Arbeit ist
W
p2V2 p1V1 .
(13.77)
Damit gilt nach dem ersten Hauptsatz
H
U 2 p2V2
U1 p1V1 .
(13.78)
13 Phänomenologische Wärmelehre
269
Für ideale Gase wird
Cmol ,V T1 p1V1
T1 ( R Cmol ,V )
Cmol ,V T2 p2V2
T2 ( R Cmol ,V )
T1 T2
(13.79)
Dieser Sachverhalt impliziert, wie beim Gay-Lussac-Versuch, dass die innere Energie unabhängig vom Volumen. Benutzen wir statt eines idealen Gases ein reales Gas, so erwarten wir, dass wegen der anziehenden Kraft zwischen den Molekülen die innere Energie vom Volumen abhängt. Damit verknüpft ist eine Temperaturänderung, die wir zum Abschluss dieses Kapitels noch berechnen wollen. Die innere Energie eines reales Gases besteht aus zwei Termen; zu der uns vom idealen Gas bekannten kinetischen Energie kommt noch ein Beitrag hinzu, der vom Binnendruck p = -a/V herrührt, also potentielle Energie darstellt. Die Enthalpie wird
H
Cmol ,V T
a § RT a · ¨ 2 ¸V V ©V b V ¹
const.
(13.80)
Der Klammer-Ausdruck stellt den aus der van der Waalsschen Zustandsgleichung berechneten Druck p dar. Die Enthalpieänderung als Funktion der Änderung der Zustandsgrößen T und V ergibt sich zu
'H
0 Cmol ,V 'T
2a RV RTV RT 'V 'T 'V 'V . 2 2 V V b (V b) V b
(13.81)
Zusammenfassung der zu 'T und 'V gehörigen Terme führt zu
§ 2a RV · RbT · § ¸ 'V ¨ Cmol ,V ¸ 'T ¨ 2 V b¹ (V b) 2 ¹ © ©V
0.
(13.82)
woraus für die Temperaturänderung folgt
'T
§ RbT 2a · 2¸ ¨ 2 © (V b) V ¹ 'V . RV · § ¨ Cmol ,V ¸ V b¹ ©
(13.83)
270
13 Phänomenologische Wärmelehre
Unter der (sinnvollen) Annahme, dass b << V sowie Cmol,p | Cmol,V + R, ergibt sich näherungsweise
'T |
'V ( RTb 2a ) . V Cmol , p
(13.84)
2
Durch Anwendung der allgemeinen Gasgleichung lässt sich dieser Ausdruck als Funktion der Druckdifferenz schreiben:
'T |
b
2a RT 'p .
(13.85)
Cmol , p
Die Ausdrücke lassen erkennen, dass es durch den Joule-Thomson-Prozess zu einer Abkühlung, aber auch zu einer Erwärmung eines realen Gases kommen kann, je nachdem welcher Term in Gl. (13.84) bzw. in (13.85) überwiegt: Erwärmung tritt ein, wenn RTb >2a, Abkühlung, wenn RTb < 2a ist. In Tab. 13.4 ist die Temperaturänderung für eine Druckdifferenz von 1 MPa für einige Gase aufgelistet. Es ist ersichtlich, dass Helium und Wasserstoff bei 0 °C oder darüber nicht verflüssigt werden können. Sie müssen zunächst vorgekühlt werden, Wasserstoff bis zu 193 K und Helium sogar bis zu 38 K.
Stoff
ǻT (°C)
Argon Helium Kohlendioxid Stickstoff Wasserstoff
-4,29 +0,61 -12,37 -2,64 +2,47
13.8
Tab. 13.4: Temperaturänderung beim Joule-Thomson Effekt für eine Druckerniedrigung von 1 MPa und Ausgangstemperatur von 0 °C
Thermodynamische Potentiale
Für reversible Zustandsänderungen in geschlossenen Systemen hatten wir mit (13.64) für die innere Energie U den Ausdruck abgeleitet
dU
TdS pdV .
Die Erweiterung auf ein offenes System lautet nach (13.18)
dU
D
TdS pdV ¦ Pi dN i . i 1
(13.86)
13 Phänomenologische Wärmelehre
271
Diese Beziehung trägt den Namen Gibbssche Fundamentalgleichung (Gibbs, J. W. 18391903) oder thermodynamische Grundgleichung. Aus ihr lassen sich andere Fundamentalgleichungen ableiten. U ist ein totales Differential, so dass die innere Energie auch als die Erzeugende der abhängigen Variablen dienen kann. Dies führt zu den Beziehungen
T
§ wU · ¨ ¸ ; © wS ¹V , N
§ wU · p ¨ ¸ ; © wV ¹ S , N
Pi
§ wU · . ¨ ¸ © wN i ¹ S ,V , N j , j zì
(13.87)
Die dritte Größe heißt chemisches Potential. Bildung der zweiten Ableitungen ergibt experimentell zugängliche Größen, nämlich die Wärmekapazität bei konstantem Volumen
T
§ w 2U · ¨ 2¸ © wS ¹V , N
§ wT · ¨ ¸ © wS ¹V , N
T ; CV
1
o CV
§ w 2U · T¨ 2 ¸ . © wS ¹V , N
(13.88)
und die adiabatische Kompressibilität:
§ w 2U · ¨ 2¸ © wV ¹ S , N
§ wp · ¨ ¸ © wV ¹ S , N
1 VNS
,
1
NS
1 § w 2U · ¨ ¸ . V © wV 2 ¹ S ,V
(13.89)
Aus den Integrabilitätsbedingungen, also den gemischten zweiten Ableitungen, ergeben sich weitere Relationen:
§ wT · ¨ ¸ © wV ¹ S , N
§ wp · ¨ ¸ ; © wS ¹V , N
§ wT ¨¨ © wN j
· ¸¸ ¹V , S , Ni ,iz j
§ wP j · ¨ ¸ . © wS ¹V , N
(13.90)
Diese Beziehungen heißen Maxwell-Relationen. Wir entnehmen den Gln. (13.87-13.89), dass das Gleichgewichtsverhalten eines Systems festgelegt ist, sobald die innere Energie U U ( S , V , N ) bekannt ist. Eine solche Größe heißt thermodynamisches Potential. Die zugehörigen Zustandsgrößen werden als natürliche Variablen bezeichnet. Mit der Benutzung der inneren Energie ist der Nachteil verbunden, dass die natürlichen Variablen z.T. schlecht messbare Größen darstellen. Das gilt z.B. für die Entropie. In anderen
272
13 Phänomenologische Wärmelehre
Fällen erfordert ein Experiment bestimmte Variablen, etwa bei chemischen Reaktionen. Als Beispiel wollen wir hier in der inneren Energie die Entropie S durch die Temperatur T ersetzen. Die damit durch (T,V,N) festgelegte Zustandsfunktion heißt freie Energie F. Der Übergang lässt sich mit Hilfe einer Legendre-Transformation bewerkstelligen. Es sei Y(x1,x2,x3) eine Funktion der unabhängigen Variablen x1,x2,x3. Ihr Differential ist
wY wY wY dx1 dx2 dx3 . wx1 wx2 wx3
dY
(13.91a)
Wir schreiben dies als
dY
c1dx1 c2 dx2 c3 dx3 .
(13.91b)
Die partiellen Ableitungen in (13.91a) entsprechen den Beziehungen (13.90). Ersetzung des Variablensatzes (S,V,N) durch den Satz (T,V,N), bedeutet, in Y(x1,x2,x3) die Variable x1 durch die partielle Ableitung c1 wY / wx1 zu ersetzen. Zu diesem Zweck setzen wir
c1dx1
d (c1 x1 ) x1dc1 .
(13.92)
Setzen wir dies in (13.91b) ein, so ergibt sich
d (Y c1 x1 ) x1dc1 c2 dx2 c3 dx3 .
(13.93)
Wir erhalten so das Differential einer neuen Funktion
Z
Z (c1 , x2 , x3 ) Y c1 x1 .
(13.93a)
In unserem Fall ist
Y
U ( S ,V , N ) ,
(13.94)
so dass
Z (T ,V , N ) U TS .
(13.93b)
Die so gewonnene Zustandsgröße heißt freie Energie und wird mit F(T,V,N) bezeichnet. Aus (13.93b) folgt
dF
dU TdS SdT .
Auch diese Beziehung trägt den Namen Fundamentalgleichung.
(13.95)
13 Phänomenologische Wärmelehre
273
Nach dem ersten Hauptsatz ist
dU
G Q GW ,
(13.96)
nach dem zweiten Hauptsatz gilt
G Q d TdS ,
(13.62)
je nachdem, ob es sich um einen irreversiblen oder reversiblen Prozess handelt. Einsetzen von (13.18) in (13.96) unter Berücksichtigung von (13.62) ergibt
dF d SdT pdV
(13.97)
Für einen isothermen Prozess wird daraus
dF d G W
bzw.
dW d dF
(13.98)
Die erste Ungleichung besagt, dass bei irreversibler isothermer Prozessführung die Änderung der freien Energie eines Systems kleiner ist als die ihm von außen zugeführte Arbeit; nur wenn der Prozess reversibel erfolgt, stimmt sie mit der zugeführten Arbeit überein. Die zweite Beziehung bedeutet, dass bei irreversiblen Prozessen die vom System geleistete Arbeit immer kleiner als die Abnahme seiner freien Energie ist; nur bei reversiblen Prozessen ist sie mit der Abnahme der freien Energie identisch. Bleibt auch das Volumen konstant, so folgt Eine isotherm-isochore Reaktion (T = const, V = const), läuft solange ab, bis das Minimum der freien Energie erreicht ist. Es erhebt sich die Frage, was aus der Differenz aus innerer Energie und freier Energie, der sog. gebundenen Energie, wird.
U F
TS .
dU dF
TdS t G Q ;
d (U F ) t G Q
(13.99a) (13.99b) (13.99c)
Bei reversiblen isothermen Prozessen wird die gebundene Energie in Wärme umgewandelt. Eine besonders für chemische Reaktionen wichtige Zustandsgröße ist die freie Enthalpie oder Gibbssches Potential; diese Größe ist definiert ist als
G : U TS pV ,
(13.100a)
274
13 Phänomenologische Wärmelehre
dG
dU TdS SdT pdV Vdp .
(13.100b)
Unter Benutzung des ersten Hauptsatzes,
dU d TdS pdV , folgt für dG
dG d SdT Vdp .
(13.100c)
Ein isotherm-isobarer Prozess (T = const, p = const) läuft so lange ab, bis sich das Minimum der freien Enthalpie eingestellt hat. In (13.101) sind die thermodynamischen Potentiale für beliebige Systeme zusammengestellt. U ( S ,V , N )
Innere Energie;
H ( S , p, N ) U pV
Enthalpie;
F (T , V , N ) U TS G (T , p, N ) F pV
Freie Energie; Freie Enthalpie
(13.101)
Wie schon dargelegt, handelt es sich dabei um extensive Zustandsgrößen. Aus der Extensivität von G folgt durch Differentiation nach O, wenn i Gassorten vorliegen
G (T , p, O N )
O G (T , p, N )
d G (T , p, O N ) G (T , p, N ) dO
N
( N1 , N 2 ,..., N i ,...N k ) .
(13.102)
Das beliebige O setzen wir gleich eins:
° k § wG · °½ G (T , p, N ) ®¦ ¨ Ni ¾ ; ¸ °¯ i 1 © w (O N i ) ¹T , p , Nr zi °¿O 1
(13.103)
k
G (T , p, N )
¦P N i
i
.
(13.104)
i 1
Dieser Zusammenhang heißt Gibbs-Duhem-Relation (P.M. Duhem, 1861-1916). Für eine Gassorte i wird sie besonders einfach:
G (T , p, N i )
P Ni
13 Phänomenologische Wärmelehre
275
Die Enthalpie wurde bereits in Kap. 13.5.2 eingeführt. Sie spielt eine wichtige Rolle bei der Verflüssigung von Gasen, die weiter unten behandelt wird. Die totalen Differentiale der Zustandsgrößen H, F und G sind
dU TdS pdV P dN dH TdS Vdp P dN dF SdT pdV P dN dG SdT Vdp P dN
(13.105)
Mit (13.72) können wir auch irreversible Prozesse miteinbeziehen. Mit der Vereinbarung D
¦P G N i
i
{ PG N
und
G N o dN
i 1
ergibt sich
dU d TdS pdV P dN , dH d TdS Vdp P dN , dF d SdT pdV P dN , dG d SdT Vdp P dN .
(13.106)
Das Gleichheitszeichen gilt für reversible, das (<)-Zeichen für irreversible Prozesse. Aus den Gleichungen lassen sich Gleichgewichtsbedingungen ableiten. Betrachten wir zum Beispiel ein abgeschlossenes, isoliertes System. Es gilt
G Q 0; dU
0; dV
0; dN
0.
Dann erhalten wir mit (13.105a) und (13.106a) dS t 0 und im Gleichgewicht dS
0
(13.107)
Solange noch irreversible Prozesse ablaufen, nimmt die Entropie zu. Im Gleichgewicht nimmt sie den Maximalwert an. Durch partielle Differentiation von (13.105) ergeben sich insgesamt acht Beziehungen.
276
13 Phänomenologische Wärmelehre
Für reversible Prozesse lauten sie:
§ wU ( S ,V ) · ¨ ¸ © wV ¹S § wH ( S , p ) · ¨ ¸ wp © ¹S § wF (T ,V ) · ¨ ¸ © wV ¹T § wG (T , p ) · ¨ ¸ © wp ¹T
§ wU ( S ,V ) · p; ¨ ¸ wS © ¹V
T;
V;
§ wH ( S , p ) · ¨ ¸ © wS ¹p
T;
p;
§ wF (T ,V ) · ¨ ¸ © wT ¹V
S ;
V;
§ wG (T , p ) · ¨ ¸ © wT ¹p
S.
(13.108)
13.9 Der dritte Hauptsatz Die Entropie ist entsprechend (13.63) nur bis auf eine Konstante definiert. Das reicht für die meisten Anwendungen aus, da häufig nur Entropiedifferenzen interessieren. Aber es gibt auch Fälle, in denen der Absolutwert benötigt wird. W. Nernst (1864-1941) formulierte daher ein Theorem, in dem er die Entropie am absoluten Nullpunkt festlegte. Es wird auch als dritter Hauptsatz bezeichnet. Um Nernsts Überlegungen zu erläutern, gehen wir von der freien Energie F aus. Wir beschränken uns wieder auf konstante Teilchenzahl.
F U TS . dF
SdT pdV
(T
const ) .
(13.105)
Betrachten wir einen bei konstantem Volumen ablaufenden Prozess, so wird
§ wF · ¨ ¸ © wT ¹V
S .
(13.109)
Damit können wir die freie Energie schreiben als
§ wF · F U T ¨ ¸ . © wT ¹V
(13.110)
Wir wollen nun einen isothermen Prozess (chemische Reaktion) ins Auge fassen. Das System habe im Anfangszustand die freie Energie F1 und im Endzustand die freie Energie F2.
13 Phänomenologische Wärmelehre
277
Für die Änderung 'F gilt dann
'F
§ w · ('F ) ¸ . 'U T ¨ T w © ¹V
(13.111)
Bei Temperaturen T > 0 sind die Änderungen 'F und 'U unterschiedlich, wie wir bereits oben gesehen haben. Nernst stellte nun fest, dass mit abnehmender Temperatur die Änderung der freien Energie bei chemischen Reaktionen immer weniger von der Temperatur abhängt. Denken wir uns die Kurven 'F (T ) und 'U (T ) graphisch aufgetragen (Abb. 13.18), so
DU DF
D U (0) = D F(0)
DU
Steigung D CV
TD S0 DF
Steigung - D S V
Abb. 13.18: Zur Herleitung des dritten Hauptsatzes
T nähern sie sich für T o 0 immer mehr einander an, wobei ihre Steigung gegen null tendiert. Nernst folgerte daher ganz allgemein
§ w · lim ¨ ('F ) ¸ 0, T o 0 wT © ¹
§ w · lim ¨ ( 'U ) ¸ 0. T o 0 wT © ¹
(13.112)
Da nach (13.96)
w ('F ) 'S wT
(13.113)
gilt, ist im Grenzfall T o 0 die Entropieänderung gleich null.
lim 'S (T , z ) 0 . T o0
(13.114)
Die Größe „z“ steht stellvertretend für weitere Zustandsvariabeln. (13.114) bedeutet zunächst, dass bei hinreichender Absenkung der Temperatur Reaktionen in reinen kondensierten Stoffen
278
13 Phänomenologische Wärmelehre
reversibel verlaufen (vgl. (13.72)). Dies entspricht der Erfahrung; die Entropie hängt weder von der Kristallmodifikation noch von der Stoffart ab, vorausgesetzt es handelt sich um reine Stoffe. Deswegen kam Nernst zu dem Schluss, dass die Entropie aller reinen Stoffe für T o 0 dem gleichen Grenzwert zustrebt. Dieser Grenzwert wurde von M. Planck (1858-1947) zu null festgelegt.
lim S (T , z )
0
T o0
(13.115)
Dies ist in Übereinstimmung mit der quantentheoretischen Behandlung des Problems. Der dritte Hauptsatz ist daher als Axiom entbehrlich. Wir besprechen zunächst die Konsequenzen für die Wärmekapazitäten
CV
§ GQ · ¨ ¸ © G T ¹V , N
§ wS · und C p T¨ ¸ © wT ¹V , N
§GQ · ¨ ¸ © G T ¹ p, N
§ wS · T¨ ¸ © wT ¹ p , N
.
(13.116)
Lösen wir die Gleichungen nach S auf, so ergibt sich im ersten Fall T
S (T ,V , N )
CV (T ,V , N ) dT . T 0
S0 (V , N ) ³
(13.117)
Nach dem 3. Hauptsatz ist S0 (V , N ) 0 . Bliebe nun für T o 0 CV endlich oder divergierte, so würde S (T , V , N ) mit T o 0 divergieren, im Widerspruch zum 3. Hauptsatz. Analog lässt sich für Cp argumentieren. Also erhalten wir als Ergebnis
lim CV T o0
0 und lim C p T o0
0.
(13.118)
Auch der thermische Ausdehnungskoeffizient
D
1 § wV · ¨ ¸ V © wT ¹ p ,T
(13.119)
verschwindet. Aus der Fundamentalrelation für die freie Enthalpie G folgt
§ wV · ¨ ¸ © wT ¹ p , N und damit
§ wS · ¨ ¸ © wp ¹T , N
(13.120)
13 Phänomenologische Wärmelehre
D
279
1 § wS · ¨ ¸ . V © wp ¹T , N
(13.121)
(13.115) soll für alle Zustandsvariablen gelten. Damit verschwindet auch (wS / wp )T , N (und sämtliche partiellen Ableitungen von S nach z mit T o 0 ), so dass sich ergibt
lim D
0.
T o0
(13.122)
Ebenfalls verschwindet im Grenzfall T o 0 die Differenz der Wärmekapazitäten. Zunächst folgt analog mittels der Fundamentalrelation der freien Energie,
§ wp · lim ¨ ¸ T o0 wT © ¹V , N § wp · lim ¨ ¸ T o 0 wT © ¹V , N
§ wS · lim ¨ ¸ T o0 wV © ¹T , N § wS · lim ¨ ¸ © wV ¹T , N
T o0
0
0.
(13.123)
(13.124)
Für die Differenz der Wärmekapazitäten gilt die Beziehung (s. unten)
§ wp · ¸ . © wT ¹V , N
(13.125)
° § wp · ½° § C p CV · lim ¨ V lim ®D ¨ ¸ ¸ ¾ 0. T o0 T o0 °¯ © wT ¹V , N °¿ © T ¹
(13.126)
C p CV
D TV ¨
Folglich
Der Ausdruck (13.125) ergibt sich aus der Definition der Wärmekapazitäten wie folgt.
Cp
§ GQ · ¨ ¸ © dT ¹ p , N
und CV
§ GQ · ¨ ¸ . © dT ¹V , N
(13.127)
Mit G Q TdS wird die Differenz
C p CV
°§ wS · § wS · ½° T ®¨ ¸ ¨ ¸ ¾. °¯© wT ¹ p , N © wT ¹V , N °¿
(13.128)
280
13 Phänomenologische Wärmelehre
Schreiben wir
S
S (V , T )
S ^T ,V (T , p )` ,
(13.129)
und bilden damit (wS / wT ) , so erhalten wir
§ wS · ¨ ¸ © wT ¹ p , N
§ wS · § wS · § wV · ¨ ¸ ¨ ¸ ¨ ¸ . © wT ¹V , N © wV ¹T , N © wT ¹ p , N
(13.130)
Diese Beziehung setzen wir in (13.128) unter Berücksichtigung von D gemäß (13.119) ein:
C p CV
§ wS · § wV · T¨ ¸ ¨ ¸ © wV ¹T , N © wT ¹ p , N
§ wp · ¸ © wT ¹V , N
D TV ¨
(13.131)
Das letzte Gleichheitszeichen folgt mittels (13.125). Eine weitere Folge des dritten Hauptsatzes ist die Unerreichbarkeit des absoluten Nullpunktes. Wir können ihm zwar beliebig nahe kommen, ihn aber nie erreichen. Zur Erläuterung müssen wir etwas vorgreifen. Wir gehen von einer der wirkungsvollsten Methoden zur Erzielung tiefer Temperaturen aus (T < 0.3 K). Es ist dies die adiabatische Entmagnetisierung. Betrachten wir ein paramagnetisches Salz. Seine Moleküle besitzen magnetische Momente, deren Richtungen im allgemeinen regellos verteilt sind. Bringen wir eine solche Substanz in ein äußeres Magnetfeld, so werden die Elementarmagnete teilweise ausgerichtet. In diesem Zustand befindliche Magnete ziehen sich an. Isolieren wir das Salz nun thermisch von der Umwelt und schalten das äußere Magnetfeld ab, so nehmen die Elementarmagnete wieder eine regellose Lage ein. Dazu wird gegen deren Wechselwirkung Energie benötigt. Sie wird aus der thermischen Energie des paramagnetischen Salzes entnommen, dessen Temperatur infolgedessen sinkt. a)
S
b)
Sum
S Sum
Sm
Sm
0
0
T2
T1¢
T1
T
T2
Abb. 13.19a,b: Zur Unerreichbarkeit des absoluten Nullpunktes
T1 T
13 Phänomenologische Wärmelehre
281
Wir kehren nun zur anfänglichen Behauptung der Unerreichbarkeit des absoluten Nullpunkts zurück. In Abb. 13.19a und b ist jeweils die Entropie des Salzes gegen die Temperatur aufgetragen. Wie gleich gezeigt wird, ist die Entropie im geordneten Zustand kleiner (im äußeren magnetischen Feld) als im ungeordneten Zustand. Folglich liegt die Entropie-Kurve des unmagnetisierten Salzes bei T z 0 über der des magnetisierten Salzes. Nehmen wir an, dass S(T) einen Verlauf hätte, wie er, im Widerspruch zum dritten Hauptsatz, in Abb. 13.19a skizziert ist. Nun entmagnetisieren wir bei der Temperatur T1 reversibel adiabatisch, wodurch wir in einem Schritt den absoluten Nullpunkt erreichen könnten. Nach dem dritten Hauptsatz müssen aber beide Entropie-Kurven bei T = 0 den Wert S = 0 annehmen (Abb. 13.19b
13.10 Anwendung der Hauptsätze auf mehrphasige Einkomponentensysteme 13.10.1 Temperaturabhängigkeit des Gleichgewichtsdrucks 13.10.1.1 Einführung in die Theorie Beginnen wir mit einem konkreten Beispiel und betrachten eine Flüssigkeit in einem abgeschlossenen Volumen V mit der inneren Energie U, die mit ihrer Dampfphase im Gleichgewicht steht. Der Übergang zwischen den beiden Phasen ist ein Phasenübergang 1. Art. Darunter verstehen wir einen Übergang, bei dem das chemische Potential µ(T, p) stetig von einer Phase A in eine andere, B, übergeht. Die Ableitungen von µ sind dagegen nicht stetig
P A (T , p) P B (T , p) ; § wP A · § wP B · ¨ ¸ z¨ ¸ ; © wT ¹ p © wT ¹ p
§ wP A · § wP B · ¨ ¸ z¨ ¸ . © wT ¹T © wT ¹T
(13.132)
Aus der Gleichheit der chemischen Potentiale kann der Dampfdruck als Funktion der Temperatur gewonnen werden. Zur Ableitung einer solchen Abhängigkeit müssen wir aber zunächst die Eigenschaften eines Phasenübergangs 1. Ordnung kennen, also auch verstehen, wie es zu Gl. (13.132) kommt. Dazu notieren wir uns als Erstes die Entropie. Sie setzt sich additiv aus den Einzelentropien der verschiedenen Phasen (ph) zusammen. Benutzen wir wieder kleine Buchstaben für molare Größen und bedeutet Q wie bisher die Molzahl, so gilt
S
¦Q
s ;
(13.133)
ph ph
ph
Daraus erhalten wir als Gleichgewichtsbedingung
G S U ,V ,Q ¦^s ph (GQ ph )U ,V ,Q Q ph ( s ph )U ,V ,Q ` ph
0.
(13.134)
282
13 Phänomenologische Wärmelehre
Einführung von Lagrange-Multiplikatoren D, E, J ergibt unter Beachtung obiger Nebenbedingungen GU = GV = GQ = 0
¦ ^s
ph
ph
GQ ph Q phG s ph D (u phGQ ph Q phG u ph ) E (v phG v ph v phG v ph ) JG Q ph ` 0 (13.135)
Als Nächstes schreiben wir uns die Gibbssche Gleichung (13.77) für die ph-te Phase hin.
p ph P ph 1 dU ph dV ph dN ph , Tph Tph Tph
dS ph
(13.136a)
in molaren Größen
p ph P ph 1 du ph d v ph dQ ph . Tph Tph Tph
ds ph
(13.136b)
Andererseits folgt für eine Phase aus (13.135)
½° ° p ph p ph P ph ½° 1 1 du ph d v ph ¾ d Ȟ ph ® s ph u ph v ph ¾ 0 Tph Tph Tph Tph Tph °¿ °¿ °¯
(13.137)
ds ph
p ph 1 du ph d v ph ; Tph Tph
(13.138)
G s ph
p 1 G u ph ph G v ph . Tph Tph
(13.139)
°
Q ph ®ds ph °¯
Einsetzen von (13.136a) und (13.139) in (13.135) ergibt zunächst
ª °§ 1
¦ «« ®¨¨ T ph
¬ ¯°©
ph
· § p ph · P ph °½ D ¸ u ph ¨ E ¸ v ph J ¾ GQ ¸ ¨ Tph ¸ Tph °¿ ¹ © ¹
°§ 1 ½°º · § p ph · Q ph ®¨ D ¸ G u ph ¨ E ¸ G Ȟ ph ¾» ¨ ¸ ¨ Tph ¸ °¯© Tph °¿»¼ ¹ © ¹
0.
(13.140)
13 Phänomenologische Wärmelehre
283
Daraus folgen die Beziehungen
§ 1 · § p ph · P ph D ¸ u ph ¨ E ¸ v ph J ¨¨ ¸ ¨ ¸ Tph © Tph ¹ © Tph ¹
0;
§ p ph · E ¸ 0. ¨¨ ¸ © Tph ¹
§ 1 · D ¸ 0; ¨¨ ¸ © Tph ¹
(13.141a-c)
Mit den beiden letzten Gleichungen folgt aus (13.140)
P ph
J
Tph
.
(13.142)
Die Gln. (13.141b) und (13.141c) bzw. (13.142) bedeuten, dass alle Phasen des Systems die gleiche Temperatur bzw. gleichem Druck besitzen. Das chemische Potential µ ist für alle Phasen gleich. Daher können wir (13.136b) und (13.139) wie folgt schreiben:
Tph
ds ph
ds ph
dQ
du ph dQ
p ph
d v ph dQ
P ph ;
1 p du ph d v ph . Tph Tph
(13.143) (13.144)
13.10.1.2 Dampfdruckkurve Mit diesen Kenntnissen lässt sich nun unser oben angesprochenes Beispiel behandeln. Dies führt zur Clausius-Clapeyron-Gleichung. (13.132) lautet auf die flüssige und dampfförmige Phase bezogen
P fl (T , p ) Pd (T , p )
(13.145)
Aus dieser Gleichung lässt sich eine Beziehung p (T) gewinnen. Die Gibbssche Fundamentalgleichung schreibt sich bei fester Teilchenzahl
dg
sdT vdp Q d P (T , p )
(13.146)
Wir fassen nun eine Verschiebung dp, dT längs der Koexistenzlinie (der Dampfdruckkurve) ins Auge. Für diese gilt wegen (13.145)
d P fl (T , p) d Pd (T , p ) ;
284
13 Phänomenologische Wärmelehre
also wird (13.146)
s fl dT v fl dp
sd dT v d dp .
(13.147)
Daraus resultiert als Steigung der Dampfdruckkurve
dp dT
sd s fl vd v fl
.
(13.148)
Die Entropiedifferenz zwischen Gas und Flüssigkeit ist mit der molaren Verdampfungswärme / m über (13.62) verknüpft:
/m
T ( sd s fl ) ,
so dass wir erhalten
dp dT
/m . T (v d v fl )
(13.149)
Das ist die Clausius-Clapeyron-Gleichung (R. Clausius, 1822-1888; B. Clapeyron, 1799-1864). Da das Flüssigkeitsvolumen gegenüber dem Dampfvolumen vernachlässigt werden kann, vereinfacht sich (13.149) unter Benutzung der idealen Gasgleichung zu
dp dT
/m T vd
p/ m . RT 2
(13.150)
Nehmen wir weiter vereinfachend an, dass in nicht zu großen T- Bereichen die Verdampfungswärme konstant ist, so folgt durch Integration der Dampfdruck zu
/m RT
p p0 e . (13.151) Zum Schluss kommen wir noch einmal zu (13.132) zurück. Da natürlich sd z s fl und v d z v fl ist, folgen aus (13.144) auch die beiden unteren Ungleichungen. Abb. 13.20a zeigt
eine Anordnung zur Messung des Dampfdruckes, Abb. 13.20b den Druckverlauf.
13 Phänomenologische Wärmelehre
285
p
p = p 0 e - L / kT
T Abb. 13.20a: Anordnung zur Messung des Dampfdruckes einer Flüssigkeit und
Abb. 13.20b: Dampfdruck als Funktion der Temperatur
In Tab. 13.5 sind Werte für die Verdampfungswärme einiger fester Stoffe und Flüssigkeiten zusammengestellt. Der Wert für Wasser ist besonders groß; er ist Ausdruck der relativ hohen intermolekularen Kräfte. Diese müssen überwunden werden, damit sich die Moleküle aus dem Flüssigkeitsverband lösen und in die Gasphase gelangen können. Winzer nutzen diese Eigenschaft aus, um ihre oberirdischen Weinlager im Sommer durch Fluten kühl zu halten.
Stoff
Tab. 13.5: Spez. Wärme bei 20 °C und 1013,25 Pa; spez. Schmelzwärme und spez. Verdampfungswärme einiger Stoffe
Aluminium Eisen Germanium Kupfer Blei Äthylalkohol Quecksilber Wasser
cp (kJ kg-1K-1)
OS (kJ kg-1 )
OV (kJ kg-1)
0,891 0,451 0,323 0,385 0,127 2,428 0,140 4,182
396 275 410 205 52,2 ----
10900 6340 4600 4790 725 815 285 2257
Wir hätten natürlich zur Ableitung der Clausius-Clapeyron-Gleichung auch einen Kreisprozess wählen können. Er ist in Abb. 13.21 dargestellt. Eine Wärmekraftmaschine arbeitet zwischen zwei Wärmebädern mit den Temperaturen T und (T - dT). Ihr Arbeitszylinder sei z.T. mit Wasser gefüllt (Volumen Vfl), der Kolben bedecke zu Beginn die Flüssigkeitsoberfläche. Der Zylinder befinde sich im thermischen Kontakt mit dem Wärmebad der Temperatur T.
286
13 Phänomenologische Wärmelehre
Dampf T -dT
T
T
p
p -dp
T -dT
Flüssigk.
Vfl
Vd V
Abb. 13.21: Kreisprozess zur Ableitung der Clausius-Clapeyron-Gleichung 1. Schritt: Der Kolben wird angehoben, bis alles Wasser verdampft ist. Der Dampf nehme das Volumen Vg ein. Die von der Maschine verrichtete Arbeit ist
p (T )(Vg V fl ) .
(13.152)
Dazu wird dem Wärmebad die Wärmemenge / (Verdampfungswärme) entnommen. 2. Schritt: Das Gas wird vom Wärmebad entkoppelt und durch adiabatische Expansion auf die infinitesimal kleinere Temperatur (T - dT) abgekühlt. Die dabei frei werdende Wärme wird an das “Kühlbad” abgegeben. 3. Schritt: Der Zylinder wird in thermischen Kontakt mit dem Wärmebad der Temperatur (T - dT ) gebracht. Durch Hineinschieben des Kolbens wird das gesamte Gas verflüssigt. Der Druck ist
p (T dT )
p (T )
dp dT dT
p (T ) dp .
(13.153)
Die zur Verflüssigung benötigte Arbeit ist
p (T dT )(Vg V fl ) ( p(T ) dp )(Vg V fl ) .
(13.154)
Insgesamt beträgt also die von der Maschine nach außen abgegebene Arbeit
W
p (T )(Vg V fl ) ( p (T ) dp)(Vg V fl ) dp (Vg V fl ) .
(13.155)
13 Phänomenologische Wärmelehre
287
4. Schritt: Durch adiabatische Expansion wird die Flüssigkeit von der Temperatur (T - dT) auf die Temperatur T gebracht und befindet sich damit wieder im Ausgangszustand. Der Wirkungsgrad des Carnot-Prozesses ergibt sich zu
K dT T
(Vg V fl ) /
T (T dT ) T
dp
(Vg V fl ) /
dT . T
dp .
(13.156)
(13.157)
Diese Beziehung ist mit der Clausius-Clapeyron-Gleichung (13.149) identisch.
13.10.1.3 Schmelzdruckkurve und Sublimationsdruckkurve Genau so wie ein Gleichgewicht zwischen Flüssigkeit und gesättigtem Dampf besteht, existiert ein solches zwischen der Oberfläche eines festen Körpers und der flüssigen oder gasförmigen Phase. Der Druck in diesen Phasen ist gegeben durch die Schmelzdruck- bzw. die Sublimationsdruckkurve. Analog dem gerade besprochenen Fall wird der Druck als Funktion der Temperatur wieder durch die Clausius-Clapeyron-Gleichung beschrieben. Für den Schmelzvorgang lautet sie
dp dT
(/ m ) f , fl T (v fl v f )
.
(13.158)
Darin bedeuten f bzw. fl die feste bzw. die flüssige Phase. (/ m ) f , fl st die molare Schmelzwärme. Im Allgemeinen ist das Volumen der flüssigen Phase größer als das der festen Phase. Dementsprechend führt eine Erhöhung des Druckes über der flüssigen Phase zu einer Erhöhung der Schmelztemperatur. Eine Ausnahme bildet Wasser. Hier gilt Vfl < Vf , d.h. die Schmelztemperatur sinkt mit steigendem Druck (“Relegation” des Eises). Eine qualitative Bestätigung liefert bereits die bekannte Tatsache, dass Eisberge schwimmen. Folglich ist das Eisvolumen größer als das Volumen des Schmelzwassers. Die rechte Seite der ClausiusClapeyron-Gleichung ist also negativ und damit dT/dp negativ. Die Druckabhängigkeit der Schmelztemperatur lässt sich im Experiment leicht zeigen: Legen wir um einen Eisblock eine dünne Drahtschlinge und befestigen an ihr ein Gewicht (Abb. 13.22), so schmilzt das Eis dort, wo der Druck längs der Drahtschlinge erhöht ist, gefriert aber wieder, wenn der Draht weitergewandert ist und der Druck wieder seinen ursprünglichen Wert angenommen hat. Es ist zu beachten, dass die Schlinge hinreichend dünn ist, denn eine Erhöhung des Druckes um 105 Pa bewirkt nur eine geringe Schmelzpunkterniedrigung von 7,5*10-3 K.
288
13 Phänomenologische Wärmelehre
Auch das Wandern der Gletscher beruht auf der Relegation des Eises. Der hohe Druck der Eismassen auf die unteren Schichten führt dazu, dass das Eis lokal schmilzt und dadurch zu Tal zu fließt. Wie bereits erwähnt, besitzen auch feste Stoffe einen Dampfdruck. Dieser ist zwar im Allgemeinen sehr klein, Abb. 13.22: Demonstration der führt aber zu einer langsamen VerdunErniedrigung der Schmelztemstung. Einen solchen direkten Überperatur von Eis durch äußeren gang eines festen Stoffes in die GasDruck phase wird als Sublimation bezeichnet. Der Effekt lässt sich beispielsweise bei Naphtalin (Mottenpulver) beobachten, das an freier Luft langsam verdunstet. Festes Kohlendioxid, bekannt als Trockeneis, besitzt bereits bei 195,1 K (-78,5 °C) einen Sublimationsdruck von 1 bar, so dass es zügig verdunstet, ohne vorher flüssig zu werden. Den umgekehrten Übergang finden wir etwa bei der Bildung von Reif oder Schneekristallen unmittelbar aus Wasserdampf. Wir haben gesehen: Im einfachsten Fall kann ein Stoff in drei Phasen vorkommen: fest, flüssig, gasförmig. In welcher Phase er sich befindet, hängt von Druck und Temperatur ab. Das Volumen ist dann durch die Zustandsgleichung bestimmt. In Abb. 13.23 ist ein Phasendiagramm dargestellt. Kurve (1) ist die Dampfdruckkurve der Flüssigkeit, Kurve (2) die Sublimationsdruckkurve der festen Phase, und (3) gibt die Schmelzdruckkurve wider. Im Allgemeinen ist die Steigung der Phasengrenze fest-flüssig positiv. Wasser bildet eine Ausnahme, hier ist die Steigung negativ. Allen drei Kurven ist ein Punkt gemeinsam; er heißt Tripelpunkt. In ihm stehen alle drei Phasen im Gleichgewicht. Für Wasser liegt er bei p = 6.11 mbar und T = 273,16 K = 0.010° C.
p (3)
flüssig (1)
fest Tripelpunkt
gasförmig
(2) 273,16
T
Abb. 13.23: Phasendiagramm von Wasser
13 Phänomenologische Wärmelehre
289
13.11 Anwendungen der Hauptsätze auf einphasige Mehrkomponentensysteme 13.11.1 Thermodynamische Potentiale von idealen Gasen und Gasmischungen Als Anwendungsbeispiel wollen wir die Potentiale einer Mischung aus idealen Gasen berechnen. Wir werden sie weiter unten zur Ableitung des Massenwirkungsgesetzes verwenden. Da es sich bei den Potentialen um extensive Zustandsgrößen handelt, gilt die Additivität. Wir beginnen mit der inneren Energie. Zunächst gilt
N V
N Q NL ; n :
p
QL
nkT
kT
V
Q NL V
;
xi :
Qi Q
pi ; p
piV Q i LkT Q i RT ;
o
(13.159) k
V
¦V ; i
(13.160)
1
Die innere Energie ist
U
k
k
¦U ¦Q u (T ) . i
i 1
(13.161)
i i
1
Die Enthalpie einer Gassorte für ein Mol beim Druck p ist gegeben durch (13.24):
hi
ui pVi ;
und für ein Gasgemisch bei p = const
H
¦Q h ¦Q (u i i
i
i
i
pVi ) .
(13.162)
i
Wir kommen zur Entropie: Für ein ideales Gas gilt nach dem ersten und zweiten Hauptsatz
S (T ,V ,Q i )
³
G Qrev
Q i ³ CVmol
T T dV Q i CVmol ln Q i ³ R . T0 V
Si (T ,V ,Q i ) Q i CVmol ln
dT p Q i ³ dV T T
T V Q i R ln S (T0 ,V0 ,Q i ) . T0 V0
(13.163a)
(13.163b)
290
13 Phänomenologische Wärmelehre
Der letzte Term hängt von der Anzahl der Teilchen ab. Diese können wir eliminieren, wenn wir die Eigenschaft der Entropie ausnutzen, eine extensive Zustandsgröße zu sein. !
S (T , OV , OQ i ) O S (T ,V ,Q i ) .
(13.164)
Um diese Forderung zu gewährleisten, müssen wir den letzten Term in (13.163b) speziell formulieren, denn der zweite Term erfüllt die Bedingung nicht. Ausgeschrieben lautet (13.164)
Si 0 (T0 ,V0 , OQ i ) (OQ i ) CVmol ln
T OV (OQ i ) R ln T0 V0
T V O si 0 (T0 ,V0 ,Q i ) OQ i CVmol ln OQ i R ln . T0 V0
(13.165a)
oder
O Si 0 (T0 ,V0 ,Q i ) Si 0 (T0 ,V0 , OQ i ) OQ i R ln O . Wir setzen das beliebig wählbare O gleich Q 0 /Q
Si 0 (T0 ,V0 ,Q i )
(13.165b)
i
Qi Q Si 0 (T0 ,V0 ,Q 0 ) Q 0 R ln 0 . Q0 Qi
(13.166)
Einsetzen in (13.163a)
§ T V /Q Si (T ,V ,Q i ) Q i ¨ 9 CmolV ln R ln T0 V0 /Q 0 © Hierin ist 9
· ¸. ¹
(13.167)
(1/Q 0 ) S (T0 , V0 ,Q 0 ) jetzt eine Konstante.
Die natürlichen Variablen der Entropie sind U,T,Q . Die Umrechnung lässt sich leicht mit Hilfe des 1. Hauptsatzes bewerkstelligen. Für ein ideales Gas gilt entsprechend (13.20)
dU Q Cmol ,V dT
o U Q Cmol ,V T const.
(13.20)
Ersetzung von T in (13.167) durch U ergibt
§ U /Q V /Q · Si (U ,V ,Q i ) Q i ¨ 9 CmolV ln R ln ¸1 . U 0 /Q 0 V0 /Q 0 ¹ ©
(13.168)
13 Phänomenologische Wärmelehre
291
Häufig wird die Entropie als Funktion von T, p, Qi benötigt. Wir drücken daher CVmol durch Cpmol aus. Weiter benutzen wir die ideale Gasgleichung bei den Temperaturen T und T0
pV Q RT
und
p0V0 Q 0 RT0 .
Es ergibt sich
Si (T , p,Q i ) Q i C pmol ln
V /V T Q i R ln i 0 S0 (T0 , p0 ,Q i ) , T0 T / T0
(13.169)
wobei S0 = S(T0, p0, Qi).
Si (T , pi ,Q i ) Q i C p ln Hierin ist 9 c durch 9 c
p T Q i R ln i 9 c . T0 p0
(13.170)
(1/Q 0 ) S (T0 , p0 ,Q 0 ) gegeben.
Für k getrennte Gassorten wird die Gesamtentropie
S
¦ S ¦Q s (T , p,Q ) ¦Q i
i
i i
i
i
i
i
§ · pi T ¨ C pi ln R ln si (T0 , p0 ,Q i ) ¸ . (13.171) T0 p0 © ¹
Dabei ist hinsichtlich des letzten Terms zu beachten, dass der Druck für alle Einzelgase gleich sein soll. Wir wenden uns jetzt der Mischung zu, in der alle Einzelbestandteile das gleiche Volumen mit dem Partialdruck pi ausfüllen.
S Misch
k
¦Q s (T , p ) . i i
i
(13.172)
i 1
Elimination von pi mittels (13.171) resultiert in
S Misch
¦Q c
i pi
i
ln
T p Q i R ln ¦ RQ i ln xi S (T0 , p0 ,Q i ) . T0 p0 i
Die molare Entropieänderung bei der Temperatur T ergibt sich aus der Differenz von (13.169) und (13.170) zu
'si
si (T , pi ) si (T , p) R ln xi .
(13.173a)
292
13 Phänomenologische Wärmelehre
Die Gesamtentropie wächst daher um
SM S
¦Q 's i
R ¦ ln xi ! 0 .
i
i
(13.173b)
i
Dieser Betrag heißt sinngemäß Mischungsentropie. Mit der Kenntnis der Entropie lässt sich nun die freie Enthalpie GM (T,p,Qi) und daraus die freie Energie FM (T,V,Qi) berechnen. Die freie Enthalpie einer Gassorte i pro Mol ist gemäß (13.101)
gi (T , p) hi (T ) Tsi (T , p ) . Im vermischten Zustand erhalten wir mittels (13.173a)
hi (T ) Tsi (T , pi )
gi (T , p) RT ln xi .
(13.174)
Die freie Enthalpie des Gesamtsystems im unvermischten Zustand ist
G
¦ G ¦Q g (T , p) . i
i
i
(13.175)
i
i
Für die Mischung folgt
GM
M i
¦G i
¦Q P (T , p,Q ) . i
i
(13.176)
i
i
Die freie Enthalpie ändert sich demnach um
'G G M G
¦Q (P i
i
gi )
i
RT ¦Q i ln xi 0 .
(13.177)
i
Die freie Enthalpie der getrennten Gase lässt sich mittels der Gibbs-Duhem-Relation berechnen. Dazu müssen wir das chemische Potential ermitteln. Aus (13.104) folgt mit (13.18)
Q 0V T § wS · ; ¸ ( R CVmol 9 )T CVmol T ln RT ln T0 Q V0 © wQ ¹
P (T ,V ,Q ) T ¨
P (T , p) (CVmol 9 )T (CVmol R )T ln Damit ist die freie Enthalpie bestimmt.
T p /T RT ln . T0 p0 / T0
(13.178)
(13.179)
13 Phänomenologische Wärmelehre
293
Die molare freie Energie einer Gassorte i ist entsprechend (13.105)
fi (T ,V )
gi (T ,V ) pV ; gi (T ,V ) RT ;
(13.180a-c)
Pi (T ,V ) RT . Die freie Energie des Gesamtsystems aus k idealen Gasen beträgt im getrennten Zustand
F (T ,V ,Q )
¦Q
f .
(13.181)
i i
i
Hierin ist µI(T,V) durch (13.178) und fi durch (13.180c) gegeben. Für die Mischung haben wir noch die Mischungsentropie, (13.173b), zu berücksichtigen. Es ergibt sich folglich
F M (T ,V ,Q )
¦Q ^ g (T ,V ) RT (1 ln x )` . i
i
i
(13.182)
i
Damit ist auch die freie Energie bekannt.
13.11.2 Chemisches Gleichgewicht und Massenwirkungsgesetz Wir betrachten jetzt ein System aus mehreren idealen Gasen, die miteinander chemisch reagieren können und dadurch eine Verbindung eingehen. Wir haben also wieder ein abgeschlossenes mehrkomponentiges System mit nur einer Phase vor uns. Es kann sich dabei z.B. aus Stickstoff und Wasserstoff handeln, die miteinander zu Ammoniak reagieren,
N 2 3H 2 R 2 NH 3 .
(13.183)
Eine andere Reaktion ist die Bildung von Wasser aus Wasserstoff und Sauerstoff,
2 H 2 O2 R 2 H 2 O .
(13.184)
Eine solche Reaktion verläuft im Allgemeinen nicht vollständig, sondern es stellt sich ein Gleichgewicht ein, das von Temperatur und Druck abhängt. Es wird durch das Massenwirkungsgesetz geregelt, dem wir uns jetzt zuwenden wollen. Es wurde 1864-1867 von C.M. Guldberg (1836-1902) und P. Waage (1833-1900) auf Grund kinetischer Überlegungen abgeleitet. Gegeben sei ein System mit dem Gesamtvolumen V, welches Q i Mole des i-ten Gases enthalte. Eine Reaktion schreiben wir in der Form
z1 A1 z2 A2 ...zk Ak R zk 1 Ak 1 zk 2 Ak 2 zm Am ... .
(13.185)
294
13 Phänomenologische Wärmelehre
Hierin bedeuten z j die stöchiometrischen Koeffizienten der m beteiligten Gase Aj . In der ersten Reaktionsgleichung ist also A1 = N2, A2 = H2, A3 = NH3 sowie z1 1, z2 3, z3 2 . Zur Vereinfachung der Schreibweise vereinbaren wir, dass die links stehenden Koeffizienten z j der Ausgangsstoffe positiv gerechnet werden und die der Reaktionsprodukte, zk j , negativ. Deshalb setzen wir
zj
zj
für j 1,..., k ;
zj
z j für j
k 1,..., m.
(13.186)
Damit erhält die Reaktionsgleichung die Form m
¦z
j
Aj
0.
(13.187)
1
Während der Reaktion ändern sich die Molzahlen entsprechend der Reaktionsgleichung:
GQ 1 : GQ 2 :...: GQ k : GQ k 1 : GQ k 2 :...: GQ m Q 1 :Q 2 :...:Q k : Q k 1 : Q k 2 :...: Q m .
(13.188)
Damit können wir schreiben
GQ j
z j G[ ,
(13.189)
wobei die zj festliegen, so dass als einzige zu variierende Größe [ bleibt. Da bei der Reaktion neue Moleküle gebildet werden, kann sich auch die Gesamtmolzahl ändern.
GQ
¦ GQ j
j
G[ ¦ z j
z G[ .
(13.190)
j
In unserem ersten Beispiel ist z = 1 + 3 –2 = 2. Die Größe z wird als Molüberschuss bezeichnet. Zur Berechnung des chemischen Gleichgewichtes wollen wir voraussetzen, dass die Reaktion bei konstantem Druck und konstanter Temperatur abläuft. Wir haben also von der freien Enthalpie, Gl. (13.105d), auszugehen:
dG
dH TdS SdT Vdp P dN .
(13.191)
Die Gleichgewichtsbedingung lautet ausgeschrieben, wenn die Teilchenzahl N durch die Anzahl der Mole Q ersetzt wird,
13 Phänomenologische Wärmelehre
295
k
¦ P dQ
(dG )T , p ,Q
i
i
.
(13.192)
1
k
Einsetzen von
¦ dQ
i
entsprechend (13.190) ergibt
1
k
¦P z
(dG )T , p ,Q
0.
i i
(13.193)
1
Für ein ideales Gas wird mit (13.173a) k
¦ z ^( g (T , p) RT ln x ` i
i
i
0;
(13.194a)
1
darin bedeuten gi die molare freie Enthalpie und xi den Molenbruch Q i /Q Umordnung wird k
¦ zi ln xi
1
1 RT
pi / p . Durch
k
¦ z g (T , p) { ln K (T , p) , i
i
(13.194b)
1
wobei wir den in der Mitte stehenden Ausdruck durch den Logarithmus einer Größe K gesetzt haben, die nicht vom Molenbruch xi abhängt. Damit wird k
zi i
x
K (T , p) .
(13.195)
i 1
Diese Beziehung stellt das Massenwirkungsgesetz dar, K heißt Massenwirkungskonstante. Es regelt das Gleichgewicht zwischen den Reaktionspartnern als Funktion der Temperatur und des Druckes, charakterisiert durch deren Molenbruch xi . Zur Berechnung der Temperatur- und Druckabhängigkeit gehen wir von dem Zusammenhang (13.105)
gi
hi Tsi
(13.105)
aus. Für ein ideales Gas wird
hi (T )
Cmol , pi (T T0 ) h0i ;
si (T , p ) Cmol , pi ln
T p R ln h0i Ts0i . T0 p0
(13.196)
296
13 Phänomenologische Wärmelehre
Der Index 0 steht für den Wert der betreffenden Größe bei der Bezugstemperatur T = T0. Einsetzen in (13.105) ergibt
gi (T , p) Cmol , pi (T T0 ) TCmol , pi ln
T p Cmol , pi s0i . ln T0 p0 R R
(13.197)
Tragen wir (13.197) in (13.194b) ein, so erhalten wir für die Massenwirkungskonstante K z § § p· ¨ T K (T , p ) ¨ ¸ ¨ k © p0 ¹ ¨ ( ¦ zi Cmolpi ) / R ©T 1
· ¸ ¸ exp zi li (q p0 / RT ) . ¸ ¹
(13.198)
Darin bedeuten
li
13.12
s0i Cmolpi R
; q p0
¦ z (h i
i
0i
CmolpiT0 ); z
¦z
i
.
(13.199)
i
Anwendung der Hauptsätze auf mehrphasige Mehrkomponentensysteme
13.12.1 Gibbssche Phasenregel Bezeichnen wir wieder mit p bzw. V sowie T die thermodynamischen Zustandsvariablen (häufig als thermodynamische Freiheitsgrade bezeichnet) des betrachteten Systems. Zwischen der Anzahl der Phasen q, der Anzahl der Komponenten k und der Anzahl der Zustandsvariablen f des Systems besteht ein Zusammenhang, der als Gibbssche Phasenregel bekannt ist. Sie lautet:
f
k 2q .
(13.200)
In einkomponentigen Systemen ist k = 1. Ist nur eine Phase vorhanden, so ist f = 2; Druck und Temperatur können unabhängig voneinander gewählt werden. Existieren zwei Phasen nebeneinander, so folgt f = 1. Es kann also nur der Druck oder die Temperatur frei gewählt werden, die andere Zustandsvariable liegt dann fest. Bei Koexistenz von drei Phasen, also am Tripelpunkt, liegen alle Zustandsvariablen fest. Die Phasenregel ist eine Folge der Hauptsätze der Thermodynamik und kann daher mit Hilfe der thermodynamischen Potentiale abgeleitet werden. Damit die Regel in der Form von (13.200) gilt, also auf k Komponenten angewendet werden kann, muss ein Teilchenaustausch berücksichtigt werden. Wir haben also von (13.105) auszugehen und betrachten ein isothermisobares System.
13 Phänomenologische Wärmelehre
297
Die Gleichgewichtsbedingung für die l-te Phase lautet q
¦ P dQ
dGl
li
0.
li
(13.201)
i 1
Die Erweiterung auf das Gesamtsystem ergibt k
q
¦¦ P dQ li
li
0.
(13.202)
l 1 i 1
Das ist ein System von q k Bedingungsgleichungen, die aber nicht voneinander unabhängig sind, da für jede Komponente die Gesamtteilchenzahl konstant sein muss. Es gilt also zusätzlich q
¦ dQ
li
0;
l 1, 2,..., k .
(13.203)
i 1
Die Zahl der unabhängigen Gleichungen ist daher nicht q k , sondern k (q 1) . Wie viele Variable stehen zur Erfüllung dieser Gleichungen zur Verfügung? Nach (13.86) hängt die l-te Phase, wenn k Komponenten existieren, von den Zustandsvariablen p und T sowie den Molzahlen ab. Das sind (2 + k – 1) Variable. Die Gesamtheit der Phasen wird also durch [2 + q (k – 1)] Variable beschrieben. Ist diese Anzahl kleiner als die Zahl der zu erfüllenden Gleichungen, so ist deren Lösung im Allgemeinen nicht möglich. Wir müssen daher fordern
2 q (k 1) t k (q 1) o qdk 2
(13.204)
Das kann auch geschrieben werden als
q f
k2 o
f
k 2q,
(13.205)
worin f die Zahl der Variablen (Freiheitsgrade) ist, die das k-komponentige System noch hat.
13.12.2 Osmose Gegeben sei ein Gefäß mit einer einkomponentigen, verdünnten Lösung. Die Gefäßwände mögen aus einer sog. semipermeablen Membran bestehen, durch die Lösungsmittel treten kann, nicht aber der gelöste Stoff. Der Druck kann z.B. an einem Steigrohr abgelesen werden (Pfeffersche Zelle, Abb. 13.24 (W. Pfeffer, 1845-1920)). Bringen wir das die Lösung
298
13 Phänomenologische Wärmelehre enthaltene Gefäß in ein zweites Gefäß mit reinem Lösungsmittel, so diffundiert ein Teil von diesem in die Lösung. Der hydrostatische Druck steigt bis auf einen bestimmten Betrag, der dadurch gegeben ist, dass keine Netto-Diffusion mehr stattfindet. Der Vorgang wird als Osmose bezeichnet, der Überdruck heißt osmotischer Druck der Lösung. Experimentell ergibt sich für diesen Druck S die von J. H. van’t Hoff (1852-1911) abgeleitete Beziehung
H
Lösung
S V Q RT
(13.206)
Hierin bedeutet Q die Anzahl der bei der Temperatur T im Volumen V gelösten Mole. R ist die Gaskonstante. Der Ausdruck entspricht der allgemeinen GasgleiAbb. 13.24: Demonstration chung. Der osmotische Druck ist also genau so groß wie der Osmose mit einer Pfefder Gasdruck, den die gelösten Moleküle in der Gasphase ferschen Zelle auf die Wände des Behälters ausüben würden. Die Osmose spielt in der Biologie und Medizin eine wichtige Rolle. In pflanzlichen Zellen kann der Druck bis zu mehreren Pascal betragen. Das ist u.a. der Grund dafür, dass auch fragile Pflanzen aufrecht stehen. Das Welken der Pflanzen wird durch eine zunehmende Durchlässigkeit der Zellwände für die im Zellsaft enthaltenen Stoffe hervorgerufen. Auch die in den tierischen und menschlichen Blutkörperchen gelösten Stoffe üben einen osmotischen Druck aus. So beträgt der osmotische Druck des Blutes der Säugetiere 7,5 105 Pa . Den gleichen osmotischen Druck besitzt eine 0,95 prozentige Kochsalzlösung. Eine solche kann daher ohne Nachteil für den Patienten als “physiologische Kochsalzlösung” dem Blut zugeführt werden. Dagegen presst eine konzentriertere Lösung wegen ihres höheren osmotischen Druckes die Blutkörperchen zusammen; eine verdünntere NaCl-Lösung würde die Blutkörperchen aufblähen bzw. zum Platzen bringen.
Lösungsmittel
Zur Ableitung des van’t Hoffschen Gesetzes haben wir von der freien Energie auszugehen, da Gesamtvolumen und Temperatur konstant sind.
V
VLM VL .
Hierin beziehen sich die Indizes LM bzw. L auf das Lösungsmittel bzw. die Lösung. Die Gleichgewichtsbedingung lautet
(G F )T ,V ,Q
(G FLM )T ,VLM ,Q (G FL )T ,VL ,Q ,
wobei Q die Gesamtmolzahl darstellt. Sie setzt sich additiv aus den Molzahlen des Lösungsmittels auf der linken und rechten Seite der Kammer sowie der Molzahl Qgel des gelösten Stoffes zusammen.
13 Phänomenologische Wärmelehre
299
Es gilt also
Q ( LM ) Q ( LM ) r
const.; Q gel
l
const.
Folglich gilt
GQ ( LM ) GQ ( LM ) r
0; GQ gel
l
0.
Entsprechend (13,105) ist
SG T pG V ¦ PiGQ i ,
GF
i
so dass sich ergibt
P( LM ) GQ LM r P( LM ) GQ LM l P gel GQ gel r
l
( P( LM )r P( LM )l )GQ LM r
0.
Daraus folgt für die chemischen Potentiale selbst
P( LM ) (T ,Vr ,Q LM ,Q gel ) P( LM ) (T ,Vl ,Q LM ) . r
l
r
l
(13.207)
Um die Druckabhängigkeit zu erhalten, drücken wir die Volumina durch die zugehörigen Drucke aus:
Vr
Vr (T , pr ,Q LM ,Q gel ); Vl
Vl (T , pl ,Q LM ) .
r
l
Damit schreibt sich (13.207)
P( LM ) (T , pr ,Q LM ,Q gel ) P( LM ) (T , pl ,Q LM ) . r
r
l
l
(13.207a)
13.12.3 Dampfdruckerniedrigung Lösen wir etwa Kochsalz (NaCl) in Wasser, so beobachten wir eine Dampfdruckerniedrigung über der Lösung verglichen mit dem Dampfdruck des reinen Lösungsmittels. Das liegt daran, dass die Anziehungskraft zwischen den Salzionen und den Lösungsmittelmolekülen größer ist als zwischen Letzteren alleine. Um ein Molekül aus der flüssigen in die dampfförmige Phase zu überführen, muss also mehr Energie aufgewandt werden als aus dem reinen Lösungsmittel. Daher sinkt der Dampfdruck über der Lösung. Die Abnahme ist proportional zur Konzentration des gelösten Stoffes. Dies wurde zuerst von F. M. Raoult (1830-1901) experimentell abgeleitet, und zwar gilt das nach ihm benannte erste Raoultsche Gesetz
300
13 Phänomenologische Wärmelehre
'p p0
Q gel Q gel Q LM
(13.208)
Hierin sind Q gel bzw. Q LM die Anzahl der Mole des gelösten Stoffes bzw. des Lösungsmittels. Es wird dabei vorausgesetzt, dass der Dampfdruck des gelösten Stoffes gegenüber Abb. 13.25: Kreisprozess dem Dampfdruck des Lözur Herleitung des ersten sungsmittels, p0, vernachläsRaoultschen Gesetzes sigt werden kann. Zur Ableitung der Beziehung gibt es wieder zwei Hahn Wege: Entweder überlegen wir uns einen künstlichen Kreisprozess oder wir benutzen die thermodynamischen Dh Potentiale. Im ersten Fall betrachten wir zwei KamL LM mern (Abb. 13.25), die in der Semipermeable Wand Abbildung unten durch eine semipermeable Wand miteinander in Verbindung stehen. Am oberen Ende der Kammern befindet sich ein Hahn, der zu einem Zylinder mit beweglichem Kolben führt. Die linke Kammer enthalte reines Lösungsmittel, die rechte Kammer nehme die Lösung auf. Die Flüssigkeitspegel sind zunächst gleich. Als ersten Schritt lassen wir nun durch Zuführung von Wärme aus der linken Kammer 1 Mol Lösungsmittel verdampfen. Es handelt sich also um einen isothermen Prozess. Dabei entsteht die Arbeit
W
p 'V
p(VD VFl ) | RT
(13.209)
Dieser Dampf gelangt über den Hahn in den Zylinder. Nach Schließen des Hahns lassen wir in einem 2. Schritt den Dampf sich reversibel ausdehnen bzw. komprimieren, bis der Druck mit dem Dampfdruck über der Lösung übereinstimmt. Da pV = const. ist, gilt auch
p'V V 'p 0 .
(13.210)
Also wird die Arbeitsleistung
p'VD
VD 'p ;
(13.211)
' p ist die Differenz (pL – pLM) der Dampfdrucke über der Lösung und dem reinen Lösungsmittel.
13 Phänomenologische Wärmelehre
301
In einem dritten Schritt wird der Zylinder mittels des Hahns mit der rechten Kammer verbunden und der Dampf unter Aufwendung von Arbeit kondensiert. Die dabei frei werdende Wärmemenge wird abgeführt.
W
p(VD VFl ) | RT .
(13.212)
Addieren wir die einzelnen Arbeitsanteile, so verbleibt
Wges
VD 'p .
(13.213)
Diese Arbeit muss nun mit der Hubarbeit übereinstimmen, welche die Osmose zwischen Lösungsmittel und Lösung leistet, wenn wir 1 Mol des Lösungsmittels von der Oberfläche links von der semipermeablen Membran auf die Oberfläche der rechten Seite der Membran übertreten lassen. Diese osmotische Arbeit ist gleich der Hubarbeit
WHub
VFl U Fl g 'h VFl S ,
(13.214)
denn der hydrostatische Überdruck auf der Seite der Lösung entspricht dem osmotischem Druck. Gleichsetzen der beiden Arbeitsbeträge ergibt unter Beachtung von S Q RT
VD ( pL pLM ) VFl S pLM pL
VFlQ RT ,
VFlQ RT VD
(13.215a)
pLM VFlQ .
(13.215b)
Die Größe Q V f l gibt die Zahl der in einem Mol Lösungsmittel gelösten Mole an. Also lässt sich schreiben
pLM pL 'p { pLM pLM
Q gel . Q gel Q LM
Das ist aber das erste Raoultsche Gesetz, was damit bewiesen ist. Das Minuszeichen drückt aus, dass es sich um eine Druckabnahme handelt. Abb. 13.26 zeigt theoretische und experimentelle Ergebnisse miteinander verglichen. Bei kleinen Konzentrationen des gelösten Stoffes findet sich gute Übereinstimmung.
(13.216)
p
Experiment Theorie
Abb. 13.26: Dampfdruckerniedrigung nach dem ersten Raoultschen Gesetz im Vergleich zu experimentellen Ergebnissen
n gel /(n gel +n LM )
302
13 Phänomenologische Wärmelehre
13.12.4 Siedepunkterhöhung und Gefrierpunkterniedrigung In einer Lösung erhöht sich infolge der Dampfdruckerniedrigung die Siedetemperatur und die Gefriertemperatur sinkt. Die gelösten Salzionen behindern die Ausbildung einer Gitterstruktur. Aus Abb. 13.27 sind die Dampfdruckkurven als Funktion der Temperatur für eine Lösung und reines Lösungsmittel zu ersehen. Eine Flüssigkeit siedet, wenn der Sättigungsdampfdruck gleich dem Außendruck ist. Damit dies für die Lösung der Fall ist, müssen wir deren Temperatur also um 'TS gegenüber der Siedetemperatur des reinen Lösungsmittels erhöhen. Wir wollen 'TS berechnen. Dazu gehen wir von der Dampdruckkurve des reinen Lösungsmittels aus,
p p
p0 e
/ RT
.
(13.105)
Durch Differentiation nach T ergibt sich
Luftdruck
dp dT
/ p , RT 2
(13.217)
Auflösen nach dT, Benutzung des ersten Raoultschen Gesetzes und Übergang zu endlichen Größen führt zur Siedepunkterhöhung 'T (TS ) LM (TS ) L T
Abb. 13.27: Dampfdruckkurve einer Lösung im Vergleich zu der des reinen Lösungsmittels
'TS
RT 2 Q gel / Q gel Q LM
Diese Beziehung Gesetz.
heißt
zweites
(13.218)
Raoultsches
Wir wenden uns nun wieder Abb. 13.24 zu. Wir sehen, dass eine Lösung infolge des erniedrigten Dampfdruckes bei einer tieferen Temperatur gefriert bzw. schmilzt als das reine Lösungsmittel. Es ergibt sich
'TSchm
Q gel RT 2 . / Schm Q gel Q LM
(13.219)
Hierin ist ' Schm die Schmelzwärme. Siedepunkterhöhung und Gefrierpunkterniedrigung hinreichend verdünnter Lösungen sind also in guter Näherung proportional zur Konzentration der gelösten Komponente, denn in diesem Fall kann Q gel gegenüber Q LM vernachlässigt werden. Die Siedepunkterhöhung kann zur Molekulargewichtsbestimmung benutzt werden.
13 Phänomenologische Wärmelehre
303
Die Gefrierpunkterniedrigung ist größer als die Siedepunkterhöhung. Für Wasser ergibt sich
1.986 273, 22 79700
'TSchm , mol
1,860 K .
(13.220)
Für die Siedepunkterhöhung folgt
'TS , mol
1,986 373, 22 539000
0,513K .
(13.221)
Wir erkennen unschwer, dass die Differenz vor allem im Unterschied der Schmelz- und Verdampfungswärme liegt.
Zusammenfassung x Nullter Hauptsatz: Alle Systeme, die mit einem gegebenen System im thermischen Gleichgewicht stehen, befinden sich auch untereinander im thermischen Gleichgewicht. Sie haben also eine Eigenschaft gemeinsam, die wir als Temperatur bezeichnen. x Das Gay-Lussac Gesetz lautet
p
p0 (1 J tC ); J
1/ 273,15 ,
wobei p den Gasdruck und tC die Temperatur in °Celsius darstellen. x Die spezifische Molwärme ist gleich der Wärmemenge, die benötigt wird, um ein Mol eines Stoffes von 14,5 °C auf 15,5 °C zu erwärmen. x Die Zustandsgleichung für ideale Gase lautet für Q Mole
p V Q R T , wobei p, V und T Druck, Volumen und Temperatur des Gases darstellen. R ist die allgemeine Gaskonstante. x Die van-der-Waalssche Zustandsgleichung für reale Gase ist
(p
a ) (V b) Q R T , V2
wobei a und b Gas-spezifische Konstanten sind.
304
13 Phänomenologische Wärmelehre
x Erster Hauptsatz (Energieerhaltungssatz): Die Zunahme der inneren Energie dU eines Systems setzt sich zusammen aus der ihm zugeführten Wärmeenergie G Q und der an ihm geleisteten Arbeit G W .
dU
G Q GW ,
oder: U ist eine Zustandsgröße, dagegen nicht Q und W. x Die Poisson-Gleichungen lauten 1
pV N
const ,
TV N 1
const ,
Tp N
1
const .
Hierin bedeutet J das Verhältnis der spezifischen Wärme bei konstantem Druck und bei konstantem Volumen, N c p / cV . x Der Wirkungsgrad des Carnotschen Kreisprozesses ist gegeben als
K 1 T2 / T1 , wobei T1 und T2 die Temperaturen der beiden Wärmespeicher sind, aus denen Wärmeenergie entnommen bzw. in das Wärme abgeführt wird. x Der zweite Hauptsatz macht eine Aussage über die Richtung, in der Prozesse ablaufen. Eine Formulierung lautet: Es ist unmöglich, eine periodisch arbeitende Maschine zu konstruieren, die nichts anderes bewirkt als einem Körper dauernd Wärme zu entziehen und diese in Arbeit zu verwandeln. x Die Entropiezunahme eines Systems dS ist definiert als die ihm bei der Temperatur T reversibel zugeführte Wärmemenge, dS G Qrev / T . Die Entropie ist daher zunächst nur definiert bis auf eine Konstante SA. B
SB
³
A
G Qrev T
SA .
x Die thermodynamischen Potentiale eröffnen die Möglichkeit, alle Zustandsgrößen durch partielle Differentiation zu gewinnen. x Der dritte Hauptsatz macht die Aussage, dass die Entropie am absoluten Nullpunkt null wird.
13 Phänomenologische Wärmelehre x
305
Die Clausius-Clapeyron-Gleichung für die Dampfdruckkurve lautet
dT T
(Vg V fl ) /
dp .
Hierin bedeuten Vg bzw. Vfl die Volumina der gasförmigen bzw. der flüssigen Phase sowie / die Verdampfungswärme. Eine analoge Beziehung gilt für die Schmelzdruckkurve. x Bei einer Entspannung eines realen Gases mittels eines Drosselventils ändert sich dessen Temperatur. Der Prozess läuft bei konstanter Enthalpie ab. Die Temperaturänderung wird als Joule-Thomson-Effekt bezeichnet. Unterhalb einer bestimmten Inversionstemperatur lassen sich Gase verflüssigen. Es gilt näherungsweise
2a § · 'T | ¨ (b ) / Cmolp ¸ 'p . RT © ¹ Hierin sind a und b die Konstanten der van-der-Waals Gleichung. x Der osmotische Druck S einer Lösung berechnet sich aus der Beziehung
S Q RT / V . x
Die Dampfdruckerniedrigung über Lösungen ergibt sich aus dem ersten Raoultschen Gesetz:
pLM pL 'p { pLM pLM
Q gel Q gel Q LM
1.
Darin bedeuten LM das Lösungsmittel und L die Lösung. x Die Siedepunkterhöhung von Lösungen berechnet sich aus dem zweiten Raoultschen Gesetz:
'TS
RT 2 Q gel , / Q gel Q LM
wobei / die Verdampfungswärme darstellt.
x Für die Gefrierpunkterniedrigung (Schmelzpunkterniedrigung) gilt ein analoger Ausdruck, wobei / Schm die Schmelzwärme bedeutet.
'TSchm
Q gel RT 2 / Schm Q gel Q LM
306
13 Phänomenologische Wärmelehre
Übungsaufgaben 1a) Berechnen Sie den Wärmestrom durch eine 0,2 m dicke Betonmauer, deren Innenseite eine Temperatur Ti = 25 °C und deren Außenseite eine solche von Ta = 0 °C besitzt. In einem zweiten Schritt möge die Mauer mit einer 0,1 m dicken Platte aus Styropor ausgekleidet sein. b) Führen Sie die Berechnung für eine 30 m lange Fernwärmeleitung (Ti = 130 °C, Ta = 20 °C) und einer Isolationsschicht von 0,1 m Dicke durch. Verluste sollen in beiden Fällen vernachlässigt werden. 2. Berechnen Sie die van der Waals-Konstanten a und b für die Werte Pkrit = 2,1 107 Pa und Tkrit = 650 K. 3. Sie pumpen morgens bei 10 °C Ihr Schlauchboot bis zu einem Druck von 1,5 bar auf. Dazu benötigen Sie 32 Mol Luft. a) Wie groß ist das Volumen des Schlauchbootes? b) Zur Mittagszeit ist die Temperatur auf 35 °C angestiegen. Welcher Druck stellt sich im Schlauchboot ein, wenn das Volumen konstant bleibt? c) Welche Wärmemenge wurde dabei zugeführt? (cv = 20,7 J/molK) d) Das Schlauchboot Ihres Freundes hat zwei Kammern. Die eine Kammer hat einen Druck von 1,3 bar bei einem Volumen von 0,3 m3, die zweite Kammer hat einen Druck 1,5 bar und ein Volumen von 0,2 m3. An einer Schwachstelle zwischen den beiden Kammern reißt die Trennwand. Welcher Gesamtdruck stellt sich nach Druckausgleich ein, wenn die Temperatur bei diesem Vorgang konstant bleibt? 4. 1 Mol N2 wird adiabatisch von 300 K und einem Anfangsdruck von 10 atm auf 1 atm entspannt. Berechnen Sie die Endtemperatur, wenn Sie die van der Waals-Korrekturen mit berücksichtigen. Deuten Sie das Ergebnis mikroskopisch. a = 0,1416 m6 Pa/Mol2; b = 3,913 10-5 m3/Mol. 5. Ein Glaskolben von 2 l Inhalt wird bei 20 °C und einem Druck von 0,8 bar mit NO2 gefüllt und zugeschmolzen. Beim Erhitzen auf 520 °C zerfällt NO2 in NO und O2. Welchen Druck muss der Kolben aushalten? 6. Ein Kalorimeter mit einer Wärmekapazität C ist mit Wasser des Volumens Va der Temperatur Ta gefüllt. Zur Bestimmung von C geben Sie eine bestimmte Menge Wasser (V0) der Temperatur T0 hinzu und ermitteln die Endtemperatur TE. Die Messwerte sind Va 1 l Ta 20 qC Te 46 qC V0 0, 6 l T0 95 °C Sie wollen nun die spezifische Wärme eines aus Al bestehenden Körpers und eines solchen aus Cu bestimmen. Dazu messen Sie die Werte a) mAl 0,358 kg TE 24,5 qC b) mCu
0, 658 kg
TE
Welche Werte erhalten Sie?
23, 6 qC.
13 Phänomenologische Wärmelehre
307
7. Wie groß ist die totale Entropieänderung, wenn zwischen zwei Wärmespeichern mit T1 = 553 K und T2 = 278 K die Wärmemenge von 100 kJ ausgetauscht wird? 8. Die Schmelzwärme von Wasser ist
6×103 J/mol
und die Verdampfungswärme
3
40, 69 10 J/mol . Berechnen Sie die Entropieänderung von 1 Mol Wasser, das reversibel bei konstantem Druck von –16 °C auf 160° C erwärmt wird. Die Wärmekapazität von Eis ist 37, 67 J/K×mol , die von Dampf beträgt 36,1 J/kmol .
9. Berechnen Sie die Entropieänderung, die bei der Mischung von 15 g Wasser von 95 °C mit 30 g Wasser von 20 °C auftritt. 10. Der Kompressor eines Kühlschrankes liefert eine mechanische Energie von 1,2 J. Dadurch wird dem Inneren bei 3 °C Wärme entzogen und an die Küche bei 26 °C abgegeben. Setzen Sie einen Carnot-Prozess voraus. a) Wie ändert sich die Entropie im Inneren? b) Wie ändert sich die gesamte Entropie in Küche und Kühlschrank? 11. Die Ausrichtung der magnetischen Einzelmomente einer paramagnetischen Substanz folgt G G bei hinreichend hohen Temperaturen T dem Curie-Gesetz M ^C /( µT )` B . Darin bedeuten G G M die Magnetisierung und B das angelegte magnetische Feld (s. Bd. II). C ist die CurieKonstante und µ die konstante Permeabilität. Berechnen Sie die freie Energie und die freie Enthalpie einer solchen Substanz. Zeigen Sie zunächst, dass die Wärmekapazität Cm(T) nur von der Temperatur abhängt. Im Folgenden möge diese als bekannt betrachtet werden. 12. Bei welcher Temperatur gefriert Wasser mit einem Salzgehalt von 30 g NaCl/l? 13. Sie haben einen guten Freund zu sich nach Hause eingeladen. Sie bereiten zwei Tassen Kaffee und sind gerade im Begriff, Ihrem Freund etwas Milch anzubieten, als Ihr Telefon klingelt. Da Sie ein wichtiges Gespräch erwarten, heben Sie den Hörer ab. Ihr Freund wartet daraufhin mit dem Eingießen, damit der Kaffee möglichst lange heiß bleibt. War sein Vorgehen richtig? 14. Ein Haus soll durch eine Wärmepumpe mit Heizwärme versorgt werden. Wo würden Sie eine solche installieren und wie soll sie betrieben werden? Welches Wärmereservoir können Sie anzapfen? Von welcher Temperatur? Wie groß ist der Wirkungsgrad der Maschine? Rechnen Sie mit einer Heizkörpertemperatur von 60 °C. 15. Wie groß ist bei einer Temperatur von 16 °C der osmotische Druck einer Zuckerlösung, die pro Liter Wasser 12 g Zucker enthält? (mmol = 260 g/mol)
14
Kinetische Gastheorie
14.1
Temperatur
In Kap. 10.3.1 haben wir nach dem durch ein Gas hervorgerufenen Druck gefragt und dabei einen Ausdruck hergeleitet, der den Druck auf die Geschwindigkeit der Atome bzw. Moleküle zurückführt.
p
Nm v 2 3d 3
Nm v 2 3V
1 nm v 2 3
(10.38)
Die Größe d3 stellt das Gasvolumen V dar, N ist die zugehörige Anzahl der Moleküle. Mit m ist die Masse eines Atoms bzw. Moleküls gemeint. Mit Nm = mges ergibt sich
pV
2 mges v 3 2
2
2 Ekin . 3
(10.39)
Die Größe mges v 2 / 2 stellt die mittlere kinetische Translationsenergie der Teilchen dar. Mit Hilfe der allgemeinen Gasgleichung folgt, dass die Translationsenergie proportional zur absoluten Temperatur ist.
2 Ekin , mol 3
2 N Amv2 3 2
RT
(14.1a)
Hierin bedeutet NA die Anzahl der Teilchen in 1 Mol. Sie heißt Avogadro-Zahl (L. R. Avogadro, 1776-1856) Damit ist die Temperatur eines einatomigen Gases zurückgeführt auf dessen mittlere kinetische Energie. Durch Einführung der Boltzmann-Konstante wird aus (14.1a)
k: m v2 2
R NA
(1,380662 r 0,000044) 1023 J / K .
3
kT . 2
(14.2)
(14.1b)
Jedes Teilchen kann sich in drei Raumrichtungen x, y, z bewegen; wir sagen, es habe drei Freiheitsgrade der Translation. Es gilt
v2
v 2x v 2y v 2z .
310
14 Kinetische Gastheorie
Die mittlere Energie pro Freiheitsgrad beträgt daher
Ekin , Fr
1 kT 2
(14.3a)
Ein Molekül mit f Freiheitsgraden besitzt die mittlere Energie Ekin
f kT / 2 ; (14.3b)
auf jeden Freiheitsgrad entfällt also die mittlere Energie Ekin, Fr
kT / 2 .
Moleküle haben nicht nur drei Freiheitsgrade der Translation, sondern zusätzlich drei Freiheitsgrade der Rotation, da sie um drei zueinander senkrechte Achsen durch den Schwerpunkt rotieren können. Ferner besitzen sie zwei Freiheitsgrade der Schwingung, je einen für die potentielle und die kinetische Schwingungsenergie. Die Rotationsenergie pro Freiheitsgrad beträgt (vgl. Kap. 5.9)
Erot
L2 = 2l (l 1) o , l 1, 2,3.... 2I 2I
(14.4)
und die Schwingungsenergie
Evib
1 =Z (v ) , v 0,1, 2.... 2
(14.5)
l und v sind Quantenzahlen, die aus der Quantenmechanik folgen. Für uns ist zunächst nur wichtig, dass Erot die Größenordnung von kT besitzt, dagegen Evib um eine bis zwei Zehnerpotenzen darüber liegt. Die Rotationsfreiheitsgrade sind daher bei Zimmertemperatur angeregt, die Schwingungsfreiheitsgrade dagegen nicht, sie tragen nicht zur inneren Energie bei. Ein Wort muss noch zur Rotationsenergie eines zweiatomigen Moleküls gesagt werden. Bereits eine klassische Betrachtung zeigt, dass das Trägheitsmoment bezüglich der Kernverbindungsachse sehr viel kleiner ist als das Trägheitsmoment bezüglich der dazu senkrechten Achsen. Die zugehörige Rotationsenergie nimmt also sehr große Werte an und ist bei Zimmertemperatur sicher nicht angeregt. (14.3a) wird als Gleichverteilungssatz der Energie (Äquipartitionstheorem) bezeichnet. Auf die experimentelle Prüfung von (14.3b) kommen wir gleich zurück. Zunächst wollen wir (die uns schon bekannte) Poisson-Gleichung auf der Basis der kinetischen Gastheorie ableiten.
14 Kinetische Gastheorie
14.2
311
Poissongleichungen
Wir betrachten einatomige Gase. Ihre innere Energie besteht lediglich aus Translationsenergie. Nach (14.1b) gilt
U
NA
mv2 . 2
Damit wird (10.22)
2 U. 3
(14.6)
2 d ( pV ) dU . 3
(14.7)
pV
Wir denken uns nun das Gas von der Außenwelt thermisch isoliert ( G Q Arbeit leisten,
pdV
dU .
0 ) und lassen es
(14.8)
Setzen wir dies in die vorhergehende Beziehung ein, so erhalten wir
pdV
3 3 pdV Vdp . 2 2
(14.9)
Zusammenfassung und Trennung der Variablen führt zu
5 dV dp 3 V p
0,
(14.10)
5 ln V ln p const. , 3 pV N
const., N
5 . 3
(14.11)
(14.12)
Dieser Ausdruck entspricht der Poisson-Gleichung, die wir bereits früher auf der Basis der phänomenologischen Thermodynamik aus dem ersten Hauptsatz abgeleitet hatten (Kap. 13.6.4). N war dort definiert als das Verhältnis der spezifischen Wärmen bei konstantem Druck und konstantem Volumen, N c p / cV .
312
14 Kinetische Gastheorie
Der Wert für N blieb unbekannt, er musste experimentell bestimmt werden. Die kinetische Gastheorie liefert jetzt auch den Wert von N für einatomige ideale Gase. Die Übereinstimmung mit den experimentellen Werten für Edelgase ist gut (Tab. 14.1). Geringe Abweichungen sind darauf zurückzuführen, dass die Gase nicht streng ideal sind
Gas
He
Ar
H2
O2
N2
CO2
cp, mol
20,90
20,89
20,88
28,84
29,34
36,84
N
1,63
1,67
1,41
1,40
1,40
1,29
Tab. 14.1: Spezifische Molwärme [J/mol Grad] bei konstantem Druck und Adiabatenexponent einiger Gase bei 20 °C Wir können unsere Überlegungen auf Moleküle erweitern. Sei f die Zahl der Freiheitsgrade eines Gasmoleküls. Dann ist die innere Energie für ein Mol des Gases
U
NA f
kT 2
f
RT . 2
(13.13)
Wir interessieren uns für die spezifischen Wärmen cmol,p und cmol,V. Für Letztere ergibt sich
dU dT
cmol ,V
f
R . 2
(14.14)
In Kap. 13 hatten wir für die Differenz der spezifischen Wärmen gefunden
cmol , p cmol ,V
R.
(13.29)
Damit erhalten wir für die spezifische Wärme bei konstantem Druck cmol,p
cmol , p
( f 2)
R . 2
(14.15)
Mit (15.14) und (15.15) folgt für N
N
f 2 . f
(14.16)
14 Kinetische Gastheorie
313
Für ein einatomiges ideales Gas, f = 3, ergibt sich wieder N 5 / 3 , für ein zweiatomiges Gas mit Rotationsanregung finden wir N 7 / 5 usw. Ein Blick auf Tab. 14.1 zeigt uns, dass auch für zwei- und dreiatomige Moleküle Experiment und Theorie gut übereinstimmen.
14.3
Boltzmann-Verteilung
In Kap. 10.3.2 hatten wir die barometrische Höhenformel abgeleitet. Sie gibt uns Auskunft darüber, wie der Druck p mit der Höhe h über dem Erdboden abnimmt.
p
p0 e
U0 g h p0
p0 e
mges g h p0V0
p0 e
mN A g h p0V0
.
(10.42)
Betrachten wir ein Mol eines Gases. Beachtung der allgemeinen Gasgleichung im Nenner des Exponenten ergibt mit R = NAk
p
p0 e
mgh kT
.
(14.17)
Der Faktor kT trägt den Namen „Boltzmann-Faktor“ (Boltzmann, L. 1844-1906). Da bei konstanter Temperatur nach dem Boyle-Mariotteschen Gesetz der Druck proportional zur Teilchenzahldichte n(h) ist, lässt sich schreiben
n(h) n0 e
mgh kT
n0 e
E pot kT
.
(14.17a)
Die barometrische Höhenformel gibt also das Verhältnis der Teilchenzahldichten in verschiedenen Höhen an. Einen Ausdruck dieser Art finden wir häufig. Denken wir z.B. an die Dampfdruckkurve eines gesättigten Dampfes,
p
p0 e
/ RT
.
(14.18)
/ ist dabei die molare Verdampfungswärme. Führen wir stattdessen die zur Verdampfung eines einzelnen Moleküls erforderliche Verdampfungswärme O / / L in den Exponenten ein, so erhalten wir
n
n0 e
O kT
.
(14.19)
Dabei wurde wieder von der Proportionalität zwischen Druck und Anzahldichte Gebrauch gemacht. Der Ausdruck ist also formal identisch mit (14.17). In beiden Fällen steht links die Anzahldichte. Je größer diese ist, umso größer ist die Wahrscheinlichkeit, ein Molekül in einer
314
14 Kinetische Gastheorie
bestimmten Höhe bzw. im Dampf anzutreffen. Es liegt daher nahe, dass ein allgemeingültiger Zusammenhang existiert. Wir postulieren: Besitzt ein System eine Anzahl von Zuständen mit den Energien E1, E2,, …., so ist die Wahrscheinlichkeit, dass sich das System im Zustand i befindet,
Pi
gi e
Ei kT
(14.20)
gi bezeichnet das statistische Gewicht des Zustandes i. Verschiedene Zustände besitzen verschiedene statistische Gewichte, wenn ihre Wahrscheinlichkeiten bereits unabhängig von allen energetischen Betrachtungen verschieden sind. Die Beziehung trägt den Namen „Boltzmann-Verteilung“. Sie kann mit den Methoden der statistischen Mechanik abgeleitet werden.
14.4
Maxwell-Boltzmannsche Geschwindigkeitsverteilung
Der Gasdruck (Kap. 10.3.1.) ist eine Folge der unregelmäßigen Bewegung der Atome oder Moleküle. Um Zahlenwerte zu bekommen, müssen wir die Geschwindigkeitsverteilung der Teilchen kennen. Wir definieren eine Verteilungsfunktion f(v), die angibt, wie sich die Geschwindigkeiten auf die Teilchen verteilt. Für den Bruchteil der Atome oder Moleküle, G G G deren Geschwindigkeitsvektor zwischen v, v dv liegt, gilt also
G dN (v) N
G f (v) d 3 v .
(14.21)
Im Folgenden interessieren wir uns für die Beträge der Geschwindigkeiten; ihre Richtungen sollen alle gleich wahrscheinlich sein. Folglich
dN (v)
N ³ f (v) d 3 v .
(14.22)
V'
V ist gegeben durch das Volumen einer Kugelschale im Geschwindigkeitsraum, für die G v v v dv ist (Abb. 14.1). In diesem infinitesimal kleinen Bereich ist die Verteilungs-
funktion f(v) konstant. Also können wir sie vor das Integral ziehen. Es ergibt sich
dN (v)
N f (v) 4S v 2 d v .
(14.23)
f(v) genügt der Boltzmann-Verteilung,
f (v) Ce
m v2 2 kT
.
(14.24)
14 Kinetische Gastheorie
315
Einsetzen in die vorhergehende Gleichung liefert
dN (v) N
2
C 4S v e
m v2 2 kT
dv .
(14.25)
Die Konstante C lässt sich aus der Normierungsbedingung berechnen. f
1 dN (v) 1 . N ³0
(14.26)
v + dv v
Mit der Verteilungsfunktion 3
2
mv § m · 2 2 kT f (v) ¨ e dv ¸ © 2S kT ¹
3
wird (14.23)
2
mv § m · 2 2 kT 4S v ¨ e dv ¸ © 2S kT ¹
dN (v) N
vy
2
(14.27)
vx
Abb. 14.1: Zur Berechnung der Maxwell-Boltzmannschen Geschwindigkeitsverteilung
Der Ausdruck gibt die Zahl der Atome bzw. Moleküle an, die eine Geschwindigkeit zwischen, v, v + dv ohne Berücksichtigung der Richtung besitzen. Sie führt den Namen Maxwell-Boltzmannsche Geschwindigkeitsverteilung. In Abb. (14.2) ist der Bruchteil dN/N (14.27) für zwei Temperaturen dargestellt. Wegen des Faktors 4 S v2 ist sie nicht symmetrisch um einen Mittelwert v verteilt. Ihre Abhängigkeit von der Temperatur ist erheblich. Das Maximum der Verteilung liegt bei der wahrscheinlichsten Geschwindigkeit vw. Durch Differentiation und Nullsetzen der Ableitung ergibt sich
2kT . m
vw
(14.28)
Die mittlere Geschwindigkeit, definiert als f
v
³ v f (v)d v ,
(14.29)
0
erhalten wir durch partielle Integration zu
v
8kT Sm
2 vw
S
,
(14.30)
316
14 Kinetische Gastheorie
dN/N T=100 K
T=300 K v (m/s)
0
400
800
Abb. 14.2: Maxwell-Boltzmannsche Geschwindigkeitsverteilung für zwei Temperaturen
1200
und das mittlere Geschwindigkeitsquadrat wird f
v2
³v
2
f (v)d v
0
3kT m
3 2 vw 2
(14.31)
Aus letzterer Beziehung folgt unmittelbar die mittlere kinetische Energie eines Teilchens mit drei translatorischen Freiheitsgraden f
m 2 v 2
3 kT 2
1 f kT . 2
(14.32)
Das entspricht dem bereits weiter oben eingeführten Wert. Zahlenwerte von v w , v, und sind in Tab. 14.2 zusammengestellt.
Gas
vw
v
He Ne Ar Xe H2 N2 O2 Co2
1065 472 338 186 1501 402 377 320
1202 533 381 210 1694 453 425 361
v2 1304 579 414 228 1839 492 461 392
Tab. 14.2: Geschwindigkeiten einiger idealer Gase bei T = 300 K
v2
14 Kinetische Gastheorie
317
Die Maxwell-Boltzmannsche Geschwindigkeitsverteilung lässt sich durch Ausmessung der Geschwindigkeit von Molekularstrahlen überprüfen. Diese gelangen aus einem Reservoir durch ein kleines Loch in eine Kammer, die an eine Vakuumpumpe angeschlossen ist. Der Druck muss soweit erniedrigt werden, dass die Moleküle auf ihrem Weg durch die Kammer nicht mit Luftmolekülen zusammenstoßen, d.h. die mittlere freie Weglänge der Gasmoleküle muss groß sein gegenüber den Kammerdimensionen. Der Molekularstrahl gelangt nach Passieren eines Geschwindigkeitsselektors in einen Detektor, dessen Funktionsweise hier nicht diskutiert werden soll. Es gibt verschiedene Nachweismöglichkeiten. Der Selektor besteht aus einer Reihe kreisförmiger Scheiben mit je einem Schlitz, die fest auf einer drehbaren Welle angebracht sind. Zunächst wollen wir uns auf zwei Scheiben beschränken (Abb. 14.3). Der Selektor lässt nur Moleküle in einem engen Geschwindigkeitsintervall passieren. Zu diesem Zweck sind die Scheiben gegeneinander verdreht, so dass die Schlitze zueinander einen Versatz aufweisen. Beträgt dieser 's R M , so gelangen nur solche Moleküle durch beide Schlitze, deren Flugzeit t = d/v gleich ist der Zeit RM / RZ , wobei Z die Winkelgeschwindigkeit der rotierenden Scheiben bezeichnet. Die Geschwindigkeit der durchgelassenen Moleküle ist also v
Zd . M
Beträgt die Schlitzbreite b
'v
v
(14.33) R 'M , so hat das Geschwindigkeitsfenster die Größe
'M
(14.34)
M
liegen, denn 'v v (1/ M 2 )'M .
b
Abb. 14.3: Laufzeitmethode zur Bestimmung der Geschwindigkeitsverteilung in einem Molekularstrahl
MolekularR f strahl
f Df
w
d
Durch Änderung der Winkelgeschwindigkeit Z des Selektors lässt sich die Zahl der durchgelassenen Moleküle im betreffenden Geschwindigkeitsfenster messen und damit die Verteilung ermitteln. Bei der praktischen Ausführung eines Geschwindigkeitsselektors muss darauf geachtet werden, dass nicht auch Teilchen den Detektor erreichen, die nach Passieren der ersten Scheibe die zweite Scheibe bei deren nächster Umdrehung passieren; es werden also mindestens drei Scheiben benötigt.
318
14 Kinetische Gastheorie
14.5
Mittlere freie Weglänge
In einem abgeschlossenen Volumen befinden sich die Moleküle nach Maß ihrer kinetischen Energie durch Zusammenstöße mit benachbarten Molekülen in regelloser Bewegung. Die Strecke, um die sie sich zwischen zwei Zusammenstößen frei bewegen können, bezeichnen wir als mittlere freie Weglänge /. Wir wollen in unserem einfachen Modell ableiten, wie sich diese Größe zusammensetzt. Dabei machen wir die Annahme, dass die Dichte hinreichend klein ist, so dass keine Mehrfachstöße stattfinden. Wir erinnern uns an den in Kap. 4.4.1.2 eingeführten Stoßparameter b. Ein Stoß findet statt, wenn b r1 r2 , wobei r1 und r2 die Radien der Stoßpartner sind. Für das Folgende ist es einfacher, ein Teilchen I mit dem Radius r1 r2 zu postulieren. Ein anderes Teilchen wird mit diesem zusammenstoßen, wenn sein Mittelpunkt innerhalb einer Fläche, dem Stoß- oder Wirkungsquerschnitt V (s. Kap. 4.4.1.2), V S (r1 r2 ) 2 auf Teilchen I trifft. Wir betrachten nun N Teilchen in einem Volumen V A 'x . Die Wahrscheinlichkeit des Stoßes eines Teilchens pro Fläche mit den zunächst als ruhend angenommenen N/V anderen Teilchen längs der Wegstrecke 'x ist gleich
¦V N / V V 'x A N / V V 'x . A A
(14.35)
Durchfliegen N Teilchen pro Sekunde eine Schicht der Dicke 'x , so ist die Zahl ' N , die mit den N/V Teilchen zusammenstoßen,
N N / V V 'x .
'N
Als Folge dieser Stöße und der daraus resultierenden Ablenkung wird die Zahl der Teilchen im Volumen V um den Bruchteil dN / N abnehmen. Folglich gilt mit N / V n
dN N
N / V V 'x
o N ( x)
N 0 e nV x .
(14.36)
Der Exponent ist gleich der Zahl der Teilchen im Volumen V x . Nach der Definition des Stoßquerschnittes tritt ein Stoß auf, wenn nV x 1 . Die Länge x ist dann die mittlere freie Weglänge l
l
1 . nV
(14.37a)
Wird berücksichtigt, dass sich alle Teilchen bewegen, so ergibt die Rechnung für l
l
1 2 nV
.
(14.37b)
14 Kinetische Gastheorie
14.6
319
Statistische Deutung der Entropie
Im Rahmen der phänomenologischen Thermodynamik haben wir die Entropie als Zustandsgröße eingeführt. Als solche ist sie definiert als
dS
G Qrev T
,
(13.62)
wobei G Qrev die dem System reversibel zugeführte Wärmemenge ist. Bei von selbst ablaufenden, irreversiblen Prozessen hatten wir gesehen, dass die Entropie stets zunimmt. Beispiele sind die Wärmeleitung in einem Metallstab (s. oben) oder auch die Durchmischung zweier Gase oder Flüssigkeiten durch Diffusion. Auf Grund unserer Erfahrung erscheint uns gerade das letzte Beispiel plausibel. Denken wir uns etwa wasserlösliche blaue Tinte in einen Behälter mit klarem Wasser gegeben, so ist uns selbstverständlich, dass sich die Tinte nach einer gewissen Zeit gleichmäßig verteilt. Dagegen haben wir nie beobachtet, dass sich Tinte und Wasser wieder entmischen. Wir sind in Beurteilung der Situation vorsichtig und sagen, dass uns dieser Fall zumindest extrem unwahrscheinlich erscheint. In der Tat ist der Begriff der Entropie eng mit dem Begriff der Wahrscheinlichkeit eines Zustandes verknüpft. In der Wahrscheinlichkeitsrechnung wird als Wahrscheinlichkeit W der Quotient W
Zahl der günstigen Fälle Zahl der möglichen Fälle
(14.38)
bezeichnet. So ist die Wahrscheinlichkeit, bei einem Wurf einer Münze diese mit der Zahl nach oben zu finden, gleich ½, denn von den zwei möglichen Fällen, Zahl oder Bild, ist einer der günstige. Die so definierten Wahrscheinlichkeiten sind also höchstens gleich eins. Betrachten wir nun zwei noch nicht miteinander wechselwirkende Gase U und V. Sie mögen sich in zwei getrennten Kammern eines Behälters befinden. Die Wahrscheinlichkeit, ein Molekül nach Wegnahme der Trennwand in der linken Kammer zu finden, ist gleich ½. Die Wahrscheinlichkeit, zwei Moleküle der gleichen Sorte gleichzeitig in der linken Kammer anzutreffen, ergibt sich, wenn wir die vier möglichen Fälle betrachten:
r, r; r, l; l, r; l, l; nur der letzte Fall ist ein günstiger Fall. Also erhalten wir die Wahrscheinlichkeit zu
1/ 2 1/ 2 (1/ 2) 2 . Drei Moleküle einer Sorte können in acht Verteilungen auf die beiden Kammern vorkommen:
rrr rrl rlr lrr
rll lrl llr lll.
320
14 Kinetische Gastheorie
Nur die letzte zeigt die drei Moleküle alle in der linken Kammer. Mithin ist die Wahrscheinlichkeit gleich 1/ 8 (1/ 2)3 . Im allgemeinen Fall von N Molekülen haben wir demnach (1/ 2) N zu bilden. Betrachten wir 1 Mol; dann ist N N A R / k . Dieser Zustand, in dem die beiden Molekülsorten getrennt sind, ist also sehr unwahrscheinlich. In der statistischen Theorie der Wärme wird als Maß für die Wahrscheinlichkeit eines Zustandes direkt die Zahl der günstigen Fälle gewählt. Das ist gleichbedeutend mit der Zahl der Realisierungsmöglichkeiten, die für ein System existieren. Vergleichen wir den Zustand der getrennten Gase mit dem Zustand der ineinander diffundierten Gase. Wir wählen zunächst eine kleine Zahl von Molekülen, z.B. 8 für jedes Gas. Das Volumen des Systems teilen wir in 16 gleiche Zellen ein, so dass für jedes Molekül eine Zelle existiert. Die 8 Zellen der linken Kammer (vor Öffnung der Trennwand) können wir auf so viele verschiedene Arten mit den U- Teilchen besetzen wie es Vertauschungsmöglichkeiten der 8 Molekülnummern gibt. Das sind 8!. Das gleiche gilt für die V-Teilchen. Es gibt also 17220 Realisierungsmöglichkeiten für jedes der beiden Gase. Betrachten wir beide Gase zusammen, aber weiter im getrennten Zustand, so gehören zu jeder Art der Besetzung der U-Kammer alle 8! Besetzungen der V-Kammer. Insgesamt existieren also 8! 8! Besetzungsmöglichkeiten des Systems. Wir bezeichnen diese als Mikrozustände des Systems, die zu dem Makrosystem „getrennte Gase“ gehören. Analog verlaufen die Überlegungen für die durchmischten Gase. Wir haben in unserem Beispiel von 8+8 Molekülen auszugehen, die wir auf 16 Plätze verteilen können. Das sind (8+8)! Möglichkeiten. 16! ist wesentlich größer als 8! 8! , d.h. der vermischte Zustand ist erheblich wahrscheinlicher als der entmischte Zustand der beiden Gase. In einem abgeschlossenen System wird also die Diffusion von selbst ablaufen. Der umgekehrte Prozess läuft nicht freiwillig ab. Oben haben wir uns in Erinnerung gerufen, dass bei einem irreversiblen Prozess die Entropie zunimmt. Auf Grund unserer Wahrscheinlichkeitsüberlegungen sehen wir jetzt, dass die Entropiezunahme mit einer Zunahme der Zahl der Realisierungsmöglichkeiten einhergeht. Die Theorie liefert als allgemeinen quantitativen Zusammenhang
'S
k ln P
(14.39)
wobei k die Boltzmann-Konstante und P die Zahl der Realisierungsmöglichkeiten des Systems bedeuten. Wir wollen für unser Beispiel der Diffusion zweier Gase U und V die Entropiezunahme berechnen. Zu Beginn befinden sich in der linken Kammer NU Moleküle, in der rechten NV Moleküle. Druck und Temperatur in den beiden Kammern seien gleich. Die Entropie der getrennten Gase ist gleich der Summe der beiden Entropien
SU k ln( NU !) und SV k ln( NV !) , also SU SV k ln( NU ! NV !) .
(14.40)
Für die ineinander diffundierten Gase ergibt sich
SM
k ln( NU NV )!
(14.41)
14 Kinetische Gastheorie
321
Die Entropiezunahme bei der Diffusion folgt damit zu
'S
S M ( SU SV ) k ln
( NU NV )! . NU ! NV !
(14.42)
Setzen wir z.B.
NU
NV
NA / 2 ,
so schreibt sich (14.39)
'S
k ln
NA ! . § NA · § NA · ¨ ¸! ¨ ¸! © 2 ¹ © 2 ¹
(14.43)
Da NA eine sehr große Zahl ist, können wir zur Berechnung die Stirlingsche Näherungsformel für N! benutzen:
ln N ! N ln N N .
(14.44)
Durch Einsetzen folgt
'S
k ln N A 2
'S
kN A ln 2
'S
R ln 2 .
NA N ln A 2 2
(14.45a) (14.45b) (14.46)
Der gleiche Wert ergibt sich aus der phänomenologischen Thermodynamik (vgl. 13.66). Zur Berechnung der Entropiedifferenz benötigen wir einen reversiblen Prozess. Dazu stellen wir uns zwei Kammern vor, die auf der einander zugewandten Seite eine semipermeable Wand besitzen (Abb. 14.4). Die eine soll nur für die Gassorte U durchlässig sein, U die andere nur für die Gassorte V. Wir können daher die beiden Kammern ohne Arbeitsaufwand ineinander schieben. Im überlappenden Volumen beU+V finden sich dann beide Gase U und V. Um den gleichen Endzustand wie oben Abb. 14.4: Anordnung zur zu erreichen, müssen wir nach dem reversiblen Mischung zweier Zusammenschieben das Volumen noch Gase V isotherm und reversibel auf das Doppelte vergrößern.
322
14 Kinetische Gastheorie
Aus dem ersten Hauptsatz folgt (13.31)
GQ
pdV
Durch Benutzung des zweiten Hauptsatzes auf der linken Seite und der allgemeinen Gasgleichung auf der rechten Seite ergibt sich
TdS
RT
dV ; V
(14.47)
Durch Integration erhalten wir 2V1
'S
R³ V1
'S
dV , V
(14.48)
R ln 2
(14.49)
Zusammenfassung x Die mittlere Translationsenergie eines Atoms oder Moleküls beträgt
mges v 2
Ekin
2
,
sie ist proportional zur Temperatur:
2 Ekin 3
RT
x Die Boltzmannkonstante k hat den Wert
k:
R NA
1,381 102 3 J/K .
x Die mittlere kinetische Energie pro Freiheitsgrad eines Atoms oder Moleküls ist
Ekin , Fr
1 kT . 2
14 Kinetische Gastheorie
323
x Die Poisson-Gleichung in den Variabeln p und V lautet
pV N
const , wobei N :
cp
f 2 . f
cV
x Die Zahl der Atome oder Moleküle, die eine Geschwindigkeit zwischen v, und v + dv besitzen (Maxwell-Boltzmannsche Geschwindigkeitsverteilung) ist gegeben durch den Ausdruck
.
dN (v) N
3
2
mv § m · 2 2 kT 4S v ¨ dv ¸ e © 2S kT ¹ 2
x Die Entropie ist gegeben durch
S
k ln P .
P bezeichnet die Zahl der Realisierungsmöglichkeiten des Systems
Übungsaufgaben 1. Berechnen Sie die mittlere Geschwindigkeit a) eines Heliumatoms bei 2 K und bei 300 K, b) eines Stickstoffmoleküls bei 300 K, c) eines Quecksilberatoms bei 900 K. 2. In einem Glaskolben, der auf ca. 10-3 mbar evakuiert ist, befindet sich ein feines drehbares Schaufelrad mit vier einseitig berußten Glimmerplättchen als Schäufelchen („Lichtmühle“). Bei Beleuchtung dreht es sich, wobei die blanken Flächen nach vorne zeigen. Wird der Druck im Kolben weiter erniedrigt, so bleibt das Rad stehen. Dasselbe passiert bei Normaldruck. Erklären Sie die Wirkungsweise der Lichtmühle und die erwähnten Beobachtungen. 3. Ein annähernd ideales Gas ist durch einen Adiabatenkoeffizienten N = 5/3 (7/5) charakterisiert. Welche Aussagen erlauben diese Zahlenwerte? Wie groß sind die inneren Energien der Gase bei 300 K? 4. Im Jahr 1965 entdeckten A. Penzias und R. Wilson die vom Big-Bang herrührende kosmische Hintergrundstrahlung. Ihre maximale Intensität besitzt sie bei einer Wellenlänge O = 1,1 mm. Nach den noch zu behandelnden Strahlungsgesetzen entspricht das einer Temperatur von T = 3,7 K. Wie groß ist bei dieser die mittlere Geschwindigkeit von Wasserstoff- und Stickstoffmolekülen?
324
14 Kinetische Gastheorie
5. Die Dichte eines Gases aus Sauerstoffmolekülen betrage 1 Molekül/cm3 .Wie groß ist bei T = 300 K der zugehörige Druck? Welche mittlere freie Weglänge haben die Moleküle (V 45 1016 cm 2 ) ? 6. In einem Behälter (V = 5 l) befinde sich bei einer Temperatur von 300 K ein ideales zweiatomiges Gas. Wie groß ist der Druck? Das Gas werde adiabatisch auf 0,8 l komprimiert. Welche Werte nehmen Temperatur und Druck an?
III
Elektrik und Optik
15
Elektrostatik
15.1
Elektrische Ladung
15.1.1 Das Coulomb-Gesetz Wohl jeder hat schon einmal die Erfahrung gemacht, dass er nach dem Aufstehen von einem Stuhl beim Anfassen der Türklinke oder eines anderen metallischen Gegenstandes einen „elektrischen Schlag“ erhielt. Dieser rührt davon her, dass durch Herumrutschen auf der mit einem Kunststoffpolster bezogenen Sitzfläche eine Doppelschicht aus unterschiedlichen elektrischen Ladungen entstanden ist, die beim Aufstehen getrennt werden. Vorausgesetzt, die Schuhe leiten keine Ladung ab, trägt die betreffende Person eine elektrische Ladung. Auch beim Gehen über einen aus Kunststoff bestehenden Teppich kann ein solcher Effekt auftreten oder wenn wir einen Stab aus Bernstein oder Glas mit einem Tuch reiben. Derartige Erscheinungen waren schon im Altertum bekannt und erhielten im Laufe der Zeit den Namen Q Q Q -Q „Elektrizität“ (von dem griechischen Wort -Q -Q -Q Q „elektron“, das Bernstein bedeutet). Zur näheren Untersuchung knüpfen wir an die Abb. 15.1: Gleichnamige Ladungen stoßen bereits oben skizzierten Kraftwirkungen sich ab, ungleichnamige ziehen sich an zwischen Ladungen an. Zunächst betrachten wir zwei an Fäden aufgehängte Korkkugeln (Abb. 15.1). Berühren wir sie beide mit dem aufgeladenen Stab aus Bernstein, so beobachten wir, dass sie sich abstoßen. Dasselbe Ergebnis zeigt ein analoger Versuch mit einem geladenen Glasstab. Geben wir dagegen der einen Kugel eine Ladung vom Bernsteinstab, der anderen aber eine vom Glasstab, so stellen wir fest, dass sich die Kugeln anziehen. Wir schließen daraus, dass es zwei unterschiedliche Ladungstypen gibt, die nach G. Ch. Lichtenberg (17421799) als negative und positive Ladung bezeichnet werden und deren Träger Elektronen und Protonen heißen. Es sind stabile Teilchen mit der Elementarladung e r1, 60 1019 As sowie einer von null verschiedenen Masse von me = 9,1091 10-31 kg bzw. mp = 1,67 10-27 kg. Die experimentelle Verifikation folgt weiter unten. Die Ladungen auf den beiden Stäben entstehen dadurch, dass negativ geladene Elektronen vom Tuch auf den Bernsteinstab übergegangen sind, während im anderen Versuch Elektronen vom Glasstab auf das Tuch übergetreten sind. Protonen tragen wegen ihrer viel gößeren Masse kaum zum Ladungstransport bei. Das Vorgesagte gilt allgemein. Bei einer engen Berührung zweier Körper unterschiedlicher chemischer Zusammensetzung können bei unterschiedlich starker Bindung Elektronen von einem auf einen anderen Körper übergehen.
326
15 Elektrostatik
Zur Ladungsmessung lassen sich Elektroskope benutzen, von denen Ales verschiedene Ausführungen gibt. Bändchen Zwei von ihnen sind in Abb. 15.2 dargestellt, ein Zeiger-Elektroskop aus Metall und ein BlättchenElektroskop. Die Kräfte zwischen den Ladungen führen zu einer AusQuarzfaden lenkung des Zeigers bzw. der Metall-Blättchen. Versehen wir die Geräte mit einer Skala und eichen sie mit einer beliebigen, aber reproduzierbaren Ladung, so werden sie zu Elektrometern. Es zeigt sich, dass Abb. 15.2: Beispiele zweier Elektrometer: die Kraft proportional zur Ladung a) Zeigerelektroskop, zunimmt. Beide Geräte liefern allerb) Blättchen- (Wulfsches ) Elektroskop dings keine Information über das Vorzeichen der Ladung. Um die Kraft zwischen zwei Ladungen quantitativ zu fassen, ist die Coulombsche Drehwaage (Abb. 15.3) auf Grund ihrer Empfindlichkeit besonders geeignet. Die Messanordnung hat große Ähnlichkeit mit der Eötvösschen Drehwaage (Kap. 6). Eine Stange aus isolierendem Material ist in der Mitte an einem dünnen Faden aufgehängt. An den beiden Enden trägt sie je eine Metallkugel, von der eine elektrisch geladen ist. Ihr gegenüber befindet sich verschiebbar eine weitere geladene Metallkugel. Durch die Kraft zwischen den beiden Kugeln entsteht ein Drehmoment. Es dreht die Stange soweit aus ihrer Ruhelage heraus, bis ihr das rücktreibende Drehmoment des verdrillten Fadens das Gleichgewicht hält. Die Ladungsabhängigkeit der Kraft kennen wir bereits, wir können sie durch Messung des Verdrillungswinkels überprüfen. Variieren wir den Abstand der geladenen Kugeln, so Q1 erhalten wir das Abstandsgesetz,
G F
Q2
f
Q1 Q2 rˆ . r2
(15.1)
vom Laser
Fragen wir nach der Kraft von Q2 auf Q1, so ist rˆ der Einheitsvektor in Richtung von Q2 nach Q1. Die Größe f ist positiv; ihr Wert hängt vom benutzten Maßsystem ab, denn nur die Einheiten von F und r liegen bis jetzt fest, die für Q oder f können noch gewählt werden. Die Beziehung trägt den Namen Coulombsches Gesetz (Ch. A. Coulomb, 1736-1806). Abb. 15.3: Anordnung zur Verifikation des Coulombsches Gesetzes
15 Elektrostatik
327
15.1.2 Maßsysteme In der Elektrik werden hauptsächlich zwei Maßsysteme verwandt: das SI-System, das wir schon in Kap. 1 eingeführt haben, und das cgs-System. Hier benutzen wir, wie fast überall im Rahmen der Experimentalphysik üblich, ersteres System. Das cgs-System wird häufig in der Theoretischen Physik verwendet. Im SI-System tritt neben die Basisgrößen Länge, Masse, Zeit als vierte Grundgröße die Stromstärke I. Ihre Einheit wird über die Kraft zwischen zwei parallelen, Strom führenden Drähten bestimmter Geometrie definiert. Wir kommen darauf in Kap. 16.5 zurück. Die Einheit ist das „Ampere (A)“ (A. M. Ampere, 1775-1836). Die Ladung wird wegen der genaueren Messbarkeit auf die Stromstärke zurückgeführt.
I
dQ dt
o Q
³ I dt .
(15.2)
Dadurch erhält die Ladung die Einheit „1 As“; diese Einheit ist identisch mit der Einheit „Coulomb (C)“.
>Q @
1C 1 As .
(15.3)
Betragen die Ladungen im Coulombschen Gesetz 10-4 As, so wird für die Kraft F im Abstand von 1m ein Wert von 89,875 N gemessen,
F
f
108 (As) 2 1m 2
89,875 N .
(15.4)
Hieraus resultiert für den Vorfaktor f
f
8,9875 109
Nm 2 . ( As ) 2
(15.5)
Wir werden später sehen, dass dieser Zahlenwert der Größe
f
1 4SH 0
(15.6)
entspricht. Darin ist H 0 die Dielektrizitätskonstante im Vakuum; sie ist mit der Lichtgeschwindigkeit im Vakuum verknüpft und hat nach dem Obigen den Wert
H0
8,854 1012 As/Vm .
(15.7)
328
15 Elektrostatik
Das Coulombgesetz lautet damit im SI-System
G F
1 Q1 Q2 rˆ 4SH 0 r 2
(15.8)
Kommen wir nun zum cgs-System. In diesem wird der Vorfaktor f gleich eins gesetzt. Die Kraft wird in dyn angegeben, die Länge in cm, so dass wir für die Ladung erhalten
>Q @ > F @> r @
dyn1/ 2 cm .
(15.9)
Die Einheit der Ladung wird so gewählt, dass sich zwei Ladungen im Abstand von 1cm mit einer Kraft von 1dyn anziehen bzw. abstoßen. Sie trägt den Namen „elektrostatische Ladungseinheit (ESL)“ 1 ESL = 1 dyn1/2 cm.
(15.10)
Viele Beziehungen in der Elektrodynamik werden durch diese Festlegung vereinfacht. Der Nachteil liegt darin, dass eine Dimensions-Überprüfung sehr erschwert wird und die Umrechnung mechanischer Größen in elektrische und magnetische Einheiten recht umständlich ist.
15.2
Elektrisches Feld
15.2.1 Elektrische Feldstärke Angenommen, im Raum befindet sich ein ausdehnungsloser Körper, der eine Ladung Q trägt. Wir nennen sie Punktladung. Wir wollen ihre Eigenschaften kennen lernen. Das ist durch Anwendung des Coulomb-Gesetzes möglich, was bedeutet, dass wir mit einer Test- oder Probeladung q die Kraft auf diese als Funktion des Ortes messen. Als Eigenschaft der Ladung Q darf das Messresultat nicht von der Größe der Probeladung abhängen. Deswegen dividieren wir die jeweilig gemessene Kraft durch die Probeladung q. Die so erhaltene Größe spannt im G G Raum ein elektrisches Feld E (r ) der Ladung Q auf. Jedem Raumpunkt ordnen wir eine elektrische Feldstärke zu
G G E (r )
Q 4SH 0 r 2
rˆ .
(15.11)
Dieser Ausdruck hat die Form des Gravitationsfeldes (Bd. I, Kap. 6). Die Feldrichtung ist so festgelegt, dass sie für positive Ladungen radial nach außen weist. In Abb. 15.4 ist die Richtung der Feldlinien durch Pfeile dargestellt, die Stärke des Feldes durch die Dichte der Pfeile. Die Dimension des elektrischen Feldes ist Kraft/Ladung. Seine Einheit ist also 1 J/As. Die Kraft auf eine Ladung q im elektrostatischen Feld schreibt sich
15 Elektrostatik
329
r 1 E : 2 rˆ r
Qi r r1
+
P
r Ri
0 Abb. 15.5: Zur Überlagerung der Feldstärke mehrerer Punktladungen am Ort P
Abb. 15.4: Elektrische Feldstärke einer geladenen Metallkugel
G F
G qE .
(15.12)
G Sind im Raum mehrere Punktladungen vorhanden (Abb.15.5), so ist E die resultierende
G
elektrische Feldstärke im Raumpunkt R ,
G G Eres ( R )
G G Qi R ri ¦ G G G G. 4SH 0 1 ( R ri ) 2 R ri N
1
G Ist die Ladung mit einer Ladungsdichte U (r ) die Gesamtladung gegeben durch
Q
G
(15.13)
dQ / dV kontinuierlich im Raum verteilt, so ist
3
³ U dV ³ U (r ) d r ,
V
(15.14)
V
und wir erhalten außerhalb des Raumladungsgebietes
G G Eres ( R)
G G G 4SH 0 ³ ( R r ) 2 1
U (r )
G G Rr 3 G G d r. Rr
(15.15)
330
15 Elektrostatik
15.2.2 Elektrischer Kraftfluss G Wir betrachten ein elektrisches Feld E beliebiger Gestalt und Stärke. Ein Teil der Feldlinien G möge ein Flächenelement dA durchsetzen. Als elektrischen Kraftfluss durch dieses Flächenelement definieren wir das Skalarprodukt
G G E dA .
d ) el
(15.16a)
r E r dA r dA
+Q
Abb. 15.6a: Zur Definition des elektrischen Flusses
Abb. 15.6b: Elektrischer Fluss einer positiven Raumladung und
G Er ist also ein Maß für die Anzahl der dA durchsetzenden Feldlinien (Abb. 15.6a). Der gesamte Fluss durch eine vorgegebene Fläche ergibt sich durch Integration zu
) el
G G EdA ³ .
(15.16b)
Wenden wir diese Beziehung auf eine geschlossene Fläche (die Flächennormale möge nach außen weisen) an, in deren Innerem sich eine Ladung Q befindet (Abb. 1.6b), so erhalten wir den gesamten elektrischen Fluss als
) el
G G
v³ E dA .
(15.16c)
A
Durch Benutzung des Gaußschen Satzes (Math. Anhang) lässt sich das schreiben als
) el
G G E v³ dA A
³
V ( A)
G di vE dV .
(15.17)
15 Elektrostatik
331
Was bedeuten diese beiden Gleichungen? Dazu betrachten wir zunächst den speziellen Fall des G elektrischen Feldes einer Punktladung, Gl. (15.11). Einsetzen von E in (15.16c) ergibt
Q
) el
4SH 0
rˆ G dA 2
v³ r
Q 4SH 0
v³ d :
1
H0
Q
1
H 0 V³
U dV
(15.18a)
also
G G E v³ dA A
G di v E
1
H0 1
H0
Q
1
H 0 V³
U dV
bzw.
(15.18b)
(15.18c)
U
Diese Beziehungen enthalten keine speziellen geometrischen Größen, so dass es nahe liegt, dass sie allgemeingültig sind. In Worten formuliert bedeuten sie Die Quellen des elektrischen Feldes sind die (positiven) Ladungen. (Gaußscher Satz der Elektrostatik, C. F. Gauß, 1777-1855) Gl. 15.18b gilt unabhängig von der gewählten Geometrie, denn ersetzen wir die Kugeloberfläche durch eine Anzahl von Kugelflächenelementen mit unterschiedlichen Abständen vom Zentrum (Abb. 15.7), in dem sich die Ladung Q befindet, so ist der Kraftfluss, der durch ein solches Flächenstück tritt, unabhängig vom Abstand, sofern der zugehörige Raumwinkel der Gleiche ist:
d ) r1
G G Er1 dAr1
dAr1
r12 dAr2 , r22
d ) r2 ,
(15.19)
(15.20)
Einsetzen in (15.19) ergibt
d ) r1
§ · r22 ·§ r12 E ¨ r2 2 ¸¨ 2 dAr2 ¸ d ) r2 r1 ¹© r2 © ¹
(15.21)
Abb. 15.7: Zur Verallgemeinerung des Gaußschen Satzes auf einen beliebig geformten, geladenen Körper undduauch
Hierin wurde für die Feldstärke das Coulombsche Gesetz benutzt. Eine beliebige geschlossene Oberfläche lässt sich durch unendlich viele infinitesimal kleine Kugelsegmente ersetzen. Die G dabei entstehenden senkrecht zum Radiusvektor bzw. zu E liegenden Flächenelemente liefern keinen Beitrag zum Fluss, da das Skalarprodukt verschwindet.
332
15.3
15 Elektrostatik
Elektrostatisches Potential und Spannung
Das elektrische Feld ist wie das Gravitationsfeld ein konservatives Kraftfeld, d.h. die Arbeit, die wir verrichten müssen, um eine Ladung entgegen dieser Kraft längs eines Weges von P0 nach P zu verschieben, ist unabhängig vom Weg. Ihr Betrag hängt also nur vom Anfangs- und Endpunkt ab (Abb. 15.8) und ist gegeben durch P
W
G G ³ F dr
P0
P
q
G
G
³ E dr
E pot ( P ) E pot ( P0 ) .
(15.22)
P0
2
Wir können diese Aussage auch so formulieren, wie wir es bereits in Kap. 13 getan haben. Führen wir nämlich die Ladung q auf einem anderen Weg vom Zielpunkt P zum Ausgangspunkt zurück, so muss das Integral über den geschlossenen Weg verschwinden. Anderenfalls hätten wir ein perpetuum mobile 1. Art vor uns. Es gilt also
P
1
G G
P1
v³ Edr
Abb. 15.8:
0,
bzw.
G rot E
0
(15.23a,b)
Das elektrostatische Feld ist wirbelfrei. Kehren wir noch einmal zu (15.22) zurück. Die an der Ladung im elektrischen Feld verrichtete Arbeit wird im System als potentielle Energie Epot gespeichert. Dabei haben wir den Anfangswert des Integrals zu null normiert. Wir formulieren nun Der Quotient aus Epot und Ladung q heißt elektrostatisches Potential. Bilden wir die Differenz der Potentiale an zwei Punkten P1 und P2: P2
G G
M ( P2 ) M ( P1 ) : ³ Edr
(15.24a)
P1
Die Potentialdifferenz zwischen zwei Punkten P1 und P2 heißt elektrische Spannung. P2 G G U : M ( P2 ) M ( P1 ) : ³ Edr P1
(15.24b)
15 Elektrostatik
333
Spannungen werden in Volt (V) angegeben (A. Volta, 1745-1827).
>U @ > E / Q @
1kgm 2 A -1s -3 1V .
(15.25)
Damit ergibt sich die Einheit der potentiellen Energie zu
>Q U @
ª¬ E pot º¼
1VAs=1Ws .
(15.26a)
Die potentielle Energie pro Zeiteinheit definiert die Leistung. Die Einheit ist also 1VA, die als 1 Watt (W) bezeichnet wird (J. Watt, 1736-1819). Eine kleinere Energieeinheit, die vor allem in der Atom-, Kern- und Elementarteilchenphysik benutzt wird, ist das „Elektronenvolt“. Es ist definiert als die Energie, die benötigt wird, um ein Elektron gegen die Potentialdifferenz von 1Volt zu verschieben.
1eV 1,602 1019 C 1V 1,602 1019 J .
(15.26b)
Bei Kenntnis der elektrischen Feldstärke lässt sich aus (15.22) das elektrische Potential ermitteln. Umgekehrt legt die Beziehung nahe, dass aus dem bekannten Potential einer Ladungsverteilung die elektrische Feldstärke berechnet werden kann. Die entsprechende Gleichung lautet nach (3.34 mit 3.12)
G E
grad M ( x, y, z ) M .
(15.27)
Der gewonnene elektrische Feldvektor steht immer senkrecht auf den Flächen gleichen Potentials, den Äquipotentialflächen. Rufen wir uns den Gaußschen Satz der Elektrostatik in Erinnerung. In der differentiellen Form ergab er sich zu
G di v E
1
H0
U .
(15.28)
G Mit E aus (15.27) ergibt sich die Poisson-Gleichung (S.D. Poisson, 1787-1840).
G div E 'M
div grad M
U . H0
'M
U / H0 ; (15.29)
Bei gegebener Ladungsverteilung lässt sich das Potential aus diesem Ausdruck durch Integration prinzipiell berechnen.
334
15.4
15 Elektrostatik
Einige spezielle elektrische Felder und zugehörige Potentiale
15.4.1 Feld einer Punktladung Das elektrische Feld einer Punktladung beträgt nach (15.11)
G G E (r )
Q 4SH 0 r 2
rˆ
(15.30)
und wurde bereits in Abb. 15.4 dargestellt. Das Potential ergibt sich aus G r
G G
M ( P ) M (f) ³ Edr f
r
³ f
Q 4SH 0 r 2
dr
(15.31)
In unendlicher Entfernung vom Zentrum der Ladung soll das Potential verschwinden. Damit folgt
M (r )
Q 4SH 0 r
.
(15.32)
Die Äquipotentialflächen M (r )
const sind konzentrische Kugeln (Abb. 15.4).
15.4.2 Feld zweier gleichnamiger Punktladungen Wir wollen das elektrische Feld zweier positiver Punktladungen gleichen Betrages kennen lernen. Dazu überlagern wir die beiden Coulombfelder der Einzelladungen. Das resultierende Feld (Abb. 15.9) ist symmetrisch zur Mittelebene zwischen den Ladungen. Die abstoßende Wechselwirkung kommt dadurch zum Ausdruck, dass sich die Feldlinien in diesem Bereich zu meiden suchen.
y
+
+
x
Abb. 15.9: Elektrisches Feld zweier gleich großer, positiver Punktladungen
15 Elektrostatik
335
15.4.3 Feld eines elektrischen Dipols Unter einem elektrischen Dipol verstehen wir zwei ungleichnamige Ladungen gleichen Betrages, die in einem bestimmten Abstand d von einander angeordnet sind. Die Feldlinien der Einzelladungen haben entgegengesetzte Richtungen. Die positive Ladung wirkt als Quelle des zugehörigen Feldes, die negative Ladung als Senke, d.h. die Feldlinien des reultierenden Feldes entspringen in der positiven Ladung und enden in der negativen Ladung. Wir wollen elektrisches Feld und Potential in großer Entfernung vom Dipol berechnen. Es ist zweckmäßig, zuerst das Potential zu ermitteln. Es ergibt sich
r E
Abb. 15.10: Elektrisches Feld eines Dipols
Q §1 1· ¨ ¸ 4SH 0 © r1 r2 ¹
M
(15.33a)
Für r1 >> d können wir schreiben
Q r1 r2 4SH 0 r 2
M
Q d cos . 4SH 0 r 2
(15.33b)
Führen wir das Dipolmoment
G G p Q d cos - zˆ Qd ein, so bekommen wir
G
M (r )
GG pr . 4SH 0 r 3
(15.33c)
Das Potential ist rotationssymmetrisch mit der Richtung des Dipolmomentes als Symmetrieachse (Abb. 15.10). Wegen der 1/ r 2 -Abhängigkeit fällt es mit der Entfernung steiler ab als das Potential einer Punktladung. Das rührt daher, dass sich mit wachsendem Abstand die entgegengesetzten Potentiale der beiden Punktladungen zunehmend kompensieren. Die elektrische Feldstärke erhalten wir durch Bildung des Gradienten von M .
G E
gradM .
336
15 Elektrostatik
G Legen wir das Dipolmoment zu p von M
· z w § eˆ ¨ 2 2 2 3/ 2 ¸ x wx © ( x y z ) ¹
· w § z eˆ ¨ 2 2 2 3/ 2 ¸ y wy © ( x y z ) ¹
4SH 0
· w§ z ¨ 2 eˆ 2 2 3/ 2 ¸ z 4SH 0 wz © ( x y z ) ¹
p 4SH 0
wM eˆx wx
wM eˆy wy
p
(0, 0, p ) fest, so sind die Komponenten des Gradienten
4SH 0
p 4SH 0
p
wM eˆz wz
p 4SH 0
p 4SH 0
p
3zx eˆx r5
3zy eˆy r5
§ 1 3z 2 · ¨ 3 5 ¸ eˆz r ¹ ©r
(15.34a)
3cos 2 eˆz . r3
Damit ergibt sich das elektrische Feld zu
G E
1 4SH 0 r
3
G (3 prˆ cos - p ) .
(15.34b)
Wird ein elektrischer Dipol in ein elektrisches Feld gebracht, so wirken auf ihn Kräfte. Ist das Feld homogen, d.h. nach Richtung und Betrag konstant, so greift an der positiven Ladung Q G G G G die Kraft F1 QE an und an der negativen die Kraft F1 QE an. Auf Grund des resultierenden Drehmomentes
G D
G G pu E
(15.35)
stellt sich der Dipol parallel zum äußeren Feld ein. Erwartungsgemäß ist in dieser Stellung seine potentielle Energie am kleinsten. Es ist
W pot
QM1 QM 2
Mit M1 M2
W pot
Q (M1 M2 ) .
(15.36a)
GG E d ergibt sich
GG pE .
(15.36b)
Im inhomogenen Feld wirkt auf den Dipol die Kraft
G F
G G G G G Q E (r d ) E (r )
^
`
G G dE Qd G , dr
(15.37a)
15 Elektrostatik
G F
337
G G p grad E
(15.37b)
Ein Dipol erfährt demnach eine Kraft in Richtung des elektrischen Feldes.
15.4.4 Feld einer geladenen Platte Alle bisher vorgestellten Beispiele betreffen inhomogene Felder. Ein homogenes Feld ist bei einer geladenen Platte realisiert. Betrachten wir eine positiv geladene Platte (Abb. 15.11). Die Ladung sei gleichmäßig über die Platte verteilt, die Flächenladungsdichte V ist also konstant. Aus Symmetriegründen steht das elektrische Feld senkrecht auf der Platte. Die Feldstärke kann aus dem Gaußschen Satz berechnet werden. Dazu legen wir eine geschlossene Fläche um die Platte. Der Fluss durch die senkrecht zur Platte liegenden Flächenstücke ist null, da das elektrische Feld senkrecht auf der Flächennormale steht. Der Fluss durch r r die zu der Platte parallel liegenden Flächenstücke wird E 1
G G G G E1 A1 E2 A2
1
H0
Q.
(1.38a)
Da die Beträge der Flächen und der Feldstärken jeweils gleich sind, ergibt sich
G E
V xˆ . 2H 0
A1
(15.38b)
r E2
r A2
Abb. 15.11: Elektrisches Feld einer positiv geladenen Platte
Der Feldvektor weist überall auf der Platte 9n die gleiche Richtung und sein Betrag konstant, das Feld ist homogen. Nur am Rand ist mit Abweichungen zu rechnen. Sie lassen sich vermeiden, wenn wir uns einen Ring gleicher Beschaffenheit und gleicher Ladungsdichte um die Platte herumgelegt denken. Inhomogenitäten treten dann erst am äußeren Rand des Ringes auf. Die Äquipotentialflächen liegen stets senkrecht zu den Feldlinien, in diesem Fall also parallel zur geladenen Platte.
15.4.5 Feld einer homogen geladenen Kugel Wir wollen als Erstes das elektrische Feld außerhalb einer positiv geladenen Kugel berechnen. Wir setzen voraus, dass die Ladungsdichte konstant ist. Dem Fall kommt deshalb besondere Bedeutung zu, weil wir es im Makrokosmos streng genommen nie mit ausdehnungslosen geladenen Körpern zu tun haben. Die Ladung ist vielmehr auf ein endliches Volumen verteilt, z.B. auf eine Kugel. Aus Symmetriegründen ist das Feld radial nach außen gerichtet. Um die
338
15 Elektrostatik
Feldstärke zu berechnen, gehen wir wieder vom Gaußschen Satz aus. Wir legen eine Kugelfläche A um die Ladungsverteilung; der Fluss durch A ist
G G EdA v³
1
E 4S r 2
H0
A
G E
Q 4SH 0 r 2
rˆ ;
Q;
(15.39a)
r !R.
(15.39b)
Dieses elektrische Feld ist identisch mit dem Feld einer Punktladung. Das ist erfreulich! Wie groß ist die elektrische Feldstärke im Innern der Kugel? Auch in diesem Fall muss das Feld r r radial nach außen gerichtet sein. Der Gaußsche Q r E E= 3 Satz ergibt 4πε R 0
r E=
R
Q r3 , H 0 R3
(15.40a)
G r ; r R. 4SH 0 R 3
(15.40b)
E 4S r 2
Q rˆ 4πε 0 r 2
r
G E
Q
Abb. 15.12: Elektrisches Feld einer homogen geladenen Kugel
Die Ergebnisse sind in Abb. 15.12 veranschaulicht. Wenn die Kugel hohl ist, gilt für die Feldstärke (15.40b); im Innern ist die Feldstärke null, da die Kugelfläche, die sich an die innere Wandung anschmiegt, keine Ladung umschließt. Die Form der Äquipotentialflächen muss der einer Punktladung entsprechen; es sind ebenfalls konzentrische Kugeln.
15.4.6 Felder höherer Multipole: Multipolentwicklung des Potentials Die oben berechneten Felder bzw. Potentiale bestimmter Ladungsanordnungen können als Spezialfälle einer beliebigen Ladungsverteilung (15.14) angesehen werden; es kann auch eine beliebige Verteilung diskreter Punktladungen, die zu (15.13) führt, sein, deren elektrisches Feld sich nach (15.15) berechnet. Im Allgemeinen lässt sich das Integral nicht geschlossen berechnen. In solchen Fälle ist es aber immer möglich, das Feld in einem Punkt, dessen Entfernung groß gegenüber den Abmessungen der Ladungsverteilung bzw. den Abständen der Ladungen ist, durch eine Taylorreihen-Entwicklung zu gewinnen. Sie wird als Multipolentwicklung bezeichnet und ist am Ende des Kapitels abgeleitet. Auf das Dipolmoment folgt G das Quadrupolmoment. Sein Beitrag zum Potential im Abstand R ist
15 Elektrostatik
MQuad
339
1 8SH 0 R 5
^Q
xx
X 2 QyyY 2 Qzz Z 2
(15.41)
`
2 Qxy XY Qxz XZ QyzYZ , mit dem symmetrischen Quadrupoltensor 2. Stufe
QQuad
§ Qxx ¨ ¨ Qyx ¨ Qzx ©
Qxy Qyy Qzy
Qxz · ¸ Qyz ¸ Qzz ¸¹
(15.42)
Das elektrische Quadrupolmoment ist ein Maß für die Abweichung der Ladungsverteilung von der Kugelsymmetrie. Sie spielen z. B. eine wichtige Rolle in der Kernphysik, wo aus dem Vorhandensein eines solchen Momentes auf die Deformation von Atomkernen geschlossen werden kann. Quadrupolfelder werden ferner in dynamischen Massenfiltern verwandt (vgl. Kap. 17.2). Es kommen auch magnetische Quadrupolmomente vor.
15.5
Elektrische Ladungen auf Leitern
15.5.1 Influenz Nähern wir einen geladenen Glasstab der Elektrode eines Elektroskops, so beobachten wir bereits einen Ausschlag, wenn der Glasstab die Elektrode noch nicht berührt hat. Er kommt dadurch zustande, dass negative Ladungsträger des Elektroskops von den positiven Ladungen des Glasstabes angezogen werden. Daher verarmt das Metall-Blättchen am unteren Ende des Messgerätes an negativer Ladung. Das ist gleichbedeutend mit einer positiven Aufladung, die zur Abstoßung führt. Der gleiche Effekt stellt sich ein, wenn wir einen Bernstein- oder Hartgummistab verwenden. In diesem Fall werden die negativen Ladungsträger des Elektroskops von der Ladung des Stabes abgestoßen. In einem dritten Versuch (Abb. 15.13a) bringen wir zwischen zwei Metallplatten, die ungleichnamig geladen sind, zwei an elektrisch nicht leitenden Griffen befestigte aneinander liegende Metallplatten. Im Innern des geladenen Plattenpaares trennen wir die inneren Platten und testen ihren Ladungszustand nacheinander mit einem Elektrometer. Es stellt sich heraus, dass die Platten entgegengesetzt gleich geladen G G sind. Im elektrischen Feld sind also wieder gemäß F q E Ladungen verschoben worden, die nach der Trennung der Platten nicht mehr zurückfließen konnten. Die Verschiebung der
340
-Q
15 Elektrostatik
+Q
Abb. 13a: Zur Ermittlung der Influenzladung
Ladungen wird Influenz genannt. Sie tritt nicht auf, wenn wir statt der inneren Metallplatten solche aus elektrisch isolierenden Materialien benutzen würden. Daraus folgt, dass ein Metall im Gegensatz zum Isolator quasi frei bewegliche Ladungsträger besitzt, die schon weiter oben erwähnten Elektronen. Anwendung findet die Influenz z.B. beim Van de Graaff-Generator (Van de Graaff, 19011967), mit dem sich hohe Spannungen ( U t 105 V ) erzeugen lassen. Das Prinzip zeigt Abb. (15.13b).
b)
a)
Abb. 15.13b: Demonstration der Influenz mit einem BecherElektrometer
Abb. 15.14: Prinzip des Van-de-Graaf-Generators
15 Elektrostatik
341
Die Elektrode eines Elektrometers ist als Metallbecher ausgebildet. Mittels eines Metalllöffels bringen wir von einer Ladungsquelle solange Ladungsportionen auf die äußere Wandung des Metall-Bechers (a), bis sich ein konstanter Ausschlag eingestellt hat. Nun ändern wir den Versuch in der Weise ab, dass wir die Ladungsportionen auf die innere Becherwand bringen (b). Diese Ladung wird sofort durch die Wandung des Bechers nach außen verschoben, weil dort die gegenseitigen Abstoßungskräfte am kleinsten sind. Das Innere des Bechers bleibt feldfrei. Wir können die Aufladung so lange fortführen, bis auf Grund der großen Kräfte ein plötzlicher Ladungsausgleich zwischen Elektrometer und Umgebung einsetzt. Im Van de Graaff-Generator (Bandgenerator) tritt an die Stelle der Aufladung durch den Ladungslöffel ein Laufband aus isolierendem Material (Abb. 15.14). Durch einen Metallkamm am unteren Ende des zunächst elektrisch neutralen Bandes wird negative Ladung vom Band abgestreift und zur Erde abgeleitet. Das Band lädt sich dadurch positiv auf. Im Innern einer metallischen Hohlkugel werden mittels eines weiteren metallischen Kamms negative Ladungsträger auf das Band aufgesprüht, so dass dessen Ladung wieder neutralisiert wird. Aus dem äußeren Bereich der Hohlkugel werden sofort Elektronen nachgeliefert, so dass die innere Fläche ladungsfrei bleibt. Die Kugel lädt sich auf diese Weise wie der Becher im obigen Beispiel stark positiv auf. Neben Selbsterregung des Generators wird auch Fremderregung durch eine äußere Ladungsquelle angewandt. Die Ladungsfreiheit im Inneren geschlossener metallischer Behälter (Faraday-Käfig) kann zur Abschirmung vor elektrischen Kräften dienen.
15.5.2 Kapazität und Kondensatoren Unsere bisherigen Überlegungen haben gezeigt, dass metallische Leiter-Anordnungen elektrische Ladungen speichern können. Diese Fähigkeit hängt stark von der Geometrie des Leitersystems ab. Wir bezeichnen sie als Kapazität C. Die Ladungsspeicher selbst heißen Kondensatoren. Das einfachste Beispiel ist ein Plattenkondensator. Wie der Name besagt, besteht er aus zwei sich in geringem Abstand gegenüber stehenden Metallplatten (Abb. 15.15). Kondensatoren spielen bei Abb. 15.15: Plattenvielen technischen Anwendungen eine wichtige Rolle. kondensator Zur Definition eines quantitativen Maßes für die Kapazität gehen wir von der Definitionsgleichung der elektrischen Spannung aus.
U
G G Edr ³
(15.24b)
Da die Feldstärke proportional zur Ladung des Systems ist, gilt die Beziehung
U vQ.
(15.43)
Der Proportionalitätsfaktor in dieser Verknüpfung definiert die Kapazität C. Sie hängt nur von den geometrischen Abmessungen der Leiteranordnung ab.
342
15 Elektrostatik
C:
Q . U
(15.43a)
Die Einheit der Kapazität wird als 1 Farad (M. Faraday, 1791-1876) bezeichnet.
1Farad = 1F = 1AsV -1 .
(15.43b)
Für praktische Zwecke ist 1 Farad meistens zu groß; üblich sind
1ȝF = 103 nF = 106 pF . Wir besprechen nun einige spezielle Kondensatoren.
15.5.2.1 Plattenkondensator Die beiden Platten dieses Kondensators mögen den Abstand d haben; die Fläche einer Platte sei A. Der Zwischenraum sei evakuiert (Abb. 15.15). Es gilt nach (15.24) und (15.38, die gesamte Ladung befindet sich auf der Innenseite der jeweiligen Platte)
C
Q U
C
H0
VA Ed
VA , V d H0
A . d
(15.44a)
(15.44b)
Die Kapazität nimmt proportional zur Plattengröße und umgekehrt proportional zum Plattenabstand zu. Das ist einleuchtend: Je größer A ist, umso mehr Ladung kann aufgebracht werden. Je kleiner d ist, desto größer ist die anziehende Kraft zwischen den Ladungen.
15.5.2.2 Koaxialkabel und Kugel Wir betrachten einen Draht mit dem Radius R1, der von einem konzentrischen metallischen Hohlzylinder mit Radius R2 umgeben ist (Abb. 15.16). Die Anordnung heißt Koaxialkabel. Die Ladung pro Längeneinheit bezeichnen wir mit O . Das elektrische Feld zeigt aus Symmetriegründen in radiale Richtung. Wir berechnen zunächst das Feld eines Drahtes. Außerhalb des Drahtes ergibt es sich aus dem Gaußschen Satz. Dazu legen wir um den Draht einen geschlossenen Zylinder.
15 Elektrostatik
343
Der elektrische Fluss durch die Mantelfläche wird
³
G G EdA 2S rl E ,
(15.45a)
Mantel
Der Fluss durch die senkrecht zu den Feldlinien liegenden Stirnflächen ist null. Also folgt
G G
³ EdA G E
2S rl E
1
H0
lO ;
O rˆ . 2SH 0 r
R1
R2
(15.45b)
(15.45c)
l
Abb. 15.16: Zur Kapazität eines Koaxialkabels
Zurück zu unserem Ausgangsproblem. Wir umgeben den Draht mit einem konzentrischen metallischen Hohlzylinder. Das Feld außerhalb des Zylinders ist null, da dort keine Ladungen existieren. Die Anordnung lässt sich daher als abgeschirmtes Kabel verwenden. Die Potentialdifferenz zwischen Draht und Zylinder ist R2
U
G G ³ Edr
R1
O 2SH 0
R2
dr r R1
³
R O ln 2 , 2SH 0 R1
(15.46)
woraus sich die Kapazität berechnet zu
C
Q U
Ol O ln R2 / R1 / 2SH 0
2SH 0
l . ln R2 / R1
Ein Kugelkondensator ist in (Abb. 15.17) gezeigt. Innenund Außenraum sind feldfrei. Im Zwischenraum herrscht das Feld einer im Mittelpunkt lokalisierten Punktladung. Die Potentialdifferenz ergibt sich nach (15.24a) zu
M ( R1 ) M ( R2 ) U
1 · Q § 1 ¨ ¸. 4SH 0 © R1 R2 ¹
(15.48)
(15.47)
R1 R2
Damit folgt für die Kapazität
C
Q U
RR 4SH 0 1 2 . R2 R1
Abb. 15.17: Kugelkondensator (15.49)
344
15 Elektrostatik
15.5.2.3 Parallel- und Reihenschaltung von Kondensatoren Die Kapazität einer Leiter-Anordnung lässt sich dadurch beeinflussen, dass mehrere solcher Elemente parallel zueinander oder hintereinander geschaltet werden (Abb. 15.18). Das ist für praktische Anwendungen sehr nützlich. Schalten wir mehrere Kondensatoren parallel zueinander, so ist die Spannung an ihnen gleich. Die Ladungen addieren sich U (bei einem Plattenkondensator addieren sich die Flächen), so dass sich die Einzelkapazitäten ebenfalls addieren.
Ci
C ges
U
N
¦C
i
.
(15.50)
1
Sind mehrere Kondensatoren in Reihe geschaltet, so werden beim Anschluss an eine Spannungsquelle durch Influenz auch die innen gelegenen Kondensatoren geladen. Die Spannungen addieren sich.
Ci Abb. 15.18: Zur Kapazität von parallel und in Reihe geschalteten Kondensatoren.
U
Q C ges
N
Q
¦C 1
;
o
i
1 C ges
N
1
1
i
¦C
(15.51a,b)
Parallelschaltung vergrößert also die Gesamtkapazität, Hintereinanderschaltung verkleinert sie.
15.6 Elektrisches Feld als Träger der elektrostatischen Energie In einem Kondensator ist elektrostatische Energie gespeichert. Verbinden wir seine Platten mit den Polen eines Glühlämpchens, so leuchtet es kurz auf. Wie groß ist diese Energie und wo ist sie lokalisiert? In einem Gedankenversuch wollen wir den Kondensator erneut laden. Wir bewerkstelligen das diesmal, indem wir sukzessiv negative Ladungen von einer Platte auf die andere Platte bringen. Dabei baut sich ein elektrisches Feld auf, das auf die Ladung eine Kraft ausübt. Um den Kondensator weiter zu laden, müssen wir Arbeit gegen diese Kraft verrichten. G G E und dr haben also verschiedene Vorzeichen. Nach (15.22) gilt
Wel
U G G ³ qEdr 0
U
³ qdU 0
Q
1 qdq C ³0
Q2 ; 2C
(15.52a)
15 Elektrostatik
345
Wir fassen einen Plattenkondensator ins Auge; dann können wir (15.44a) benutzen und schreiben
Wel Wel
1 CU 2 2
H0 2
H0 A 2 d
U2
H0 2
Ad
U2 ; d2
E 2V ;
(15.52b)
(15.52c)
Diese Gleichung besagt, dass die Energie im elektrostatischen Feld gespeichert ist. Die Aussage darf natürlich nicht von der Geometrie der Leiter-Anordnung abhängen. Um sie zu eliminieren, dividieren wir (15.52c) durch das Volumen und erhalten als Energiedichte des Feldes
w el
H0 2
E2 .
(15.53)
Diese Beziehung gilt allgemein für jede Leiter-Anordnung.
15.7
Dielektrika im elektrostatischen Feld
15.7.1 Dielektrische Suszeptibilität und Dielektrizitätskonstante Bisher haben wir vorausgesetzt, dass der Raum zwischen den Elektroden eines Kondensators evakuiert war. In den Experimenten hatten wir stillschweigend Luft zugelassen. Nähmen wir sehr genaue Messungen vor, so würden wir in letzterem Fall eine sehr geringe Vergrößerung der Kapazität feststellen. Weit größer wird der Effekt, wenn wir zwischen die Platten, bei gleichem Abstand, einen isolierenden Stoff bringen. Die Kapazität steigt je nach Material um über das Zehnfache. Wir tragen dieser Kapazitätsänderung dadurch Rechnung, dass wir einen Faktor H einführen, den wir als Dielektrizitätskonstante bezeichnen. Die auf die Dielektrizitätskonstante im Vakuum bezogene Größe heißt Dielektrizitätszahl H r .
Hr :
H . H0
(15.54)
Es wurden dabei isotrop aufgebaute Materialien vorausgesetzt. In Tab. 15.1a und b sind die Dielektrizitätskonstanten für verschiedene Stoffe zusammengestellt.
346
15 Elektrostatik
Gase He H2 N2 CO2 O2
Flüssigkeiten Metylalkohol, CH3OH Äthanol, C2H5OH Azeton, (CH3)2CO Benzol, C6H6 Wasser flüssiger Wasserstoff flüssiges Helium
Hr
Bedingungen
1,000074 1,000264 1,000606 1,000946 1.000523
0°C, 1 bar, <1 MHz “ “ “ “
Hr
Temperatur
32,63 24,0 20,7 2,28 81,1 1,228 1,048
25°C 25 200 20 18 20,4° K 4,18° K
Tabelle 15.1.a: Dielektrizitätszahlen einiger Gase und Flüssigkeiten
Feste Körper Bernstein Quarzglas Porzellan KCl CaF2 Diamant CaTiO3 (Keramik)
Hr
Temperatur
2,8 3,7 5,5-6,5 5,03 7,36 16,5 |160
20°C “ “ “ “ “ “
Tabelle 15.1b: Dielektrizitätszahlen einiger Festkörper Die Kapazität schreibt sich
CDiel
H CVak .
(15.55)
Die Ursache für die Kapazitätserhöhung liegt in der Polarisation der Materie im elektrischen Feld. Es gibt zwei Arten der Polarisation, die Verschiebungspolarisation und die Orientierungspolarisation. Wir besprechen zunächst den ersten Fall. Abb. 15.19 zeigt einen Kondensator, dessen Zwischenraum zum Teil von einem nichtleitenden Stoff eingenommen wird. Durch das elektrische Feld wird auf die Atome eine Kraft ausgeübt. Diese bewirkt eine Verschiebung der Schwerpunkte der negativen und positiven Ladungsträger. Aus den nach außen hin neutralen Atomen oder Molekülen werden elektrische Dipole. Wir nennen sie im Unterschied zu den permanenten Dipolen, die unabhängig von
15 Elektrostatik
347
einem äußeren Feld existieren, induzierte elektrische Dipole. Die DipolBildung heißt Polarisierung der Materie. Das induzierte Dipolmoment eines Atoms bzw. Moleküls ist
G qd
G pind
d
Qfrei = s frei A
(15.56)
G wobei d von der negativen zur positiven Ladung weist. Die Summe über alle induzierten Dipolmomente pro Volumeneinheit wird als Polarisation G P der Materie bezeichnet.
G P
Q Pol = s geb A
1 G pi . ¦ V i
r Evak
r Ediel
Abb. 15.19: Elektrisches Feld eines Kondensators beim Einbringen eines Dielektrikums
(15.57)
Die Polarisierung des Dielektrikums hat zur Folge, dass auf den Stirnflächen Ladungen auftreten. Im Innern heben sie sich im Mittel auf. Da die Ladungen in einer dünnen Oberflächenschicht lokalisiert sind, heißen sie häufig gebundene Ladungen. Für ein Dielektrikum in Form eines Kubus im homogenen Feld wird die Flächenladungsdichte
Q pol
V geb
nqd A A
A
P.
(15.58)
G Sie ist also gleich dem Betrag der Polarisation P . Deren Richtung liegt parallel zum Vakuumfeld. Im Gaußschen Satz (15.18b) steht auf der rechten Seite die Gesamtladung. Zu der auf einen Plattenkondensator von außen aufgeflossenen „freien“ Ladung V frei A kommt also jetzt noch
die auf den Stirnflächen „gebundene“ Oberflächenladung V geb A hinzu. Für die elektrische Feldstärke ergibt sich
E
1
H0
V
frei
V geb .
(15.59a)
Hierin ist durch das Minuszeichen bereits das unterschiedliche Vorzeichen der Ladungen berücksichtigt. Wir sehen, dass die Feldstärke im Dielektrikum abnimmt. Setzen wir für die Flächenladungsdichten die zugehörige Vakuumfeldstärke bzw. die Polarisation entsprechend (15.23) und (15.28) ein, so können wir (15.59a) auch schreiben als
348
15 Elektrostatik
G G P EVak .
G E
(15.59b)
H0
Mit der elektrischen Feldstärke nimmt die Spannung am Kondensator um den gleichen Faktor H ab, vorausgesetzt, der geladene Kondensator wurde vor Einbringen des Dielektrikums von der Spannungsquelle getrennt. Die Kapazität nimmt entsprechend zu. Führen wir den Versuch dagegen so durch, dass der Kondensator mit der Spannungsquelle verbunden bleibt, so kann sich die Feldstärke zwischen den Kondensatorplatten nicht ändern. Es muss also die Feldstärke-Minderung durch das Dielektrikum kompensiert werden. Das kann nur geschehen, indem insgesamt eine H -fach größere Ladung auf die Platten fließt, was wieder eine entsprechende Vergrößerung von C bedeutet. Zur Extraktion von H aus obiger Gl. (15.59b) benötigen wir den Zusammenhang zwischen G G P und E . Für ein Medium geringer Dichte (z.B. Gase), in dem sich die Atome (Dipole) nicht beeinflussen, können wir davon ausgehen, dass die Ladungsverschiebung in einem Atom proportional zum elektrischen Feld ist.
G G p H 0D E .
(15.60)
Die Proportionalitätskonstante wird mit D bezeichnet und heißt Polarisierbarkeit. Sie hängt von der Struktur des betreffenden Atoms ab. Ihre Dimension ist m3. Die Polarisation pro Volumen wird damit mit (15.57)
G P
G nDH 0 EDiel
G
F eH 0 EDiel .
(15.61)
Hierin ist n die Anzahl der Atome pro Volumen. Die eingeführte Größe F e heißt dielektrische Suszeptibilität; sie ist definiert als
F e : nD .
(15.62)
Damit folgt aus (15.59b)
EDiel
EVak , 1 Fe
(15.63)
und für H ergibt sich unter Beachtung von (15.55)
H
1 Fe .
(15.64)
Für dichte Medien muss der Ausdruck (15.62) ersetzt werden durch die Clausius-MosottiBeziehung (R. J. E. Clausius, 1822-1888; O. F. Mosotti, 1791-1863),
15 Elektrostatik
349
nD . 1 nD / 3
Fe
(15.65)
Zur Verifizierung gehen wir von den Überlegungen am Ende des Kapitels (Ergänzung 2) aus. Aus (1A2.3) und (1A2.6) folgt
G ELokal
G 1 G E Pn . 3H 0
G G G Setzen wir ELokal in (15.61) anstelle von EDiel ein, so ergibt sich mit Pn { P
G § G 1 G· P H 0 nD ¨ E P¸ , 3H 0 ¹ © G
bzw. P
H 0 nD G E. 1 nD / 3
+
-
Berücksichtigung von (15.61) führt auf (15.65). Zur Entstehung der Polarisation durch Ladungsr verschiebung kann eine solche durch die AusE richtung von bereits ohne Feld vorhandenen molekularen Dipolen treten (Abb. 15.20). BeiAbb. 15.20: In einem Dielektrikum entspiele finden sich in Tab. 15.2. Für unsere steht durch ein elektrisches Feld durch weiteren Überlegungen legen wir wieder ein die polaren Moleküle eine Polarisation homogenes elektrisches Feld wie im Plattennd kondensator zu Grunde. Auf die positive und die negative Ladung des Dipols wirkt ein Kräftepaar, so dass ein Drehmoment entsteht (Abb. 15.21)
G D
G §d G· G G 2 ¨ u F ¸ Q ( p u E) . ©2 ¹
(15.66)
Dieses dreht den Dipol so lange, bis er parallel zum Feld liegt. Seine potentielle Energie ist dann minimal. Wir finden sie, indem wir den Dipol gegen das elektrische Feld um einen Winkel D herausdrehen. Die Arbeit, die wir dazu aufwenden müssen, beträgt M
W
³ D dM 0
pE cos M .
(15.67)
350
15 Elektrostatik
Die potentielle Energie ergibt sich daraus zu
GG pE .
E pot
(15.68)
r F
r d /2
r E
r F
Dem Drehmoment wirken Kräfte durch Stöße anderer Moleküle entgegen, so dass die Polarisation eine Funktion der Temperatur wird. Die Ableitung setzt Kenntnisse der statistischen Mechanik voraus, deshalb sei hier nur das Ergebnis für F mitgeteilt:
Molekül
Abb. 15.21: Drehmoment auf einen Dipol im elektrischen Feld
P H0E
F
np 2 . 3H 0 kT
p
HCl H2O NH3 NaCl (15.69)
Die dielektrische Suszeptibilität wächst mit 1/T. Eine solche Temperaturabhängigkeit heißt Curie-Verhalten (P. Curie, 1859-1906).
1.08 1,85 1.47 9,00
Tab. 15.2: Elektrisches Dipolmoment einiger Moleküle in Debye (1 Debye = 3,3356 10-30) Asm.
15.7.2 Elektrostatische Feldgleichungen in Materie Im Vakuum werden die Eigenschaften des elektrischen Feldes vollständig beschrieben durch (15.18b/c) und (15.23/15.28). Es sind dies die Beziehungen
G G E v³ dA A
G G Edr v³
1
H0
Q
1
³ U dV
H0 V
0
(15.18b)
G div E
(15.18c)
G rot E
1
H0 0
U
(15.23)
(15.28)
In Materie muss die (freie) Ladung durch die Differenz von freier und gebundener Ladung ersetzt werden; für letztere gilt nach (15.58)
1
H0
v³ V A
geb
dA
1
H0
G G
v³ PdA . A
(15.70)
15 Elektrostatik
351
Berücksichtigung in (15.18b) und Addition von
1
H0
G G
v³ PdA
auf beiden Seiten der Gleichung
A
ergibt
G §G P · G 1 v³A ¨© E H 0 ¸¹ dA H 0 V³ U dV ; (15.71a)
G §G P· div¨ E ¸ H0 ¹ ©
U . (15.71b) H0
Hierin ist U die Raumladungsdichte der von außen auf die Leiter-Anordnung aufgebrachten Ladung.
15.7.3 Elektrostatische Feldenergie im Dielektrikum In Kap. 15.6 hatten wir für einen Plattenkondensator die elektrische Feldenergie im Vakuum hergeleitet zu
Wel
1 CU 2 2
H0 A 2 d
U2
H0 2
Ad
U2 d2
(15.72)
Befindet sich ein Dielektrikum zwischen den Platten, so ist die Kapazität H -mal so groß, so dass wir erhalten
Wel
H 0H A 2 d
H 0H 2
U2
H 0H 2
Ad
U2 d2
(15.73)
2
E Ad
Die Energiedichte wird also
w el
H 0H 2
E2 .
w el
1 GG ED 2
(15.74a,b)
G G Früher war es üblich, für die Größe H 0H E eine neue Feldgröße D , die Verschiebungsdichte, einzuführen. In vielen Lehrbüchern findet sich diese Darstellung auch heute noch. (15.74a) geht dann über in (15.74b).
352
15.8
15 Elektrostatik
Elektronen und Ionen im elektrischen Feld
15.8.1 Millikan-Versuch Das erste Experiment zur Bestimmung der Ladung des Elektrons wurde von R. A. Millikan (1868-1953) durchgeführt. Er benutzte dazu feine Öltröpfchen, die sich beim Zerstäuben von Öl bilden und sich infolge von Reibung an Luftteilchen elektrisch aufladen. Diese geladenen Teilchen werden in ein homogenes elektrisches Feld gebracht (Abb. 15.22). Beim Einschalten des Feldes fallen die Tröpfchen r zuerst beschleunigt, nehmen aber dann FR hn g infolge der der Bewegung entgegengesetzten Auftriebs- und Reibungskraft eine konr r r F - FG - FR stante Geschwindigkeit an. Die Verhältnisse entsprechen denen beim KugelfallViskosimeter (Kap. 10.4.3.2). Durch Messng der konstanten Sinkgeschwindigkeit Abb. 15.22: Zur Bestimmung der elektrilässt sich der Radius der Tröpfchen ermitschen Elementarladung nach Millikan teln. Die auftretenden Kräfte sind auch
Gewichtskraft FG Auftriebskraft FA Reibungskraft FR
4S 3 r UÖl ; 3
4S 3 r U Luft ; 3 6SK rv.
(15.75)
Schalten wir das elektrische Feld ein und regeln seine Stärke so ein, dass die elektrische Feldkraft der Differenz aus Gewichts- und Auftriebskraft das Gleichgewicht hält, so schwebt das Tröpfchen gerade. Es gilt
neE
U
Öl
U Luft g
4S 3 r 1. 3
(15.76)
Hierin ist n die Anzahldichte der Elementarladungen auf einem Öltröpfchen. (Wegen der bereits merklichen Brownschen Molekularbewegung ist es zweckmäßig, nicht den Schwebezustand herzustellen, sondern die Fall- und Steiggeschwindigkeiten zu messen, die sich bei G einem elektrischen Feld parallel und antiparallel zur Gravitationsfeldstärke g ergeben). Änderung von n durch Umladung der Tröpfchen mittels Bestrahlung mit Röntgen- bzw. J -Strahlung erfordert für die Schwebezustände die Feldstärken bzw. Spannungen
n2 n1
n1 'n n1
U1 U2
o
'n n1
'U . U2
(15.77)
15 Elektrostatik
353
Aus den Werten von 'U können die diskreten Werte von 'n bestimmt werden. Das kleinste gemeinsame Vielfache ist 'n 1 . Damit folgt der Wert für n1 und aus obiger Gl. (15.76) die Elementarladung e zu
e = 1,60217733(45) As.
15.8.2 Ablenkung von Ladungsträgern im elektrischen Feld Wir untersuchen jetzt die Ablenkung von geladenen Teilchen durch ein homogenes elektrisches Feld. Dieser d Fall findet Anwendung z. B. in Oszillosv = v 0x kopen und Massenspektrometern. Die x Ez a Versuchsanordnung zeigt Abb. 15.23. Geladene Teilchen mögen so in ein hol mogenes elektrisches Feld eingeschossen werden, dass der anfängliche Geschwindigkeitsvektor senkrecht zu den Abb. 15.23: Ablenkung geladener TeilFeldlinien weist. Die Kraft auf die Teilchen im homogenen elektrischen Feld chen ist während des Durchfluges konstant. Der Fall entspricht dem horizontalen Wurf eines Massenpunktes in einem Gravitationsfeld (Kap. 1.2.2.1.1). Die Bahnkurve des Teilchens im elektrischen Feld Ez, so erhalten wir für die Ablenkung ' z
'z ( x)
1 2 at 2
2
QE § x · ¨ ¸ . 2m © v 0 x ¹
(15.78)
Die Geschwindigkeit lässt sich ausdrücken durch die Beschleunigungsspannung U, die das Teilchen vor Eintritt in das transversale elektrische Feld durchlaufen hat,
vx
2QU . m
(15.79)
Setzen wir vx0 in (15.78) ein, so ergibt sich für die Ablenkung am Ende des Kondensators
'z (l )
El 2 . 4U
(15.80)
354
15 Elektrostatik
Der Ablenkungswinkel folgt mit (15.78) aus
tan D
§ dz · ¨ ¸ © dx ¹ x
L
QE l m v 2x
El . 2U
(15.81)
Die Ablenkung im Abstand d vom hinteren Ende des Plattenkondensators wird
'z (l d )
El 2 d tan D , 4U El § l · ¨ d ¸. 2U © 2 ¹
(15.82)
15.8.3 Kontaktspannung Wir haben bereits in Kap. 15.1 festgestellt, dass bei enger Berührung zweier Nichtleiter U/V Metall U / V Metall und anschließender Trennung der beiden Körper, z.B. eines Glasstabes und eines - 2,96 Li - 0,28 Co Seidentuches, sich diese elektrisch aufladen. - 2.92 K - 0,23 Ni Elektronen gehen von einem zum anderen - 2,76 Ca - 0,16 Sn Körper über, da ihre Bindungsfestigkeit in - 2,71 Na - 0.12 Pb ihnen unterschiedlich ist. Auf Grund der - 2,34 Mg 0,00 H2 Ladungstrennung entsteht eine Potential- 1,33 Al +0,35 Cu differenz, die Kontaktspannung genannt - 1,11 Mn +0,79 Ag wird. Auch wenn zwei Metallflächen eng - 0,76 Zn +0,85 Hg aneinander gebracht werden, entsteht eine - 0,51 Cr +1,36 Au derartige Kontaktspannung durch den unter- 0,44 Fe +1,60 Pt schiedlich starken Übertritt von Elektronen - 0,40 Cd zwischen den beiden Metallen. Elektronen in einem Metall können wir eine charakteristische Austrittsarbeit zuordnen. Darunter Tab. 15.3: Kontaktspannungen von Meverstehen wir die Energie, die zur Loslösung tallen bei t = 25°C eines Elektrons aus dem Metall in das Vakuum erforderlich ist. Die verschiedenen Stoffe lassen sich nach ihrem Kontaktpotential in eine Spannungsreihe nach zunehmender Austrittsarbeit anordnen (Abb. 15.24 und Tab. 15.3). In einer solchen Reihe lädt sich ein Metall beim Kontakt mit einem vor ihm stehenden Metall negativ, mit einem nach ihm stehenden Metall positiv auf. Als Bezugselektrode dient die Wasserstoff-Elektrode. Sie besteht aus einer mit Platinmohr überzogenen Elektrode, die von molekularem Wasserstoff umspült wird und in eine 1-molare Säure taucht. Die Kontaktspannungen liegen bei ca. 1Volt. Trotzdem können nach Trennung der Ladungen bei Isolatoren Spannungen bis zu 105 V entstehen. Das
15 Elektrostatik
355
liegt daran, dass die Oberflächen der beiden Körper sehr glatt sind und daher sehr nahe zueinander gebracht werden können. Beim Trennen der Stoffe bleiben die Ladungen erhalten; die Kapazität des gebildeten Kondensators nimmt um mehrere Größenordnungen ab und die Spannungen vergrößern sich entsprechend. Anders dagegen bei U (V) 1 Metallen; infolge der leichten Verschiebbarkeit der Ladungen tritt beim Trennvorgang ein teilweiser Ladungsausgleich ein. Er kommt erst zum Stillstand, wenn die letzte Verbindung zwischen den Platten abreißt. Ihr mittlerer Abstand ist dann bereits um Zehnerpotenzen größer. Beim weiteren Auseinanderziehen 0 Ag Cu H2 Pb Sn NiCo Cd Fe Cr Zn Mn nimmt die Kapazität daher lediglich 2 um etwa einen Faktor 10 ab und die Trennspannung nur um diesen Wert zu.
-0,7
Abb. 15.24: Kontaktspannungen von Metallen
15.8.4 Hohe Spannungen: Teilchenbeschleuniger und Gewitterentstehung Den Bandgenerator haben wir bereits in Kap. 15.5.1 als ein Gerät kennen gelernt, mit dem hohe Spannungen bis zu etwa 10 MV erzeugt werden können. Er findet Anwendung in der Kernphysik, wo er als Spannungsquelle für Niederenergie-Beschleuniger weit verbreitet ist. Ladungstrennung spielt auch bei der Entstehung von Gewittern eine wichtige Rolle. Auf Grund der negativen Ladung der Erde existiert in der unteren Atmosphäre ein elektrisches Feld. Dadurch entstehen in Wassertropfen und Eispartikeln induzierte Dipolmomente (Abb. 15.26), deren positive Ladung sich im unteren Teil befindet. Die kleineren Teilchen werden durch die starke Vertikalströmung der Luft nach oben getragen. Da deswegen auf ihrer Vorderseite mehr Stöße mit Ionen stattfinden als auf ihrer Rückseite, laden sie sich insgesamt positiv auf. Die größeren Partikel fallen infolge ihres Gewichtes nach unten; sie tragen daher insgesamt eine negative Ladung. Durch die so eintretende Ladungstrennung sind die entstehenden Wolken in ihrem oberen Teil positiv, in ihrem unteren Bereich negativ geladen. Bei hinreichender Feldstärke innerhalb der Wolke bzw. zwischen Wolke und Erde erfolgt ein Durchschlag in Form eines Blitzes. Dabei ist zu beachten, dass sich die Erdoberfläche unterhalb einer geladenen Wolke durch Influenz positiv auflädt.
356
15 Elektrostatik
__ r v
gereinigtes Gas
r v
Gas und Staub
StaubBehälter Abb. 15.25: Zur Entstehung von Gewittern
Abb. 15.26: Elektrischer Staubabscheider
15.8.5 Elektrostatische Staubabscheider Unter Staub verstehen wir feste Teilchen, die nach ihrer Größe in Grob- und Feinstäube unterteilt werden. Grobstäube mit einem Durchmesser von über 10 µm verbleiben nur kurze Zeit in der Luft und sinken dann als Staubniederschlag zu Boden. Feinstäube mit einem Durchmesser von weniger als 5 µm bleiben in der Atmosphäre, bis sie die Größe von Grobstaub erreicht haben. Ihre Verweildauer beträgt etwa 14 Tage, in denen sie aber durch Windströmungen weit von ihrem Entstehungsort weggeblasen werden können. In Industrieanlagen entstehen beim Fabrikationsprozess zum Teil erhebliche Staubmengen. Es liegt auf der Hand, dass Staub möglichst quantitativ vermieden oder, wenn das nicht möglich ist, nachträglich entfernt werden muss. Eine Möglichkeit der Abscheidung bilden Elektrofilter. Ihre Wirkungsweise beruht auf der Ionisierung der Staubteilchen in einer Gasentladung. Eine solche wird in einem elektrischen Feld zwischen einer geladenen ringförmigen Metallplatte am Rand des Abgaskamins und einem gegensinnig geladenen Draht in seiner Mitte erzeugt (Abb. 15.26). Die meist negativ geladenen Partikel werden nach außen abgelenkt und auf der äußeren Elektrode abgeschieden. Von Zeit zu Zeit wird der Staub von dort mechanisch entfernt. Vor allem Kohlekraftwerke sind mit elektrostatischen Staubabscheidern ausgestattet.
15 Elektrostatik
357
15.8.6 Xerografie Die Xerografie ist ein Trockendruckverfahren (Xero heißt trocken), das schnelles Kopieren einer Vorlage ermöglicht. Der Kopierer besteht aus einer drehbaren Trommel aus Metall, die mit Selen (einem Halbleiter) beschichtet ist (Abb. 15.27). Sie wird zunächst im Dunkeln elektrostatisch aufgeladen. Die zu kopierende Vorlage wird durch eine geeignete Optik auf die Trommel abgebildet. Bei der Belichtung wird ein Teil der Ladung freigesetzt, wobei die Zahl der (durch Fotoeffekt) abgelösten Elektronen proToner portional zur einfallenden Lichtintensität ist. Das unsichtbare „Ladungs“-Bild wird sichtbar gemacht, indem entgegengesetzt aufgeladenes feines Tonerpulver Abstreifer Selenin Richtung der Trommel beschleunigt Schicht wird, wo es sich entsprechend dem lokalen Ladungszustand der Trommel abPapier setzt. Anschließend wird ein Blatt Papier oder eine Folie auf den Zylinder gepresst, wodurch der Toner auf den TräErhitzer ger übertragen wird. Durch Wärmeeinwirkung wird der Toner schließlich in Abb. 15.27: Prinzip des Xerox-Verfahrens den Träger eingebrannt, so dass eine zur Vervielfältigung einer Vorlage haltbare Kopie entsteht. Nach Reinigung tannenbaum der Trommel kann die nächste Seite kopiert werden. Das Verfahren wurde bereits 1935 von Ch. Carlson erfunden. Ein Farbkopierer arbeitet im Prinzip genau so. Statt des schwarzen Toners werden drei Toner in den Farben blau, gelb und rot verwendet.
Ergänzung 1: Multipolentwicklung in kartesischen Koordinaten G Das Potential einer beliebigen Ladungsverteilung U (r ) lässt sich durch eine Entwicklung in eine Taylorreihe gewinnen. Sie wird umso genauer, desto kleiner das Verhältnis r/R ist, d. h. desto größer der Abstand R vom Ladungsschwerpunkt, bezogen auf die Ausdehnung der Ladungsverteilung, ist. Das Potential einer Anordnung von k Punktladungen ist entsprechend (15.32) geben durch (Abb. 15A1.1)
G
M ( R)
1 4SH 0
k
Qk
¦ RG rG 1
k
(15A1.1a)
358
15 Elektrostatik
Bei kontinuierlicher Verteilung der Ladungen wird daraus nach (15.15)
z Qk r rk
r r R - rk
y
0
G
r P (R)
Rk
x
M ( R)
Abb. 15A.1.1: Zur Multipolentwicklung des Potentials
1
4SH 0 V³
G G G . Rr
U (r )d 3 r
(15A1.1b)
G G Für eine gegebene Funktion f (r c) lautet die Taylorreihe um die Stelle r c
f ( x1c, x2c , x3c )
3
f (0,0,0) ¦ 1
0 herum
3 wf (0,0,0) wf 2 (0,0,0) x1c ¦ x1cxlc ... wxkc wxkc wxlc 1
(15A1.2)
n
1 w ½ ®¦ xk ¾ f ( x1c, x2c , x3c ) x1c ¦ wxk ¿ n 0 n! ¯ k f
x2c x3c 0
Im vorliegenden Fall lautet die zu entwickelnde Funktion entsprechend (15A1.1a,b)
G f (r )
f ( x1 , x2 , x3 )
1 G G Rr
1 1/ 2
^( X1 x1 ) ( X 2 x2 )2 ( X 3 x3 )2 ` 2
(15A1.3)
Kürzen wir den Ausdruck in der geschweiften Klammer mit Nen ab, so erhalten wir für die Ableitungen
G wf (r ) wxk rG
0
X k xk ® 3/ 2 G ¯ Nen r
Xk 0
X
2 1
X 22 X
2 3/ 2 3
Xk R3
(15A1.4)
15 Elektrostatik
G w 2 f (r ) wxk wxl rG
359
3 X k xk X l xl G kl ½ ® ¾ 5/ 2 Nen Nen3/ 2 ¿ rG ¯
0
0
(15A1.5)
2
3 X k X l R G kl . R5 Damit ergibt sich das Potential im Fall diskreter Punktladungen zu
G
1 1 N 1 N 3 ® ¦ Qn 3 ¦¦ Qn xnk X k 4SH 0 ¯ R n 1 R n1k 1
M ( R)
½ 1 N 3 Qn 3 X k X l R 2G kl xnk xnl ...¾ 5 ¦¦ 5 R n 1 k ,l 1 2 R ¿
(15A1.6)
3 N ½ Qn 3 X k X l R 2G kl 1 1 N 1 N G G Q R p xnk xnl ..¾ ® ¦ n ¦ ¦ n 3 ¦ 5 4SH 0 ¯ R n 1 R n1 R n 1 k ,l 1 2 ¿
G
M ( R)
(15A1.7) Der dritte Term kann noch vereinfacht werden.
Qn 3 X k X l R 2G kl xnk xnl ¦ ¦ R5 n 1 k ,l 1 2 N
3
1 N 3 3 X k X l R 2G kl Qn 3 xnk xnl rn2G kl ¦ ¦ 5 3! n 1 k ,l 1 R
(15A1.8)
1 N 3 3 X k X l R 2G kl Qn rn2G kl ¦¦ 3! n 1 k ,l 1 R5
Der zweite Term der rechten Seite verschwindet, denn 3
¦ 3X
k
k ,l 1
X l R 2G kl
3
¦ 3X k 1
2 k
R 2 3R 2 3R 2
0.
(15A1.9)
Im ersten Term führen wir die Abkürzung
Qkl
N
¦ Q 3x n
n 1
nk
xnl rn2G kl
ein. Die Terme Qkl stellen die Komponenten eines symmetrischen Tensors dar, der als Quadrupoltensor bezeichnet wird. Damit folgt der dritte Term in (15A1.7) zu
360
15 Elektrostatik
G
M ( R)
1 1 N 1 N G G 1 ® ¦ Qn 3 ¦ R pn 5 R n1 R 4SH 0 ¯ R n 1
3
½ Qkl 3 X k X l R 2G kl ...¾ (15A.10) 1 6 ¿
¦
k ,l
Da N
¦ Q ^3 x
Q11 Q22 Q33
n
n 1
2 1n
x22n x32n 3rn 2
`
0,
(15A1.11)
ergibt sich schließlich
G
M ( R)
1 1 N 1 N G G 1 ® ¦ Qn 3 ¦ R pn 5 R n1 R 4SH 0 ¯ R n 1
3
½ Qkl X k X l ...¾ 1 2 ¿
¦
k ,l
(15A1.12)
Schreiben wir im Quadrupolterm die Summe aus und führen statt der Xi die Größen X,Y,Z ein, so wird dieser zu
MQuad
1 8SH 0 R 5
^Q
xx
X 2 QyyY 2 Qzz Z 2
(15A1.13)
`
2 Qxy XY Qxz XZ QyzYZ , mit dem Quadrupoltensor
QQuad
§ Qxx ¨ ¨ Qyx ¨ Qzx ©
+Q r p1
Qzy
Qxz · ¸ Qyz ¸ Qzz ¸¹
-Q r r p 2= - p1
0 -Q
Qxy Qyy
r p2
+Q
Abb. 15A.1.2: Elektrischer Quadrupol
Der erste Term in (15A1.13) stellt das Potential dar, das von der im Ursprung konzentrierten Gesamtladung G am Ort P( R) herrührt. Der zweite Term ist der so genannte Dipolterm. Er hängt als Vektorgröße von der relativen Orientierung jedes Dipols bezüglich des G Abstandsvektors R ab. Bei neutralen Molekülen wie KCl ist er der führende Term der Multipolentwicklung. Das Quadrupolmoment ist ein Maß für die Abweichung der Ladungsverteilung von der Kugelsymmetrie. Es lässt sich aus zwei antiparallel angeordneten gleichen Dipolen zusammensetzen (Abb. 15A1.2).
15 Elektrostatik
361
Ergänzung 2: Lokales elektrisches Feld In einem dielektrischen Festkörper setzt sich das elektrische Feld am Ort eines Atoms aus dem äußeren Feld Eext und dem von den Dipolmomenten aller Atome des Mediums mit Ausnahme des betreffenden Atoms Eprobe zusammen.
G Elokal
G G Eext E probe .
(15A2.1)
Wir wollen eine ellipsoidförmige Probe ins Auge fassen, für die sich Eprobe berechnen lässt (Abb. 15A2.1). Die ebene Platte parallel oder senkrecht zur Richtung von Eext und eine kugelförmige Probe sind Spezialfälle eines Ellipsoids. Zur weiteren Behandlung denken wir uns die Materie innerhalb einer Kugel um das Probenatom herausgeschnitten.
G E probe
G G Eaußerh. Kugel Einnerh. Kugel .
(15A2.2)
Den Radius der Kugel rKug wählen wir so groß, dass die Dipole außerhalb der Kugel als kontinuierliches Dielektrikum mit der Polarisierung Pn angesehen werden können. Dabei kann er klein gegenüber der G Wellenlänge des Lichts gewählt werden, so dass Pn als konstant gelten kann. Die Ladungen auf der Oberfläche des Ellipsoids ergeben das sog. G Entelektrisierungsfeld EEnt . Für ein Ellipsoid berechnet es sich zu
G EE nt
1
H0
G N E nt Pn
+ + +
+ +
r EL
r EN
Abb. 15A2.1: Zur Ableitung des lokalen Feldes
(15A2.3)
NEnt ist der Entelektrisierungsfaktor (vgl. Aufgabe 11). Zusammen mit dem äußeren Feld wird G es meistens zum makroskopischen Feld E zusammengefasst.
G E
G G Eext EL .
(15A2.4)
Das Feld, das von den Ladungen auf der Oberfläche der Hohlkugel herrührt, heißt Lorentzfeld. Es hat die Größe
G EL
1 G Pn . 3H 0
(15A2.5)
Dieser Wert ergibt sich aus (15A2.3) mit NEnt = 1/3, denn die Ladungsdichte auf der Oberfläche der Hohlkugel ist dem Betrage nach identisch mit derjenigen der Ellipsoid-Oberfläche. Es
362
15 Elektrostatik
bleibt noch das Feld zu ermitteln, das am Ort des herausgegriffenen Atoms von den elektrischen Dipole im Inneren der Kugel herrührt. Es hängt als Einziges von der räumlichen G Anordnung der Atome ab. Das Feld eines punktförmigen Dipols im Abstand r ist
G G E (r )
GG G G 3( pr )r r 2 p . 4SH 0 r 5
(15.135b)
Durch Summation über alle Atome innerhalb der Kugel lassen sich die Komponenten von G G EIn berechnen. Für ein kubisch primitives Gitter ist EIn 0 , ebenfalls für mehrere andere Strukturen und für amorphe Dielektrika. In einem solchen Fall ergibt sich also das lokale Feld zu
G Elokal
G G 1 1 G Eext N Ent Pn Pn . 3H 0 H0
(15A2.6)
Für eine kugelförmige Probe wird dies
G Elokal
G 1 G 1 G Eext Pn Pn 3H 0 3H 0
G Eext ,
(15A2.7)
für eine dünne Platte senkrecht zum elektrischen Feld
G Elokal
G 1 G 1 G Eext Pn Pn 3H 0 H0
G 2 G Eext Pn 3H 0
und für eine solche mit der Plattenebene parallel zum Feld
G Elokal
G 1 G Eext Pn 3H 0
(15A2.8)
15 Elektrostatik
363
Zusammenfassung x
Die Kraft zwischen zwei Punktladungen q1 und q2 im Abstand r voneinander im Vakuum ist durch das Coulombgesetz gegeben,
G F
1 q1 q2 rˆ . 4SH 0 r 2
x
G G Das elektrische Feld E (r ) ist definiert als die Kraft auf eine positive ProbeG G G G ladung q. Es gilt F (r ) qE (r ) .
x
G Der elektrische Fluss ) el durch eine Fläche A ist definiert als ) el
G G
³ E dA .
Das
elektrische Feld ist ein konservatives Kraftfeld, d.h. es ist unabhängig vom Weg. Die Arbeit, um eine Ladung q entgegen dem elektrischen Feld von P1 nach P zu verschieben, ist also P
W
G G F ³ dr
P1
x
P
G G q ³ Edr
E pot ( P ) .
P1
Das elektrische Potential ist definiert als Quotient aus potentieller Energie Epot und Ladung q: M (r ) E pot / q . Die Potentialdifferenz zwischen zwei Punkten M (P) und M (P1) wird als elektrische Spannung bezeichnet. P G G U : M ( P ) M ( P1 ) : ³ Edr . P1
x x
x
Bei bekannter Ladungsverteilung lässt sich das Potential aus der Poissongleichung G Qd , wobei d vom positiven zum G G G negativen Pol gerichtet ist. Im homogenen Feld existiert ein Drehmoment D ( p u E ) , G G im inhomogenen Feld wirkt auch eine Kraft F grad E . G Ein elektrischer Dipol besitzt das Dipolmoment p
Die Kapazität einer Leiteranordnung ist definiert als C = Q/U. Bei Parallelschaltung von Kondensatoren addieren sich die Einzelkapazitäten, bei Hintereinanderschaltung die reziproken Kapazitäten.
364 x
15 Elektrostatik In einem Dielektrikum werden durch Verschiebung der Ladungen Dipolmomente induziert, die zu einer makroskopischen Polarisation P führen. Bei N Atomen oder Molekülen beträgt diese
G NQd
G P
G ND Ediel
G
H 0 F el Ediel .
Der Faktor D heißt Polarisierbarkeit, F el die Suszeptibilität. x
Die Energiedichte des elektrischen Feldes ist gegeben durch
w el
HH 0 E 2 / 2
wobei H die Dielektrizitätskonstante des Mediums ist. x
Die Eigenschaften des elektrischen Feldes werden charakterisiert durch die Feldgleichungen
G §G P v³A ¨© E H 0 G G
v³ Edr
0
· G 1 U dV ¸ dA H 0 V³ ¹ bzw.
G rot E
bzw.
G §G P· di v¨ E ¸ H0 ¹ ©
0 . Im Vakuum ist
G P
U ; H0 0.
Übungsaufgaben 1. Zwei Kugeln der Massen m sind in einem Punkt an Fäden der Länge l aufgehängt. Im Aufhängepunkt befindet sich eine dritte Kugel. Alle Kugeln tragen die gleiche Ladung. Berechnen Sie die Ladung der Kugeln, wenn die Fäden in der Gleichgewichtslage miteinander den Winkel D bilden. Wie groß ist die Zugkraft, die auf die Fäden wirkt? 2. Vier gleiche Ladungen q befinden sich in den Ecken eines Quadrates. Welche Ladung qx des entgegengesetzten Vorzeichens muss in der Mitte des Quadrates angebracht werden, damit sich das gesamte Ladungssystem im Gleichgewicht befindet? 3. Zwei sich unter 90° schneidende unendlich ausgedehnte Platten seien homogen geladen. a) Berechnen Sie die Komponenten des elektrischen Feldes E = E (Ex, Ey, Ez) in den vier Quadranten. b) Skizzieren Sie den Verlauf der Feldlinien.
15 Elektrostatik
365
3 x 2 V/m 2 . Berechnen Sie das zughörige G elektrische Feld in den drei Raumrichtungen. Bilden Sie das Volumintegral von di v E im Gebiet eines Würfels mit der Kantenlänge 2a und dem Mittelpunkt im Ursprung des Koordinatensystems. Ermitteln Sie durch einen geeigneten Grenzübergang die Ladung, die sich auf der xy-Fläche bei x = 0 innerhalb des Quadrates (Seitenlänge 2a) befindet. Welche Energie muss aufgebracht werden, um ein Elektron einmal entlang eines Quadrates in der xy-Ebene herum zu bewegen (Kantenlänge = 1 m). Was bedeutet in diesem Zusammenhang die Größe G rot E ?
4. Gegeben ist das elektrische Potential M ( x, y, z )
5. Gegeben seien zwei Punktladungen +q und –q, die auf der z-Achse im Abstand d symmetrisch zum Koordinatenursprung angeordnet sein mögen. G G a) Geben Sie das Potential M (r) eines solchen Dipols im Punkt r ( x, y, z ) an. b) Berechnen Sie Potential und Feld für den Fall r >> d an. Skizzieren Sie den Verlauf der Feldlinien und Äquipotentialflächen des Dipols. 6.a) Auf der x-Achse eines kartesischen Koordinatensystems befinden sich symmetrisch zum Nullpunkt im Abstand d zwei Punktladungen q. Eine weitere Ladung, -2q, ist im Nullpunkt angebracht. b) Insgesamt vier Punktladungen befinden sich in der xy-Ebene bei z = 0 im Abstand b vom Nullpunkt. Die Ladungen auf der x-Achse seien positiv, die auf der y-Achse negativ. Berechnen Sie das Quadrupolmoment der Anordnungen. 7. Um die Spannungsdifferenz U zwischen zwei geladenen Kondensatorplatten zu bestimmen, wird mit einer Spannungswaage die Kraft gemessen, mit der sich die Platten anziehen. Wie lautet der Zusammenhang zwischen Kraft und Spannung? 8. Mit welcher Kraft ziehen sich zwei geladene Metallplatten der Seitenlänge a = 2 mm an, wenn der Plattenabstand l= 1,5 mm und die Potentialdifferenz U = 220 V beträgt? Wie ändert sich die Kraft, wenn der Zwischenraum mit einem Dielektrikum der DK H ausgefüllt wird. Wie groß ist die Ladung auf den Platten mit und ohne Dielektrikum, wenn die Spannung konstant gehalten wird? 9. Gegeben sei eine lineare Kette von regelmäßig angeordneten Ionen mit alternierendem Vorzeichen der elektrischen Ladungen. Wie groß ist die potentielle Energie pro Ion? 10. Zwei gleich stark negativ geladene Metallkugeln der Radien R1 und R2, die sich in großem Abstand r >> R1, R2 voneinander befinden, werden durch einen dünnen leitenden Draht miteinander verbunden. Wie groß sind die Potentiale vor der Verbindung und welche stellen sich danach ein?
366
15 Elektrostatik
11. Wird ein dielektrischer elliptisch geformter Körper in ein elektrisches Feld gebracht, so wird er homogen polarisiert. Aufgrund der Polarisation entsteht in der Probe ein dem äußeren G G Feld entgegenwirkendes homogenes Entelektrisierungsfeld Eent NP / H 0 . Der Entelektrisierungsfaktor ist ein Tensor 2. Stufe, der auf Diagonalform gebracht werden kann. Berechnen Sie die drei Komponenten des Tensors für den Fall einer Kugel, eines langen Stabes und einer Scheibe. 12. Innenleiter und Abschirmmantel (Außenleiter, R = 5 mm) eines 100 m langen Koaxialkabels (Hr = 4) werden mit den beiden Enden eines Plattenkondensators der Kapazität C = 0,5 nF verbunden. Wie groß ist die Gesamtkapazität der Parallelschaltung, wenn der Abstand zwischen Innenleiter und Abschirmung 1 mm beträgt? Welche elektrische Energie ist in der Anordnung gespeichert, wenn an sie eine Spannung von 200 V gelegt wird? 13. Berechnen Sie die Gesamtkapazität nebenstehender Kondensatorschaltung; (C1 = 2µF, C2 = 5µF).
C2 C1
C1 C2 C2
C2 C1
14. Das permanente elektrische Dipolmoment eines Wassermoleküls beträgt p = 6,22 10-30 Cm. Wie groß ist die Kraft zwischen einem H2O-Molekül und einem Na+-Ion, das sich im Abstand von 1,2 nm befindet? 15. An einem neutralen He-Atom (Polarisierbarkeit D = 0,2 10-24 cm3) fliegt im Abstand von 2.5 nm ein Elektron mit einer Geschwindigkeit v << c vorbei. Wie groß ist das anziehende elektrische Feld am Ort des Elektrons?
16
Elektrischer Strom
16.1
Stationärer elektrischer Strom
Unter dem elektrischen Strom verstehen wir eine gerichtete Bewegung elektrischer Ladungen.
I:
dQ . dt
(16.1)
Die Einheit der Stromstärke ist das Ampere (A). Es ist festgelegt durch die mit Strömen einhergehenden Kräfte. Wir kommen gleich darauf zurück. Es ist ferner nützlich, die Stromdichte einzuführen. Sie ist definiert als die Stromstärke, die durch eine senkrecht zur Stromrichtung liegende Fläche fließt (Abb. 16.1).
I
³
A
G G j dA .
(16.2)
Die den Strom tragenden Ladungsträger sind je nach Material hauptsächlich Elektronen und Ionen. Das wird weiter unten näher ausgeführt. Die Stromstärke drücken wir aus durch die GeschwinG digkeit v der Ladungsträger, ihre Ladung q und ihre Anzahldichte n.
I
GG nqAv
G j
bzw.
A r I
r dA r j
Abb. 16.1: Zur Definition der Stromdichte
G nq v .
(16.3)
Besteht der elektrische Strom aus der Bewegung positiver und negativer Ladungen wie etwa in Salzlösungen, so sind deren Anteile zu addieren.
j
n q v n q v .
(16.4)
Die physikalisch korrekte Stromrichtung negativer Ladungsträger ist die vom negativen zum positiven Pol der Spannungsquelle. Positive Ladungsträger bewegen sich in umgekehrter Richtung. Im Gegensatz dazu wird in der Elektrotechnik aus historischen Gründen die Richtung des elektrischen Stromes definiert als die Richtung positiver Ladungsträger, also vom positiven zum negativen Pol der Spannungsquelle. Wir leiten noch die Kontinuitätsgleichung her. Eine solche ist uns schon bei inkompressiblen Flüssigkeitsströmungen begegnet (Kap. 10.4.4.2). Betrachten wir den elektrischen Strom durch eine geschlossene Oberfläche:
I
G G
v³ j dA A
dQ dt
d U dV , dt V³
wobei wir die Ladungsdichte entsprechend (Kap. 1.2.1) eingeführt haben.
(16.5)
368
16 Elektrischer Strom
Wandeln wir das Oberflächenintegral mit Hilfe des Gaußschen Satzes in ein Volumenintegral um,
G G
G
v³ jdA ³ divj dV , A
(16.6)
V
so ergibt sich durch Vergleich
G di v j
wU wt
(16.7)
Die zeitliche Abnahme der Ladung in einem Volumen ist gleich der Stromstärke durch die geschlossene Oberfläche dieses Volumens.
Durch den Stromfluss kann es nirgendwo im Leiter zu einer Ladungsanhäufung kommen, d.h. Ladungen können weder erzeugt noch vernichtet werden. Häufig wird obige Beziehung geschrieben als
G wU di v j wt
r dA
r j
Q = Ñò r dV V
16.2
(16.8)
und als Kontinuitätsgleichung bezeichnet. Ist die Ladungsdichte zeitlich konstant, so vereinfachen sich die Beziehungen (16.5) bzw. (16.8) zu
I Abb. 16.2: Zur Kontinuitätsgleichung strömender elektrischer Ladungen
0
G G v³ j dA 0 ,
bzw.
G div j
0
(16.9a,b)
A
Die Stromdichte ist quellenfrei.
Elektrischer Widerstand und Ohmsches Gesetz
Zwischen den Klemmen einer Spannungsquelle liege die Spannung U. Verbinden wir die Pole mit einem Leiter, so fließt ein elektrischer Strom. Wie groß ist die Stromstärke? Das hängt von den elektrischen Eigenschaften des Leiters ab. Zunächst zeigt sich, dass jedenfalls bei metallischen Leitern, die Stromstärke proportional der Spannung ist. Die Proportionalitäts-
16 Elektrischer Strom
369
konstante nennen wir den Ohmschen Widerstand des Leiters, der reziproke Wert heißt Leitwert.
U
R I .
(16.10a)
Der Ausdruck heißt Ohmsches Gesetz (Ohm, G. S. 1789-1854). Weitere Experimente ergeben für den Widerstand eines homogenen Leiters der Länge l und dem Querschnitt A
R
l . A
U
(16.11)
Die Größe U ist der spezifische Widerstand des Leiters. Die Dimension des elektrischen Widerstandes ist
> R@
ª U º 1V « I » 1A :1Ohm : . ¬ ¼
(16.11a)
Damit ergibt sich die Einheit des spezifischen Widerstandes mit (16.11) zu 1 ȍm . Die zu U reziproke Größe heißt elektrische Leitfähigkeit V ,
V
1
U
.
(16.12)
In Tab. 16.1 sind die spezifischen Widerstände einiger Materialien zusammengestellt.
Metall
U 0 /10 6 : m
D /103 K -1
4D / K
Ag Al Ba Bi Cu Hg Ni 0,4 Cu 0,5 Zn 0,1 (Konstantan) W
0,015 0,025 36 107 0,016 0,941 0,5
4,1 4,7 6,1 4,45 4,3 0,99 <0,1
210 419 133 120 335 69
0,05
4,8
380
Tab. 16.1: Spezifischer Widerstand U0, Temperaturkoeffizient D und Debye-Temperatur 4 D einiger Metalle
370
16 Elektrischer Strom
Drücken wir R in (16.10) durch (16.11) aus, so erhalten wir
U l
E
U A
jA ,
(16.10b)
oder nach j aufgelöst
G G j VE .
(16.10c)
G G Dabei haben wir vorausgesetzt, dass der Widerstand isotrop, d.h. dass j & E ist, Auch diese Formulierung heißt Ohmsches Gesetz.
16.3
Elektrische Leistung
Für die Arbeit, die benötigt wird, um eine Ladung entgegen einem elektrischen Feld zu verschieben, hatten wir gefunden
W
qU .
(15.22)
Sie wird in Joulesche Wärme umgewandelt. Die pro Zeiteinheit verrichtete Arbeit, also die Leistung, ist dann bei konstanter Spannung
P
dq U dt
o
P UI
I 2R
U2 . R
Die Leistung wird in Watt (W) angegeben (J. Watt, 1736-1819),
> P@
1V×1A=1W .
Damit folgt für die Einheit der Arbeit
>W @
1Ws .
(16.13)
16 Elektrischer Strom
16.4
371
Stromverzweigungen
16.4.1 Kirchhoffsche Regeln Elektrische Schaltungen bestehen im Allgemeinen aus einer Kombination von hintereinander und parallel Knoten Knoten geschalteten Bauelementen. Es treten Stromverzwei-I2 gungen und Knotenpunkte, in denen mehrere Leitungen zusammen laufen, auf (Abb. 16.3). Die Berechnung der -I3 Teilströme und -spannungen wird erleichtert durch die zwei Kirchhoffschen Regeln (G. R. Kirchhoff, 1824Abb. 16.3: Zur ersten Kirchhoff1887). Aus der Kontinuitätsgleichung folgt, dass an schen Regel einem Verzweigungspunkt (Knotenpunkt) ebenso viel Ladung abfließt wie zufließt. Werden die zufließenden Ströme positiv gezählt und die abfließenden negativ, so gilt, dass die Summe aller Ströme null wird.
¦I
0.
i
(16.14)
i
Das ist die 1. Kirchhoffsche Regel. Wir wenden uns nun Abb. 16.4 zu. Sie zeigt hintereinander geschaltete Bauelemente, in die wir auch die Spannungsquelle miteinbeziehen wollen. Die Schaltung bildet eine Masche. Nach der einen der elektrostatischen Feldgleichungen, die auch beim Vorhandensein stationärer Ströme angewendet werden kann (die Ladungsverteilung im Stromkreis ist zu jedem Zeitpunkt konstant),
G G
v³ Edr
0,
folgt, dass die Summe der Teilspannungen gleich null ist; die Generator-Spannung wird dabei negativ gerechnet.
¦U i
i
0 .
(16.15)
Masche _
+
Abb. 16.4: Zur zweiten Kirchhoffschen Regel
Das ist die 2. Kirchhoffsche Regel, die auch als Maschenregel bezeichnet wird.
372
16 Elektrischer Strom
16.4.2 Reihenschaltung von Widerständen Schalten wir mehrere Widerstände Ri in Reihe (Abb. 16.5), so folgt aus der Maschenregel UG
I
I ( R1 R2 ...Ri )
I ¦ Ri .
(16.16)
i
R2 Ri
R1
UG _
Der Quotient U/I G ist aber der Gesamtwiderstand Rges der Schaltung, so dass gilt
+
¦R .
Rges
Abb. 16.5: Reihenschaltung von Widerständen
(16.17)
i
i
Bei der Reihenschaltung von Widerständen ist der Gesamtwiderstand gleich der Summe der Einzelwiderstände.
16.4.3 Parallelschaltung von Widerständen Wir fassen nun eine Parallelschaltung von Widerständen ins Auge (Abb. 16.6). Es liegt also eine Stromverzweigung vor, so dass gilt
Ri,Ii
I ges
R2,I2 R1,I1
I
_
+
UG Abb. 16.6: Parallelschaltung von Widerständen
U Rges
U U U ... R1 R2 Ri
U¦ i
1 , Ri
(16.18)
Dabei haben wir die jeweilige Stromstärke ersetzt durch den Quotienten aus der anliegenden Spannung und dem jeweiligen Widerstand. Es gilt also
1 Rges
1
¦R i
.
(16.19)
i
Der Gesamtwiderstand ist also stets kleiner als der kleinste Einzelwiderstand. Bei der Parallelschaltung von Widerständen addieren sich die Kehrwerte der Einzelwiderstände.
16 Elektrischer Strom
16.5
373
Messung elektrischer Ströme
16.5.1 Strommessung Zur Messung elektrischer Ströme gibt es verschiedene Messgeräte. Die Ausnutzung der Längenänderung eines stromdurchflossenen Drahtes durch Erwärmung führt zu einem Hitzdraht-Instrument, die aber kaum noch eingesetzt werden, da sich die Länge proportional 'T P I 2 ändert. Außerdem sind solche Geräte wenig empfindlich. Ihr Messbereich beginnt bei etwa 0,1 A. Wesentlich empfindlicher sind Drehspulinstrumente, die auf der magnetischen Wirkung des Stromes beruhen. Wie in Kap. 17.2 gezeigt wird, übt ein Magnetfeld (erzeugt durch einen Permanentmagneten) auf eine vom Strom durchflossene Drahtschleife ein Drehmoment aus, das proportional zur Stromstärke ist. Die Drehung der S N Drahtschleife wird durch einen mit ihr verbundenen Zeiger auf eine Skala übertragen (Abb. 16.7). Ein geeichtes Strommessinstrument heißt Amperemeter; es wird in Reihe mit dem Abb. 16.7: Prinzip des Amperemeters Bauelement, das die Stromstärke bestimmt, geschaltet. Es ist weiter möglich, die elektrolytische Zersetzung molekularer Stoffe durch den elektrischen Strom zur Strommessung auszunutzen. Die pro Zeit an den Elektroden abgeschie-dene Stoffmenge ist proportional zur Stromstärke.
16.5.2 Spannungsmessung Zur Messung der Spannung einer Stromquelle oder des Spannungsabfalls an einem Verbraucher wird z. B. ein Drehspulinstrument mit einem hohen Vorwiderstand parallel zu Spannungsquelle oder Lastwiderstand geschaltet (Abb. 16.8). Bezeichnet Rv den Wert des Vorwiderstandes und Ri den Innenwiderstand des Messgerätes, so fließt durch Letzteres der Strom I = U/(Rv + Ri).
Da die beiden Widerstände bekannt sind, lässt sich das Strommessgerät direkt in Volt eichen. Damit der Strom im Schaltkreis möglichst wenig verfälscht wird, muss der Vorwiderstand hoch sein.
RV G RL _
RI,IG +
UG Abb. 16.8: Zur Messung der elektrischen Spannung
374
16 Elektrischer Strom
16.5.3 Widerstandsmessung Ein Widerstand R U / I kann im Prinzip durch eine Spannungs- und eine Strommessung ermittelt werden. Allerdings ist das Messverfahren nicht fehlerfrei, wie ein Blick auf Abb. 16.9 zeigt. Entweder wird der Strom korrekt ermittelt und die zugehörige Spannung verfälscht oder umgekehrt. Diese Fehler lassen sich mit einer Nullmethode vermeiden (Ch. Wheatstone, 1843). In der WheatU stoneschen Brückenschaltung wird der auszumessende Widerstand Rx mit drei anderen Widerständen, von I denen mindestens einer (R1) veränderlich sein muss, entsprechend Abb. 16.10 zusammengeschaltet. Zwischen den Punkten C und D liegt ein empfindliches Rx Strommessinstrument. Durch Variation von R1 lässt sich erreichen, dass die Brücke (Messinstrument) stromlos wird. Das ist der Fall, wenn die Potentiale bei C und D _ + gleich sind. Es muss dann also gelten
UG
Abb. 16.9: Zur Problematik der Widerstandsmessung
UAC = UAD
oder
R1 I1
Rx I 3 .
U CB
U DB ;
(16.20) (16.21)
Analog müssen wir fordern
Rx I D I4 R4 3
R2 I 2
(16.22)
R4 I 4 .
(16.23)
Bei abgeglichener Brücke (Stromlosigkeit der Brücke) ist
I C I
oder
I1 R 1 +
R2
I2
B
I1
I2
und
I3
I4 .
(16.24)
Ersetzung von I1 und I3 in (16.21) ergibt mit (16.23)
_
Abb. 16.10: Messung von Widerständen mittels einer Kompensationsschaltung (Wheatstonesche Brückenschaltung)
Rx
R4
R1 . R2
(16.25)
Die Spannung der Quelle ist unwichtig, denn sie ist in dieser Bestimmungsgleichung nicht enthalten.
16 Elektrischer Strom
16.6
375
Leitungsmechanismen in Festkörpern, Flüssigkeiten und Gasen
Bei der Besprechung der Elektrostatik haben wir zwischen elektrischen Leitern und Nichtleitern unterschieden. Gute Leiter sind Metalle, zu den Isolatoren gehören Gläser und viele Kunststoffe. Dazwischen rangieren die Halbleiter. Auch unter Flüssigkeiten gibt es gute und schlechte Leiter; wir wollen uns aber zunächst den „festen“ Körpern zuwenden. Dem allgemeinen Sprachgebrauch folgend, bezeichnen wir sie als Festkörper.
16.6.1 Elektrische Leitung in Metallen Ladungsträger in Metallen sind die Elektronen. Im Atom sind sie als negativ geladene Hülle an den positiv geladenen Atomkern gebunden. Im Metall müssen die Elektronen leicht beweglich sein, anders wäre deren gute elektrische Leitfähigkeit nicht zu erklären. Wenn das aber der Fall ist, sind sie nicht mehr an den einzelnen Atomen lokalisiert, sondern gehören dem ganzen Festkörper an: sie bilden ein Elektronengas, das sich ähnlich verhält wie die Atome eines Gases in einem abgeschlossenen Raum. Die Existenz des Elektronengases lässt sich nach Tolman (R. C. Tolman, 1881-1948) experimentell beweisen. Lassen wir nämlich einen flachen metallischer Zylinder schnell um seine Achse rotieren, so werden quasifreie Elektronen von deren Standpunkt aus durch die Zentrifugalkraft nach außen beschleunigt. Dadurch entsteht ein elektrisches Feld zwischen Mittelachse und Außenrand, das auf die Elektronen eine entgegengesetzt gerichtete Kraft ausübt. Elektronen sammeln sich so lange am Außenrand an, bis sich die beiden Kräfte die Waage halten. Es gilt dann
eE
mZ 2 R .
(16.26)
Der elektrischen Feldstärke entspricht eine Potentialdifferenz zwischen Achse und Außenrand, die gemessen werden kann, so dass sich daraus ein Wert für e/m ergibt. Dieser stimmt gut mit dem Wert überein, der aus der Ablenkung freier Elektronen durch äußere Felder folgt.
e 1,7588047(49) 1011 Askg 11 m
(16.27)
Weiter oben, (16.3), haben wir die Stromdichte geschrieben als
G j
G nq v o
G j
G G nev V E .
(16.28)
Nach dem Ohmschen Gesetz ist die Stromdichte proportional zur Feldstärke. Ist diese konstant, so muss auch die Geschwindigkeit konstant sein. Es ist daher zweckmäßig, für das Verhältnis dieser beiden Größen eine neue Größe einzuführen. Sie wird Beweglichkeit b genannt.
b:
v ; E
(16.29)
376
16 Elektrischer Strom
G G nebE V E ;
G j
neb .
V
(16.30) (16.31)
I
Die Leitfähigkeit hängt vom Produkt aus Ladungsträger-Dichte und Beweglichkeit ab. Die Größen n und b lassen sich aus der r Messung von V und der Hall-Spannung B bestimmen. Unter der Hall-Spannung (E. H. Hall, 1855-1938) verstehen wir die PotenAbb. 16.11: In einem transversalen magtialdifferenz, die auf Grund der Ladungsnetischen Gleichfeld tritt durch Ablenkung anhäufung auf den senkrecht zu den Stirnder Ladungsträger ein elektrisches Feld auf flächen liegenden Seiten eines Leiters durch (Halleffekt) ein Magnetfeld entsteht (Abb. 16.11). Die Methode wird ausführlich in Kap. 17.2.3 besprochen. Werte für n und b sind aus Tab. 16.2 zu ersehen. Die Ladungsträgerdichten für Metalle liegen, unabhängig von der Temperatur, zwischen 1022 und 1023 Elektronen, d.h. am Strom ist etwa ein Elektron pro Atom beteiligt. Diese hohen Anzahldichten führen mit dazu, dass die für Gase geltenden Gesetzmäßigkeiten nicht auf Metalle übertragen werden dürfen. Es bleibt zu verstehen, dass die Elektronengeschwindigkeit im Leiter bei angelegtem Feld G konstant ist. Nach der Newtonschen Bewegungsgleichung werden Ladungsträger im E -Feld beschleunigt. Also muss noch eine „Reibungskraft“ existieren, die ähnlich wie die auf eine Kugel in einer viskosen Flüssigkeit (Kap. 10.4.3.2) wirkende Reibungskraft proportional der Geschwindigkeit ist. Diese Kraft hat ihre Ursache in den Wechselwirkungen der Elektronen mit dem Kristallgitter,
Halbleiter
Eg eV
Ge
0,67
Si
1,12
Diamant InSb
5,47 0,16
GaAs
1,43
ni cm-3
bn bp -1 -1 2 m V s m V-1 s-1 2
0,39
0.19
11
0.15
0,06
0
1,0 10 1,5 1016
0,18 7,80
0,16 0,08
1,3 106
0,85
0,04
2,3 1013 1,8 10
Tab. 16.2: Energielücke Eg, Ladungsträgerkonzentration ni und -beweglichkeiten bn und bp einiger Halbleiter dem Kristallgitter, in dem sie sich bewegen. Es sind hauptsächlich zwei Prozesse. Zum einen werden Elektronen an den schwingenden Atomrümpfen gestreut und übertragen dabei einen Teil ihrer Energie auf diese. Dabei müssen wir daran denken (Kap. 9.1), dass die AtomSchwingungen infolge ihrer Wechselwirkung korreliert erfolgen. Die (quantisierten) Gitter-
16 Elektrischer Strom
377
schwingungen heißen Phononen. Dieser Teil der Wechselwirkung wird deshalb als ElektronPhonon-Streuung bezeichnet. Zum anderen beeinflusst die Streuung an elektrisch neutralen Störstellen, die in jedem Metallgitter vorhanden sind, die Geschwindigkeit der Elektronen. Es kann sich dabei um Gitterfehler oder um Fremdatome handeln. Nennen wir die Zeit zwischen zwei Stößen W , sie wird leicht missverständlich als Stoßzeit (oder auch als Relaxationszeit) G G bezeichnet, so gilt für die „Reibungskraft“ mit v { v D
G FR
G m v D / W ,
(16.32)
so dass die Kräftebilanz im elektrischen Feld lautet
G G eE mv D / W Hierin haben wir v D
0.
(16.33)
G 'v geschrieben, um zum Ausdruck zu bringen, dass vD die mittlere
zusätzliche Geschwindigkeit der Ladungsträger in Gegenwart eines elektrischen Feldes ist. Sie wird als Driftgeschwindigkeit bezeichnet, um sie von der Geschwindigkeit zu unterscheiden, welche die einzelnen Ladungsträger auf Grund ihrer thermischen Bewegung besitzen. Für die Geschwindigkeit der Elektronen im Metall folgt
G vD
G eE W m
G bE .
(16.34)
Führen wir diese Beziehung in (16.28) ein, so sehen wir, dass die Leitfähigkeit unabhängig von der Feldstärke ist. Das entspricht dem Ohmschen Gesetz.
V
ne 2W . m
(16.35)
Messen wir den spezifischen Widerstand eines metallischen Leiters bei verschiedenen Temperaturen, so finden wir bei tieferen Temperatu-ren eine Abhängigkeit ~ T 5 , bei höheren eine ~ T (Abb. 16.12. Der Übergang findet im Bereich der Debye-Temperatur statt. Diese ist ein Maß für die größten Energien der in einem Kristall vorkommenden Gitterschwingungen und hat demzufolge für jedes Material einen charakteristischen Wert. Wie aus Tab. 16.1 hervorgeht, liegen sie bei den meisten Substanzen bei Werten zwischen 100 und 500 K. Der erwähnte Zusammenhang des Widerstandes mit einer
r
~T
r0
~
5
T
T Abb. 16.12: Spezifischer Widerstand eines Metalls als Funktion der Temperatur
378
16 Elektrischer Strom
typischen Größe des schwingenden Kristallgitters lässt vermuten, dass die Temperaturabhängigkeit auf der mit T zunehmenden Anzahl eben dieser Gitterschwingungen (Phononen) beruht (Es werden zunehmend Gitterschwingungen mit höheren Frequenzen bzw. Energien angeregt). Die Theorie zeigt, dass dies zutrifft. Dagegen ist die Streuung an Gitterfehlern und Defekten temperaturunabhängig. Sie ist der Grund für den Restwiderstand eines Leiters, der sich bei Annäherung an den absoluten Nullpunkt einstellt.
16.6.2 Elektrische Leitung in Halbleitern Wie der Name sagt, ist die elektrische Leitfähigkeit von Halbleitern erheblich geringer als in Metallen. Beispielsweise beträgt sie bei Zimmertemperatur für Kupfer 6,5 107 ȍ -1m -1 , während der Wert für Germanium 2 ȍ -1m -1 ist. Weiter zeigt sich, dass die Temperaturabhängigkeit der Leitfähigkeit nicht wie bei Metallen einem 1/T-Gesetz gehorcht, sondern einem Exponentialgesetz
V
V 0e
'W 2 kT
,
(16.36)
Ein solches Verhalten deutet auf einen Aktivierungsprozess für die Ladungsträger hin. Die Größe 'W heißt thermische Aktivierungsenergie. Sie beträgt für Germanium 0,67 eV. Die äußeren Elektronen in einem Halbleiter sind viel stärker an den Atomrümpfen lokalisiert als in Metallen. Nur eine verhältnismäßig kleine Anzahl kann auf Grund ihrer thermischen Energie eine Bindung verlassen und dann zur Leitfähigkeit beitragen. Steigt die Temperatur, so nimmt die thermische Energie des Kristallverbandes zu und die Anzahldichte der Elektronen wächst nach (16.36) exponentiell an. Es ist aber noch ein zweiter Beitrag zur Leitfähigkeit zu berücksichtigen. Das aus einer aufgebrochenen Bindung stammende quasifreie Elektron hinterlässt nämlich eine Lücke. Wegen der Ladungsneutralität des Kristalls entspricht dieses einer positiven Ladung. Wir nennen sie ein positiv geladenes Loch, oder kurz, einfach ein Loch oder auch Defektelektron. Ein solches Loch (Abb. 16.13) kann sich im angelegten elektrischen Feld ebenfalls bewegen, indem von einem benachbarten Atom ein Elektron nachrückt usw. In einem Halbleiter ohne Fremdatome, wir nennen ihn intrinsischen Halbleiter, ist die Anzahldichte p der Löcher gleich der Anzahldichte n der Elektronen, denn er muss nach außen elektrisch neutral sein.
n
p
np
ni .
(16.37)
Wir sehen, dass auch der Löcherleitung die Bewegung von Elektronen zu Grunde liegt. Da aber die Anzahldichte der zur chemischen Bindung beitragenden Elektronen um viele Größenordnungen über denen der Löcher liegt, vereinfacht das Loch-Konzept die Beschreibungsweise von Halbleiter-Eigenschaften ganz wesentlich.
16 Elektrischer Strom
379
Wir schreiben deshalb die Leitfähigkeit
V
e(nbn pbp ) .
(16.38)
Durch Ausnutzung des Hall-Effektes lässt sich herausfinden, ob Elektronen- oder LöcherLeitung überwiegt. Durch Einsetzen der Beweglichkeiten entsprechend (16.34) ergibt sich
V
2 ne2W e pe W p . mn mp
(16.39)
Um die einzelnen Größen bestimmen zu können, müssen zusätzliche Messverfahren herangezogen werden.
Ge
Ge
Ge
Ge
Ge
Ge
Ge - Ge - Ge - Ge
Ge
Ge
Ge
As
Ge
Ge - Ge
Ge
-
Ge
Ge -
-
-
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ga
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
-
-
Ge
Ge
Ge
Ge
Ge
Abb. 16.13: Halbleiterkristall (Ge) mit einem positiven Loch Abb. 16.14a: Halbleiterkristall aus vierwertigem Ge mit einem dreiwertigen bzw. einem fünfwertigen Fremdatom Die große Bedeutung der Halbleiter liegt darin, dass ihre Leitfähigkeit durch Dotierung mit Fremdatomen in weiten Grenzen verändert werden kann. Wir unterscheiden zwei Typen von Störstellenleitung (Abb. 16.14a); werden etwa in Germanium 4-wertige Kristallatome durch 5-wertige Fremdatome, z. B. Phosphor- oder Arsen-Atome, ersetzt, so ist das zur Bindung nicht benötigte Elektron relativ frei beweglich und kann zum Ladungstransport beitragen. Solche Atome wirken also als Elektronenspender und heißen deshalb Donatoren. Werden dagegen 3-wertige Atome, wie etwa Gallium- oder Indium-Atome, substitutionell eingebaut, so fehlt ihnen ein Bindungs-Elektron; es entstehen positive Löcher, die im elektrischen Feld von
380
16 Elektrischer Strom
neutralen Nachbaratomen Elektronen aufnehmen können. Sie wirken demnach als ElektronenFänger und heißen deswegen Akzeptoren. Abb. 16.14b zeigt schematisch die Energieniveaus eines Halbleiterkristalls zusammen mit denen der Donatoren und Akzeptoren. Übersteigt infolge Dotierung die Anzahl der quasifreien Elektronen die der Löcher erheblich, so sprechen wir von n-Leitung, im umgekehrten Fall von p-Leitung.
E
Leitungsband
ED
Leitungsband
DonatorEg niveaus Akzeptorniveaus
Eg
Die Neutralitätsbedingung bei Störstellenleitung lautet
np
ni2 .
(16.40)
EA
0 Valenzband
Valenzband
Abb. 16.14b: Energieniveauschemata in dotierten Halbleitern
16.6.3 Elektrische Leitung in Supraleitern Es gibt viele Materialien, deren spezifischer Widerstand bei Abkühlung unter eine bestimmte Temperatur Tc sprunghaft verschwindet (Tab. 16.3). Der Effekt wurde zuerst 1911 von H. Kamerlingh Onnes (1853-1926) an Quecksilber gefunden. Ein solches Material stellt also einen perfekten Leiter dar. Zusätzlich besitzt ein Supraleiter aber noch eine andere Eigenschaft, Element TC/K Verbindung TC/K die wenige Monate später von W. Meissner (1882-1974) und R. Al 1,19 Al2CMO3 10,0 Ochsenfeld (geb. 1901) entdeckt 4,15 InNbSn 18,1 HgD wurde. Wird eine noch normalLa 6,0 AlGeNb3 20,7 leitende Probe in ein Magnetfeld Pb 7,19 gebracht, so durchsetzen die magNb 9,25 netischen Feldlinien (s. Kap. 3) den Körper ungestört. Wird dieser Tab. 16.3a: Sprungtemperatur TC einiger weiter abgekühlt, so werden am Typ I-Supraleiter Sprungpunkt die Feldlinien aus der Probe herausgedrängt. Wie wir in Kap. 17.4.2 sehen werden, entspricht dies dem Verhalten eines perfekten Diamagneten. Für einen hypothetischen perfekten Leiter ist ein solches Verhalten nicht zu erwarten. Die Supraleitung fand 1957 durch die BCS-Theorie ihre Erklärung. (J. Bardeen, 1908-; L.R. Cooper, geb. 1930; J.R. Schrieffer, geb. 1931). In diesem Modell wird davon ausgegangen, dass sich zwischen den Leitungselektronen eine anziehende Wechselwirkung ausbilden kann.
16 Elektrischer Strom
381
Dadurch kommt es zu einer Paarbildung der Elektronen mit entgegengesetztem Impuls; diese neuen Teilchen werden als Cooper-Paare bezeichnet. Cooper-Paare besitzen also den Gesamtimpuls null. Sie können daher keine kinetische Energie an das Gitter abgeben, vorausgesetzt, die Energie der angeregten Gitterschwingungen (Phononen) ist kleiner als die Bindungsenergie des Cooper-Paares. Da also für sie keine Streuprozesse möglich sind, können sie sich ungehindert durch das Gitter bewegen. Das heißt aber, dass der spezifische Widerstand null ist. Jahrzehnte lang lag die höchste Sprungtemperatur bei ca. 23 K. Da entdeckten 1986 J.G. Bednorz (geb. 1950) und K.A. Müller (geb. 1927) mit speziellen Oxid-Keramiken eine neue Klasse von Supraleitern, deren Sprungpunkt oberhalb der Temperatur des flüssigen Stickstoffs liegt (78 K). Die bis jetzt erreichte höchste Sprungtemperatur wurde für HgBa2Ca2Cu3O8 gemessen; sie beträgt 134 K. Leider ist die Bearbeitung des Materials schwierig. Ein wichtiges
Verbindung
TC/K Verbindung
TC/K
Yba2Cu3O7 Bi2Sr2Ca1Cu2O8 Bi2Sr2Ca2Cu3O10
92 90 120
110 127 134
Tl2Ba2Ca1Cu2O8 Tl2Ba2Ca2Cu3O10 HgBa2Ca2Cu3O8
Tab. 16.3b: Sprungtemperatur TC einiger Typ II-Supraleiter Anwendungsgebiet der Supraleitung liegt in der Herstellung starker Magnete (L16.1), neben dem Einsatz für wissenschaftliche Zwecke vor allem für Kernspintomografen. Die Entwicklung von Stromkabeln mit hoher Stromdichte hat in den letzten Jahren erhebliche Fortschritte gemacht (L16.2,3).
16.6.4 Ionenleitung in Flüssigkeiten Werden zwei Platinelektroden in Wasser getaucht, in dem heteropolare Moleküle gelöst sind, so fließt nach Anlegen einer Spannung ein elektrischer Strom (Abb. 16.15). Wir bezeichnen diesen Vorgang als Elektrolyse und die den Strom leitenden Flüssigkeiten als Elektrolyte. Im Gegensatz zu Metallen wird der Ladungstransport durch Ionen getragen. Ionen sind negativ oder positiv geladene Teilchen, in die ein Molekül im Lösungsmittel zum Teil dissoziiert. Wir wollen im Folgenden von Wasser als Lösungsmittel ausgehen. Wassermoleküle besitzen ein Dipolmoment. Beim Lösungsvorgang schieben sie sich zwischen die Ionen und trennen
+
_
I
Abb. 16.15: Stromleitung in einem Elektrolyten bei Anlegung einer äußeren Spannung
382
16 Elektrischer Strom
diese unter Energiegewinn. Jedes gelöste positive und negative Ion ist von einer Hülle von Wasser-Dipolmolekülen umgeben (Abb. 16.16). Dieser Vorgang heißt Hydratation. Durch die hohe Dielektrizitätskonstante des Wassers ( H = 81 werden die interionischen Kräfte um den Faktor 1/81 herabgesetzt (vgl. 15.12 und 15.63), was den Ionentransport begünstigt.
-
-
+ -
+
-
-
+
+
+
+ -
Bisher war von flüssigen Elektrolyten die Rede. Die heteropolaren Moleküle bestehen aus Säuren, Basen oder Salzen. Elektrolyse kommt aber auch bei Schmel_ zen oder manchen festen Stoffen vor, z.B. + + + + bei Silberhalogeniden. Bei der Elektrolyse wandern die negativen Ionen (die Kationen) zum positiven Pol (der Anode) der Spannungsquelle und die positiven Ionen (die Anionen) zum Abb. 16.16: Zur Entstehung der Hydration negativen Pol (der Kathode). Dort werden sie neutralisiert und scheiden sich in fester oder gasförmiger Form ab. Bezeichnen Z die Ladungszahlen, b die Beweglichkeiten und n die Anzahldichten, so schreibt sich die Stromdichte für verdünnte Lösungen + -
-
+
+
+ -
-
+
-
+ -
-
j j
+
+
j
e ( Z b n Z b n ) E ;
(16.41)
die Leitfähigkeit des Elektrolyten ist also
V
e ( Z b n Z b n ) .
(16.42)
Da die Gesamtladung eines Systems erhalten bleibt, sie ist hier null, gilt
Z n
Z n ,
(16.43)
und wir können (16.42) ersetzen durch
V
en Z (b b ) .
(16.44)
Für verdünnte Lösungen gilt also das Ohmsche Gesetz. Aus der gemessenen Leitfähigkeit kann die Summe der Beweglichkeiten ermittelt werden. Die getrennte Bestimmung der Beweglichkeiten benötigt noch eine weitere Beziehung zwischen ihnen. Dazu kann der mit dem Ladungstransport verknüpfte Masse-Transport dienen. Die Beweglichkeiten betragen etwa das 10-4-fache wie in Metallen. Für die bei der Elektrolyse abgeschiedene Stoffmenge gelten die Faradayschen Gesetze (M. Faraday, 1791-1867). Aus der Faraday-Konstanten und der Avogadro-Zahl lässt sich die Elementarladung bestimmen. Das Verfahren ist aber nicht sehr genau, bereits die 5. Stelle hinter dem Komma ist unsicher.
16 Elektrischer Strom
383
1. Die abgeschiedene Masse m ist der transportierten Ladung Q proportional.
m
AQ
mmol Q . ZF
F
NLe .
Hierin bedeuten F die Faraday-Konstante und NL die Avogadrosche Zahl, der Proportionalitätsfaktor A heißt elektrochemisches Äquivalent. 2. Die durch gleiche Ladungen Q abgeschiedenen Massen m verschiedener Elektrolyte verhalten sich wie die äquivalenten Massen. Die äquivalente Masse mA eines Stoffes ist die Atommasse ma oder die Molekülmasse mm dividiert durch die Wertigkeit Z des entsprechenden Ions.
m1 m2
16.6.5
mA 1 mA2
;.
(16.45)
Ladungstransport in Gasen, Gasentladungen
Betrachten wir einen Glaszylinder (Abb. 16.17), in den zwei Elektroden eingeschmolzen sind. I Der Zylinder möge mit Gas von etwa 102 Pa _ + gefüllt sein. Es besteht aus elektrisch neutralen Atomen, so dass nach Anlegung einer Spannung ein Strom zunächst nicht fließen kann. Erst wenn durch zusätzliche Maßnahmen Ladungsträger erzeugt werden, setzt ein Strom ein. Wir sprechen von einer unselbständigen Gasentladung. Ladungsträger können z.B. durch Heizen Abb. 16.17: Unselbständige Entladung; der Kathode oder durch Ionisation durch UVp | 102 Pa Strahlung bzw. J -Strahlung (hochenergetische elektromagnetische Strahlung) erzeugt werden. Abb. 16.18 zeigt die Strom-Spannungs-Charakteristik. Die Stromstärke steigt zunächst proportional zur Spannung, biegt dann ab und geht in einen nahezu konstanten Wert über. Bei weiterer Erhöhung der Spannung setzt bei einem kritischen Wert ein steiler Anstieg des Stromes an, um dann bei der Zündspannung UZ in eine selbständige Entladung überzugehen, bei der eine von außen vorgenommene Zufuhr von Ladungsträgern nicht mehr erforderlich ist, sondern der Strom sich selbst erhält. Dies geschieht im Wesentlichen durch ElektronenStoßionisation. Werden Elektronen soweit beschleunigt, dass ihre kinetische Energie die Ionisationsenergie der Atome/Moleküle ( 10 eV ) übersteigt, so können sie aus diesen ein
384
16 Elektrischer Strom
I
Elektron herausschlagen. Beim Stoß entsteht also ein positives Ion und ein zusätzliches Elektron.
Bogenentladung anomale Glimmentladung
e A o A e e .
(16.46)
Die beiden Elektronen können durch Stoßionisation weitere zwei Elektronen erzeugen usw. Es entsteht eine Ladungsträgerselbständige Lawine. Die Leuchterscheinungen kommen Entladung dadurch zustande, dass ein Teil der Atome nicht ionisiert werden, sondern Elektronen nur in energetisch höhere Zustände angeregt werden. Beim Zurückfallen in den Ausgangszustand (der Grundzustand heißt) wird diese Energie in Form von Strahlung Proportionalwieder freigesetzt. Deswegen wird die Bereich Entladung nach Zündung als Glimmentladung bezeichnet, während diejenige unRekombina- Sättigungsterhalb der Zündspannung Dunkelentlationsbereich Bereich dung heißt. Uk UZ U US Bei hohen Stromdichten setzt eine Bogenentladung ein. Es entsteht ein LichtAbb. 16.18: Strom-Spannungs-Charakteristik bogen wie etwa beim Elektro-Schweißen einer Gasentladung (Abb. 16.19). Eine kurze Bogenentladung, ist ein Funken. Die hohen Stromdichten werden durch einen höheren Gasdruck erreicht. Durch die große Anzahl WolframArgon stift von Ionen, die auf die Elektroden prallen, werden diese stark erwärmt. Es kommt zu einer Glühemission von Sekundärelektronen, welche die Stromstärke weiter erhöhen. Bei hohem Gasdruck und hohen Feldstärken entsteht eine Coronaentladung. Sie geht einher mit einem bläulichen Leuchten, das wir an Hochspannungsleitungen oder – vor Gewittern – als St. Elms-Feuer an Abb. 16.19: ElektroSchiffsmasten (Spitzenentladung) beobachten könschweißen mittels einen. Für die selbständige Entladung charakterisner Bogenentladung tisch ist eine (im Wesentlichen) fallende Kennlinie. Nach diesem Überblick wollen wir auf den Mechanismus der Stromleitung etwas näher eingehen. Wir betrachten zunächst die Kinetik der Ladungsträger. Wir gehen von einem Gas aus, dass ungefähr gleiche Teile positiver und negativer Ladungsträger (Elektronen und positive Ionen) besitzt.
normale
n | n
n.
(16.47)
16 Elektrischer Strom
385
Anders als bei den bisher besprochenen elektrischen Leitungsvorgängen sind Ionen nicht stabil, sondern können mit Teilchen entgegengesetzter Ladung rekombinieren, wobei neutrale Moleküle entstehen. Die Ladungsträgerdichte wird also bestimmt durch die Erzeugungsrate D (dn / dt )erz und die Vernichtungsrate E (dn / dt )vern . Diese ergibt sich wie folgt. Die mittlere freie Weglänge / eines positiven Ions der Geschwindigkeit v ist gegeben durch die Zeit tl, nach der es von einem negativen Ladungsträger mit einem Rekombinationsquerschnitt A eingefangen wird; es gilt
/
1 . An
(16.48)
Da es n+ positive Ionen gibt, ist die Einfang- oder Rekombinationsrate
n tl
Avn n : ßn n o .
(16.49)
Insgesamt erhalten wir für die zeitliche Änderung der Ladungsträgerdichte
dn D E n2 . dt
(16.50)
Im stationären Gleichgewicht (dn/dt = 0) gilt
nstat
D . E
(16.51)
Hört die Erzeugung von Elektronen zur Zeit t = 0 bei einer Ladungsträgerdichte n0 auf, so hat n(t) nach einer Zeit t abgenommen auf
n(t )
n0 n0 : . 1 ßn0t 1 t / W 1/ 2
(16.52)
Die Halbwertszeit W 1/ 2 gibt an, nach welcher Zeit die Teilchenzahldichte auf die Hälfte ihres Anfangswertes abgesunken ist. Wir kommen nun zur Strom-Spannungs-Kennlinie zurück und betrachten zunächst den Bereich der unselbständigen Entladung. Die künstlich gebildeten Ladungsträger erhalten, wie G bei den Leitungsvorgängen weiter oben, im elektrischen Feld E eine Geschwindigkeit
G vD
eW S t G E; m
(16.53)
386
16 Elektrischer Strom
sofern die Ladungsträger eine Elementarladung tragen. Stoßzeit bzw. mittlere freie Weglänge hängen vom Gasdruck ab. Solange die Zahl der pro Zeiteinheit die Elektroden erreichenden Ladungsträger klein ist gegenüber der Rekombinationsrate, besteht noch Gleichgewicht zwischen Erzeugung und Vernichtung von Ladungsträgern; es gilt (16.51). Die Stromdichte ist
G j
G en (b b ) E , e
G D (b b ) E . E
(16.54)
In diesem Bereich gilt also das Ohmsche Gesetz. Wird die Spannung erhöht, so wächst die Geschwindigkeit der Ionen. Daher sinkt die Zeit, die für Rekombinationsprozesse zur Verfügung steht; die Rekombinationsrate nimmt ab. Stromsättigung tritt ein, wenn alle gebildeten Ladungsträger die Elektroden erreichen, bevor sie rekombinieren können. Die Stromdichte ist in diesem Fall proportional zur LadungsträgerErzeugungsrate D und zum Abstand d der Elektroden:
j
2ed D .
(16.55)
Der Faktor 2 rührt daher her, dass bei einer Ladungsträgererzeugung durch Ionisation immer ein Ladungs-Paar entsteht. Bei Erreichen der Zündspannung setzt, wie schon erläutert, eine selbständige Gasentladung ein. Durch die lawinenartige Zunahme der Ladungsträger steigt die elektrische Leitfähigkeit und der Widerstand nimmt ab. Das ist die Erklärung der negativen Strom-Spannungs-Kennlinie. Um den Strom zu begrenzen und die Spannungsquelle vor Zerstörung zu bewahren, muss ein Widerstand in Reihe mit der Gasentladungsröhre geschaltet werden. Bei Wechsel_ + spannung ist eine Drossel empfehlenswert (Abb. 16.20).. Die einsetzende Glimmentladung zeigt eine ausgeprägte Schichtstruktur. Die in der Nähe der Elektroden befindlichen leuchtenden Streifen heißen Kathoden- und AnodenGlimmlicht. Die säulenartige Schicht zwischen ihnen wird als positive Säule beKathoden- positive Anodenzeichnet. In Richtung auf das Kathodenglimmlicht Säule glimmlicht glimmlicht liegen weitere schmalere leuchtende Zonen, unterbrochen von DunkelAbb. 16.20: Struktur einer selbständigen räumen. Bogenentladung Die Schichtung entspricht der Feldverteilung. Diese ist also nicht mehr räumlich konstant. Durch die unterschiedlichen Beweglichkeiten der Ladungsträger kommt es zur Ausbildung von Raumladungen. Aus Abb. 16.21 sind Feldstärkeverlauf, Potential- und Raumladungsverlauf zu ersehen. Die Feldstärke ist am größten im Kathodenfall. SekundärElektronen, die durch den Aufprall von Ionen auf die Kathode entstehen, werden hier stark
16 Elektrischer Strom
387
beschleunigt, so dass sie nach Durchlaufen einer Strecke x1 genügend Energie besitzen, um Gasatome anzuregen. Dies ist an dem intensiven Kathoden-Glimmlicht zu erkennen. Nach weiterer Beschleunigung reicht die Energie der Elektronen zur Ionisation Lage der Lage der aus. Es entsteht eine hohe Konzentration Anode Kathode von Elektronen und Ionen. Die Ionen staen sich infolge ihrer geringeren Beweglichkeit, es entsteht eine positive Raumr ladung. Der größte Teil des Feldes fällt zwischen Raumladung und Kathode ab. Unmittelbar dahinter ist die Geschwinx digkeit der Elektronen trotz ihrer größeren Beweglichkeit gering; sie besitzen daher nicht genügend Energie, um Atome E zu ionisieren, es entsteht eine negative Raumladung. Sie sorgt andererseits im Verein mit der positiven Anode dafür, dass sich in der positiven Säule, wieder x ein größeres, konstantes Feld ausbildet, in dem die mittlere Energie der Elektronen gerade ausreicht, dass sich Erzeugungsj und Vernichtungsrate der Ionen die Waage halten. Durch die einhergehende Anregung bzw. Abregung der Gasteilchen entsteht ein intensives, diffuses Leuchten. Wird der Gasdruck erniedrigt, x so zerfällt die positive Säule in einzelne Abb. 16.21: Elektrische Feldstärke, Scheiben. Ihre Dicke entspricht der mittPotential und Raumladung innerhalb leren freien Weglänge der Elektronen. einer Gasentladung Die Physik der Gasentladungen bildet die Basis für zahlreiche technische Produte. Die unselbständige Gasentladung wird etwa in Proportional-Zählrohren ausgenutzt. Ein Geiger-Müller-Zählrohr (Abb. 16.22) besteht aus einer mit Argon gefüllten Ionisationskammer, längs deren Achse sich ein dünner Draht befindet. Er ist über einen Widerstand mit dem positiven Pol einer Spannungsquelle verbunden. Der negative Pol von Kammer und Spannungsquelle liegt auf Erdpotential. Der Gasdruck beträgt ca. 104 Pa. Die Feldstärke in der Nähe des Drahtes ist schon bei Spannungen von einigen 100 V so hoch, dass bei Ionisation des Gases durch ein schnelles Teilchen Strom-Sättigung erreicht wird. Der am Widerstand abfallende Spannungsimpuls durchläuft einen Verstärker und kann dann einem Registriergerät zugeführt werden Bei nicht zu hoher Spannung am Zählrohr ist die Anzahl der den Draht erreichenden Teilchen proportional der Energie des Primärteilchens, so dass diese bestimmt werden kann. Bei nicht zu hoher Spannung am Zählrohr ist die Anzahl der den Draht erreichenden Teilchen proportional der Energie des Primärteilchens, so dass diese bestimmt werden kann. Weitere Anwendungen sind Glimmlampen, die den Kathodenfall ausnutzen, Spektrallampen bzw. Leuchtstoffröhren und die als sog. Sparlampen im Handel erhältliche Leucht-
388
16 Elektrischer Strom
+
stofflampen kurzer Bauart. In den beiden Letzteren strahlt die positive Säule ultraviolettes Licht ab, das in der auf der Wandung aufgetragenen Leuchtstoffschicht in sichtbares Licht umgewandelt wird. Licht großer Leuchtdichte kann in Quecksilber- und XenonHochdrucklampen erzeugt werden. Neben die Ausnutzung der Bogenentladung für zum Zwecke der Materialbearbeitung dienen Verstärker Lichtbögen auch als intensive Strahlungsquelle in Projektionsgeräten. Beispiele für eine kurzzeitige Bogenentladung sind das für p » 104 Pa _ fotografische Zwecke ausgenutzte „Blitzlicht“, das bei der plötzlichen Entladung eines Kondensators in einer GasentladungsAbb. 16.22: Geiger-Müller-Proporröhre entsteht, und vor allem die Blitze bei tionalzählrohr Gewittern.
16.7
Stromquellen
Ein elektrischer Strom setzt eine Potentialdifferenz U0 voraus. Sie wirkt als treibende Kraft und wird deswegen auch, etwas missverständlich, als elektromotorische Kraft (EMK) bezeichnet. In Wirklichkeit handelt es sich bei ihr ja um Energie pro Ladungseinheit. Die Erzeugung einer Spannung bedeutet, dass an einer Klemme des Generators ein Ladungsüberschuss herrRi schen muss und an der anderen ein Ladungsmangel. Ladungsträger sind die Elektronen. U0 Ra U Damit ein hinreichend starker Strom fließen kann, muss der Generator in der Lage sein, an seinen Klemmen pro Zeiteinheit eine große Zahl von Elektronen abzugeben bzw. aufzunehmen. I Wir werden uns den entsprechenden physikalisch-chemischen Vorgängen gleich zuwenden. Abb. 16.23: Zum Innenwiderstand Die maximal zu entnehmende Stromstärke ist eines Generators durch den Innenwiderstand Ri des Generators begrenzt (Abb. 16.23). Bezeichnen wir wie oben die Klemmenspannung des unbelasteten Generators mit U0, den Widerstand des Leiterkreises, den sog. Lastwiderstand, mit Ra, so ergibt sich für die Stromstärke I
I
U0 Ra Ri
U0 1 . Ra 1 Ri / Ra
(16.56)
16 Elektrischer Strom
389
Nur wenn der Innenwiderstand gegenüber dem Lastwiderstand zu vernachlässigen ist, wird die Stromstärke allein durch Letzteren bestimmt. Wir können den 2. Term auf der rechten Seite auch schreiben als
U
U0
1 . 1 Ri / Ra
(16.57)
Die Klemmenspannung U des belasteten Generators wird durch den Innenwiderstand der Stromquelle herabgesetzt. Stromgeneratoren für technische Zwecke basieren fast ausschließlich auf dem Induktionsgesetz und erzeugen damit Wechselstrom. Sie werden in Kap. 19 behandelt. Etliche elektrische Geräte müssen unabhängig vom öffentlichen Netz arbeiten. Sie haben meist einen kleineren Energiebedarf, der von chemischen Stromquellen in Form von Batterien und Akkumulatoren gedeckt werden kann. Zunehmende Bedeutung erlangen chemische Brennstoffzellen, da sie die Möglichkeit öffnen, als Stromlieferanten in Elektroautos eingesetzt zu werden. Unser größter Energielieferant ist die Sonne. Ihre Strahlungsenergie wird in den Solarzellen ausgenutzt. Wir wollen diese Stromquellen hier in ihren Grundzügen besprechen, soweit das auf dem bisher erworbenen Kenntnisstand schon möglich ist.
16.7.1 Galvanische Elemente Werden zwei Metallelektroden aus unterschiedlichem Material in einen Elektrolyten getaucht, so bildet sich zwischen den Polen eine elektrische Spannung von 1-2 V aus (Abb. 16.24). Diese kommt dadurch zustande, dass an den Elektroden positive Metallionen in Lösung gehen, da dies energetisch günstiger ist als im Metallstab zu verbleiben. Dabei lädt sich die + Elektrode negativ und ihre nähere Umgebung positiv auf; es entsteht eine Potentialdifferenz. Diese bremst weitere Ionen ab; Gleichgewicht Zn Cu herrscht, wenn gerade so viele Ionen zur Elektrode zurück wandern wie in Lösung gehen. Das Gleichgewicht wird gestört durch Anlegung einer äußeren Spannung zwischen Elektrode und Raumladungsschicht. Befindet sich der positive Pol an der Elektrode, so gehen verd. H2SO4 positive Ionen vermehrt in Lösung. Bei umgekehrter Polung werden sich Metallionen aus Abb. 16.24: Aufbau eines galvanischen der Lösung an der Elektrode abscheiden. Die Elementes mit verdünnter Schwefelgleichen Vorgänge spielen sich an der anderen säure Metall-Elektrode ab. Da die Potentialdifferenzen an den beiden Elektroden verschieden sind, entsteht zwischen ihnen eine Spannung
-
'U
U1 U 2 , wobei U1
'M1 , U 2
'M2 .
(16.58)
390
16 Elektrischer Strom
Eine derartige Anordnung aus einem Elektrolyten, in den zwei Metall-Elektroden eintauchen, heißt galvanisches Element. Der Name erinnert an L. Galvani (1737-1798), der als erster mit einem solchen Element (aus Froschschenkel und Metallelektroden experimentierte). Die Spannung eines Elementes im unbelasteten Zustand kann unmittelbar aus Tab. 15.3 abgeleitet werden. Die heute benutzten Primärelemente sind alle Abarten des 1866 von G. Leclanche (1839-1882) erfundenen Zink-Braunstein-Elementes. (Abb. 16.25). Es besteht aus einer KohleBraunstein (MnO2) Mischung als Anode, die von einem Zinkzylinder als Kathode umgeben ist. Als Elektrolyt fungiert im einfachsten Fall Ammoniumchlorid (NH4Cl), das zur Verfestigung mit Stärke und Zellulose vermischt ist. Es spielen sich folgende Reaktionen ab: Kathode: Zn o Zn 2 2e ,
(16.59a)
Anode: 2 MnO2 2 NH 4 2e o MnOOH 2 NH 3 ,
(16.59b)
Elektrolyt: Zn
+
2
2 NH 4Cl 2 NH 3 o Zn( NH 3 ) 2 Cl2 2 NH 4
Kohle-BraunsteinMischung Plastikdeckel fester Stärke-NH4ClElektrolyt Zn-Becher
Abb. 16.25: Zn-Braunstein-Element
(16.59c)
Durch die Bindung von Zn2+-Ionen im DiamminKomplex wird die Zn2+-Konzentration im Elektrolyten klein gehalten. Die Spannung bleibt so bestehen. Die Zelle ist erschöpft, wenn sich soviel [Zn(NH3)2]2+ gebildet hat, dass das Chlorid dieses Ions auskristallisiert und damit die Leitfähigkeit abnimmt. Modernere galvanische Elemente sind die Alkali-Mangan-Batterie (1.5V) oder zunehmend Lithium-Elemente (3V). Die Lebensdauer dieser Batterien sind größer als die der Braunstein-Zelle. Außerdem ist die Beweglichkeit der Ionen größer, so dass die entnehmbare Stromstärke ebenfalls größer ist. Das gilt ganz besonders für LiElemente, die zudem sehr klein gemacht werden können.
16.7.2 Akkumulatoren Neben den Primärelementen gibt es Sekundärelemente (als Akkumulatoren bezeichnet), die erst nach Aufladung zu einer Stromquelle werden. Nach ihrer Erschöpfung lassen sie sich, im Gegensatz zu den oben erläuterten Elementen, wieder regenerieren, indem ihnen von außen elektrische Energie zugeführt wird. Am verbreitesten ist der Blei-Akkumulator. Im Prinzip besteht eine Zelle aus zwei sich gegenüber stehenden Bleiplatten, die in verdünnte Schwefelsäure tauchen. Nach kurzer Zeit überziehen sich beide Platten mit einer dünnen Schicht aus Bleisulfat (PbSO4). Jetzt laden wir die Zelle, indem wir von außen eine Spannung anlegen. Dabei laufen die folgenden Reaktionen ab:
16 Elektrischer Strom
391
PbSO4 2OH o PbO2 H 2 SO4 2e
(16.60a)
Kathode: PbSO4 2 H 2e o Pb H 2 SO4 .
(16.60b)
Anode:
Durch die Aufladung ist die Anode zu Bleioxid und die Kathode zu metallischem Blei geworden. Es ist also wie oben ein Element mit unterschiedlichen Elektroden entstanden, das selbst als Stromquelle dienen kann; die Spannung beträgt 2,02 V. Bei der Entladung laufen die chemischen Prozesse in umgekehrter Richtung ab. Anschließend kann der Akku wieder aufgeladen werden. Als Wirkungsgrad des Akkus wird das Verhältnis von abgegebener Energie zu Aufladeenergie definiert. Er liegt bei 75-80%. Zur Erreichung einer möglichst großen Speicherkapazität muss die Oberfläche der Elektroden so groß wie möglich sein. Daher werden an Stelle der oben postulierten Blei-Platten Bleigitter benutzt, wodurch eine Speicherkapazität von ca. 30 Wh pro kg Blei erreicht wird. Es ist interessant, einmal auszurechnen, wie groß die Kapazität eines Kondensators sein müsste, der imstande ist, die gleiche Energie zu liefern. Es ergibt sich bei einer Spannung von 2V der Wert C | 6 104 F ! Ließe sich ein solcher Kondensator realisieren? Als weiteres Beispiel soll kurz der Nickel-Cadmium-Akkumulator dargestellt werden. Die beiden Elektroden befinden sich in KOH-Lauge; im ungeladenen Zustand sind sie mit einer Hydroxid-Schicht überzogen. Beim Anlegen einer äußeren Spannung kommt es zu folgenden Reaktionen: Anode:
2 Ni (OH ) 2 2OH o 2 Ni (OH )3 2e ,
Kathode: Cd (OH ) 2 2e o Cd 2OH .
(16.62a) (16.62b)
Es entsteht eine Spannung von 1,2 V. Bei einer Stromentnahme laufen die Reaktionen wieder in umgekehrter Richtung ab.
16.7.3 Brennstoffzellen Die Energieentnahme einer Batterie erfolgt, wie gerade erläutert wurde, durch elektrochemische Prozesse. Bei Akkumulatoren ist diese Reaktion reversibel. Alle Batterien sind folglich Energiespeicher mit einem bestimmten Reservoir an elektrischer Energie. Brennstoffzellen werden besser als Energiewandler bezeichnet, obgleich dies natürlich für eine begrenzte Zeit auch für jede Batterie gilt. Zur Gewinnung elektrischer Energie muss einer Brennstoffzelle kontinuierlich „Betriebs- oder Brennstoffe“ zugeführt werden. Die Energieerzeugung beruht auf der Umkehr des elektrolytischen Prozesses (L2,3,4,5). Die Gesamtreaktion besteht aus zwei Teilreaktionen, die an den räumlich getrennten Elektroden stattfinden. Im einfachsten Fall wird der Anode Wasserstoff zugeführt (Abb. 16.26). Unter Mitwirkung eines Katalysators entstehen H+-Ionen, die in den Elektrolyten eintreten.
392
16 Elektrischer Strom
Die Ionen wandern zur Kathode, wo sie mit dem dort adsorbierten Sauerstoff reagieren. Auch dazu ist ein Katalysator erforderlich. Dabei entsteht in diesem Beispiel Wasser. Die zur Reduktion des SauerAnode Kathode stoffs erforderlichen Elektronen werden von der Anode über einen äußeren Stromkreis herangeführt. Am LastH2 O2 widerstand fällt bei einem solchen Element eine Spannung von etwa 1,2 V ab. Bei einem sauren Elektrolyten erfolgt der Ladungstransport im Elektrolyten durch Protonen, bei einem basischen im Allgemeinen durch die Elektrolyt Hydroxilionen. Wir schreiben die chemischen Prozesse (K+OH-) auf:
Ni
Ag
Abb. 16.26: Prinzip einer Brennstoffzelle
Anode:
H 2 o 2 H 2e
Kathode: 2 H 2e
1 O2 o H 2 O . 2
(16.63a) (16.63b)
Es wird also Wasserstoff als Brennstoff mit Sauerstoff als Verbrennungsmittel (Oxidans) zu Wasser „verbrannt“. Die Reaktionen laufen schon bei niedrigen Temperaturen (60-130 °C) ab. Es gibt verschiedene Typen von Brennstoffzellen, die sich zum Teil noch in der Erprobung befinden. Sie werden nach dem verwendeten Elektrolyten unterschieden. In obigem Beispiel besteht der Elektrolyt aus KOH. Der Brennstoffzellen-Typus ist daher unter dem Namen Alkaline Fuel Cell (AFC) bekannt. Die Zelle besitzt einen Wirkungsgrad von 60%. Sie werden in Raumfahrzeugen eingesetzt. Nachteilig wirkt sich bei diesem Typ eine mögliche Vergiftung des Elektrolyten durch Karbonate aus, wenn reformierter Wasserstoff aus Kohlenwasserstoffen als Brennstoff benutzt wird. Diese Schwierigkeiten lassen sich in einer PEMF-Zelle (Proton Exchange Membrane Fuel Cell) vermeiden (Abb. 16.27). In ihr übernimmt eine dünne Protonen-leitende Membran die Rolle des Elektrolyten. Die Zelle kann mit Wasserstoff oder Methan betrieben werden. Die Arbeitstemperatur beträgt weniger als 80 °C. Die zugehörigen Wirkungsgrade sind 60 bzw. 40%. Es sind Leistungen bis zu ca. 250 kW möglich. Da die chemischen Reaktionen an der Kontaktfläche stattfinden, d.h. nur im Grenzgebiet von Elektrode (Katalysator) und Elektrolyt ablaufen, ist eine Brennstoffzelle flächenhaft aufgebaut. Sie ist nur einige Zehntel Millimeter dick. Die Elektroden bestehen aus Edelmetall-Katalysatoren auf porösen Substratschichten. Die Spannung beträgt ca. 0.5 V. Eine Vielzahl solcher Einzelzellen ist zu Stapeln zusammengefasst und liefert durch Hintereinanderschaltung die gewünschte Betriebsspannung. Der Wirkungsgrad einer Brennstoffzelle ist definiert als
KB Z
erzeugte Energie 100 (%) 'H
Darin ist 'H die Enthalpieänderung des chemischen Prozesses. Für die Erzeugung elektricher Energie kann aber nur der Anteil der freien Reaktionsenthalpie genutzt werden, im Gegensatz zu einer Wärmekraftmaschine. Der maximale Wirkungsgrad ist also
16 Elektrischer Strom
'G 100 ( %) . 'H
Unter Benutzung der Relation (s. Kap. 13) 'G H TdS ergibt sich
K B(max) Z
'H T 'S 100 ( %) . (16.64) 'H
Fordern wir, dass der Umgebung keine Wärme entzogen wird, so kann der Wirkungsgrad bis zu 100% betragen. Die erreichten Wirkungsgrade liegen bei 5070%. Abb. 16.27: Prinzip einer Proton-ExchangeMembran-Fuel-Cell (PEMF-Zelle)
Poröse Katalysator Sauerstoff Elektroden
Poren
Kathode
Membran
K B(max) Z
393
Anode
Wasserstoff Wasser Kohlepapier
16.7.4 Solarzellen Sonnenergie kann in unterschiedlicher Weise zur Energieerzeugung nutzbar gemacht werden, am einfachsten durch Sonnenkollektoren, die erwärmtes Brauchwasser zur Verfügung stellen. Dagegen sind bisher nur wenige größere Anlagen zur solartechnischen Stromerzeugung in Betrieb, wie z.B. in Kalifornien ein Kraftwerk für 300 MW. Aber auch hier wurden in jüngster Zeit Pläne für Großkraftanlagen ausgearbeitet. 2006 wurde der Grundstein für ein Kraftwerk dieser Art in Spanien gelegt, dass Leistungen im GW-Bereich erzeugen soll. Durch spezielle Kollektoren (Parabolinnenkollektoren, Solartürme mit Nachführungseinrichtung und Paraboloidkraftwerke) werden Temperaturen von über 1000 °C erreicht, die mit Hilfe von Gasoder Dampfturbinen Wärme in elektrische Energie umwandeln können. Eine direkte Erzeugung von elektrischem Strom bietet die Photovoltaik. Abb. 16.28 zeigt einen pnhn p Halbleiter, dessen Enden über einen Widerstand miteinander verbunden sind. Wenn Licht auf den Halbleiter fällt, kann am Widerstand eine elektrische Spannung von ca 0,8V auftreten. n Die Entstehung der Spannung soll im Folgenden erläutert werden. Ein pn-Halbleiter besteht aus einem Kristall, dessen eine Seite überwiegend p-leitend ist und dessen andere Seite überwiegend n-leitend ist. Wie in Kap. 16.6.2 dargelegt, wird dies durch Abb. 16.28: pn-Halbleiter als Solarzelle geeignete Dotierung erreicht. Löcher- und Elek-
394
16 Elektrischer Strom
tronenkonzentration sind in Abb. 16.29 skizziert. Auf Grund des Konzentrationsgefälles im Bereich der Grenzschicht kommt es zu einer Diffusion von Elektronen in den p-Teil. Dort werden sie von Akzeptoren eingefangen oder rekombinieren mit den Löchern. Analog diffundieren Löcher in den n-Teil, wo sie mit den Elektronen rekombinieren. Dadurch verarmt die Mitte der Grenzschicht an beweglichen Ladungsträgern und zu beiden Seiten bilden sich Raumladungen mit unterschiedlichem Vorzeichen aus (Abb. 16.29). Das elektrische Feld ist von der n-Seite zur p-Seite gerichtet und wirkt damit dem Diffusionsstrom entgegen. Stationäres Gleichgewicht stellt sich ein, wenn Feld- und Diffusionsstrom gleich sind. Das elektrische Feld verursacht einen Potentialsprung. Damit verbunden ist eine Bandverschiebung, die hier aber nicht berücksichtigt wird. Fällt auf den pn-Halbleiter Licht ein, so erzeugt jedes absorbierte Lichtquant (Photon) n p ein Elektron und ein Loch. Durch die Diffusionsspannung UD über der Grenzschicht wer16 den die Elektronen in den p-Teil und die 10 Löcher in den n-Teil getrieben. Dies führt zur c [p] [n] Erniedrigung 'M ph des Potentialsprungs: 14
10
10 r
12
'M ph
'M Ddu 'M Dbel .
(16.65)
'M ph kann als Photospannung an den Enden
des Halbleiters abgenommen werden. 0 Typische Werte für maximal erreichbare Leerlaufspannungen einer Photodiode liegen je nach Halbleiter zwischen 0,4 und 1,4 V. Der Wirkungsgrad von Solarzellen ist definiert als j E das Verhältnis aus gewonnener elektrischer Leistung zu eingestrahlter Lichtleistung. Wäh0 rend bisher von einer theoretischen OberDj grenze von 30% ausgegangen wurde, werden neuerdings Konzepte diskutiert, die Wirkungs0 grade bis zu 86% ermöglichen sollen (L16.6). Kommerzielle Solarzellen haben z. Zt. WirAbb. 16.29: Charakteristische Kennkungsgrade von maximal 17%. Als Ausgangsgrößen eines unbelichteten Halbleiters material wird hauptsächlich kristallines und zunehmend amorphes Silizium und seiner Legierungen verwendet; dazu kommen GaAs und analoge III-V-Verbindungen, Cadmiumtellurid (CdTe) und Chalkopyrit-Verbindungen, sowie organische Materialien. Durch Verschaltung von Solarzellen mit unterschiedlichen Energielücken kann ein breites Spektrum des Sonnenlichtes zur Stromerzeugung ausgenutzt werden (L16.7). Die Herstellungskosten der Zellen sind noch zu hoch, dass sie mit herkömmlich gewonnener elektrischer Energie konkurrieren könnten. Daher werden verstärkt Dünnschicht-Solarzellen aus polykristallinem Silizium, die nur einige Mikrometer dick sind, diskutiert (L16.8). Dadurch könnten die Materialkosten wesentlich verringert werden. Eine Übersicht über den derzeitigen Entwicklungsstand regenerativer Energien findet sich in L16.9.
16 Elektrischer Strom
395
16.7.5 Thermoelemente Thermoelemente als Spannungsquellen beruhen auf der Temperaturabhängigkeit der Kontaktspannung. Letztere wurde bereits in Kap. 16.7.5 eingeführt. Sie beruht auf den unterschiedlichen Elektronen-Austrittsarbeiten zweier Metalle. Näherungsweise genügen die Anzahldichten auf beiden Seiten des Kontaktes einer Boltzmannverteilung
n2 n1
e
'E k BT
(16.66)
wobei die Differenz der Elektronen-Austrittsarbeiten 'E der Kontaktspannung U entspricht.
'E
E2 E1
e(M2 M1 ) eU .
(16.67)
Einsetzen in (16.65) und Auflösen nach U ergibt
U
k BT n1 ln . e n2
(16.68)
Schalten wir zwei gleichartige Kontakte, die sich auf unterschiedlichen Temperaturen befinden, nach dem Schema von Abb. 16.30 gegeneinander, so entsteht zwischen den beiden äußeren Enden eine Thermospannung, die proportional der Temperaturdifferenz ist:
U th
k B § n1 · ln ¨ ¸ (T1 T2 ) a'T e © n2 ¹
Metall 1
Dabei haben wir vorausgesetzt, dass das Verhältnis der Anzahldichten im Wesentlichen durch die unterschiedlichen Austrittsarbeiten der Metalle und nicht durch die Temperatur bestimmt ist. Experimente zeigen, dass die Thermospannung einiger Metallkombinationen wirklich dieser Beziehung folgt; für andere muss sie ergänzt werden durch einen quadratischen Term:
U th
a'T b( 'T ) 2 .
Metall 1
(16.69a)
(16.69b)
Metall 2
T1, U12
T2,U21
Abb. 16.30: Schaltung eines Thermoelementes
Um die Empfindlichkeit eines Thermoelementes zu charakterisieren, ist es zweckmäßig, die differentielle Thermospannung dUth/dT anzugeben. Die Werte liegen für Metalle im Bereich einiger ȝK/T . Das Auftreten einer Thermospannung ist nicht auf Metalle beschränkt. Besonders große Werte der differentiellen Thermospannung finden sich bei Metall-Halbleiter-Kontakten. Die
396
16 Elektrischer Strom
Thermospannungen liegen um bis zu 3 Größenordnungen über denen von Metall-MetallKontakten (Tab.16.4).
Bi
Konst. Co
Ni
K
Pd
Na
Pt
Hg
-7
-3,4
-1,6
-1,5
-0,9
-0,3
-0,2
0,0
0,0
C
Al
Mg
Pb
Sn
Cs
Man- Ir ganin
Zn
0,2
0,4
0,4
0,4
0,45
0,5
0,6
0,65
0,7
Ag
Au
Cu
W
Cd
Mo
Fe
Sb
0,7
0,7
0,75
0,8
0,9
1,2
1,8
4,7
Tab. 16.4: Thermoelektrische Spannungsreihen in bezug auf Wasserstoff in µV/Grad Die Thermospannung wurde von Th. J. Seebeck (1770-1831) 1821 entdeckt. Die Erscheinung ist daher auch unter dem Namen Seebeck-Effekt bekannt. Es gibt auch den umgekehrten Effekt, er heißt Peltier-Effekt (J. Ch. A. Peltier, 1785-1845). Wird an ein Thermoelement, dessen Lötstellen auf gleicher Temperatur liegen, eine äußere Spannung gelegt U12 U21 (Abb. 16.31), so kühlt sich eine Kontaktstelle ab und die andere erwärmt sich. Erwärmung erfolgt an der Kontaktstelle, die sich beim Seebeck-Effekt bei gleicher Richtung des Thermostromes die Kältere ist. Die Wärmeleistung ist proportional zum Strom. Metall 2 Metall 1 Metall 2
DT2
DT1
P
_
+
U Abb. 16.31: Zur Demonstration der Wirkungsweise eines Peltierelementes
dU t h dT
3 . T
dQW dT
3I .
(16.70)
3 wird als Peltier-Koeffizient bezeichnet. Typische Werte liegen bei 102 J/As. Zwischen ihm und der differentiellen Thermospannung besteht die Relation
(16.71)
Die beiden Effekte sind also eng miteinander verwandt. Das wird im Rahmen der Festkörperphysik ausführlich erläutert. Thermoelemente werden in großem Umfang zur Temperaturmessung verwandt. PeltierElemente können in kleineren Wärmepumpen oder Kühlzellen eingesetzt werden.
16 Elektrischer Strom
397
16.7.6 Kondensatoren als Energiespeicher In Kondensatoren hoher Kapazität lassen sich beträchtliche Energiemengen speichern. Sie reichen aus, um bei Stromausfällen in hochohmigen Verbrauchern, z.B. bei Datenspeichern in Computern oder Fernsehgeräten, die Stromversorgung aufrecht zu erhalten. Solche Ultracaps (Ultra Capacitors) sind aus Kohlenstoff als leitende Flächen aufgebaut. Die dielektrische Schicht bildet sich durch chemische Veränderung des organischen Elektrolyten beim Anlegen der Spannung. Die Dicke des Dielektrikums liegt zwischen 10-4 µm und 10-3 µm. Die Kondensatoren besitzen bei kleinen Volumina Kapazitäten bis zu ca. 103 F. Da die Spannungsbelastbarkeit mit derzeit 2,3 V recht klein ist, müssen für den praktischen Gebrauch entsprechend viele Ultracaps hintereinander geschaltet werden. Ein Beispiel möge die Speicherfähigkeit eines Ultracap demonstrieren: Gegeben sei C 103 F ; der Verbraucherwiderstand betrage RV 0, 25 Mȍ , so dass die Zeitkonstante
W 6,9 104 Std. beträgt. Ausgehend von U0 = 2,3V o I 0 9, 2µA . Der Entladevorgang berechnet sich mittels der 2. Kirchhoffschen Regel (16.15) nach Trennung der Variabeln zu 't W ln
I0 ; I
W
RV C .
(16.72a)
Da die Abnahme der Spannung bzw. der Stromstärke sehr klein gegenüber dem Maximalwert sein soll, können wir ln(I0 /I) entwickeln, wodurch sich ergibt
't W
I0 I ; I0
(16.72b)
Fordern wir I (t ) / I 0 t 0,99 , so ergibt sich, dass eine solche Stromstärke über eine Dauer von 6,87 102 Std. aufrechterhalten werden kann. Selbst wenn eine anfängliche Stromstärke von 1 mA nicht unter 1% sinken soll, ist das also mit einem solchen Kondensator nahezu 7 Std. lang möglich. Neuerdings werden Ultracaps diskutiert, bei denen die wirksame Fläche durch eine „Aufrauung“ der Oberfläche um mehrere Zehnerpotenzen vergrößert ist (L16.10).
398
16 Elektrischer Strom
Zusammenfassung x Ein elektrischer Strom besteht aus einem Transport positiv bzw. negativ geladener G Teilchen; sind n r die entsprechenden Anzahldichten und v ± die zugehörigen DriftG geschwindigkeiten, so ist die Stromdichte j
G j
G G n q v D n q v D
G G G x Mit der elektrischen Feldstärke E ist die Stromdichte j verknüpft durch j wobei V eine Materialkonstante ist und elektrische Leitfähigkeit heißt.
G
VE ,
x Bei Stromverzweigungen gelten die Kirchhoffschen Regeln. In einem Knotenpunkt elektrischer Leiter gilt für die Ströme
¦I
0;
i
i
in einem geschlossenen Stromkreis gilt unter Einschluss der von außen aufgeprägten Spannungen
¦U
i
0.
i
x Bei der Reihenschaltung von Widerständen ist der Gesamtwiderstand gleich der Summe der Einzelwiderstände. Bei Parallelschaltung von Widerständen addieren sich die Kehrwerte der Einzelwiderstände. x In Gasentladungen setzt sich der Strom aus Elektronen und Ionen zusammen. Eine unselbständige Entladung bedarf der dauernden Erzeugung von Ladungsträgern durch äußere Eingriffe; eine selbständige Entladung liegt vor, wenn sich Erzeugung und Vernichtung von Ladungen im Gleichgewicht befinden. x In einer chemischen Batterie werden die unterschiedlichen Kontaktspannungen der Elektroden ausgenutzt. x In einer wieder aufladbaren Batterie (Akkumulator) entsteht die Spannung durch räumliche Trennung der negativen und positiven Ladungen durch Energiezufuhr von außen. x Brennstoffzellen funktionieren umgekehrt wie die Elektrolyse. Der Brennstoff, z.B. Wasserstoff, tritt unter Elektronenabgabe in einen Elektrolyten ein. An der Kathode reagiert er mit dem Verbrennungsmittel, im einfachsten Fall, zu einer neutralen Verbindung (hier Wasser). Die für die Reaktion erforderlichen Elektronen werden der Kathode über einen äußeren Lastwiderstand von der Anode her zugeführt.
16 Elektrischer Strom
399
Übungsaufgaben 1. Ein Drehspulamperemeter hat einen Widerstand von Rg
0,5 kȍ und zeigt bei einem
Strom von 10 µA Vollausschlag. Das Instrument soll als Voltmeter benutzt werden. Welches ist der empfindlichste Spannungsbereich? Durch einen Vorwiderstand wird der Messbereich auf 5 V erweitert. Wie groß muss der Vorwiderstand RV sein? Eine 140 V-Batterie speist 20 hintereinandergeschaltete Widerstände von je R 100 kȍ . Wie groß ist die Spannung U an jedem Einzelwiderstand? Wie weit weicht die Anzeige des Voltmeters davon ab? 2. Zwölf gleich große Widerstände von R0 7 : bilden das Gerüst eines Würfels. Berechnen Sie den resultierenden Widerstand R zwischen den beiden in Richtung einer Raumdiagonale gegenüberliegenden Würfelecken. 3. Eine Person stehe auf einem nichtleitenden Boden. Wie groß ist in etwa der Widerstand zwischen seinen beiden Händen? Ohne gesundheitliche Schäden hervorzurufen, können 5 mA durch den Körper fließen. Bei welcher Spannung wird die Berührung einer Stromquelle gefährlich, wenn ein Strom von ca. 100 mA tödlich ist? Betrachten Sie Blut als physiologische Kochsalzlösung. 4. Eine Halbleiterprobe habe bei 25° C einen Widerstand von 120 : . Bei einer Temperatur von 75 °C beträgt der Widerstand noch 10 : . Was bedeutet der Begriff „Thermische Aktivierungsenergie“? Wie groß ist sie in obigem Beispiel? 5. Der Strom durch eine Al2O3-Schmelze betrage 40 kA. Wie viel Kilogramm Aluminium werden in 1,5 Stunden abgeschieden? 6. Beschreiben und diskutieren Sie einige wiederaufladbare Batterietypen. Wie lässt sich der Ladungszustand eines Blei-Akkumulators überprüfen?
17
Statische Magnetfelder
Im ersten Kapitel wurden das elektrische Feld und das elektrische Potential eingeführt. Eine Potentialdifferenz erzeugt in einem Leiter einen elektrischen Strom. Das daran sich anschließende Kapitel befasste sich mit den Grundlagen stationärer Ströme, wobei die magnetischen Eigenschaften des elektrischen Stromes nur gestreift wurden. Wegen des großen Umfangs ist es zweckmäßig, ihnen ein eigenes Kapitel zu widmen. Zunächst untersuchen wir die magnetischen Wirkungen stationärer Ströme im Vakuum (an Luft), anschließend werden jene von Materie besprochen. Dazu gehört auch der Ferromagnetismus, der uns in Form von Kompassnadeln oder Haftmagneten aus dem täglichen Leben bekannt ist. Als Indikator für das magnetische Feld werden wir die Kraft auf eine solche „Kompassnadel“, einen permanenten magnetischen Dipol, benutzen. Daher wollen wir uns zunächst mit den Grundeigenschaften eines solchen Dipols vertraut machen.
17.1
Eigenschaften des magnetischen Feldes
17.1.1 Permanentmagnete Unter Ferromagnetismus verstehen wir das spontane Auftreten eines makroskopischen magnetischen Momentes in Eisen und einigen anderen Materialien. Hier interessiert zunächst nur die Tatsache, dass sich ein Magnet wie z.B. eine Kompassnadel in einem solchen (äußeren) Magnetfeld ausrichtet. Damit haben wir den gewünschten Indikator für Form und Richtung eines Magnetfeldes gewonnen. Wir führen dazu einige Versuche aus: Wir wissen bereits, dass eine horizontal drehbar aufgehängte Kompassnadel immer in Nord-Süd-Richtung weist. Erinnern wir uns daran, dass sich ein elektrischer Dipol in einem (homogenen) elektrischen Feld in Richtung der Feldlinien einstellt und in einem N S inhomogenen Feld zusätzlich eine Kraft erfährt. Es ist daher naheliegend, der Erde ein magnetisches Feld zuzuordnen, in dessen Richtung sich die Nadel einstellt. Das Magnetfeld muss nach dieser Hypothese in NordSüd-Richtung oder umgekehrt verlaufen (und inhomogen sein). Wir ergänzen diese Beobachtung dadurch, Abb. 17.1: Magnetfeld eines Stabdass wir die Erde durch einen stabartig geformten Mag- magneten neten ersetzen. Über den Stabmagneten wird ein Blatt Papier gespannt. Wir tasten nun den Bereich zwischen den Enden des Magneten mit unserer Kompassnadel ab und markieren ihre Lage auf dem Papier (Abb. 17.1). Dabei entstehen Linien, die sich in der Nähe der beiden Enden verdichten. Wir können sie direkt sichtbar machen, indem wir auf das Papier Eisenfeilspäne streuen, die selbst kleine Magnete darstellen. Diese ordnen sich nach leichtem Klopfen entlang der Linien an. Die beiden Häufungsstellen der Linien bzw. der Eisenspäne bezeichnen wir als die Pole des Stabmagneten. Die Linien heißen magnetische Feldlinien. Die Richtung magnetischer Feldlinien wird dadurch festgelegt, dass der Pol der Kompassnadel (eines Stabmagneten), der zum geographischen Nordpol weist, als Nordpol bezeichnet
402
17 Statische Magnetfelder
wird und der zum Südpol Zeigende als magnetischer Südpol. Nähern wir einer Kompassnadel eine zweite Kompassnadel, so stellen wir fest, dass sich ungleichnamige Pole anziehen und gleichnamige Pole abstoßen. Das entspricht den Erfahrungen, die wir mit elektrischen Ladungen gemacht haben. Die Stärke eines magnetischen Pols, kurz Polstärke p genannt, tritt an die Stelle der elektrischen Ladung. Magnetische Pole kommen allerdings nicht alleine vor, sondern treten immer als Paare von Nord- und Südpol auf, d. h. als Dipol. Es gibt keine magnetischen Monopole. Für die Kraft zwischen zwei punktförmigen Magnetpolen p1 und p2 ergibt das Experiment eine Beziehung, die dem Coulombgesetz entspricht. G F
p1 p2 rˆ . r2
f
(17.1)
Aus später ersichtlichen Gründen wird der Vorfaktor f als 1/(4SP0 ) geschrieben. P0 heißt Permeabilitätskonstante. Zwischen ihr, der Influenzkonstanten und der Lichtgeschwindigkeit besteht die Verknüpfung (s. Kap. 17.3)
1 . c2
H 0 P0
(17.2)
Damit erhält µ0 den Wert
P0
4ʌ×10-7 VsA -1m -1 .
(17.3)
Das Coulombsche Gesetz für Magnetpole ist also
G F
p1 p2 rˆ . 4SP0 r 2 1
(17.4)
Mit der Festlegung der Einheit von µ0 ergibt sich für die Einheit der Polstärke [p] = 1Vs.
(17.5)
Als magnetische Feldstärke wird in Analogie zur elektrischen Feldstärke der Quotient aus der Kraft, die ein Magnetfeld auf einen Magnetpol (Probepol) ausübt, und dem Probepol definiert. G B
G F . p
Die Einheit folgt aus (17,4) und (17,5) zu > B@
Vs m2
Tesla
T (Tesla, Nikola 1856-1943)
17 Statische Magnetfelder
403
17.1.2 Die Grundgleichungen des magnetischen Feldes im Vakuum
_
+
Wir hatten gefunden, dass ein elektrisches Feld in einer positiven Ladung entspringt und in einer negativen Ladung endet. Es ist ein wirbelfreies Quellenfeld. Diese Eigenschaften sind in zwei Grundgleichungen formuliert. Das magnetische Feld unterscheidet sich qualitativ vom elektrischen Feld. Wir haben gerade einige Eigenschaften von Permanentmagneten kennen gelernt. Jetzt wollen wir die magnetischen Eigenschaften des elektrischen Stromes untersuchen und dabei ebenfalls die entsprechenden Grundgleichungen aufstellen. Unsere Versuchsanordnung (Abb. 17.2a) soll aus einem Stromkreis bestehen, der einen langen geraden Draht enthält. Bringen wir eine Magnetnadel in seine Nähe, so stellt diese sich überall senkrecht zum Radiusvektor (Abb. 17.2b). Der Draht ist von einem kreisförmigen Magnetfeld umgeben, das weder Anfang noch Ende hat.
Abb. 17a: Anordnung zur Bestimmung des Magnetfeldes eines geraden stromführenden Drahtes
Abb. 17.2b: Magnetische Dipole ordnen sich in Richtung des Magnetfeldes an
Bei Umkehrung der Stromrichtung dreht sich die Richtung der Magnetnadel um, d.h. das magnetische Feld ändert seine Richtung. Die experimentellen Ergebnisse zur Abhängigkeit des Feldes von Stromstärke, Länge des Leiters und Abstand lassen sich darstellen durch
B(r )
P0 I . 2S r
(17.6)
Das Magnetfeld eines geraden Drahtes ist also proportional zur Stromstärke und umgekehrt proportional zum Abstand von der Drahtachse. Der Vorfaktor wird weiter unten verständlich G werden. Die Richtung von B ist durch die Rechte-Hand-Regel gegeben: Zeigt der Daumen in die Richtung des technischen Stromes, so zeigen die Finger in Richtung des Magnetfeldes.
404
17 Statische Magnetfelder
Das Auftreten ringförmiger magnetischer Feldlinien lässt sich mathematisch dadurch formulieren, dass das Linienintegral über einen geschlossenen Umlauf ungleich null ist. Es ergibt sich
G G Bdr
v³
P0 I 2S r 2S r
Kreis
P0 I .
(17.7)
Der Wert des Integrals ist unabhängig von der Wahl des Integrationsweges. Der Beweis wird wie bei der Herleitung des Gaußschen Satzes der Elektrostatik geführt. Die so verallgemeinerte Beziehung heißt Amperesches Durchflutungsgesetz.
G G
v³ Bdr
P0 I .
(17.8a)
C
Durch Benutzung des Stokesschen Satzes kann diese Gleichung in die Differentialform G G umgewandelt werden. Mit I ³ j dA erhalten wir
G G
G G
v³ Bdr ³ rot B dA C
G G
P0 ³ j dA ,
und damit gilt
G rot B
G
P0 j
.
(17.8b)
G G Früher wurde zwischen der magnetischen Feldstärke H und der magnetischen Induktion B unterschieden. Sie sind im Vakuum verknüpft durch die Relation
G B
G
P0 H .
(17.9)
Wir benutzen wie im Fall des elektrischen Feldes wieder nur eine Feldgröße, nämlich die G G magnetische Feldstärke B . Die Größe H heißt magnetische Erregung. Eine andere wichtige Beziehung betrifft den magnetischen Kraftfluss, den wir analog zum elektrischen Kraftfluss definieren:
)m
G G
³ B dA .
(17.10)
A
G Er ist ein Maß für die Zahl der magnetischen Kraftlinien, die durch die Fläche A treten (Abb. 17.3). Da die magnetischen Feldlinien geschlossen sind, folgt, dass der gesamte
17 Statische Magnetfelder
405
r B
Abb. 17.3a: Zur Definitition des magnetischen Flusses und
r dA
Abb. 17.3b: Der magnetische Fluss durch eine geschlossene Oberfläche ist null geschlossen
Kraftfluss durch die Oberfläche S eines Volumens V null ist, denn es treten genau so viele Feldlinien aus wie ein. Es gilt also
G G
v³ B dS
0.
(17.11a)
S
Formen wir dieses Oberflächenintegral mit Hilfe des Gaußschen Satzes in ein Integral über das G von der Oberfläche S eingeschlossene Volumen V um, so folgt
G G
G
v³ B dS ³ div B dV
0,
S
woraus sich ergibt
G div B 0 .
(17.11b)
Diese Gleichung drückt aus, dass es keine magnetischen Monopole gibt. Die Aussagen der Gln. (17.8) und (17.11) können wir wie folgt zusammenfassen: Das magnetische Feld eines elektrischen Stromes ist ein quellenfreies Wirbelfeld. Die beiden Gleichungen können dazu benutzt werden, die Magnetfelder vor allem symmetrischer stromführender Leiteranordnungen auszurechnen.
406
17 Statische Magnetfelder
17.1.3 Magnetische Felder einiger spezieller Leiteranordnungen 17.1.3.1 Magnetfeld eines homogenen Zylinders Das Magnetfeld eines langen, homogenen Zylinders (Abb. 17.4) im Außenraum ist gleich dem eines dünnen, geraden Drahtes.
G G B (r ) dr
v³
Kreis
2S
³ B (r ) r dM
2S r B (r )
P0 I
(17.12a)
0
B(r )
B
B(r) =
r
m0 I r 2p r02
B(r) =
r0
(17.12b)
Im Bereich r < r0 wird das Feld nur von dem Bruchteil S r 2 j des Stromes erzeugt. Es ergibt sich
µ0 I 2p r
2S r B (r )
r
r0
P0 I , r ! r0 . 2S r
Abb. 17.4: Magnetfeld eines stromführenden langen Zylinders
B(r )
P0S r 2 j ,
1 P0 rj 2
(17.13a)
P0 I r , r r0 2S r02 (17.13b)
Die magnetische Feldstärke steigt also innerhalb des zylindrischen Leiters proportional zum Abstand von der Achse an. Für r = r0 erreicht sie demnach den Höchstwert und fällt für größere Abstände mit 1/r ab.
17.1.3.2 Magnetfeld im Inneren einer langen Spule G Wie ein Versuch mit Eisenfeilspänen zeigt, ist das magnetische Feld B im Inneren einer stromdurchflossenen langen Spule nahezu homogen. Wie leicht einzusehen ist, verläuft es in axialer Richtung. Im Außenraum verteilt es sich auf einen größeren Bereich und ist deswegen klein. Für die Berechnung der Größe von B wählen wir einen rechteckigen Integrationsweg wie in Abb. 17.5 gezeigt. Zum Integral tragen die Wegstücke im Außenraum der Spule nichts bei: Für die senkrecht zum Magnetfeld liegenden Wegstücke ist das Skalarprodukt null. Das achsenparallele Wegstück können wir soweit nach außen verlegen, dass dort das Feld vernachlässigt werden kann. Folglich erhalten wir für eine Spule mit N Windungen
G G
v³ B dr ,
lB
P0 N I
o B
P0 nI ,
(17.14)
17 Statische Magnetfelder
407
Beispiel: n 103 , I 1A, µ0
1, 26 u 10-6 Vs/(Am)
o B 0, 00126 T 12, 6 G.
Integrationsweg
Zum Vergleich dazu beträgt das Magnetfeld der Erde am Äquator 0,31 G . Abb. 17.5: Zur Berechnung des Magnetfeldes im Inneren einer langen Spule
7.1.4 Das Vektorpotential Sollen Magnetfelder komplizierterer Leiteranordnungen berechnet werden, so versagt das Amperesche Gesetz. Wir können aber noch auf eine andere Weise Magnetfelder ermitteln. Erinnern wir uns zunächst daran, wie wir in Kap. 1 vorgegangen sind, um ein elektrisches Feld aus seinen Quellen zu berechnen. Es gibt dort zwei Möglichkeiten. Die Erste besteht darin, den Gaußschen Satz der Elektrostatik anzuwenden. Die zweite Möglichkeit geht vom elektrostatischen Potential M (r ) aus. Ist dieses bekannt, so kann das Feld durch Gradientenbildung, G G E (r ) grad M (r ) , gewonnen werden. Wir stellen uns daher die Frage, ob es auch ein magnetisches Potential gibt, aus dem das Magnetfeld abgeleitet werden kann. Dies ist tatsächlich der Fall, aber das Potential ist kein Skalar, sondern eine Vektorgröße. Es heißt deswegen G G G G Vektorpotential des magnetischen Feldes B (r ) und wird mit A (r ) bezeichnet. Wir definieren es als:
G B
G rot A .
(17.15)
G G Damit ist die Quellenfreiheit von B (r ) automatisch gewährleistet, denn es gilt immer
G G di v B ( u A) { 0 .
(17.16)
Das Vektorpotential ist allerdings vieldeutig, denn es ist nur bis auf den Gradienten einer G skalaren Ortsfunktion f (r ) bestimmt. Schreiben wir also
G A'
G G A grad f (r ) ,
(17.17)
G G so besteht weiterhin der Zusammenhang zwischen B und A entsprechend (17.15), denn es G G gilt ebenfalls immer rot grad f = 0. Es ist daher zweckmäßig, A (r ) einer zusätzlichen Bedingung (Eichbedingung) zu unterwerfen.
408
17 Statische Magnetfelder
Es erweist sich als sinnvoll, für den Fall zeitunabhängiger Felder die sog. Coulombeichung zu wählen.
G div A 0 .
(17.18)
Durch diese Einschränkung ist das Vektorpotential bis auf eine additive Konstante eindeutig G bestimmt. Diese wird wie im elektrostatischen Fall so festgelegt, dass A (r o f) 0 wird. Fassen wir die Definitionsgleichungen für das Vektorpotential zusammen, so erhalten wir
G rot A
G G B; di v A 0 .
(17.19)
17.1.5 Biot-Savartsches Gesetz für beliebige Stromverteilungen In der Elektrostatik lässt sich das Potential aus einer gegebenen Ladungsverteilung berechnen. G G Genauso kann das Vektorpotential aus einer gegebenen Stromverteilung j (r ) bestimmt werden. Um das einzusehen, gehen wir vom Ampereschen Gesetz, (17.8a), aus. Unter Benutzung von (A1.62) erhalten wir
G u ( u A) Da
G G G grad div A div grad A P0 j .
(17.20)
G di v A 0 , folgt G 'A P0 j .
(17.21a)
Um das Ergebnis mit dem in der Elektrostatik gefundenen Resultat vergleichen zu können, schreiben wir es in Komponentenform:
'Ax
P0 jx , 'Ay
P0 j y , 'Az
P0 jz .
(17.21b)
Die Gleichungen entsprechen in ihrer Form vollständig der Poisson-Gleichung, 'M G G G G In Analogie zur Lösung letzterer ergibt sich für A (r1 ) im Punkt P (r1 )
G G A(r1 )
P0 4S
³
G G j ( r2 )dV2 , r12
wobei dV2 ein Volumenelement des Leiters ist und r12
U / H 0 .
(17.22) G G r1 r2 ist (Abb. 17.6).
17 Statische Magnetfelder
409
G G G G Bei bekanntem A (r1 ) kann das magnetische Feld am Ort P(r1) aus B rot A berechnet werden. Bei der Differentiation von A ist darauf zu achten, dass diese nach den Koordinaten G des Aufpunktes P(r1) vorzunehmen ist. Differentiation und Integration können vertauscht werden, so dass wir erhalten
G G
G G B (r1 )
P0 j (r )dV2 u 2 . ³ 4S r12
(17.23)
Unter Beachtung von
ergibt die Ausführung der Differentiation
G G B(r1 )
P0 4S
³
G G j (r2 ) u eˆ12 dV2 . r122
(17.24)
r r r12 A r P (r1 ) r2
r r1
( x1 x2 ) 2 ( y1 y2 ) 2 ( z1 z2 ) 2
r12
r j
dV2
0 Abb. 17.6: Zur Definition des Vektorpotentials
G Hierin ist der Einheitsvektor eˆ12 r12 / r12 . Wir interessieren uns hier besonders für das Feld stromführender dünner Leiter. Unter der Voraussetzung konstanter Stromdichte können wir schreiben (Abb. 17.7)
G G ³ j (r )dV
V
G G G G G ds ³ ³ j dA I ds . s
(17.25)
A
Damit reduziert sich (17.24) zu
G G B(r1 )
G
P0 ds2 u eˆ12 I . 4S ³ r122
(17.26)
r ds
r j
Diese Beziehung heißt Biot-Savartsches Gesetz (J. B. Biot, 1774-1862; F. Savart, 1791-1841). Es G bedeutet, dass das von einem Leiterelement ds2 erzeugte Magnetfeld senkrecht steht auf der Ebene, Abb. 17.7: Zum Biot-Savartschen Gesetz die von dem Leiterelement und dem von diesem auf den Aufpunkt gerichteten Vektor aufgespannt wird. Seine Größe ist durch den Wert des Integranden bestimmt.
410
17 Statische Magnetfelder
17.1.6 Anwendungen des Biot-Savartschen Gesetzes Die Berechnung des Gesamtfeldes kann schwierig sein. Wir beschränken uns hier auf drei Beispiele, aus denen auch die Problematik klar wird. 17.1.6.1 Magnetisches Feld eines geraden, dünnen Leiters Abb. 17.8 zeigt einen langen geraden Draht, durch den ein Strom I fließen möge. Wir G interessieren uns für das Magnetfeld im Punkt P ( R ) , wobei R der senkrechte Abstand vom Draht ist. Der Aufpunkt P erscheint einem G Leiterelement unter dem Winkel E . Ist r der Abstandsvektor, so gilt nach Abb. 17.8
ds = dl
b
r
l
R
r
R . sin E
l
R ctg E , dl { ds
P
(17.27)
R d E (17.28) sin 2 E
Nach dem Biot-Savartschen Gesetz folgt damit für den Betrag des magnetischen Feldes
B( R) Abb. 17.8: Zur Berechnung des Magnetfeldes eines stromführenden dünnen Leiters
B( R)
P0 I S sin E d E 4S R ³0 P0 I . 2S R
(17.29a) (17.29b)
Dieses Ergebnis haben wir bereits in Kap. 17.1.3. gefunden.
17.1.6.2 Magnetisches Feld einer Stromschleife In der xy-Ebene eines kartesischen Koordinatensystems befinde sich ein zum Kreis gebogener dünner Draht mit dem Radius R. Sein Zentrum liege im Nullpunkt. Das Magnetfeld eines Leiterstückes in einem Punkt dieser Ebene steht nach (17.26) senkrecht auf diesem und dem Vektor des Aufpunktes P(x,y,0), hat also nur eine z-Komponente (Abb. 17.9a). Der Betrag des Vektorproduktes im Biot-Savartschen Gesetz ist
G ds2 u eˆ12
sin u ds
( R r cos D ) ds , r12
(17.30)
17 Statische Magnetfelder
411
Bz P(r1) = P1
r r r1 = r
r r12 r r r2 = r
eˆ12
u
r ds2
-4
-2
0
2
4 z/R
Abb. 17.9: a) Zur Berechnung des Magnetfeldes einer Stromschleife; b) Magnetfeld auf der Achse
so dass für das Magnetfeld folgt
Bz
P0 I 4S
( R r cos D ) ds . r123 9
(17.31)
v³
Die analytische Berechnung für einen beliebigen Punkt in der Schleifenebene ist nicht möglich, da in diesem Fall elliptische Integrale zu lösen sind, was nur numerisch zu bewerkstelligen ist. Das magnetische Feld auf der z-Achse ist dagegen geschlossen angebbar. Für das Feld im Mittelpunkt des Kreisstromes ergibt sich, da r12 = R und u = S / 2 ,
Bz
P0 I 2R
.
(17.32)
Zur Ermittlung des Feldes in anderen Punkten der Achse gehen wir von dem Beitrag eines Leiterelementes aus.
G dB
G G
P0 ds u r . I r3 4S
(17.33)
Betrachten wir seine Komponente BA senkrecht zur Achse, so sehen wir, dass sich bei der Integration Paare von einander gegenüberliegenden Wegelementen wegheben, während sich G G die Parallelkomponenten dB& dB sin D addieren. Da sin D R / r und r A ds , ergibt sich aus (17.33) für das resultierende Magnetfeld B&
Bz
412
17 Statische Magnetfelder
Bz
P0 IR ds 4S r 3 ³
P0 IR 2S R 4S r 3
P0 I S R2 . 2S r 3
(17.34a)
z 2 R 2 können wir stattdessen auch schreiben
Mit r
Bz
P0 I 2
2 3/ 2
2S ( z R )
S R2 .
(17.34b)
Den Verlauf des Feldes auf der Achse zeigt Abb. 17.9b. Das Produkt aus Stromstärke und Fläche eines Kreisstromes heißt magnetisches DipolG moment des Kreisstromes und wird mit pm bezeichnet. Der Flächennormalen-Vektor ist dabei G wie bisher definiert als A S R 2 eˆz .
G pm
G I A.
(17.35)
Wir können demnach das Feld schreiben als
Bz
P0 pm . 2S r 3
(17.34c)
Ein Vergleich mit dem Ausdruck für das elektrische Feld eines elektrischen Dipols, (17.135b) lehrt uns, dass die beiden Fernfelder in ihrem Verlauf übereinstimmen. Das überrascht zunächst, da das Magnetfeld ein quellenfreies Wirbelfeld ist, das elektrische Feld aber ein wirbelloses Quellenfeld.
17.1.6.3 Magnetisches Feld einer Helmholtz-Anordnung In manchen Fällen werden allseitig zugängliche Magnetfelder benötigt, die über einen größeren Bereich homogen sind. Solche Felder lassen sich mit zwei einander gegenüber stehenden Ringspulen erzeugen (Helmholtz, H. L. 1821-1894) (Abb. 17.10). Dabei kommt es sehr auf das Verhältnis des Spulendurchmessers zum Abstand der Spulen an. Wir betrachten hier den Fall zweier Drahtschleifen. Zur Berechnung möge der Koordinatennullpunkt in die Mitte zwischen den Schleifen liegen. Wir konzentrieren uns auf das Magnetfeld auf der Mittelachse. Als solche werde die z-Achse gewählt.
17 Statische Magnetfelder
413
Bz / B (z = 0)
d=R
1 0.0928
R z
Bz
(d = R)
-0.5
0.0
0.5 z/R
Abb. 17.10: a) Helmholtz-Spulenpaar zur Erzeugung homogener Magnetfelder b) Magnetfeld auf der Achse Der Betrag des Feldes im Abstand z vom Nullpunkt ist nach (17.34b)
B( z )
§d · § d · B¨ z ¸ B¨ z ¸ ©2 ¹ © 2 ¹ 2 ½ P0 IR 1 1 . ® 2 2 3/ 2 2 2 3/ 2 ¾ 2 ¯[(d / 2 z ) R ] [(d / 2 z ) R ] ¿
(17.36)
In der Nähe von z = 0 entwickeln wir diesen Ausdruck in eine Taylorreihe. Dabei heben sich die Terme mit ungeradzahligen Potenzen von z heraus. Es ergibt sich
B( z )
P0 IR 2 [(d / 2) 2 R 2 ]3 / 2
3 d 2 R2 ½ 15 d 4 / 2 3d 2 R 2 R 4 4 2 1 z z ...¾ ® 2 2 2 2 2 4 8 (d / 4 R ) ¯ 2 (d / 4 R ) ¿ (17.37)
Wählen wir den Abstand d der Spulen gleich deren Radius R, so verschwindet der Term in z2. Das hat zur Folge, dass das Feld in sehr guter Näherung konstant ist:
B( z ) |
P0 IR 2 2
(5R / 4)
3/ 2
144 z 4 ½ . ®1 4 ¾ ¯ 125 R ¿
Für z/R = 0,17 beträgt die Abweichung nur 1 ‰ .
(17.38)
414
17 Statische Magnetfelder
17.1.6.4 Magnetfeld einer zylindrischen Spule In Abschnitt (17.1.3.2) haben wir das Magnetfeld im Inneren einer langen Spule berechnet. Wir wollen jetzt das Feld auf der Achse, (z), einer beliebigen zylindrischen Spule der Länge L unter Einschluss der Randeffekte behandeln. Der Koordinatennullpunkt liege im Spulenmittelpunkt. Der Beitrag des Magnetfeldes, der von dem Anteil dn ( N / L) d ] { n d ] herrührt, ergibt sich nach (17.34b) zu
P0 nIR 2
dBz
3/ 2
2^( z ] ) 2 R 2 `
d] .
(17.39a)
Dieser Ausdruck ist von –L/2 bis L/2 zu integrieren. Dazu machen wir die Substitution
z ]
R tan D .
Dies führt zu
P0 nI
dBz
2
D2
³ cos D dD
(17.39b)
D1
woraus für das Feld folgt
Bz
P0 nI °
z L/2 z L/2 ® 2 2 2 ° ( z L / 2) R ( z L / 2) 2 R 2 ¯
½° ¾ ¿°
(17.40)
Im Zentrum der Spule ergibt sich
B
L/R=20
P0 nI
Bz
2
L/R=5 L/R=10
-10 -5
0
5
10 z/R
Abb. 17.11: Magnetfeld auf der Achse einer Helmholtzanordnung für verschiedene z/R und
L 2
L / 4 R2
.
(17.40a)
Das Magnetfeld auf der Achse ist in Abb. 17.11 dargestellt. Im Allgemeinen ist es inhomogen und Randeffekte sind nicht zu vernachlässigen. Nur wenn die Spule im Vergleich zu ihrem Radius sehr lang ist, ist es im Inneren annähernd homogen. Für L >> R folgt dann der uns bereits bekannte Ausdruck
Bz
P0 nI
17 Statische Magnetfelder
415
17.2 Kräfte auf bewegte Ladungsträger im Magnetfeld 17.2.1 Lorentzkraft Wir bringen einen geraden Draht so zwischen die Pole eines Hufeisenmagneten, dass er senkrecht zu dessen Magnetfeld liegt (Abb. 17.12). Beim Einschalten eines elektrischen Stromes beobachten wir, dass der I Draht aus dem Magnetfeld hinaus geschleuLitze dert wird. Ändern wir die Stromrichtung, so kehrt sich die Bewegungsrichtung des Drahtes um. Auf das Drahtstück der Länge l (im Magnetfeld) wirkt also eine Kraft, die sowohl senkrecht zu dem im Draht fließenden Strom als auch senkrecht zum Magnetfeld r gerichtet ist. Bis auf einen ProportionalitätsF faktor, der im SI-System den Wert 1 erhält, muss also gelten Abb. 17.12: Auf einen Leiter tritt senkrecht zu der durch Magnetfeld und Stromrichtung G G G F I l u B Lorentzkraft, (17.41a) aufgespannten Ebene die Lorenzkraft auf d Die Kraft wird als Lorentzkraft (H. A. Lorentz, 1853-1932) bezeichnet. Ihre Richtung ist definitionsgemäß durch die Linke-Hand-Regel festgelegt. Weist der Mittelfinger in die G G Richtung des technischen Stromes I und der Zeigefinger in die Richtung von B , so zeigt der G Daumen in die Richtung der Kraft F . G G N G G Da I l j Al e vV Q v , können wir die Lorentzkraft auch schreiben als V
G F
G G Q vu B .
(17.41b)
Setzen wir wie bisher voraus, dass die Stromstärke in „Ampere“ gemessen wird, so kann (17.41a) zur Festlegung der Einheit der magnetischen Feldstärke dienen. Sie ergibt sich zu
[ B] 1
N Vs =1 2 =:1T . Am m
(17.42)
Die Lorentzkraft in der Form von (17.42) lässt sich schön mit dem Fadenstrahl-„Rohr “ demonstrieren. Es besteht aus einem Glaskolben, der ein Gas unter geringem Druck ( p | 103 bar ) enthält (Abb. 17.13). Der Kolben befindet sich zwischen zwei Helmholtzspulen, die für ein homogenes Magnetfeld sorgen. Die aus einer Glühkathode freigesetzten Elektronen werden in einem Wehneltzylinder (A. R. B. Wehnelt, 1871-1944) zu einem feinen
416
17 Statische Magnetfelder
G Strahl gebündelt und von der ringförmigen Anode auf die Geschwindigkeit v senkrecht zum Magnetfeld beschleunigt. Ihr Betrag ist (s. (15.79))
v
2eU / m .
(15.79)
Glaskolben Die Bahnkurve ist ein Kreis in der xy-Ebene, denn die Lorentzkraft steht stets senkrecht auf dem Geschwindigkeitsvektor. Sie wirkt als Zentripetalkraft, so dass wir erhalten
Anode WehneltElektrode
B
K
Ionen
e vB
Neongas Abb. 17.13: Fadenstrahlrohr zur Ermittlung der spezifischen Elementarladung e/m Krankheit
m v2 , R
(17.43)
woraus sich mit Hilfe von (15.79) der Bahnradius R zu
R
2U (m / e) . B
(17.44)
ergibt. Längs ihrer Bahn stoßen die Elektronen mit Gasatomen zusammen und regen ein Teil von ihnen zum Leuchten an. Es entsteht ein kreisförmiger, eng begrenzter, leuchtender Faden. Auf den ersten Blick ist das überraschend, denn warum diffundieren die Elektronen hinter der Anode nicht auseinander? Das liegt daran, dass auch Gasatome ionisiert werden. Diese haben wegen ihrer großen Masse eine gegenüber den Elektronen vernachlässigbare Geschwindigkeit. Heraus diffundierende Elektronen bilden mit den positiven Ionen ein radial nach außen gerichtetes elektrisches Feld, das weitere Elektronen zur Umkehr zwingt. Durch Ausmessung des Radius lässt sich bei Kenntnis von U und B die spezifische Elektronenladung e/m bestimmen.
17.2.1.1 Drehspulmessinstrumente
Zur Messung von Stromstärke und Spannung werden, wie in Kap. 2 bereits angeführt, meistens Drehspulinstrumente benutzt. Ein solches Gerät besteht aus einer kurzen rechteckigen Spule mit N Windungen, die zwischen den geeignet geformten Polschuhen eines Permanentmagneten drehbar angeordnet ist (Abb. 17.14). Die Spule habe eine Querschnittsfläche A = 2rl. Wir betrachten zunächst eine einzige Stromschleife. Nach (17.35) ist ihr magnetisches Moment G G pm I A . Auf die zum Magnetfeld senkrechten Abschnitte l wirkt die Lorentzkraft
G F
G G I (l u B ) .
17 Statische Magnetfelder
417
Das Kräftepaar erzeugt ein Drehmoment
G D
G G 2 r uF ,
(17.45)
dessen Betrag sich ergibt zu
D
G G 2rF sin(r , F ) G G 2rlIB sin(r , F ) G G
denn sin(r , F )
N
S
G G pm B sin( pm , B )
G G sin( pm , B ) .
r r
Damit lässt sich das Drehmoment als vekG G torielles Produkt aus pm und B schreiben
G D
G G pm u B .
r l
(17.46)
Das Drehmoment einer Spule mit N Windungen ist dementsprechend N-mal so groß. Beim Einschalten des Stromes wird die Spule solange aus ihrer Ruhelage herausgedreht, bis ihr das entgegen gerichtete Drehmoment einer Spiralfeder das Gleichgewicht hält.
r B
r I
y
x
Abb. 17.14: Aufbau eines Strommessgerätes
17.2.1.2 Grundlagen magnetischer Linsen
Magnetische Felder spielen u.a. in der Elektronen- und Ionenoptik eine wichtige Rolle, denn geladene Teilchen lassen sich durch Magnetfelder fokussieren. Sie übernehmen damit die Rolle von Glaslinsen im Bereich des sichtbaren Lichtes. Es gibt zwei Möglichkeiten: Die Abbildung im magnetischen Längsfeld und die im magnetischen Querfeld. Magnetische Linsen finden Anwendung z.B. bei Bildröhren in Fernsehern oder Monitoren, bei Massenspektrometern und Elektronenmikroskopen. Häufig werden sie mit elektrischen Linsen kombiniert.
17.2.1.2.1 Abbildung im homogenen magnetischen Längsfeld einer langen Spule
Aus einer Glühkathode ausgetretene Elektronen werden wie oben durch elektrische Felder G fokussiert und auf die Geschwindigkeit v beschleunigt. Nach Passieren einer Lochblende im Punkt (0; 0; 0) treten sie dann divergent in ein homogenes magnetisches Längsfeld mit den
418
17 Statische Magnetfelder
Komponenten (0; 0; Bz) ein (Abb. 17.15). Dort beschreiben sie spiralförmige Bahnen. Die Bewegungsgleichung lautet
G ma
G G (e)(v u B ) .
(17.47)
Das entspricht den Komponentengleichungen
Blende r B
R
z 4f Abb. 17.15: Homogenes magnetisches Längsfeld einer langen Spule als magnetische Linse und
m m
wv x wt wv y
wt wv z m wt
ev y Bz , ev x Bz ,
(17.48)
0.
Integration der letzten Gleichung ergibt eine Bewegung mit konstanter Geschwindigkeit in z-Richtung. Integration der beiden ersten Gleichungen führt auf eine Kreisbahn, so dass die resultierende Bahnkurve eine Spirale darstellt. Ihr Radius stimmt mit dem von (17.44) überein.
R
2U (m / e) , wobei B = Bz . B
(17.49)
Die Steighöhe der Spirale, also die Strecke ' z , die während der Umlaufzeit
T
2S R vR
(17.50)
durchlaufen wird, folgt aus (17.48c) zu
'z
v zT
2S v z m . B e
Sind die Eintrittswinkel M klein, kann in (17.51) v z erhalten
'z
(17.51) v cos M | v gesetzt werden und wir
2S v m . B e
(17.52)
In diesem Abstand werden also alle Elektronen, die unter verschiedenen Winkeln von einem dingseitigen Punkt ausgehen, nach einem Umlauf in einem bildseitigen Punkt wieder vereinigt. Die Brennweite f der magnetischen Linse ergibt sich daher zu 'z / 4 .
17 Statische Magnetfelder
f:
'z 4
2mU . B e
S
419
(17.53)
Die Linse hat einen Abbildungsmaßstab von 1:1. Vergrößerungen sind also nicht zu erzielen. Außerdem befinden sich Gegenstand und Bild im Magnetfeld der Linse, sind also schwer zugänglich.
17.2.1.2.2 Abbildung im inhomogenen magnetischen Längsfeld einer kurzen Spule
Ist die Spule kurz, l d R , so ist das Magnetfeld zwar weiter spiegelsymmetrisch zu ihrer Mittelebene, ist aber jetzt inhomogen. In z-Richtung konvergieren die Feldlinien, um ab der Mittelebene wieder zu divergieren. Das Feld hat also eine Radialkomponente (Abb. 17.16), deren Vorzeichen an der Mittelebene wechselt. Daraus folgt, dass ein (Elektron oder Ion 1), das von einem Punkt P auf der z-Achse unter einem bestimmten Winkel aus startet und in das in Richtung wachsender z-Werte gerichtete Magnetfeld eintritt, durch dessen Querkomponente eine seitliche Ablenkung nach hinten erfährt. Auf Grund dieser seitlichen Geschwindigkeitskomponente entsteht durch die starke Feldkomponente in z-Richtung eine radial nach Innen gerichtete Lorentzkraft, so dass das Teilchen einen Impuls in Richtung der z-Achse erhält. Beim Austritt aus dem Feld tritt eine seitliche Ablenkung in umgekehrter Richtung auf, so dass sich das Elektron (bei geeigneter Feldstärke) parallel zur Achse weiter bewegt. Analoge Überlegungen gelten für ein Elektron 2, dessen Startrichtung in einer Ebene senkrecht zur z-Achse um 180° gegenüber der des Elektrons 1 gedreht ist. Alle Kräfte r auf dieses sind entgegengesetzt, so dass es ebenfalls w¢ zum Parallelstrahl wird. Da beide Elektronen im Feld auch eine Drehung erfahren, sind die Ebenen, in der a¢ sich die Elektronen vor bzw. hinter der Linse bewegen, gegeneinander verdreht. Natürlich lässt sich der Strahr a w lengang auch umkehren: Parallel zur z-Achse in die magnetische Linse eintretende Elektronen werden in einem Punkt vereinigt. Der Abstand dieses Punktes Abb. 17.16: Zur Berechnung der von der Mittelebene der Spule wird analog zur LichtBrechkraft einer kurzen Linse optik als Brennweite der Linse bezeichnet. Für achsenund nahe Bahnen erhalten wir
1 f
e 8mU
f
³B
2
dz .
(17.54)
f
Hierin ist U wieder die Spannung, welche nötig ist, um die Elektronen auf die Geschwindigkeit v zu beschleunigen und B das Magnetfeld in Achsenrichtung. (17.54) kommt folgendermaßen
420
17 Statische Magnetfelder
zustande: Ein Elektron möge parallel zur z-Achse in das Magnetfeld der Spule eintreten. Am Ion greift im senkrechten Abstand r von der z-Achse auf Grund des Magnetfeldes eine Kraft an, die entgegengesetzt gleich der Zentrifugalkraft ist.
G d 2r m 2 dt
G mZ 2 r .
(17.55)
Aus (17.35a) folgt für Z
eB . m
Z
(17.56)
G Die Änderung des Radiusvektors r erfolgt aber mit der halben Winkelgeschwindigkeit, da nach dem Sehnen-Tangentensatz D ' D / 2 und damit
Z ' dD '/ dt (1/ 2) dD / dt Z / 2 eB /(2m) .
(17.57)
Berücksichtigen wir dies in (17.55), so ergibt sich
d 2r dt 2
2
1§ e · ¨ ¸ B2r . 4©m¹
(17.58)
Auf Grund der Inhomogenität des Feldes ändert sich der Bahnradius, wenn sich das Ion durch die Spule bewegt. Dem tragen wir Rechnung, indem wir schreiben
dr dr dz dr vz ; dt dz dt dz 2 d r d § dr · d § dr · ¨ vz ¸ vz ¨ ¸ 2 dt dt © dz ¹ dt © dz ¹
d § dr · v ¨ ¸. dt © dz ¹
(17.59)
denn für kleine Einfallswinkel können wir vz durch v ersetzen. Der letzte Term lässt sich umschreiben in
v
d § dr · ¨ ¸ dt © dz ¹
v
d § dr · dz ¨ ¸ dz © dz ¹ dt
v2
d 2r . dz 2
(17.60)
Setzen wir dies in (17.59b) ein und ersetzen in (17.58) die Radialbeschleunigung durch den so erhaltenen Ausdruck, so ergibt sich
17 Statische Magnetfelder
v2
421
2
d 2r dz 2
1§ e · ¨ ¸ B2r . 4© m¹
(17.61)
Die Geschwindigkeit v bestimmt sich aus (17.43) zu
v2
2 eU / m ,
(17.43)
Damit erhalten wir
d 2r dz 2
1 §e· 2 ¨ ¸B r . 8U © m ¹
(17.62)
Durch Integration ergibt sich für den Ablenkungswinkel der Elektronen nach Durchlaufen des Feldes
tan G
f
dr dz
1 §e· 2 ¨ ¸ ³ B rdz 8U © m ¹ f
(17.63a)
Da die Spule kurz sein soll, ändert sich der Abstand r nicht allzu viel. Wir ziehen r deswegen vor das Integral und ersetzen ihn durch den Abstand R beim Eintritt in das Magnetfeld. Da tan G < 0 ist, ist die Bahn hinter der Spule zur Achse hin geneigt. Die reziproke Brennweite ergibt sich nach Abb. 17.17 aus tan G R / f zu
1 f
f
1 §e· 2 ¨ ¸ ³ B dz 8U © m ¹ f
(17.63b)
Um starke Vergrößerungen zu erreichen, muss die Brennweite der Linsen klein sein. Das erfordert große inhomogene Felder, also eng begrenzte, große Felder in Durchstrahlrichtung (vgl. Kap. 17.1.6.4). Das leisten Eisen-gekapselte Spulen.
R
d
f
Abb. 17.17: Zur Definition der Brechkraft einer kurzen Linse
422
17 Statische Magnetfelder
17.2.1.2.3 Abbildung durch ein magnetisches Querfeld
Durch eine Spaltblende mögen Ionen der Masse m und der Ladung Q mit der GeschwinG digkeit v divergent aus einer Quelle IQ in ein senkrecht zur Strahlachse gerichtetes Magnetfeld eintreten (Abb. 17.18). Dort beschreiben sie wie im Fadenstrahlrohr Kreisbahnen mit dem Radius
R
mv . QB
(17.44)
Die Geschwindigkeit v ist durch (17.43) gegeben. Wir betrachten jetzt ein Ion der Masse m1, das senkrecht zu einer Geraden IQA durch den Eintrittsspalt tritt. Nach Durchlaufen eines Halbkreises mit dem Radius R trifft es die Gerade gD im Punkt A. Ein anderes Ion, das die Quelle unter dem Winkel (90q r M ) verlässt, erreicht nach Durchlaufen des Magnetfeldes die Gerade gD im Punkt B. Die Strecke AB ist Detektor-
S
r B
R
ebene
AB | 2 R 2 R cos M
2 R (1 cos M ) ,
gD
(17.64a)
BA was sich für kleine Winkel M vereinfacht:
IQ aa
AB
RM 2 .
(17.64b)
Alle Ionen, die unter dem Winkel (90q r M ) die Quelle verlassen, werden auf einen Austrittsspalt der Breite RM 2 in Höhe der Geraden gD abgebildet und dort von Halbleiter-Detektoren nach-
Abb. 17.18: Ein homogenes magnetisches Querfeld fungiert als Massenfilter
d { AB gewiesen. Der Radius der Bahnkurve der Ionen hängt von deren Masse ab. Eine Anordnung wie in Abb. 17.18 lässt sich daher als Massenfilter verwenden. Teilchen mit den Massen m1 und m2 können voneinander getrennt werden, solange sich die Auftreffbereiche nicht überlappen. Die Bedingung lautet also
R1 R2 t wobei R
RD 2 , 2
( R1 R2 ) / 2 der mittlere Radius ist. Er ist durch (17.44) bestimmt zu
(17.65)
17 Statische Magnetfelder
423
2U (m / Q) . B
(17.44)
R
Das Massen-Auflösungsvermögen 'm / m ergibt sich durch Auflösen dieser Beziehung nach m unter Berücksichtigung von (17.65) zu
'm m
R12 R22 R2
( R1 R2 ) 2 R , R2
(17.66a)
'm D2. m
(17.66b)
Je größer also die Divergenz der Ionenbahnen am Eintrittsspalt ist (im Rahmen der Gültigkeit von (17.64b)), desto kleinere Massenunterschiede können noch nachgewiesen werden.
17.2.1.2.4 Geschwindigkeitsfilter
Wir schicken einen Ionenstrahl entlang der z-Achse (Abb. 17.19) durch einen Spalt in ein homogenes magnetisches Querfeld (0, By, 0). Gleichzeitig wirke auf ihn ein senkrecht zu diesem gerichtetes homogenes elektrisches Querfeld (Ex, 0, 0). Lorentzkraft und elektrische Feldkraft bewirken eine Ablenkung der Ionen in einander entgegengesetzten Richtungen. Sie gelangen nur dann durch den Austrittsspalt, wenn die resultierende Kraft verschwindet. Das bedeutet
QE
Q vB .
(17.67)
Bei gegebenen Feldstärken E und B ist diese Bedingung (bei unendlich schmalen Spalten) nur für eine bestimmte Geschwindigkeit erfüllbar, gegeben durch das Verhältnis von E und B:
v
E . B
(17.68)
Die Anordnung wirkt also als Geschwindigkeitsfilter. Nach dem Entdecker M. C. W. Wien (1866-1938) heißt es Wien-Filter. Endlich breite Spalte lassen Ionen in einem schmalen Geschwindigkeitsintervall passieren, das von der kinetischen Energie der Ionen und der Länge des durchlaufenen Feldraumes mitbestimmt wird.
Spalte y
x
r v
z r E (E y ,0,0)
r B(0, Bx ,0)
Abb. 17.19: Durch Kombination eines magnetischen und eines elektrischen Querfeldes entsteht ein Geschwindigkeitsfilter
424
17 Statische Magnetfelder
17.2.1.3 Hall-Effekt
Durch einen rechteckigen metallischen Leiter mit dem (Abb. 17.20) fließe ein elektrischer Strom mit der Stromdichte j;
G j
Querschnitt
G nebE .
A
ad
(17.69)
Hierin sind n die Dichte und b v / E die Beweglichkeit der Ladungsträger. Senkrecht zur G Stromrichtung befinde sich ein homogenes magnetisches Feld B . Durch die Lorentzkraft G G werden die Elektronen senkrecht zu j und B abgelenkt. Dies hat eine Ansammlung von Elektronen auf der einen Seite und eine Verarmung auf der anderen Seite zur Folge. Es baut sich solange ein elektrisches Feld EH auf, bis sich elektrische Feldkraft und Lorentzkraft das Gleichgewicht halten.
eEH
e vB .
(17.70)
Durch Einführung der Beweglichkeit wird daraus
EH
bBE .
(17.71)
Auf Grund des entstandenen Feldes entsteht bei der in Abb. 17.20 skizzierten Messanordnung zwischen Vorder- und Rückseite des Leiters eine elektrische Spannung, die als Hallspannung bezeichnet wird.
d
r E
r j
UH Abb. 17.20: Halleffekt. Durch Einwirkung eines homogenen magnetischen Querfeldes auf einen stromdurchflossenen Leiter oder Halbleiter entsteht eine elektrische Spannung und
r B
UH
EH d .
(17.72)
Ersetzung von E in (17.71) durch j mittels (17.69) und Einsetzen in (17.72) ergibt
UH
jb B ne
I B. nea
Die Größe 1/(ne) heißt Hall-Konstante.
(17.73)
17 Statische Magnetfelder
425
Die Beziehung gestattet durch Messung der Hall-Spannung die Bestimmung der Konzentration der Ladungsträger. Das Vorzeichen von UH gibt Auskunft über das Vorzeichen der Ladung. Ist umgekehrt die Ladung bekannt, so kann der Halleffekt zu einer genauen Messung von Magnetfeldern benutzt werden.
17.2.1.4 Kräfte zwischen stromdurchflossenen Leitern
Wir knüpfen an die experimentelle Ableitung der Lorentzkraft zu Beginn des Kap. 3.2.1 an. Dort hatten wir die Kraft auf einen stromdurchflossenen Draht im Feld eines Permanentmagneten untersucht. Wir ersetzen jetzt den Magneten durch einen stromführenden Leiter, im einfachsten Fall durch einen langen geraden Draht. Wie wir wissen, erzeugt er auch ein Magnetfeld. Die beiden Drähte seien parallel zueinander aufgehängt (Abb. 17.21).
Abb. 17.21: Zwei gleichsinnig vom Strom durchflossene parallel verlaufende Drähte ziehen sich an, gegensinnig durchflossene stoßen sich ab aus
I _
+
I
_
+
Fließen die Ströme parallel zueinander, so beobachten wir, dass sich die Drähte anziehen, bei antiparalleler Stromführung stoßen sie sich ab. Quantitativ ergibt sich aus (17.41) durch EinG G G setzen von B aus (17.29b) und Berücksichtigung von I A B für den Betrag der Kraft
F
P0 I1 I 2 l . 2S r12
(17.74)
Auf dieser Beziehung beruht die Definition der Einheit der Stromstärke, des Ampere. 1 A ist die Stärke eines stationären elektrischen Stromes, der zwischen zwei im Abstand von 1 m angeordneten parallelen, unendlich langen Drähten im Vakuum pro Meter die Kraft von 2 10-7 N hervorruft.
426
17.3
17 Statische Magnetfelder
Relativistischer Zusammenhang zwischen elektrischen und magnetischen Feldern
Nach unseren bisherigen Erfahrungen scheinen elektrische und magnetische Felder völlig unabhängig voneinander zu existieren. Wir werden aber im Folgenden sehen, dass in Wirklichkeit eine enge Verknüpfung zwischen ihnen besteht. Betrachten wir das Beispiel einer negativen Probeladung q, die sich parallel zu einem stromdurchflossenen Draht mit der G y Geschwindigkeit v 0 bewegt (Abb. 17.22). r q v¢ Wie stellt sich die Situation in einem fest mit r r r r dem Draht verbundenen Inertialsystem S ¢ r v¢+ = v, v¢- = 0 dar? Die Antwort kennen wir bereits: Bewegen sich Probeladung und Elektronen x im Inneren des Drahtes in die gleiche Richtung, so wirkt nach (17.12b) und (17.41b) auf die Probeladung eine anzieS hende Kraft der Größe
F
y´ S¢
q v¢+ = - v, v¢- = 0
r r
r v¢=0
x´
Abb. 17.22: Eine negative Probeladung bewege sich mit der Geschwindigkeit v0 parallel zu einem stromdurchflossenen Draht
P0 I q v 0 . 2S r
(17.75)
Hierin ist r der Abstand zwischen Ladung und Draht. Den Strom I drücken wir aus durch I U vA , wobei U die Dichte der Elektronen ist, v ihre Geschwindigkeit und A die Querschnittsfläche des Drahtes. Wir wollen zunächst den Fall v = v0 betrachten. Wir erhalten dann als Kraft
F
P0 q U A 2 v 2S r
P0 c 2 q U A v 2 (17.76) r c2 2S
Wir merken noch an, dass der Draht natürlich ungeladen ist; positive Ladung der Atomrümpfe und negative Ladung der Elektronen heben sich auf. Die positiven Ladungen ruhen in unserem Koordinatensystem. Wir verlegen nun unseren Beobachtungsort in ein sich mit dem Draht bewegendes Inertialsystem S´. Auf Grund des Relativitätsprinzips erwarten wir, dass die Probeladung mit einer gleich großen Kraft angezogen wird. In der Tat erzeugen die positiv geladenen Atomrümpfe des Drahtes am Ort der Probeladung ein Magnetfeld. Aber nun scheint sich ein Debakel abzuzeichnen: Die Probeladung ist in Ruhe, also ist die Lorentzkraft gleich null. Als rettender Ausweg bietet sich eine elektrische Feldkraft an. Dazu muss der sich bewegende Draht von S´ betrachtet geladen erscheinen. Das ist tatsächlich der Fall, und zwar deswegen, weil der Draht in S´ betrachtet, kürzer ist als in S. Da Ladungen beim Wechsel des Koordinatensystems unverändert bleiben, ändern sich mit der Länge des Drahtes auch die Ladungsdichten, und
17 Statische Magnetfelder
427
zwar für die sich bewegenden positiven Ladungen und die ruhenden negativen Ladungen unterschiedlich. Die Längenkontraktion beträgt nach Kap. 2.3.1.1,
l ' l 1 v2 / c2 ,
(2.10b)
wobei l die Länge eines Drahtstückes im Koordinatensystem S ist, in dem der Draht ruht. Der Querschnitt bleibt gleich, so dass das Volumen gemäß kleiner ist als in S. Bezeichnen wir die stationäre Ladungsdichte in S mit U , so befindet sich im Drahtstück der Länge l und dem Querschnitt A die Ladung Q U l A . Ersetzen wir U 0 durch U ' und l durch l´, so folgt für die Ladungsdichte des Drahtstückes in S´
U
U0
1 1 v2 / c2
.
(17.77)
Daraus ergibt sich die Ladungsdichte der sich in S´ bewegenden positiven Ladungen zu
U '
U
1
.
1 v2 / c2
(17.78)
Die negativen Ladungen ruhen in S´. Folglich ist ihre Ladungsdichte dort gleich der „Ruhedichte“ U 0 . In (17.77) ist dann U0 U ' , denn U ' ist die Dichte, wenn der Draht ruht. Folglich gilt für die Elektronen im Draht
1
U
U '
,
(17.79)
U '
U 1 v2 / c2 .
(17.80)
1 v2 / c2
bzw.
Berücksichtigen wir, dass der Draht in S neutral ist, U ladungsdichte U '
U'
U
'
U U
U , so erhalten wir als Gesamt-
'
v2 / c2 1 v2 / c2
.
(17.81)
Der sich bewegende Draht ist positiv geladen und erzeugt am Ort der Probeladung ein G elektrisches Feld E c .
428
17 Statische Magnetfelder
Die zugehörige Coulombkraft ist durch (15.12) gegeben:
G G F c qE c .
(17.12)
Das elektrische Feld eines geladenen Drahtes im Abstand r von der Achse ist durch (1.45c) gegeben:
G E
O rˆ . 2SH 0 r
(17.45c)
Damit wird der Betrag der elektrischen Kraft
F'
e
U A
v2 / c2
2SH 0
r
1 v2 / c2
(17.82)
sie ist zum Draht gerichtet. Ein Vergleich mit der in S wahrgenommenen Kraft F zeigt, dass die Kräfte bis auf den Wurzelfaktor gleich sind, sofern
H 0 P0 c2
1.
(17.2)
Diese Beziehung hatten wir schon in Kap. 17.1.1 kennen gelernt. Sie folgt hier direkt aus dem Relativitätsprinzip. Es ist also
F'
1 1 v2 / c2
F.
(17.83)
Für kleine Geschwindigkeiten sind die Kräfte also gleich. Allein durch einen Wechsel des Bezugssystems wird aus einer magnetischen Kraft eine elektrische Kraft und umgekehrt. Gehen wir also von einer elektrischen Kraft in S´ aus, so können wir durch eine KoordinatenTransformation in das Ruhesystem des Drahtes die Lorentzkraft ableiten. Dies zeigt, dass zwischen elektrischen und magnetischen Feldern ein enger Zusammenhang besteht, so dass wir zu Recht von einem elektromagnetischen Feld sprechen. Bei der Besprechung der relativistischen Dynamik hatten wir gefunden, dass sich die Kraft bei hohen Geschwindigkeiten selbst transformiert. In unserem Beispiel ist für F´ die transversale Komponente einzusetzen. Für diese gilt
F'
1 1 v2 / c2
F.
(7.13))
Dieser Ausdruck ist aber gerade identisch mit (17.83), so dass letztere Beziehung auch für große Geschwindigkeiten erfüllt ist.
17 Statische Magnetfelder
17.4
429
Materie im magnetischen Feld
17.4.1 Übersicht Wir hatten in Kap. 15 gefunden, dass das elektrische Feld in Materie elektrische Dipole induziert oder schon vorhandene Dipole ausrichtet, woraus eine dielektrische Polarisation G resultiert. Analog dazu bewirkt ein Magnetfeld eine Magnetisierung M einer Probe. Sie wird G durch atomare magnetische Momente pm verursacht, die ebenfalls entweder durch das Feld induziert werden oder, wenn schon vorhanden, in diesem ausgerichtet werden.
G M
1 G ¦ pm . V V
(17.84a)
G Da die Dimension des magnetischen Momentes Am2 ist, ergibt sich für die von M zu
>M @
1A / m .
(17.84b)
Ähnlich wie im elektrischen Fall, wo die Polarisation eine Änderung der elektrischen Feldstärke in Materie zur Folge hat, wird im äußeren Magnetfeld eine Veränderung des G magnetischen Feldes B beobachtet. Stellen wir uns etwa eine stromdurchflossene Spule vor G und bezeichnen wir das Vakuum-Feld in ihrem Inneren mit B0 , so können wir schreiben
G B
G G B0 P0 M .
(17.85)
G Es ist zu beachten, dass erst das Produkt aus P0 und M die Dimension von B hat. Die G Erfahrung zeigt, dass der zweite Term bei nicht zu hohen Temperaturen proportional zu B0 ist. Der Proportionalitätsfaktor heißt magnetische Suszeptibilität F m .
G
P0 M
G
F m B0 .
(17.86)
G Durch Einsetzen und Ausklammern von B0 folgt
G G G B (1 F m ) B0 : P B0 .
(17.87)
Der Klammerausdruck wird als Permeabilität P bezeichnet. Auf Grund des Vorzeichens und Wertes von F m werden die Stoffe bezüglich ihres magnetischen Verhaltens in drei Typen eingeteilt. Alternativ kann die Klassifizierung durch den Wertebereich von µ erfolgen.
430
17 Statische Magnetfelder
In Tab. 17.1 sind die molaren Suszeptibilitäten F m , mol einiger Stoffe bei Raumtemperatur zusammengestellt. Wir besprechen zunächst den Diamagnetismus.
Typ
µ
Fm
Diamagnetische Stoffe
<0
z f ( B)
z f (T )
<1
Paramagnetische Stoffe
>0
z f ( B)
z f (T )
>1
Ferromagnetische Stoffe
>> 0
f ( B)
f (T )
>> 1
Tab. 17.1: Einteilung des Magnetismus nach Vorzeichen und Größe der magnetischen Suszeptibilität Fm bzw. der Permeabilität µ
17.4.2 Diamagnetismus Diamagnetische Stoffe besitzen kein permanentes magnetisches Moment. Im Magnetfeld werden aber magnetische Dipole induziert. Die Beobachtung zeigt, dass ein Diamagnet im inhomogenen Feld eine abstoßende Kraft erfährt. Die Magnetisierung ist also dem induzierenden Feld entgegengesetzt, d. h. die magnetische Suszeptibilität ist negativ. Die Kraft ist analog zur Elektrostatik (Gl. 15.37b) gegeben durch
G F
Probe N r B
S
Abb. 17.23: Anordnung zur Ermittlung der magnetischen Suszeptibilität und
G G pm grad B .
(17.88a)
Eine Probe mit dem Volumen V erfährt also eine Kraft
G F
G G M V grad B
G Fm G V B grad B . (17.88b) P0
Ist der Feldgradient bekannt, so lässt sich durch Messung der Kraft, etwa mittels einer geeichten Feder (Abb. 17.23), die Suszeptibilität bestimmen. Da die Werte sehr klein sind, muss die Messanordnung sehr empfindlich sein. Der Diamagnetismus ist eine Eigenschaft aller Stoffe, er wird aber in Para- und Ferromagneten von deren magnetischen Eigenschaften überdeckt. Alleiniger Diamagnetismus tritt auf in Atomen mit abgeschlossenen Elektronenschalen, z.B. in Edelgasen. Eine besonders große negative Suszeptibilität zeigt Wismut (Tab. 17.2a)
17 Statische Magnetfelder
431
Stoff
F m <109 / Mol Stoff
F m <109 / Mol
Wasserstoff Helium Neon Argon Krypton Xenon Kohlendioxyd
-3,98 -1,19 -6,74 -19,6 -28,8 -43,9 -21,0
-5,46 -19,5 -28 -99 -280 -11,4 -13
Kupfer Silber Gold Antimon Wismut Zink Wasser
Tab. 17.2a: Magnetische Suszeptibilität einiger diamagnetischer Stoffe
17.4.3 Paramagnetismus Paramagnetische Stoffe bestehen aus permanenten magnetischen Dipolen. Auf Grund der thermischen Bewegung ändert sich ihre Orientierung dauernd, so dass eine Probe kein resultierendes magnetisches Moment aufweist, µ M = 0. In einem äußeren Magnetfeld werden die Stoff Dipole z.T. ausgerichtet, und daher hat die Magneti1,003 758 sierung jetzt einen von null verschiedenen Wert. Er Eisenchlorid 1,000 000 4 erweist sich als umgekehrt proportional zur Tempe- Luft Sauerstoff 1,003 400 ratur. Die Suszeptibilität wird
Fm
P0 N pm2 3 kT
.
(17.89)
Tab. 17.2b: Permeabilität µ einiger paramagnetischer Stoffe
17.4.4 Ferromagnetismus Der Ferromagnetismus ist durch sehr hohe Werte der Suszeptibilität gekennzeichnet, die um mehrere Größenordnungen über denen von Paramagneten liegen. Während bei dia- und paramagnetischen Stoffen die Magnetisierung proportional zur Stärke G des äußeren Feldes B0 ist, hängt sie bei Ferromagneten von der Vorgeschichte ab. Füllen wir den Innenraum einer langen Spule mit einem ferromagnetischen Material, z.B. Eisen, das nach außen keinerlei Magnetismus zeigt, und schalten den Stromkreis ein, so beobachten wir bei kleinen Feldstärken B0 zunächst einen linearen Anstieg der Magnetisierung (Abb. 17.24);
432
17 Statische Magnetfelder
Stoff
µ
Eisen, je nach Vorbehandlung Heuslersche Legierung (75,6% Cu, 14,3% Mn, 10,1% Al) Kobalt µ-Metall (76% Ni, 17 % Fe, 5% Cu, 2% Cr) Mo-Permalloy (78,5% Ni, 3,8% Mo, 17,7% Fe)
400-10 000 50-80 80-180 12 000-45 000 20 000-75 000
Tab. 17.2c: Permeabilität einiger ferromgnetischer Stoffe der Verlauf wird aber mit weiter zunehmender Feldstärke flacher und mündet in eine Sättigung ein. Bei wieder abnehmender Feldstärke wird nicht wieder der bisherige Weg durchlaufen, sondern einer oberhalb der Neukurve, so dass selbst bei B0 = 0 eine Restmagnetisierung übrig bleibt. Sie wird als Remanenz bezeichnet. Umpolung und Steigerung des Feldes ergibt die Kurve c. Die zur Beseitigung der Restmagnetisierung erforderliche Feldstärke BK heißt Koerzitivfeld. Nach Erreichung der Sättigung wird durch Reduzierung von B0 und anschließender erneuter Umpolung das Maximum der Neukurve erreicht. Die gesamte durchlaufene Kurve heißt Hysteresekurve. Ihre Fläche ist ein Maß für die Energie, welche zur Ausrichtung der magnetischen Dipole benötigt wird. Der Ferromagnetismus verschwindet bei einer bestimmten Temperatur TC, die als Curie-Temperatur bezeichnet wird. Oberhalb TC verhält sich der Stoff paramagnetisch. Der Verlauf der Suszeptibilität F m in diesem Bereich kann b M durch das sog. Curie-Weiss-Gesetz dargestellt werden (C. Curie, 1859-1906, P. Weiss, 18651940). C heißt Curie-Konstante, 4C ist die paraMR a magnetische Curie-Temperatur.
Ba
BK
Fm c
C . T 4C (17.90)
Werte für TC , 4C und C einiger Ferromagnete sind in Tab. 17.3 wiedergegeben. Wie lässt sich der große Unterschied in den Eigenschaften eines Paramagneten und eines Ferromagneten verstehen? In beiden Fällen basiert der Magnetismus auf permanenten atomaren magnetischen Momenten der Materialien. Die Größe der Momente variieren nicht stark. Der Grund für die große Magnetisierung ist die starke Wechselwirkung der Leitungselektronen mit den Spins der Elektronen nichtabgeschlossener Abb. 17.24: Magnetisierungskurve eines Ferromagneten als Funktion des äußeren Magnetfeldes
17 Statische Magnetfelder
Tab. 17.3: Curietemperatur TC, Curiekonstante C und paramagnetische Curietemperatur )C einiger ferromagnetischer Stoffe
433
Substanz
TC/K
C/K
)C/T
Co Fe Ni EuO
1395 1043 629 70
2,24 2,22 0,59 4,7
1415 1100 650 78
Schalen in ferromagnetischen Metallen. Diese hat zur Folge, dass sich die magnetischen Momente in ganzen Bereichen parallel stellen. Es existieren in diesen Stoffen also bereits ohne ein äußeres Feld Gebiete mit einer spontanen Magnetisierung (Abb. 17.25). Sie heißen Weisssche Bezirke. Ohne äußeres Feld kompensieren sie sich weitgehend. In einem äußeren Magnetfeld werden die magnetischen Momente eines solchen Bezirks simultan in die Feldrichtung umgeklappt. Dadurch wird die Magnetisierung in kleinen Sprüngen, den sog. BarkhausenSprüngen (H. Barkhausen, 1881-1956), geändert. Sie lassen sich durch einen Induktionsvorgang Abb. 17.25: Weißsche Bezirke in (Kap. 18) akustisch hörbar machen. Dazu wird eine einem äußerlich unmagnetischen kleine Induktionsspule mit einem Eisenstab in eine Ferromagneten Feldspule gebracht und über einen Verstärker mit einem Lautsprecher verbunden (Abb. 17.26). Bei langsamer Erhöhung des Stromes in der Feldspule entstehen Spannungsspitzen, die als Knackgeräusche zu hören sind. Ferromagnetische Stoffe bestehen hauptsächlich aus Übergangselementen
a)
B
b)
Ba Abb. 17.26: a) Anordnung zur Hörbarmachung von Barkhausen-Sprüngen b) Vergrößerter Ausschnitt der Magnetisierungskurve von Abb. 17.24. Die Magnetisierung verläuft entsprechend der Barkhausen-Sprünge stufenförmig
434
17 Statische Magnetfelder
17.4.5 Andere Formen des Magnetismus Zu den Materialien mit kollektivem Magnetismus gehören auch die sog. Antiferromagnete und Ferrimagnete. Es sind meistens Isolatoren. Ein Antiferromagnet besitzt zwei magnetische Untergitter, in denen die gleich großen magnetischen Momente antiparallel zueinander gerichtet sind. Die Gesamt-Magnetisierung ist also null. Bei einem Ferrimagnet sind die magnetischen Momente der beiden Untergitter unterschiedlich groß, so dass eine spontane Magnetisierung verbleibt. – Der bisher besprochene Magnetismus basiert auf den magnetischen Momenten der Hüllen-Elektronen der Atome. Magnetische Kernmomente führen zum Kernmagnetismus. Sie sind drei Größenordnungen kleiner als die Momente der Elektronen.
17.4.6 Grundgleichungen des statischen magnetischen Feldes in Materie Die Gln. (17.8) und (17.11) sind die Grundgleichungen des magnetischen Feldes im Vakuum in Integralform.
G G
v³ Bdr
P0 I
G G
v³ B dS
(17.8)
C
0
(17.11)
S
Die rechts stehende Gleichung bedeutet, dass das Magnetfeld quellenfrei ist; es gibt keine magnetischen Monopole. Daran ändert sich auch nichts, wenn wir das Feld in Materie betrachten. Diese Gleichung gilt also weiterhin. Die linke Gleichung, das Amperesche Gesetz, besagt, dass ein Magnetfeld durch eine Bewegung elektrischer Ladungen hervorgerufen wird. Nun wissen wir, dass auch die Elektronen in bestimmten Materialien zum Magnetfeld beitragen können. Wir haben also auf der rechten Seite von 17.11 den Term
G G
P0 v³ Mdr
(17.91)
C
hinzuzufügen.
G G
v³ Bdr C
G G
P0 I P0 v³ Mdr
(17.92)
C
Die Grundgleichungen der Magnetostatik in Materie lauten also zusammengefasst
G
G
G
v³ B P M dr
P0 I ;
G G rot B P0 M
P0 j ;
0
C
G
G G
v³ B dS S
0;
G di v B 0.
(17.93a-d)
Starke Magnetfelder werden durch Elektromagnete erzeugt. Betrachten wir eine ringförmige Spule, deren Inneres bis auf einen schmalen Luftspalt von einem ferromagnetischen Kern
17 Statische Magnetfelder
435
ausgefüllt wird (Abb. 17.27). Fließt ein Strom I durch die Spule, so ist das Feld B im Kern um den Faktor µ größer als ohne Eisenkern. Da das Feld in der Spule wegen der Quellenfreiheit G auch den Spalt durchsetzen muss, folgt, dass die B -Felder im Eisen und im Spalt gleich sind.
G BFe
G BLuft .
(17.94)
Um B auszurechnen, bemühen wir (17.93a). Wir schreiben die Gleichung in der Form
G G
v³ H ds
l H Fe d H Luft
l
B
PP0
d
B
P0
NI
(17.95)
wobei (17.9) benutzt wurde. Für B folgt also
B
P0 NI . d l/P
(17.96)
Drücken wir noch die Länge l der Spule bzw. des Eisenjochs durch dessen mittleren Radius R aus, so ergibt sich
B
P P0 N I . P d 2S R
(17.97)
Für d << l/µ wird B µ - mal größer als das Feld einer Luftspule.
B
P P0 N I l
,
(17.98)
B R d
0
1
2
3 4 d /(2p R / µ)
Abb. 17.27: Das Magnetfeld in dem schmalen Schlitz eines von einer Ringspule umgebenden ferromagnetischen Torus ist µ-mal größer als das Feld der Spule und
436
17 Statische Magnetfelder
Für d >> l/µ ist
B
P0 N I d
,
(17.99)
was eine Verstärkung des Feldes einer Luftspule um den Faktor l/d bedeutet.
17.5
Das Magnetfeld der Erde
Das magnetische Feld der Erde war bereits vor mehreren 1000 Jahren den Völkern in China bekannt. Zu Beginn des Mittelalters diente es den seefahrenden Völkern in Europa zur Navigation. Auch Zugvögel richten sich nach ihm. Das Feld entspricht näherungsweise dem eines magnetischen Dipols im Erdmittelpunkt, dessen Richtung gegenüber der geographischen NordSüd-Richtung um 11,4° geneigt ist (Abb. 17.28). Die Feldstärke beträgt an den Polen ca. 60 µT, am Äquator ca. 30 µT. Im Allgemeinen hat das Feld eine Horizontal- und eine Vertikalkomponente. Die Abweichung der Magnetnadel von der geographischen Nord-SüdRichtung wird als Deklination bezeichnet, ihre Neigung gegenüber der Horizontalen als Inklination. Beide Werte variieren von Ort zu Ort (Abb. 17.29), außerdem schwach mit der Zeit. In geologischen Zeiträumen kam es allerdings zu großen Veränderungen des Feldes. So drehte sich die Richtung in unregelmäßigen zeitlichen Abständen mehrfach um. Dies ergaben Analysen der Magnetisierung von eisenhaltigen Gesteinsproben. Die Untersuchungen basieren auf der Annahme, dass bei der Gesteinsbildung aus flüssigem Magma die durch das Erdfeld verursachte Magnetisierung eingefroren wurde, sich also in späteren Zeiträumen nicht mehr änderte. 11,4°
N Erdkugel
PS
S
PN
S Abb. 17.29: Abweichungen des Magnetfeldes der Erde von dem eines magnetischen Dipols (L17.1) und
Abb. 17.28: Das Magnetfeld der Erde rührt von der Rotation einer flüssigen Kugelschale her, die den festen Erdkern umschließt
17 Statische Magnetfelder
437
Der Zeitpunkt der Gesteinserstarrung kann durch radioaktive Datierungsmethoden ermittelt werden. Weniger als 2% des Gesamtfeldes stammen von ferromagnetischem Gestein. Woher rührt also der Hauptanteil des Erdmagnetfeldes, das sog. Hauptfeld? Dazu müssen wir uns den Aufbau der Erde vor Auge führen. Die Erdkruste ist 30-40 km dick. Es schließt sich der Erdmantel an; er besteht im Wesentlichen aus Eisen-, Nickel- und magnesiumhaltigen Silikaten. Der aus einer Nickel-Eisen Legierung bestehende Erdkern beginnt in ca. 3000 km Tiefe. Sein äußerer Teil ist flüssig, im Innern ist er fest. Ferromagnetismus als Ursache des Hauptfeldes kommt deswegen nicht in Frage, weil in Tiefen von ca. 30 km die Curie-Temperatur überschritten wird. Im Erdinneren müssen also ringförmige elektrische Ströme fließen. Als solche werden Magmaströme ionisierter Teilchen im flüssigen äußeren Teil des Erdkerns angesehen (L17.1,2,3). Sie entstehen durch das Zusammenwirken zweier Effekte. Auf Grund des radialen Temperaturgradienten kommt es zu Konvektionsströmen. Aus dem Innern steigt flüssiges Magma auf, kühlt sich ab und sinkt als feste Materie wegen seiner geringeren Dichte wieder nach unten. Auf die sich bewegenden G G G Teilchen wirkt wegen der Erddrehung die Corioliskraft FC 2m (v u Z ). Sie führt zu einer tangentiellen Ablenkung der Teilchenströme. Dazu kommen Verstärkungseffekte nach dem Dynamo-Prinzip des Nebenschlussmotors (Kap. 18.5). An die Stelle des rotierenden Ankers tritt der Erdkern, der im schwachen Feld der Erdkruste und des Außenfeldes rotiert. Dadurch wird ein Induktionsstrom erzeugt, der das Feld der Erdkruste verstärkt usw. Das Außenfeld hat seine Ursache in den elektrischen Strömen der Ionosphäre und der Magnetosphäre. Beobachtete lokale Feldveränderungen werden unter anderem durch Ansammlung ferromagnetischen Gesteins (z.B. Basalt) hervorgerufen. Das Erdmagnetfeld bewahrt die Erde vor dem Bombardement der Ionen des Sonnenwindes, indem es sie so ablenkt, dass sie um die Erde herumgeführt werden. Für das Leben auf unserem Planeten ist das eminent wichtig.
438
17 Statische Magnetfelder
Zusammenfassung x Magnetische Felder werden von Permanentmagneten und von elektrischen Strömen G erzeugt. Die magnetische Feldstärke B (magnetische Induktion) und die magnetische G Erregung H im Vakuum sind verknüpft durch die Relation
G B
G µ0 H .
Der Proportionalitätsfaktor µ0 heißt Permeabilitätskonstante. x Stationäre Magnetfelder sind quellenfrei; es gibt keine magnetischen Monopole,
G div B 0 . x Das Linienintegral des magnetischen Feldes über einen geschlossenen Umlauf C eines stromführenden Drahtes ist
G G
v³ Bds C
§ µ0 I ¨¨ ©
G G·
³ j dA ¸¸¹ G A
bzw.
G rot B
G µ0 j .
x Das zylinderförmige magnetische Feld um einen stromführenden geraden Draht hat den Betrag
µ0 I . 2S r
B(r )
x Das magnetische Feld einer langen zylindrischen Spule der Windungszahl n pro m im Inneren der Spule ist homogen und beträgt
B
µ0nI
G G G G x Das Vektorpotential A(r ) des magnetischen Feldes B(r ) ist definiert als
G rot A
G B;
Eindeutigkeit lässt sich erreichen durch die Coulombsche Eichbedingung
G div A 0 .
17 Statische Magnetfelder
439
G G x Das von einem Leiterelement ds2 in einem Punkt P (r1 ) erzeugte Magnetfeld ist durch das Biot-Savartsche Gesetz gegeben,
G
G G B (r1 )
P0 ds2 u eˆ12 I . 4S ³ r122
G G x Auf ein sich im elektrischen Feld E und magnetischen Feld B mit der G Geschwindigkeit v bewegendes geladenes Teilchen der Ladung Q wirkt die Kraft
G F
G G G Q E v u B ; (Lorentzkraft).
x Auf Grund der Lorentzkraft entsteht in einem vom Strom I durchflossenen Leiter in G G G einem homogenen magnetischen Querfeld B senkrecht zu I und B eine elektrische Spannung UH (Hallspannung). x Zwischen elektrischen und magnetischen Feldern besteht ein relativistischer Zusammenhang. Beim Übergang von einem Bezugssystem zu einem anderen wird die elektrostatische Coulombkraft in die -Lorentzkraft transformiert und umgekehrt. G x Das magnetische Feld B in Materie ist mit dem Magnetfeld B0 im Vakuum G G G verknüpft durch B (1 F m ) B0 : P B0 . Auf Grund der magnetischen Suszeptibilität F m unterscheiden wir
Diamagnetische Materialien
F m 0; F m 1 ;
Paramagnetische Materialien F m ! 0; F m 1 ; Ferromagnetische Materialien F m ! 0; F m !! 1 . x Die Grundgleichungen der Magnetostatik in Materie lauten zusammengefasst
G
G
G
v³ B P M dr 0
C
G G
v³ B dS S
0
P0 I
bzw.
G G rot B P0 M
G div B 0 .
G
P0 j
440
17 Statische Magnetfelder
Übungsaufgaben 1. Um die Horizontalkomponente des erdmagnetischen Feldes zu messen, denken wir uns eine Magnetnadel horizontal aufgehängt und durch einen kleinen Stoß zu horizontalen Schwingungen angestoßen. Um aus der Schwingungsdauer die Feldkomponente bestimmen zu können, benötigen Sie neben dem Trägheitsmoment der Nadel deren Polstärke. Geben Sie entsprechende Messverfahren an. 2. Wie lassen sich homogene magnetische Felder erzeugen? Begründen Sie bitte Ihre Antwort! 3. In einem ein Quadrat bildenden Leiter fließe ein elektrischer Strom I. Berechnen Sie das Magnetfeld im Mittelpunkt des Quadrates. Vergleichen Sie das Resultat mit dem Feld eines Ringstromes im Zentrum. 4. Bestimmen Sie die Abhängigkeit des Magnetfeldes vom Ort für ein Koaxialkabel. Die Ströme im Innenleiter und in der Abschirmung sollen gleich groß sein. 5. Die Pole einer Stromquelle A und B seien durch einen halbkreisförmigen Leiter miteinander verbunden, durch den ein elektrischer Strom fließt. Bestimmen Sie die Kraft auf den Leiter, wenn sich dieser in einem homogenen Magnetfeld befindet, das in Richtung senkrecht zur geraden Verbindungslinie zwischen A und B in der Ebene des Leiters weist. 6. 14C- und 12C-Atome werden in einer Ionenquelle einfach ionisiert und durch die Spannung U = 1,2 kV beschleunigt. Durch einen Schlitz treten sie in ein senkrecht zur Flugrichtung gerichtetes Magnetfeld B = 0,4 T ein. a) Wo treffen sie auf die Fotoplatte? b) Wie kann mit dieser Anordnung die Masse der Teilchen bestimmt werden?
r B
Fotoplatte Teilchenstrom
7. Ein Helmholtz-Spulenpaar besitze je 120 Windungen bei einem Radius von 45 cm. G a) Wie groß ist das B - Feld in der Mitte bei z = 0? b) Wie groß ist die relative Abweichung bei z = r 5 mm? c) Wie groß muss die Stromstärke sein, damit das Erdmagnetfeld (BErde = 5 10-5 T) kompensiert wird? Ist sonst noch etwas zu beachten? 8. Negativ geladene Ionen bewegen sich in einem homogenen elektrischen Feld (0,0,Ez) in G ^1, 0, 0` - Richtung mit der Geschwindigkeit v . a) Welche Bahn beschreiben die Ionen bei einheitlicher Geschwindigkeit? b) Wie müssen Sie die Anordnung erweitern, um bei unterschiedlichen Geschwindigkeiten der Ionen die spezifische Ladung e/m bestimmen zu können?
17 Statische Magnetfelder
441
9. Sie haben ärgerlicherweise Ihren 1000 kg schweren VW-Golf zu Schrott gefahren und stellen sich beim Schrotthändler, der soeben die zusammengestauchten Reste Ihres ehemaligen Lebensinhaltes mit einem elektrischen Magnethebekran auf die unzähligen anderen Autoleichen stapelt, die Frage, wie groß wohl das magnetische Feld B dieses gewaltigen Magneten ist (Angriffsfläche 0,5 m2). Bei genauerer Betrachtung entdecken Sie eine 2 cm dicke nichtmagnetische Distanzplatte, die für einen konstanten Luftspalt sorgt, in dem sich B aufbaut (µ = µ0). Sie fühlen dem Gerät weiter auf den Zahn und zählen 200 Windungen eines dicken Kupferdrahtes. Wie groß sind B und Wicklungsstrom?
18
Zeitlich veränderliche Felder
Bisher haben wir uns mit den Eigenschaften statischer elektrischer und magnetischer Felder befasst. Wir wollen diese Einschränkung jetzt fallen lassen und zeitabhängige Felder in unsere Fragestellungen miteinbeziehen. Das bedeutet, dass wir von zeitlich veränderlichen Ladungsdichten und Strömen ausgehen. Diese Veränderungen sollen allerdings so langsam erfolgen, dass sich dagegen die Felder über die gegebene Ladungs- bzw. Stromverteilung praktisch unendlich schnell ausbreiten. In diesem Fall können Laufzeiteffekte vernachlässigt werden und die Felder breiten sich im Raum synchron aus. Dieses Vorgehen wird als quasistationäre Näherung bezeichnet.
18.1
Faradaysches Induktionsgesetz
Eine Leiterschleife werde mit ihren Enden mit einem Spannungsmessgerät verbunden (Abb. 18.1). Erzeugen wir in ihrem Zentrum ein zeitveränderliches Magnetfeld, so zeigt das Messinstrument eine Spannung Um(t) an. Sie wird nach ihrem Entdecker, M. Faraday, Induktionsspannung genannt. Um heraus zu finden, von welchen Parametern sie im Einzelnen abhängt, führen wir einige Versuche durch.
R R
N
S
Bz
Abb. 18.1: Versuche zum Induktionsgesetz
x Wir schieben durch die Leiterschleife einen Stabmagneten. Dabei beobachten wir, dass U(t) proportional zur Geschwindigkeit anwächst, mit der der Magnet durch die Schleife bewegt wird. Beim Umdrehen des Magneten ändert sich das Vorzeichen der Spannung. Aus der Stromrichtung folgt, dass das Magnetfeld der Stromschleife so orientiert ist, dass dem Pol des Stabmagneten ein gleichnamiger Pol gegenübersteht.
444
18 Zeitlich veränderliche Magnetfelder
x Variation der Windungszahl N zeigt, dass Um(t) ~ N ist. x Bei festgehaltenem Magneten verändern wir die Fläche A der Leiterschleife, indem wir sie zusammendrücken. Dabei entsteht eine Spannung Um ~ dA/dt. x Wir erzeugen in der Leiterschleife durch eine Helmholtz-Anordnung ein homogenes Magnetd feld. Bei Drehung der Schleife in diesem Feld entsteht eine Spannung U ind ) m , wobei dt GG ) m BA der magnetische Fluss durch die Leiterschleife ist. Fassen wir die Beobachtungen zusammen, so ergibt sich, dass die Induktionsspannung gegeben ist durch die negative zeitliche Änderung des magnetischen Flusses durch die Leiterschleife.
U ind
d)m ; dt
)m
G G
³ B dA .
(18.1)
Das negative Vorzeichen bedeutet, dass die Induktionsspannung der Änderung des magnetischen Flusses entgegengerichtet ist. Der in einem geschlossenen Leiterkreis fließende Strom ist dan – wie im ersten Versuch gefunden – so gerichtet, dass sein Magnetfeld dem Primärfeld entgegengerichtet ist und dadurch _ die Bewegung, die es erzeugt, hemmt. Quintes+ senz: Zur Erzeugung einer Induktionsspannung muss Arbeit verrichtet werden. Dieser SachAbb. 18.2: Demonstration der Lenzverhalt ist als Lenzsche Regel bekannt (H. F. schen Regel E. Lenz, 1804-1865). Sie folgt direkt aus dem Energieerhaltungssatz. Wäre das Vorzeichen positiv, so ständen sich ungleichnamige Magnetpole gegenüber, die sich anziehen würden. Der Stabmagnet würde ohne unser Zutun in die Spule hinein gezogen, wobei eine Induktionsspannung entstanden wäre und damit elektrische Energie. Wir hätten ein perpetuum mobile 1. Art vor uns, elektrische Energie entstände aus dem Nichts. Zur Demonstration der Lenzschen Regel kann eine Anordnung nach Abb. 18.2 dienen. Eine um einen Eisenstab gewickelte Spule ist über einen Schalter mit einer Spannungsquelle verbunden. Weiter befindet sich lose auf dem Stab ein Aluminiumring. Wird der Schalter geschlossen, so wird der Ring auf Grund der Abstoßung empor geschleudert. Wird ein ausgedehnter Leiter durch ein inhomogenes Magnetfeld bewegt, so entstehen ringförmige Induktionsströme, Abb. 18.3: Waltenhofen- die Wirbelströme genannt werden. Ihre Wirkung lässt sich sehr sches Pendel schön mit dem Waltenhofenschen Pendel zeigen (Abb. 18.3). Es
18 Zeitlich veränderliche Magnetfelder
445
besteht aus einem Elektromagneten, zwischen dessen Polschuhen sich eine dicke Aluminiumoder Kupferscheibe als Körper eines Pendels befindet. Bei ausgeschaltetem Magnetstrom schwingt die Scheibe, nur durch die Lagerreibung schwach gedämpft, zwischen den Polen hin und her. Bei Einschaltung des Stromes wird die Scheibe stark abgebremst. Versuchen wir, sie schnell mit der Hand durch das Magnetfeld zu bewegen, so verspüren wir einen starken Widerstand, so als ob sich die Scheibe in einem hochviskosen Medium befände. Ersetzen wir die Scheibe durch einen kammartig geschlitzten Pendelkörper, so verringert sich die Dämpfung erheblich. Beim Hindurchtreten der kompakten Scheibe durch das inhomogene Feld ändert sich in jedem Punkt eines herausgegriffenen kreisförmigen Abschnitts der Scheibe das magnetische Feld. Entlang der Punkte entsteht durch Induktion eine Ringspannung und als Folge derer kreisförmige Ströme, die sogenannten Wirbelströme, die nach der Lenzschen Regel die Bewegung des Pendels hemmen. Durch das Einbringen von senkrechten Schlitzen werden die Strombahnen weitgehend unterbrochen, so dass die Dämpfung stark reduziert wird. In den meisten Fällen sind Wirbelströme unerwünscht, so z.B. bei Transformatoren und Elektromotoren bzw. Generatoren, wo durch sie Energie in Form von Wärme verloren geht. Durch Fertigung des Eisenjoches als Stapel dünner, gegeneinander isolierter Eisenbleche lassen sich solche Verluste minimieren. Ausgenutzt wird die Wirbelstrom-Bremsung z.B. in elektrisch angetriebenen Schienenfahrzeugen.
18.2 Selbstinduktion Durch die zeitliche Änderung des magnetischen Flusses in einer „Induktionsspule“ entsteht in dieser nach dem Induktionsgesetz eine Spannung. Das Magnetfeld und damit der Fluss möge durch eine Feldspule erzeugt werden, die sich im Inneren der Induktionsspule befindet. Der Fluss ist proportional zur Stromstärke I und somit ist d ) / d t d I / d t . Eine Induktionsspannung proportional d I / d t muss nach dem Induktionsgesetz aber auch in der Primärspule auftreten.
U ind
L
dI . dt
(18.2)
Der Proportionalitätsfaktor L heißt Selbstinduktionskoeffizient oder kurz Induktivität der Spule. Ihre Einheit ist nach H. Henry (1797-1878) benannt
> L@
1Vs / A :1Henry 1H
Die Induktivität lässt sich im Prinzip aus den Daten der Spule berechnen.
(18.3)
446
18 Zeitlich veränderliche Magnetfelder
18.2.1 Selbstinduktion einer langen Spule Für eine lange Spule der Länge l und der Windungszahl n pro Meter ergibt sich die Selbstinduktion L wie folgt: Das magnetische Feld im Innern der Spule ist nach (17.14b)
B
P0 nI ,
(17.14b)
womit sich der magnetische Fluss bzw. die zeitliche Flussänderung durch eine ihrer Windungen ergibt zu
AB
)m d )m dt
P0 n AI
P0 n A
(18.4)
dI dt
In einer Spule mit N nl Windungen entsteht also eine Spannung
U ind
P0 n 2 l A
dI . dt
(18.5)
Durch Vergleich mit (18.2) folgt für L
L
P0 n 2 A l
.
(18.6)
Die Induktivität spielt vor allem in der Wechselstromtechnik eine wichtige Rolle. Wir besprechen zunächst der Einschalt- und Abschaltvorgang in einem Stromkreis mit Induktivität
RV
_
+
Abb. 18.4: Stromkreis mit Spule und Ohmschem Widerstand
a) Einschaltvorgang Wir betrachten einen Stromkreis gemäß Abb. 18.4. Er besteht aus einer Spule der Induktivität L und einem in Reihe geschalteten Ohmschen Widerstand R, der sich aus dem Ohmschen Widerstand der Spule und einem möglichen Außen- oder Verbraucherwiderstand zusammensetzt. Zum Zeitpunkt t = 0 werde der Stromkreis über eine Gleichspannung U0 geschlossen.
18 Zeitlich veränderliche Magnetfelder
447
Nach den Kirchhoffschen Regeln gilt
U 0 U ind U0 R
I
RI
U0 L
dI . dt
(18.7a)
L dI . R dt
(18.7b)
Die Lösung dieser inhomogenen Differentialgleichung lässt sich bereits ohne mathematisches Lösungsverfahren finden: Für t = 0 liegt die ganze Batteriespannung an der Spule. Der Strom ist null, da Uind = -U0 . Nach hinreichend langer Zeit ist die Induktionsspannung null und der Strom ist allein durch den Ohmschen Widerstand gegeben, I = U0/R. An diese Grenzwerte muss der Stromverlauf im Zwischenbereich angepasst werI den. Das leistet eine Exponentialfunktion
I (t ) (U 0 / R )e t / W
I=
Vom Maximalwert I = U0/R weicht der Strom um diesen Betrag ab. Also erhalten wir als Lösung
I
U0 1 et /W ; W R
L/R .
I=U0/R
(18.8)
Der Quotient aus L und R heißt Zeitkonstante. Sie bestimmt den Anstieg des Stromes. Der Verlauf der Stromstärke ist in Abb. 18.5a dargestellt.
U0 (1 - e-t /t ) R
t
t
Abb. 18.5a: Stromverlauf in einer Spule beim Anlegen einer Spannung
b) Ausschaltvorgang Wir legen den Schalter nach der anderen Seite um, so dass Spule und die jetzt in Reihe geschalteten Widerstände RL und RV einen geschlossenen Stromkreis bilden. Durch die Änderung der Stromstärke beim Abschalten wird in der Spule eine Spannung induziert, die nach der Lenzschen Regel versucht, den Strom aufrecht zu halten. Es gilt
U ind
L
dI dt
RI .
R
RL RV
(18.9)
Trennung der Variablen und Integration führt zu I
dI ³I I 0
t
R dt , L ³0
(18.10a)
448
18 Zeitlich veränderliche Magnetfelder
ln
I I0
R t L
o I
I 0 et /W .
(18.10b)
Die Induktionsspannung ergibt sich durch Einsetzen von (18.10b) in (18.9) zu
U ind
U 0
RL RV t / W ;W e RL
L /( RL RV )
I
(18.11)
U/U0
(c)
(b)
1.0
I = U0 / R
I = I 0e
-
t t
=
1/e 0.0
t
1 0
t
0
t
Abb. 18.5b,c: Verlauf von Strom (b) und Spannung (c) beim Abschalten der äußeren Spannungsquelle und Schließung des Stromkreises über R aber Der Verlauf der Stromstärke ist aus Abb. 18.5b zu ersehen Abb. 18.5c zeigt, dass unmittelbar nach Umlegen des Schalters (t = 0) Spannungen auftreten, die wesentlich über der Batteriespannung liegen.
18.2.2 Selbstinduktion eines Koaxialkabels Neben der Kapazität eines Koaxialkabels, die wir bereits früher berechnet haben, ist für technische Anwendungen seine Induktivität von Wichtigkeit. Zur Erinnerung: Ein solches Kabel besteht aus einem Innenleiter mit kreisförmigem Querschnitt und einem ihn umgebenden konzentrischen Außenleiter (Abb. 18.6). Die Ströme in den Leitern fließen antiparallel zueinander. Um den Innenleiter erzeugt er ein Magnetfeld, das nach (17.12b) gegeben ist durch
R1 R2 Abb. 18.6: Aufbau eines Koaxialkabels
B(r )
P0 I . 2S r
(17.11b)
Der magnetische Fluss durch eine auf den beiden
18 Zeitlich veränderliche Magnetfelder
449
Leitern senkrecht stehende Fläche ist
G G ³ BdA
)m
A
z0 z
³
z0
§ P0 I ¨ ¨ 2S ©
R2
dr · ³ r ¸¸ dz R1 ¹
R2
P0 Iz dr ; 2S R³ r
(18.12)
1
Daraus ergibt sich für den Fluss und dessen zeitliche Änderung
P0 Iz R2 ln ; 2S R1
)m
d )m dt
P0 z R2 dI ln 2S R1 dt
(18.13, 14)
Andererseits gilt
d )m dt
L
dI ; dt
(18.15)
Durch Vergleich folgt
L
18.3
P0 R z ln 2 . 2S R1
(18.16)
Gegeninduktion
Abb. 18.7 zeigt eine lange Spule mit dem Querschnitt A, der Länge l und n1 Windungen pro Meter, durch die ein zeitveränderlicher Strom I1 fließt. Dicht um die Spule ist eine zweite Spule mit n2 Windungen/m gewickelt). Das Magnetfeld im Innern der ersten Spule ist
B
P0 n1 I . 2S l
(17.14a)
Der Fluss ist ) m B A . Er durchsetzt auch die Spule 2; die zeitliche Änderung des Stromes bewirkt in ihr eine Induktionsspannung
U ind ,2 U ind ,2
n2 A
dB ; dt
(18.17)
U~
P0 n1 n2 A dI1 l
l
dt
{ L12
dI1 . dt
Der erste Faktor L12 heißt Gegeninduktivität.
(18.18)
Abb. 18.7: Zur Gegeninduktivität zweier übereinander gewickelter Spulen
450
18 Zeitlich veränderliche Magnetfelder
Aus Symmetriegründen ist zu vermuten, dass der Koeffizient L12 mit L21 identisch ist, nicht nur in diesem speziellen Fall einer langen Spule. Zur Überprüfung betrachten wir einen vom Strom I1 durchflossenen beliebigen Stromkreis 1. Er ruft im Punkt G G P (r2 ) ein Magnetfeld B hervor, das mit dem Biot-Savartschen Gesetz berechnet werden kann (Abb. 18.8). Das Feld r r erzeugt nach (17.22) ein Vektorpotential B dr2 r r P(r2 ) G dA2 G G P0 I1 dr1 A(r2 ) , (18.20)
4S
r r2
r12 r dA1 r dr1 r P(r1 ) r r1
12
G
wobei d r1w y ein Linienelement des Kreises 1 ist. Der den anderen Leiterkreis durchsetzende magnetische Fluss ist
)m
G G
³ B dA
Af
0
³r
G G
³ rot AdA
f
f
.
(18.21)
Af
Daraus folgt mit Hilfe des Stokesschen Satzes:
G G rot AdA f ³
Abb. 18.8: Zur Berechnung der Gegeninduktivität
Af
v³
G G Adr2 .
(18.22)
(2)
Einsetzen von A(r2) aus (18.21) ergibt
G G
)m
P0 I1 dr1 dr2 . v v ³ ³ 4S (1) (2) r12
(18.23)
Damit wird die Induktionsspannung
U ind ,2
L12
dI1 ; dt
(18.24)
mit der Gegeninduktivität
L12
P0 4S
G G dr1 dr2 v³ v³ r12 (1) (2)
(18.25)
Da das Doppelintegral völlig symmetrisch bezüglich der beiden Leiterkreise ist, folgt
L12
L21
(18.26)
18 Zeitlich veränderliche Magnetfelder
18.4
451
Energie des magnetischen Feldes
In Kap. 18.2.1 hatten wir den Ein- und Ausschaltvorgang in einem Stromkreis betrachtet, der eine Spule und einen Ohmschen Widerstand enthielt. Beim Einschalten der Spannung baut sich in der Spule ein Magnetfeld auf. In diesem ist dann magnetische Feldenergie gespeichert. Das leuchtet sofort ein, wenn wir den Ausschaltvorgang nach Abb. 18.5b betrachten. Der Strom fällt nicht sofort auf null ab, sondern klingt je nach Größe der Zeitkonstante erst langsam ab. Die treibende Spannung ist die entstandene Induktionsspannung. Multiplizieren wir sie mit dem Strom, so erhalten wir die momentane Leistung
Wmagn (t ) U ind I
L
dI I. dt
(18.27)
Die gesamte im Magnetfeld gespeicherte Energie bzw. Leistung ergibt sich durch Integration über die Zeit. 0
Wmagn
L ³ I I0
dI dt dt
1 2 LI 0 ; 2
(18.28)
Hierin ist I0 der durch die Spule fließende Strom vor dem Abschalten der Spannung. Diese Leistung wird im Ohmschen Widerstand in Wärme umgewandelt. Allgemein gilt also
Wmagn
LI 2 / 2 .
(18.29)
Die in einer langen Luftspule gespeicherte magnetische Energie wird mit (18.6)
Wmagn
1 µ0 nI 0 Al 2µ0 l
1 B 2 Al . 2µ0
(18.30)
Damit erhalten wir für die Energiedichte, der allgemein gilt
Wmagn V
: w magn
B2 . 2 µ0
(18.31)
452
18.5
18 Zeitlich veränderliche Magnetfelder
Anwendungen des Induktionsgesetzes
18.5.1 Generatoren und Motoren Elektrische Energie wird auch heute noch überwiegend durch mechanisch angetriebene Generatoren erzeugt. Wird umgekehrt einem solchen Generator elektrische Energie zugeführt, so arbeitet er als Elektromotor. Es gibt verschiedene Ausführungsformen, die alle auf dem Induktionsgesetz beruhen. Der prinzipielle Aufbau eines WechselstromMotors/ Generators ist der gleiche wie beim Drehspulinstrument. Er ist in Abb. 18.9a dargestellt. Zwischen den Polschuhen eines fest montierten Elektromagneten (Stators) mit homogenem Feld B ist eine Spule auf einer Welle drehbar (als Rotor) angeordnet. Auf ihr befinden sich zwei Schleifkontakte, an denen die beiden Enden der Spule befestigt sind. Durch den Antrieb der Welle mit der WinkelAbb. 18.9a: Prinzip des Wechselgeschwindigkeit Z entsteht zwischen den beiden strommotors bzw. -generators Kontakten eine Induktionsspannung
U
G G dA NB dt
NB A Z sin Zt .
(18.32)
Wird der Generator umgekehrt an eine Wechselspannung U angeschlossen, so dreht sich die Spule synchron mit der Frequenz Z der Spannungsquelle. Soll die Anordnung als Gleichstrom-Generator/-Motor dienen, so muss die Spannung nach einer halben Umdrehung umgepolt werden, damit das Drehmoment immer die richtige Richtung hat. Das wird durch den Kommutator erreicht, der im einfachsten Fall aus zwei voneinander isolierten Halbzylindern besteht, die gegeneinander um 180° versetzt auf der Welle angebracht sind. Ein Generator dieser Ausführung liefert eine stark pulsierende Spannung, und der entsprechende Motor bringt ein sehr inkonstantes Drehmoment hervor. Dem Übelstand kann abgeholfen werden durch die Anbringung mehrerer gegeneinander versetzter Spulen auf dem Rotor (Als Trommelanker 12 11 10 9 8 7 6 5 4 3 2 1 (Abb. 18.9b) ausgebildet) Der Magnet benötigt keine externe Spannungsquelle; auf Grund seiner remanenten Magnetisierung ist immer ein kleines magnetisches Feld vorhanden. Der in der Spule erzeugte, zunächst schwache Strom wird dazu ausgenutzt, das Feld sukzessive zu verstärken bis Sättigung eintritt. Diese Methode wird als dynamo-elektrisches Abb. 18.9b: Aufbau eines Trommelankers Prinzip bezeichnet.
18 Zeitlich veränderliche Magnetfelder
453
18.5.1.1 Gleichstrom-Maschinen Es gibt zwei Möglichkeiten, das Magnetfeld in der Feldspule zu erzeugen. Bei der Hauptschluss-Maschine sind Induktionsspule und Feldspule in Reihe geschaltet, während sie bei der Nebenschluss-Maschine parallel geschaltet sind. a) Die Hauptschluss-Maschine Im Leerlaufbetrieb liegt nur eine sehr geringe Spannung UK an den Klemmen der Maschine. Der Feldmagnet wird erst dann erregt, wenn der Stromkreis über einen Verbraucher mit dem Widerstand RV geschlossen wird (Abb. 18.10). UK ist gleich der Induktionsspannung Uind, vermindert um den Spannungabfall am Innenwiderstand Ri .Letzterer setzt sich zusammen aus dem Widerstand RA der Induktionsspule (des Ankers) und dem der Feldspule, Rf. Also gilt mit
Ri
RA R f
UK
U ind Ri I ,
(18.33)
12
11
Stator
1
Rotor
10 2
N
9 3
S
8 4 7 6
5
Uind Abb. 18.10: Schaltung der Hauptschlussmaschine
In Abb. 18.11 ist der Verlauf der Induktions- und der Klemmenspannung in Abhängigkeit von der Stromstärke dargestellt. Uind steigt zunächst linear an, biegt aber bei größerer Stromstärke wegen der beginnenden Sättigung der Magnetisierung ab. Der Arbeitspunkt ergibt sich aus dem Schnittpunkt des Graphen Uind(I) mit der Geraden UK = (Ri+RV)I.
Die elektrische Leistung des Generators ist
U ind I
Ri I 2 RV I 2 .
(18.34)
Der Wirkungsgrad ist definiert als das Verhältnis von nach außen abgegebener Leistung zur Gesamtleistung. Er ergibt sich zu
K
Pa P
UK U ind
RV . RV Ri
(18.35)
454
18 Zeitlich veränderliche Magnetfelder
Ukl
a)
Uind
b) U0
U = f (I)
Ukl
IRi
U = (R i + R v ) I
I
I
Abb. 18.11: Hauptschlussmaschine: a) Erregungskurve mit Arbeitspunkt b) Strom-Spannungs-Kennlinie Er ergibt sich zu
K
Pa P
UK U ind
RV . RV Ri
(18.35)
Zur Optimierung muss also der Innenwiderstand klein gegenüber dem Verbraucherwiderstand sein. Dazu werden die Spulen aus relativ dicken Drähten gefertigt. Die Hauptschluss-Maschine liefert eine von der Belastung abhängige Spannung. Ihr Vorteil ist andererseits, dass sie sich der jeweiligen Belastung anpasst.
b) Die Nebenschluss-Maschine Bei der Nebenschluss-Maschine liegen Feldspule und Verbraucher parallel zur Induktionsspule (Abb. 18.12). Der in ihr erzeugte Strom IA setzt sich folglich zusammen aus dem Feldstrom If und dem Strom IV durch den Verbraucher
IA
I f IV .
(18.36)
Es gelten die Beziehungen
IV
UK ,If RV
Daraus folgt
UK . Rf
(18.37)
18 Zeitlich veränderliche Magnetfelder
If IV
455
RV . Rf
(18.38)
Einsetzen in (18.36) ergibt
IV
Rf RV R f
I A und I f
RV IA . R f RV
Stator
Rotor 12
11
1
10
2
(18.39)
9
Damit erhalten wir für die Leistungen in den drei Parallelkreisen
PA Pf PV
N
2 A A
R I ; RV2 R f ( RV R f ) 2 R 2f RV ( RV R f ) 2
I A2 ;
3
8 4
7 6
5
S
(18.40) Abb. 18.12: Schaltung der Nebenschlussmaschine
2 A
I .
Der Wirkungsgrad der Nebenschluss-Maschine ergibt sich zu
K
R 1 V Rf
1 . RA ( RV R f ) 2
(18.41)
R 2f RV
Zur Erreichung eines großen Wirkungsgrades müssen Rf groß und RA klein gegen RV sein. Die Statorwicklungen bestehen daher aus dünnen Drähten. Die Kennlinie der Maschine ist in Abb. 18.13 gezeigt.
Ukl
Uind
Ukl
Abb. 18.13: Strom-Spannungs-Kennlinie einer Nebenschlussmaschine und
I(Rf+Rv)
I
456
18 Zeitlich veränderliche Magnetfelder
Im Leerlauf, IV = 0, hat die Klemmenspannung ihren höchsten Wert; sie entspricht der Induktionsspannung. Mit zunehmender Belastung, also größerem Strom IV, steigt auch der Ankerstrom an und UK sinkt infolge des am Anker auftretenden Spannungsabfalls. Da der Feldstrom proportional UK ist, wird das Magnetfeld geschwächt, was eine weitere Abnahme der Klemmenspannung zur Folge hat. Schließlich tritt der Moment ein, dass trotz kleiner werdendem RV der Strom IV = UK/RV zu sinken beginnt, da die Klemmenspannung UK schneller abnimmt als RV. Wird die Maschine kurzgeschlossen, so fällt der Strom auf einen sehr kleinen Wert, der durch die remanente Magnetisierung bestimmt ist. Wie die Kennlinie zeigt, bleibt in ihrem oberen Teil die Klemmenspannung ziemlich konstant. Sie ist aber empfindlich gegenüber starken Belastungsschwankungen.
c) Die Verbund-Maschine Durch Kombination der Hauptschluss- und der Nebenschluss-Maschine lassen sich die jeweiligen Nachteile weitgehend vermeiden. Dazu erhält der Feldmagnet zwei Wicklungen, von denen die eine in Reihe mit der Ankerwicklung geschaltet ist und die andere parallel zu ihr.
18.5.1.2 Wechselstrom-Maschinen Wechselstrom-Maschinen kommen ohne Kommutator aus. Entgegen dem in Abb. 18.9a gezeigten Prinzipschaltbild ist die Induktionsspule als Stator ausgebildet, während der Feldmagnet rotiert. Das hat den Vorteil, dass auch große Ströme ohne Komplikationen durch die nötigen Schleifkontakte abgenommen werden können. Letztere werden nur noch benötigt, um dem Rotor den notwendigen Feldstrom zu liefern. Er wird entweder durch Gleichrichtung eines Teils des Induktionsstromes (Nebenschluss-Anordnung) oder durch einen separaten Gleichstrom-Generator erzeugt. Ein solcher Innenpol-Wechselstrom-Generator ist in Abb. 18.14 gezeigt. In diesem Fall besteht der Feldmagnet aus drei Elektromagneten mit alternierenden Polen. Der Stator trägt sechs Induktionsspulen, die mit ebenfalls abwechselndem Richtungssinn gewickelt und in Reihe geschaltet sind. Auf diese Weise addieren sich am Ausgang die Einzelspannungen. Um eine Wechselspannung von 50 Hz zu erzeugen, muss der Generator mit 50 60 / 3 1000 Umdrehungen/Minute laufen. Nach (18.32) ist die Spannung sinusförmig
UK
U 0 sin Zt .
(18.32)
Die Scheitelspannung hängt vom Aufbau des betreffenden Generators ab. Um die an einen Stromkreis mit Ohmschem Widerstand abgegebene Leistung mit der einer Gleichstrom-Maschine vergleichen zu können, wurden die Effektivwerte von Spannung und Strom eingeführt.
18 Zeitlich veränderliche Magnetfelder
457
Stator
Induktionsspulen
Rotor
Abb. 18.14: Innenpol-Wechselstrom-Generator
Feldspulen
Die momentane Leistung ist
P (t ) U 0 I 0 sin 2 Zt .
(18.42)
Die mittlere Leistung über eine Periode wird damit T
P
1 U 0 I 0 sin 2 Zt T ³0
U 0 I0 2
Dies entspricht der Leistung einer Gleichspannungsquelle der Spannung U Strom I
U eff
(18.43
U 0 / 2 , die den
I 0 / 2 abgibt. Daher werden die Größen
U 0 / 2 ; I eff
I0 / 2
(18.44)
als Effektivwerte von Spannung und Strom bezeichnet.
18.5.1.3 Drehstrom-Maschinen
Werden auf dem Stator drei voneinander um 120° versetzte Spulen angebracht, so entsteht eine Drei-Phasen-Wechselspannung; der entsprechende Strom heißt auch Drehstrom. Werden die drei Klemmenpaare mit den entsprechenden Statorklemmen eines Drehstrommotors verbunden, so entsteht im Innenraum ein Feld, das sich mit einer bestimmten Winkelgeschwin digkeit dreht.
458
18 Zeitlich veränderliche Magnetfelder
Die Drehung lässt sich mit einer Magnetnadel demonstrieren, die sich im Zentrum befindet (Abb. 18.15a). Als Rotor dient ein Kurzschlussanker. Es gibt mehrere Ausführungen.
U1 = U 0 sin wt U 2 = U 0 sin(wt - 120°) U 3 = U 0 sin(wt - 240°)
Kupferstäbe Abb. 18.15a: Demonstration eines Drehfeldes mit einer rotierenden Magnetnadel
Abb. 18.15b: Kurzschlussanker gegessen
In Abb. (18.15b besteht er aus einem Metallzylinder, der aus geschichteten Eisenblechen zusammengesetzt ist. In seinen längsseitig angebrachten Nuten befinden sich Kupferstäbe, in denen durch das Drehfeld Wirbelströme induziert werden. Durch die Wechselwirkung der Felder wird der Anker „mitgenommen“. Eine andere Möglichkeit besteht darin, als Anker einen Eisenring mit einer geschlossenen Wicklung zu verwenden, in der starke Ströme induziert werden. Sie versuchen, die Rotation der Statorfelder entsprechend der Lenzschen Regel zu verhindern, wodurch der ganze Ring in Drehung versetzt wird. Der Vorteil des Drehstromgenerators liegt darin, dass er erheblich größere Leistungen als ein Ein-Phasen-Wechselstromgenerator abzugeben vermag. Es ist zwischen zwei Schaltungen der Feldspulen zu unterscheiden: In der Sternschaltung (Abb. 18.16a) ist das eine Ende der Spulen miteinander verbunden, in der Dreieckschaltung (Abb. 18.16b) sind die Spulen in Reihe geschaltet, so dass ein geschlossener Kreis entsteht. Das ist möglich, weil die Summe der induzierten Ströme gleich null ist. Die Spannung wird an den Verbindungspunkten zweier Spulen abgegriffen. Werden in einer Sternschaltung zwischen dem jeweiligen Spulenende und dem gemeinsamen anderen Ende nach Abb. 18.16a drei gleich große Ohmsche Widerstände geschaltet, so fließen in den Verbraucherkreisen die Ströme I1
I 0 sin Zt ,
I2
I 0 sin(Zt 120q),
I3
I 0 sin(Zt 240q).
(18.45)
18 Zeitlich veränderliche Magnetfelder
459
Durch Anwendung der Additionstheoreme lässt sich zeigen, dass bei gleichem I0 die Summe der Ströme verschwindet, so dass durch die gemeinsame Rückleitung kein Strom fließt. Er wird deswegen häufig Nullleiter genannt.
1
a)
b)
1 U1
U1,3 U12 U2
U3,2
U3
2
3
U1,2
3
2
Abb. 18.16a: Sternschaltung der Feldspulen in einer Drehstrommaschine cccccccgegessen
Abb. 18.16b: Dreieckschaltung der Feldspulen
Wir fragen nun nach der Spannung U zwischen den Klemmen zweier Spulen. Dazu müssen wir die Einzelspannungen addieren. Beispielsweise erhalten wir für U12
U
2S · § U 0 sin Zt U 0 sin ¨ Zt ¸ 3 ¹ © 2S 2S · § cos Zt sin U 0 ¨ sin Zt sin Zt cos ¸ 3 3 ¹ © §3 · 3 cos Zt ¸¸ U 0 ¨¨ sin Zt 2 ©2 ¹ 2S 2S § · 3 U 0 ¨ sin sin Zt cos cos Zt ¸ 3 3 © ¹
(18.46)
S· 2S · § § 3 U 0 cos ¨ Zt ¸ 3 U 0 sin ¨ Zt ¸ . 3 ¹ 6¹ © © Es ergibt sich eine Wechselspannung mit dem
3 -fachen Scheitelwert eines Einphasen-
Wechselstrom-Generators. Die Dreieckschaltung liefert drei um 120° versetzte Wechselspannungen mit gleicher Scheitelspannung wie beim Einphasen-Wechselstromgenerator. Der Strom in jeder Leitung setzt sich dagegen aus zwei Strömen zusammen; z.B. gilt
I1
I A IB .
(18.47)
460
18 Zeitlich veränderliche Magnetfelder
Er beträgt das 3 -fache des in einer Spule fließenden Stromes. Die abgegebene Leistung verteilt sich auf die einzelnen Phasen verteilt. Eine Leitung wird somit weniger belastet als beim Einphasen-Wechselstrom-Generator gleicher Leistung Drehstrom kann zum Betrieb eines Drehstrommotors genutzt werden. Dieser funktioniert nach dem Prinzip von Abb. 18.15a.
18.5.2 Wechselstromkreise mit komplexen Widerständen Bisher haben wir nur den Fall betrachtet, dass an einem Wechselstrom-Generator ein Stromkreis mit Ohmschem Widerstand angeschlossen war. Wir wollen nun auch induktive und kapazitive Widerstände zulassen, die durch Spulen und Kondensatoren entstehen. Wir werden sehen, dass in einem solchen Schaltkreis der Strom gegenüber der Spannung phasenverschoben ist. Beispielsweise beträgt die Phasenverschiebung bei einem Kreis mit rein induktivem Widerstand 90°. Es ist daher naheliegend, zur Darstellung dieses Sachverhaltes die komplexe Zahlenebene zu benutzen und den Spannungsabfall an einer Induktivität auf der imaginären Achse aufzutragen. Die Benutzung komplexer Zahlen erleichtert die Berechnungen erheblich. Wir diskutieren drei Fälle: Einen Stromkreis mit einer Induktivität, einen solchen mit einer Kapazität und einen, in dem sich beide Typen sowie ein Ohmscher Widerstand befinden. 18.5.2.1 Stromkreis mit Induktivität
In einem Stromkreis mit einer Induktivität L (Abb. 18.17) gilt nach den Kirchhoffschen Regeln
U G U ind U(t)
U,I
I(t)
L
U0
t
I
Abb. 18.17: Wechselstromkreis mit Induktivität
0,
(18.48)
wobei UG die Spannung der Stromquelle ist. Es folgt in der Schreibweise reeller Zahlen
U 0 sin Zt
L
dI . dt
(18.49)
Integration führt zu
I
U0 sin Zt dt L ³
U0 cos Zt ZL
I 0 cos Zt
I 0 sin(Zt S / 2).
(18.50)
Der Strom hinkt der Spannung um 90° hinterher. Eine Verzögerung des Stromes ist plausibel, denn die auftretende Induktionsspannung verzögert den Strom.
18 Zeitlich veränderliche Magnetfelder
461
18.5.2.2 Stromkreis mit Kapazität
Die Kapazität ist definiert durch
C I
Q U
o U
U 0 Z C cos Zt
Q C
o
I 0 cos Zt
Jetzt eilt der Strom der Spannung voraus (Abb. 18.18). Auch das ist einleuchtend, denn damit am Kondensator eine Spannung liegt, muss erst Ladung auffließen.
1 dQ C dt
dU dt
o U 0 Z cos Z t
1 I C
(18.51)
I 0 sin(Zt S / 2)
(18.52)
U(t)
U,I
I(t)
L
U0
t
I Abb. 18.18: Wechselstromkreis mit Kapazität
18.5.2.3 Stromkreis mit Induktivität, Kapazität und Ohmschem Widerstand
Jetzt behandeln wir eine Reihenschaltung aus L, C, R (Abb. 18.19). Die angelegte Spannung muss gleich der Summe der Spannungsabfälle sein.
R L
U0
dI Q IR U G ; dt C dU G d 2I dI 1 . L 2 R I dt dt C dt
U(t)
I(t) t
U L U C IR U G ; L
U,I
I
C
Dt
Dt = (j / 2p ) T
Abb. 18.19: Wechselstromkreis mit Ohmschem Widerstand, Induktivität und Kapazität
Im Folgenden benutzen wir die komplexe Darstellung und setzen für die angelegte Spannung
UG
U 0 eiZt .
(18.54)
Sie bewirkt einen Strom
I
I 0 ei (Zt M ) .
(18.55)
462
18 Zeitlich veränderliche Magnetfelder
Dabei ist M der Phasenwinkel zwischen Strom und Spannung. Einsetzen in die untere der Gln. (18.45) ergibt
1 § · ) R¸I ¨ i (Z L ZC © ¹
UG .
(18.56)
Definieren wir entsprechend dem reellen Ohmschen den komplexen Widerstand Z
Z eiM
durch den Quotienten UG/I, so folgt für die Impedanz Z oder den Scheinwiderstand 2
Z
1 · § R2 . ¨ZL ZC ¸¹ ©
(18.57)
Der Phasenwinkel folgt aus
tg M
Im( Z ) Re( Z )
Z L 1/(ZC ) R
.
(18.58)
Diese Ergebnisse lassen sich in einem sogenannten Zeigerdiagramm darstellen (Abb. 18.20). Der Ohmsche oder Wirkwiderstand wird auf der Abzisse aufgetragen und der Imaginärteil auf der Ordinate. Letzterer besteht aus zwei Anteilen, dem induktiven Widerstand
RL
iZ L ,
(18.59)
und dem kapazitiven Widerstand
RC
1 iZC
i . ZC
(18.60)
Sind die beiden Teilwiderstände dem Betrage nach gleich, so bleibt nur der Ohmsche Widerstand übrig und der Phasenwinkel ist null. Ist umgekehrt der Ohmsche Widerstand sehr klein gegen den Betrag des Imaginärteils, so beträgt die Phasenverschiebung fast 90°. Da in diesem Fall keine Verluste erkennbar sind, sollte die mittlere Leistung der Stromquelle null sein. Zur Verifizierung machen wir zunächst einen kleinen Abstecher und formulieren den Strom in reeller Schreibweise. Die Lösung werde geschrieben als
eiD
cos D i sin D
(18.61)
Aus der Theorie der Differentialgleichungen folgt, dass bei einer komplexen Lösung sowohl der Realteil wie auch der Imaginärteil eine Lösung darstellen. Wir befinden uns im Einklang mit den obigen Ergebnissen, wenn wir den Imaginärteil wählen (Die richtige Lösung wird ganz allgemein durch die Anfangsbedingungen festgelegt).
18 Zeitlich veränderliche Magnetfelder
I (t )
463
I 0 sin(Zt M ) .
(18.62)
Die mittlere Leistung ergibt sich durch Integration über eine Periode T
P U I
U 0 I0 T sin Zt sin(Zt M ) dt T ³0 U 0 I0 T (sin 2 Zt cos M sin Zt cos Zt sin M )dt T ³0
2S / Z zu
.
(18.63)
Nur der erste Term trägt zur mittleren Leistung bei.
P Für M
U 0 I0 cos M U eff I eff cos M . 2
(18.64)
90q wird die mittlere Leistung null.
Im Z iw L
æ ì 1 üö içwL - í ý÷ îw C þ ø è Abb. 18.20: Zeigerdiagramm zur Darstellung komplexer Widerstände
ì i ü í ý îw C þ
ì Im Z ü tg j = í ý1 î Re Z þ
Z j
R Re Z
Der zweite Term in (18.63) liefert in einer halben Periode einen positiven Beitrag und in der Folgenden einen gleich großen negativen Beitrag. Das bedeutet, dass der Stromquelle abwechselnd Leistung entzogen und zurückgegeben wird. Da sie im Mittel verschwindet, heißt dieser Teil Blindleistung. Von der Stromquelle müssen sowohl Wirkleistung wie Blindleistung zur Verfügung gestellt werden.
464
18.6
18 Zeitlich veränderliche Magnetfelder
Einfache Netzwerke
Induktive und kapazitive Widerstände weisen ein gegenläufiges Frequenzverhalten auf. Während ein induktiver Widerstand proportional zur Frequenz Z zunimmt, nimmt ein kapazitiver Widerstand mit wachsendem Z ab. Dieses Verhalten kann zur Herstellung von Hoch- und Tiefpässen benutzt werden; durch die Kombination beider entsteht ein Frequenzfilter. Ein Hochpass besteht im einfachsten Fall aus einer Kapazität und einem Ohmschen Widerstand, die nach Art eines frequenzabhängigen Spannungsteilers geschaltet sind (Abb. 18.21a). Die Ausgangsspannung Ua wird am Ohmschen Widerstand abgenommen. Ist Ue die Eingangsspannung, so gilt für das Verhältnis von Ue/Ua
Ua Ue
UR U R UC
R . 1/(iZC ) R
(18.65a)
Erweiterung mit dem Konjugiert Komplexen ergibt
Ua Ue
Z 2 R 2C 2 iZ RC . 1 Z 2 R 2C 2
(18.65b)
Daraus ergibt sich durch Multiplikation mit dem Konjugiert Komplexen und anschließendem Radizieren
Ua
Z RC
Ue
1 Z 2 R 2C 2
.
(18.66)
Für kleine Frequenzen wird das Spannungsverhältnis gleich dem Wert des Zählers, für große Frequenzen strebt es gegen eins (Abb. 18.21b).
C
1.0
Ua
U0
R
U0
Ue
0.5
0.0
0
w 5
Abb. 18.21: a) Hochpass aus einer Kapazität und einem Ohmschen Widerstand; b) Verhältnis von Ausgangs- zur Eingangsspannng
18 Zeitlich veränderliche Magnetfelder
465
Werden kapazitiver und Ohmscher Widerstand miteinander vertauscht, so entsteht ein Tiefpass (Abb. 18.22). Wir erhalten
Ua Ue
UC U R UC
R
1/(iZC ) , (18.67) 1/(iZC ) R
Ua
Ue
woraus sich in analoger Weise ergibt
Ua
1
Ue
1 Z 2 R 2C 2
.
(18.68)
Abb. 18.22: In einem Tiefpass sind Ohmscher Widerstand und Kapazität miteinander vertauscht
Für kleine Frequenzen wird das Spannungsverhältnis gleich eins, für große Frequenzen nimmt es wie 1/(Z RC ) ab, strebt also gegen null. Wird in den beiden Schaltungen die Kapazität durch eine Induktivität ausgetauscht, so wird aus einem Hochpass ein Tiefpass und umgekehrt. Allerdings sind die Übertragungseigenschaften wegen des immer vorhandenen Ohmschen Widerstandes etwas schlechter. Eine Induktivität in Kombination mit einer Kapazität und einem Ohmschen Widerstand findet in Frequenzfiltern Einsatz. Eine Reihenschaltung der drei Schaltelemente wie in Abb. 18.23a arbeitet als ein solches Filter, während eine Parallelschaltung von Induktivität und Kapazität einen Sperrkreis darstellt. Wir diskutieren hier den ersten Fall. Das Verhältnis von Ausgangs- zu Eingangsspannung ist
Ua Ue
R 1 · § R i ¨ZL ¸ Z C¹ ©
Ua Ue
;
(18.69) C
Ue
R 1 · § R ¨ZL ¸ C¹ Z © 2
2
L
R
Ua
(18.70) Abb. 18.22a: Die Reihenschaltung von R, Ri und RC bildet ein Durchlass Filter
Für den Fall
Z2
1/ LC
(18.71)
verschwindet der zweite Term und das Spannungsverhältnis wird gleich eins. Wechselstrom mit dieser Frequenz kann das Filter ungeschwächt passieren. Zu größeren und zu kleineren Frequenzen fällt die Ausgangsspannung ab (Abb. 18.23b).
466
18 Zeitlich veränderliche Magnetfelder
Ua Ue
b)
c)
j
p /2 Dw1/ 2
w
w
-p / 2
Abb. 18.23: b) Verhältnis der Ausgangsspannung zur Eingangsspannung bei einem Durchgangsfilter c) Phase der Ausgangsspannung
Die Halbwertsbreite der Durchlasskurve ist gegeben durch die Bedingung, dass die Ausgangsspannung auf die Hälfte des Maximalwertes abgefallen ist.
R 1 · § R2 ¨ Z L ZC ¸¹ ©
2
1 . 2
(18.72)
Daraus folgt
Z
3R 3R 2 1 r 2 2 L 4L LC
'Z1/ 2
3R 2 4 . 2 L LC
(18.73)
(18.74)
. Der Phasenwinkel der Ausgangsspannung relativ zur Eingangsspannung als Funktion der Frequenz ist aus Abb. 18.23c zu ersehen.
18 Zeitlich veränderliche Magnetfelder
18.7
467
Der Transformator
Die für technische Anwendungen benötigten Spannungen und Ströme variieren erheblich. Deswegen muss eine Generatorspannung in die jeweilig erforderliche Spannung umgesetzt werden. Das leisten Transformatoren. Sie bestehen aus zwei Spulen (Abb. 18.24), der F Primärspule mit N1 Windungen und der Sekundärspule mit N2 Windungen, die sich I1 auf einem gemeinsamen geschlossenen Eisenjoch befinden. Wie bereits erwähnt, ist dieses aus vielen gegeneinander isolierten, dünnen Eisenblechen zusammengesetzt, um Wirbelstromverluste gering zu halten. Auch L1 L2 U1 U2 Ferrit-Kerne (Isolatoren) werden zur Minimierung von Wirbelströmen eingesetzt. Im Folgenden besprechen wir die Eigenschaften des verlustfreien, „idealen“ TransformaI2 tors. Ohmsche Widerstände in den Wicklungen, Verluste im Eisenjoch und Verzögerungen im Aufbau des Magnetfeldes infolge Hysteresis werden vernachlässigt. Abb. 18.24: Aufbau eines Transformators
18.7.1 Der ideale Transformator Wird an die Primärspule eine Wechselspannung U gelegt, so wird durch den in ihr fließenden Strom ein zeitveränderlicher magnetischer Fluss erzeugt. Dieser erzeugt eine Induktionsspannung
U ind ,1
L1
dI1 dt
N1
d )m . dt
(18.75)
Der Strom stellt sich so ein, dass
U1 U ind ,1
0.
(18.76)
Setzen wir voraus, dass der gesamte Fluss auch die Sekundärspule durchsetzt, so entsteht bei offenem Sekundärkreis an ihren Klemmen eine Induktionsspannung
U 2 { U ind ,2
N2
d )m . dt
(18.77)
468
18 Zeitlich veränderliche Magnetfelder
Division von (18.77) durch (18.75) führt zu dem Resultat
U2 U1
N2 . N1
(18.78)
Die Sekundärspannung des unbelasteten, verlustfreien Transformators ist gegenüber der Eingangsspannung (bei gleichem Wicklungssinn der Spulen) um 180° verschoben; ihr Wert beträgt das N2/N1-fache der Eingangsspannung. Die primärseitig vom Trafo aus der Stromquelle entnommene Leistung ist bei Vernachlässigung aller Verluste reine Blindleistung, da Strom und Spannung um 90° phasenverschoben sind. Das ändert sich, wenn der Sekundärkreis über einen Widerstand Z geschlossen wird. Der durch den Verbraucher bestimmte Strom I2 erzeugt jetzt seinerseits einen magnetischen Fluss ) 2 , der sich dem primären Fluss )1 überlagert. Wie wir oben gesehen haben, wird durch die zeitliche Änderung von )1 die Kompensation von U1 gewährleistet. Die zusätzliche Durchflutung N 2 I 2 muss also durch einen zusätzlichen Primärstrom I1c ausgeglichen werden, der gegeben ist durch die Bedingung
N1 I1c
N2 I2 .
(18.79)
Mit der Festsetzung der Vorzeichen nach Abb. 18.24 wird der Primärstrom
I1
I1, Leerl
N2 I2 . N1
(18.80)
Es ist zu beachten, dass I2 gegenüber I1,Leerl nach Maßgabe des komplexen Widerstandes im Sekundärkreis phasenverschoben ist. Im Allgemeinen wird I1 größer sein als I1,Leerl . Die Beziehung lässt sich auf formale Weise auch aus den Transformatorgleichungen finden: Nach der Kirchhoffschen Maschenregel muss in einem geschlossenen Stromkreis die Summe aller eingeprägten Spannungen gleich dem Spannungsabfall am Verbraucher sein. Im Primärkreis treten nur eingeprägte Spannungen auf, nämlich die Spannung der Stromquelle, die Selbstinduktionsspannung L1dI1 / dt und die Gegeninduktionsspannung L12 dI 2 / dt . Im Sekundärkreis finden sich als eingeprägte Spannungen die Selbst- und Gegeninduktionsspannung. Am Verbraucher fällt die Spannung ZI 2 ab. Mit dem Ansatz I ei (Zt M ) ergibt sich nach Umordnung der beiden Induktionsterme
U1 0
iZ ( L1 I1 L12 I 2 ) ZI 2 iZ ( L12 I1 L2 I 2 )
.
(18.81)
18 Zeitlich veränderliche Magnetfelder
469
Aus der ersten Gleichung folgt
I1 da
U1 L 12 I 2 , iZ L1 L1 U1 iZ L1
o I1
I1Leerl ,
I1, Leerl
(18.82)
L12 I 2 , q.e.d . L1
Strom- und Spannungsverhältnis ergeben sich aus den beiden Gleichungen zu
I2 I1
iZ L12 , Z iZ L2
U2 U1
L12 Z . 2 L1 Z iZ ( L12 L1 L2 )
(18.83)
(18.84)
Die Diskussion sei dem Leser überlassen.
18.7.2 Anwendungen Von den zahlreichen Anwendungen erwähnen wir hier nur wenige. Im Allgemeinen befinden sich die Kraftwerke, welche die erforderliche elektrische Energie produzieren, in größerer Entfernung von den Verbrauchern, so dass die Energie diesen über Hochspannungsleitungen zugeführt werden muss. Eine hohe Spannung ist erforderlich, um die Verluste durch Joulesche Wärme gering zu halten. Der auf die übertragene Leistung Pel U I bezogene Leistungsverlust beträgt
'Pel Pel
I 2R UI
R Pel . U2
(18.85)
Bei vorgegebener Leistung nehmen die relativen Verluste mit 1/U 2 ab. Typische Werte für U liegen bei 2 104 V. Die Energieeinsparungen sind enorm, wie wir uns an einem Beispiel klarmachen können. Angenommen, es sollte eine Leistung von 2 kW über eine Leitung von 10 : übertragen werden. Die verfügbare Spannung betrage 230 V. Der relative Leistungsverlust ist
470
18 Zeitlich veränderliche Magnetfelder
'Pel Pel
R Pel U2
10 2000 0,5 , 2002
(18.86)
'Pel Pel
R Pel U2
10 2000 0,5 , 2002
(18.86)
beträgt also 50%. Wird dagegen die Spannung auf 2 104 V hochtransformiert, so verringern sich die relativen Verluste um vier Größenordnungen:
'Pel Pel
R Pel U2
10 2000 0,5 104 . 4 108
(18.87)
Hohe Spannungen sind weiter überall da erforderlich, wo Ladungsträger durch elektrische Schweißdraht
geschmolzenes Metall Werkstücke
U~
U~ leitende Unterlage
Abb. 18.25: Prinzip des elektrischen Schweißapparates
Abb. 18.26: Anordnung zum Schmelzen von Metallen
Felder stark beschleunigt werden müssen, z. B in Bildröhren von Oszilloskopen, Monitoren oder Fernsehern. Hohe Ströme werden zum Punktschweißen oder in Schmelzöfen benötigt. Abb. 18.25 zeigt das Schema eines elektrischen Schweißapparates, Abb. 18.26 das einer Anordnung zum Schmelzen von Metallen.
18 Zeitlich veränderliche Magnetfelder
18.8
471
Wechselstrom-Gleichrichtung
Elektronische Bauelemente müssen mit Gleichstrom betrieben werden. Er wird durch Gleichrichtung des im Allgemeinen verfügbaren Wechselstromes mittels Dioden gewonnen. Die Funktionsweise einer Halbleiter-Diode wurde bereits in Kap. 16.6.2 skizziert. Die einfachste Schaltung nach Abb. 18.27 benutzt eine Diode. Während einer halben Periode lässt
Ue
Ua
Ua
Ue
Ua
Ua t Abb. 18.27: Einweggleichrichtung mit einer Halbleiterdiode; unten: Ausgangsspannung
t Abb. 18.28: Zweiweggleichrichtung
eine Diode den Strom passieren, während der zweiten Halbwelle sperrt sie den Strom. Die Ausgangsspannung bei dieser Einweg-Gleichrichtung ist im unteren Teil gezeigt. Ihre starke Welligkeit kann durch einen parallel zum Ausgang geschalteten Kondensator, der sich während des Spannungsanstieges auflädt, etwas gemindert werden, die Ausgangsspannung ist aber trotzdem für die meisten Zwecke ungeeignet. Nach Verstärkung erzeugt sie in einem Lautsprecher den sog. Netzbrumm. Bessere Eigenschaften weisen Zweiweg-Gleichrichter (Abb 18.28) auf. Sie nutzen beide Halbwellen aus; das verringert die Welligkeit erheblich
Abb. 18.29: Graetz-Brückenschaltung zur Gleichrichtung
Abb. 18.30: Glättung der Welligkeit durch C1 und nachgeschaltetem Tiefpass auch
472
18 Zeitlich veränderliche Magnetfelder
Nachteilig wirkt sich die Halbierung der Spannung durch den Abgriff der Wechselspannung zwischen der Mitte und einem Ende der Sekundärwicklung des Trafos aus. Diesem Missstand lässt sich durch eine Brückenschaltung, der so genannten Grätzschaltung begegnen. Wie Abb. 18.29 zeigt, besteht sie aus vier Dioden. Während die positive Halbwelle an der oberen Klemme des Trafos anliegt, fließt der Strom über D1, Ra, D4 zur unteren Anschlussklemme. Bei umgekehrter Polung gelangt der Strom über D4, Ra, D2 von der unteren zur oberen Klemme. Der Spannungsverlauf entspricht dem bei der Zweiweggleichrichtung mit dem Vorteil, dass die Amplitude jetzt den doppelten Wert aufweist. Wie beim Einweggleichrichter wird die Spannung durch einen Kondensator geglättet. Durch einen nachgeschalteten Tiefpass kann die Welligkeit weiter herabgesetzt werden (Abb. 18.30). Eine noch bessere Glättung lässt sich durch elektronische Stabilisierung erreichen.
18.9 Leistungsanpassung Gegeben sei eine Wechselstromquelle mit der Spannung U und dem Innenwiderstand Z1. An ihren Klemmen liege ein Verbraucher mit dem Widerstand Z2 (Abb. 18.31). Durch den Schaltkreis fließe der Strom I. Welchen Wert muss Z1 bzw. Z2 annehmen, damit der Verbraucher aus der Stromquelle die maximale Leistung erhält? Es sei
Z1
§ 1 · R1 i ¨ Z L1 ¸ , Z2 ZC1 ¹ ©
§ 1 · R2 i ¨ Z L2 ¸. Z C2 ¹ ©
Z1
(18.88)
Z2 Der Effektivwert I eff des Stromes ist
U~
Ie f
Abb. 18.31: Zur Leistungsoptimierung
Ue f f f
Z1 Z 2
.
(18.89)
Die an den Verbraucher abgegebene Wirkleistung ist
Pel
I eff2 R2
I eff
U eff2 Z1 Z 2
2
R2 .
(18.90)
Setzen wir die komplexen Widerstände entsprechend (18.88) ein, so ergibt sich
Pel
U e2 f f R2 1§ 1 1 · °½ ° ( R1 R2 ) ®Z ( L1 L2 ) ¨ ¸¾ Z © C1 C2 ¹ °¿ °¯ 2
2
.
(18.91)
18 Zeitlich veränderliche Magnetfelder
473
Zur Optimierung muss der zweite Term verschwinden, d.h. L2 und C2 ergeben sich aus
§ § 1 · 1 · ¨ Z L2 ¸ ¨ Z L1 ¸ Z C2 ¹ ZC1 ¹ © ©
.
(18.92)
Die Blindwiderstände müssen also entgegengesetzt gleich sein, so dass keine Blindleistung auftritt. Spannung und Strom sind in Phase. Das Maximum bezüglich R2 ergibt sich unter Beachtung dieser Bedingung aus
dPel dt zu
R2
0
(18.93)
R1 .
(18.94)
18.10 Die Grundgleichungen des elektromagnetischen Feldes im Vakuum: Die Maxwell-Gleichungen Die Gln. (15.23/28) und (17.8/11) beschreiben die Eigenschaften stationärer elektromagnetischer Felder. Wir wollen sie jetzt auf zeitveränderliche Felder erweitern. Dazu gehen wir vom Induktionsgesetz aus.
U ind
d )m dt
d G G BdA dt ³A
(18.1)
Bei alleiniger zeitlicher Änderung des Magnetfeldes können wir dafür schreiben
G wB G ³ dA . wt
U ind
(18.95)
Andererseits hatten wir gefunden, dass sich die Spannung aus dem Linienintegral über die elektrische Feldstärke ergibt
U
G G
v³ Edr .
(15.24)
C
Damit können wir (18.87) schreiben als
G G
v³ Edr C
d G G BdA . dt ³A
(18.96)
474
18 Zeitlich veränderliche Magnetfelder
Dabei ist A die Fläche der Leiterschleife und C die sie begrenzende Randkurve (Abb. 18.32). Diese Verknüpfung gilt für beliebige Leiterschleifen, so dass es nahe liegt, sie ganz wegzulassen. Das so verallgemeinerte Induktionsgesetz ist die eine der Grundgleichungen des elektromagnetischen Feldes. Ein sich zeitlich änderndes Magnetfeld erzeugt ein elektrisches Wirbelfeld.
r A
Abb. 18.32: Ein sich zeitlich änderndes Magnetfeld erzeugt ein elektrisches Wirbelfeld Eine zweite Beziehung ergibt sich durch Erweiterung des Ampereschen Gesetzes
G G
v³ Bdr
P0 I .
(18.97)
C
A2C A1C
I R
C
Abb. 18.33: Zur Einführung des Verschiebungsstromes
Betrachten wir einen geladenen Kondensator, dessen Enden über irgendeine Leitung miteinander verbunden sind (Abb. 18.33). Es gibt nun zwei Möglichkeiten, die Beziehung unter Einschluss des Kondensators anzuwenden. Zunächst konzentrieren wir uns auf die skizzierte Kreisscheibe mit der von C beliebig umrandeten Fläche und sehen, dass Gl. (18.90) erfüllt ist. Der Entladungsstrom ist mit einem Magnetfeld verknüpft, das den Leiter ringförmig umgibt. Nun ersetzen wir die Fläche durch den skizzierten offenen
18 Zeitlich veränderliche Magnetfelder
475
Hohlkörper mit der Oberfläche A2C, dessen Randkurve durch die gleiche Kurve C gebildet wird. Da A2C zwischen den Platten des Kondensators hindurch läuft, umfasst jetzt ein Umlauf über C keinen Strom. Aus (18.97) folgt B = 0. Die beiden Fälle stehen miteinander im Widerspruch. Um ihn aufzulösen, führte J. C. Maxwell (1831-1879) den Verschiebungsstrom ein. Im Plattenkondensator ist eine Ladung Q gespeichert, so dass zwischen den Platten der Fläche A ein elektrisches Feld existiert.
Q H 0 AE .
(15.38)
Dabei ist zu berücksichtigen, dass sich die gesamte Ladung auf der Innenseite der jeweiligen Platte befindet. Fließt im Stromkreis ein (Entladungs-) Strom, so ändert sich die Ladung der G Platten und damit das E - Feld.
dQ dt
H0 A
wE . wt
(18.98)
Dieser zeitlichen Verschiebung von Ladungen von der einen zur anderen Platte wird nun ein Verschiebungsstrom zugeordnet. Berücksichtigen wir auch eine mögliche zeitliche Flächenänderung, so gilt
IV
H0
d G G EdA . dt ³A
(18.99)
Fügen wir den Verschiebungsstrom zu I in (18.97) hinzu, so erhalten wir
G G Bdr v³
P0 I H 0 P0
C
G G
v³ Bdr C
P0 I
d G G EdA , oder dt ³A
1 d G G EdA c 2 dt ³A
(18.100a)
(18.100b)
Dies ist die zweite der Grundgleichungen des elektromagnetischen Feldes.
Leitungsstrom wie Verschiebungsstrom sind von einem ringförmigen Magnetfeld umgeben. G Ist nur E zeitlich veränderlich, so erhalten wir
G G Bdr v³ C
G 1 wE G P0 I 2 ³ dA . c A wt
(18.101)
476
18 Zeitlich veränderliche Magnetfelder
Zu den Grundgleichungen gehören weiter der Gaußsche Satz für das elektrische Feld, (1.18b) und der Gaußsche Satz für das magnetische Feld, (17.11). Die vier Grundgleichungen werden als Maxwell-Gleichungen bezeichnet. Zusammengefasst lauten sie in der Integral- bzw. Differentialform
G wB ; wt G G G 1 wE ; rot B P0 j 2 c wt G 1 di v E U;
d G G BdA dt ³A C G G 1 d G G Bdr P I EdA 0 vC³ c 2 dt ³A G G 1 EdA v³ ³ U dV
G rot E
G G v³ BdA 0
G di v B 0.
G G Edr v³
A
H0 V
(18.102, 103)
H0
A
Die ersten zwei Beziehungen der Differentialform ergeben sich durch Umwandlung von (18.95) und (18.101) in ein Flächenintegral mit Hilfe des Stokesschen Satzes. Der Vergleich mit der rechten Seite der ursprünglichen Gleichung ergibt die gewünschte Differentialform. Die beiden unteren Gleichungen liegen bereits aus vorherigen Kapiteln in dieser Form vor ((15.18c) und (17.11b)). In Abb. 18.34 sind die Gleichungen illustriert. Die Ursache elektrischer Felder sind elektrische Ladungen und sich zeitlich ändernde magnetische Felder. Magnetische Felder entstehen durch elektrische Ströme und sich zeitlich ändernde elektrische Felder.
r dB/dt
r dB/dt
r E
r B
r B
r dB/dt
r B
r E
r B
Abb. 18.34: Erläuterung der Maxwell-Gleichungen. Ein magnetisches Feld B entsteht durch einen elektrischen Strom I und durch ein sich änderndes elektrisches Feld E und umgekehrt ein E-Feld durch ein sich änderndes B-Feld. Ist die Änderung des B-Feldes zeitlich nicht konstant, so entsteht durch das sich dann änderndes E-Feld wiederum ein B-Feld
r E
18 Zeitlich veränderliche Magnetfelder
477
Zu den Maxwell-Gleichungen fügen wir noch den Ausdruck für die Lorentzkraft hinzu:
G F
G G G Q ( E v u B) .
(18.41)
Aus diesen 5 Gleichungen lassen sich alle elektromagnetischen Erscheinungen ableiten.
18.11
Elektromagnetische Schwingungen und Wellen
18.11.1 Elektromagnetische Schwingungen 18.11.1.1 Freie gedämpfte Schwingungen
Ein elektromagnetischer Schwingungskreis besteht aus der Parallelschaltung einer Spule mit der Induktivität L und einem Kondensator der Kapazität C (Abb. 18.35). Verluste vernachlässigen wir vorerst (R = 0). Der Kondensator sei zu Anfang auf die Spannung U aufgeladen. Nach Zuschaltung der Spule beginnt er, sich zu entladen und erzeugt dabei in ihr ein magnetisches Feld. Nach einer Viertelperiode ist die gesamte elektrische Feldenergie als magnetische Feldenergie in der Spule gespeichert. In der zweiten Viertelperiode zerfällt das Feld wieder und der auftretende Induktionsstrom lädt den Kondensator mit umgekehrter Polung auf. In der zweiten Halbperiode wiederholt sich der Vorgang in umgekehrter Richtung
L
C
L
C
Epot Ekin t
Abb. 18.35: Oszillation der elektrischen und magnetischen Energie in einem (verlustfreien) Schwingungskreis bis der ursprüngliche Ladungszustand des Kondensators wieder erreicht ist. Elektrische und magnetische Feldenergie pendeln also wie beim mechanischen Pendel periodisch hin und her.
478
18 Zeitlich veränderliche Magnetfelder
Zur quantitativen Behandlung formulieren wir die Schwingungsgleichung. Dabei wollen wir jetzt auch Verluste berücksichtigen, die etwa durch den Ohmschen Widerstand der Spule auftreten (Abb. 18.36). Der zugehörige Spannungsabfall sei mit UR bezeichnet. Nach der 2. Kirchhoffschen Regel folgt
U ind
(18.104)
Einsetzen der bekannten Ausdrücke für Uind und UC ergibt
L C Abb. 18.36: Parallelschwingungskreis mit Ohmschem Widerstand
R
UC U R ;
L
dI 1 Q IR 0. dt C
(18.105a)
Nochmaliges Differenzieren führt zu der Beziehung
d 2I R dI 1 2 I 0. 2 dt 2 L dt LC
(18.105b)
Vergleichen wir diese Differentialgleichung mit der entsprechenden Gleichung für ein mechanisches Pendel, Gl. (11.7),
d 2x dx 2G Z02 x 0 2 dt dt so erkennen wir, dass sie identisch sind, wenn wir für die Dämpfungskonstante G und die Eigenfrequenz Z0 des ungedämpften Schwingkreises setzen
G
R 2L
und Z0
1 . (Thomsonsche Schwingungsformel) LC
(18.106)
Der Masse entspricht die Induktivität, der Federkonstanten die reziproke Kapazität (Machen Sie sich das plausibel!). Wir können also unter Berücksichtigung von (18.106) alle Ergebnisse von früher übernehmen. Es sind drei Fälle zu unterscheiden:
1. G Z0 2. G ! Z0 3. G
Z0
(18.107)
18 Zeitlich veränderliche Magnetfelder
479
Im ersten Fall beschreibt die Lösung eine gedämpfte Schwingung mit der Frequenz
1 R2 2 : LC 4 L
(18.108)
G § · I 0 e G t ¨ cos Zt sin Zt ¸ . Z © ¹
(18.109)
Z02 G 2
Z
I
Die Amplitude der Schwingung nimmt exponentiell mit der Zeit ab. Nach der Zeit 1/ G ist sie auf den e-ten Teil abgeklungen. Ist G ! Z0 , so ergibt sich der Kriechfall. Für die oben benutzten Anfangsbedingungen wird die Stromstärke
I
I0 O2eO1t O1eO2t , O2 O1
wobei O2 O1
(18.110)
2 G 2 Z02 .
Die Lösung hat höchstens ein Maximum und fällt dann exponentiell ab. Für G Z0 ergibt sich der aperiodische Grenzfall. Er trennt den Schwingungsbereich vom Kriechbereich. Die Stromstärke ist
I
I 0 e G t (1 G t ) .
(18.111)
In Abb. 18.36a,b sind die Lösungen für die drei Fälle dargestellt.
I
T I0 (t) : e -d / t
I d > w0
t
d = w0
t Abb. 18.36a: Gedämpfte Schwingung in einem verlustbehafteten Schwingkreis und
Abb. 18.36b: Aperiodischer Grenzfall und Kriechfall
480
18 Zeitlich veränderliche Magnetfelder
18.11.1.2 Erzwungene Schwingungen
R
L
C
~
Generator
Abb. 18.37: Serienschwingungskreis mit Wechselstromgenerator
Der Schwingkreis in Abb. 18.36 werde zwischen Spule und Kondensator aufgetrennt. Zwischen die beiden Enden schalten wir eine Wechselstromquelle mit der Spannung (Abb. 18.37)
Ue
U 0 eiZt .
(18.112)
Der Schwingkreis wird dadurch zu erzwungenen Schwingungen angeregt. Die Schwingungsgleichung folgt jetzt aus
U e U ind Ue d 2I dI 2G Z02 I . 2 dt dt L
UC U R ,
(18.113) (18.114)
Diese Differentialgleichung stimmt mit der einer mechanischen Schwingung, Gl. (11.27c) überein, wenn wir die rechte Seite ersetzen durch den Quotienten aus äußerer Kraft und Masse des Pendels (bzw. durch den Quotienten aus äußerem Drehmoment und Trägheitsmoment eines Drehpendels).
Abb. 18.38: Stromverlauf in einem Schaltkreis, an den von außen eine frequenzabhängige, sinusförmige Spannung liegt (erzwungene Schwingung) und
Abb. 18.39: Verlauf des Phasenwinkels in Abhängigkeit der Frequenz
18 Zeitlich veränderliche Magnetfelder
481
Sie wird wie dort gelöst durch den Ansatz
I 0 ei (Zt M ) .
I
(18.115)
Die Amplitude I0 und der Phasenwinkel M zwischen äußerer Spannung und Stromstärke im Kreis folgen zu
I0
tan M
U0 / L 2 0
(Z Ze2 ) 2 (2G Ze ) 2
,
(18.116)
2G Ze , Z02 Ze2
(18.117)
wobei Z02 und J durch (18.106) gegeben sind. Die beiden Größen sind als Funktion der Erregerfrequenz Ze in den Abb. 18.38 und 18.39 aufgetragen. Zur näheren Diskussion sei auf Kap. 11 verwiesen.
18.11.1.3 Gekoppelte Schwingungskreise
Ck C1
L1
R1
L2
C2
L
C
C
L
R2
Abb. 18.40: Induktive bzw. kapazitive Kopplung zweier Schwingungskreise Gekoppelte Schwingungskreise haben für die Übertragung und den Empfang elektromagnetischer Signale große Bedeutung. Die Gesetzmäßigkeiten sind die gleichen wie bei der Kopplung mechanischer Schwingungen, die in Kap. 11.5 ausführlich behandelt wurden. Die Kopplung kann z.B. durch gegenseitige Induktion erfolgen. Sie lässt sich aber auch mittels einer Kapazität oder durch einen Ohmschen Widerstand bewerkstelligen. Hier wollen wir uns auf den ersten Fall beschränken (Abb. 18.40; dabei soll am ersten Schwingkreis eine Wechselspannung liegen.
482
18 Zeitlich veränderliche Magnetfelder
Die Kirchhoffschen Regeln ergeben nach einmaligem Differenzieren
L1
d 2 I1 dI 1 R1 1 I1 2 dt dt C1
d 2I dI 1 L2 22 R2 2 I2 dt dt C2
L12
d 2 I 2 dU e dt 2 dt
d 2I L12 21 dt
(18.118)
Zuerst behandeln wir freie Schwingungen, Ue = 0. Den Lösungsansatz
I
I 0 e iZt
(18.118)
differenzieren wir zweimal und setzen die Ableitungen in (18.118) ein. Nach Division durch Z erhalten wir so
1 ½ ) ¾ I1 iZ L12 I 2 ® R1 i (Z L1 ZC1 ¿ ¯ 1 ½ ) ¾ I 2 iZ L12 I1 ® R2 i (Z L2 Z C2 ¿ ¯
0 (18.119)
0
Zur besseren Übersicht spezialisieren wir uns auf den Fall identischer Schwingungskreise, L1 = L2 = L, C1 = C2 = C, R1 = R2 = R. Die Lösungen ergeben sich durch Nullsetzen der Koeffizientendeterminante. Wir erhalten für verlustfreie Kreise
Z1,2
Z0
(18.120)
1r k
Die Resonanzfrequenz Z0 des ungekoppelten Kreises spaltet in zwei Eigenfrequenzen Z1 und Z2 auf. Die Kreise sind „verstimmt“. Wir denken uns jetzt an den Primärkreis eine Wechselspannung gelegt.
Ue
U 0 eiZt
(18.121)
Berücksichtigung dieses Ansatzes in (18.118) liefert jetzt das Gleichungssystem
Z1 I1 iZ L12 I 2
U
Z 2 I 2 iZ L12 I1
0
(18.122)
18 Zeitlich veränderliche Magnetfelder
483
Elimination von I1 ergibt für den Strom I2 im Sekundärkreis
I2
Z 3k / L
Ue
^Z
4
2
2
2 0
2
(k 1) Z (2Z W ) Z
4 2 0
`
(18.123) 2
2
2
2 2 0
4W Z (Z Z )
wobei zur Abkürzung W = R/L und Z02 1/( LC ) gesetzt wurde. Die Größe k L12 / L bezeichnet den Kopplungsgrad der Schwingungskreise. Abb. 18.41 zeigt für ein bestimmtes k den auf die Eingangsspannung bezogenen Stromverlauf als Funktion der Frequenz. Statt eines Maximums bei k = 0 treten jetzt zwei Maxima auf.
1 I2
k 2 = 0, 05
Abb. 18.41: Auf die Eingangsspannung normierte Stromstärke I2 im angekoppelten Schwingkreis
0
w2 w
w1
Alle Schaltelemente eines Schwingkreises sind verlustbehaftet, so dass, wie gezeigt, eine Schwingung mit der Zeit abklingt. Zur Erzeugung ungedämpfter Schwingungen muss dem Schwingkreis die in Joulesche Wärme umgewandelte Energie wieder zugeführt werden. Das gelingt mit Hilfe einer Rückkopplungsschaltung nach Abb. 18.42, die den prinzipiellen Aufbau
Ue+kUa _
Ua
Rückkopplungsglied Abb. 18.42: Prinzip der Entdämpfung eines Schwingkreises durch phasenrichtige Rückkopplung eines Teils der verstärkten Spannung auf
_
+
kUa
+
Ue
L _
Verstärker
Abb. 18.43: Meißnersche Rückkopplungsschaltung mit einer Elektronenröhre
C
484
18 Zeitlich veränderliche Magnetfelder
wiedergibt. Wegen der großen Bedeutung für die drahtlose Telekommunikation ist in Abb. 18.43 die zuerst von A. Meißner (1883-1958) realisierte Schaltung mit einer Elektronenröhre gezeigt. Als eine solche verwendete Meißner eine Triode. Sie besteht aus einer Kathode, welche im erhitzten Zustand Elektronen freisetzt, einem die Kathode umgebenden Gitter und der Anode. Liegt zwischen dieser und Kathode eine Spannung, so fließt durch die Röhre ein Elektronenstrom, der sog. Anodenstrom. Er kann durch Anlegung einer (negativen) Spannung an das Gitter gesteuert werden. Der Anoden-Stromkreis enthalte nun einen Schwingkreis, der mit einer zweiten Spule induktiv gekoppelt ist. Diese liegt zwischen Gitter und Kathode. Beim Einschalten der Anodenspannung entsteht eine Schwingung, die durch Induktion auf die zweite Spule übertragen wird. Die oszillierende Gitterspannung steuert bei richtiger Polung den Anodenstrom so, dass dieser verstärkt wird. Bei geeigneter Kopplungsstärke können also durch Rückkopplung eines geringen Teils der Schwingungsenergie Verluste im äußeren Schwingkreis ausgeglichen werden, so dass ungedämpfte Schwingungen entstehen. In modernen Schaltungen ist die Elektronenröhre durch einen Halbleiter ersetzt und zur Rückkopplung werden RC-Glieder verwandt. Mit den geschilderten Methoden können durch Reduktion von Induktivitäten und Kapazitäten Schwingungen bis zu ca. 1010 Hz erzeugt werden. Dieser Grenzwert ist durch die endliche Laufzeit der Elektronen in Röhren und Transistoren bedingt, die größer als die Schwingungsdauer wird. Noch höhere Frequenzen lassen sich mit dem Klystron erreichen, bei dem Laufzeiteffekte gerade dazu ausgenutzt werden, um eine Modulation des Elektronenstroms zu erzielen. Recht einfach lässt sich die Wirkungsweise eines Zweikammer-Klystrons verstehen (Abb. 18.44). Elektronen, die in den ersten Hohlraumresonator eintreten, werden durch das anliegende oszillierende elektrische Feld abwechselnd beschleunigt und HF-Generator abgebremst. Aus der GeschwindigAnode keitsmodulation wird nach einer beKathode stimmten Flugstrecke eine DichteModulation. Die Elektronenpakete gelangen anschließend in einen zweiten Resonator, der sich an einem Ort maximaler Elektronendichte befindet. Die periodische zeitliche Änderung der Rückkopplung Ladungsdichte im Resonator erzeugt + eine elektromagnetische Schwingung _ in diesem. Durch phasenrichtige RückAbb. 18.44: Prinzip des Zweikammerklystrons kopplung der Schwinungsenergie in den ersten Schwingungskreis wird die Dichte-Modulation verstärkt, so dass eine stabile ungedämpfte Schwingung entsteht. Da die Elektronenpakete zunächst annähernd eine Rechteckform haben und damit neben der Grundschwingung viele Oberschwingungen aufweisen, kann der zweite Resonator auch auf ein Vielfaches der Frequenz des ersten Generators abgestimmt werden.
18 Zeitlich veränderliche Magnetfelder
485
Neben diesem Typ gibt es das Reflexklystron, das nur einen Resonator besitzt. Wie der Name besagt, befindet sich hinter diesem ein elektrischer Spiegel, an dem der modulierte Elektronenstrahl reflektiert wird, so dass er erneut den Resonator durchläuft. Damit ist die Rückkopplung (bei geeigneter Einstellung des Spiegels) automatisch gewährleistet.
18.11.2 Elektromagnetische Wellen Elektromagnetische Schwingungen stellen zeitliche Oszillationen elektrischer und magnetischer Feldenergie dar. Wir wollen jetzt fragen, unter welchen Umständen elektromagnetische Wellen entstehen und welche Eigenschaften sie haben. Elektromagnetische Wellen können sich in den freien Raum oder längs elektrischer Leitungen ausbreiten. Betrachten wir zunächst den ersten Fall. Ausgangspunkt ist der uns bekannte geschlossene Schwingkreis. Sukzessive denken wir uns die Kapazität des Kondensators durch Auseinanderziehen der Platten verkleinert (Abb. 18.45).
E(t) E (t)
C
B(t) L
Abb. 18.45: Übergang von einem geschlossenen zu einem offenen Schwingungskreis bis hin zu einer Antenne. Während die elektromagnetische Energie in ersterem gespeichert ist, kann sie von einer Antenne abgestrahlt werden. Außerdem reduzieren wir die Induktivität der Spule, indem wir ihre Windungszahl verringern. Diesen Prozess wiederholen wir, bis Spule und Kondensator ganz verschwunden sind und wir nur noch einen geraden leitenden Draht vor uns haben, der Hertzscher Dipol (H Hertz 18571894), genannt wird. Im Ausgangszustand sind elektrisches und magnetisches Feld im Schwingkreis lokalisiert. Je mehr wir den Kreis aufbiegen, umso weiter reichen die zeitveränderlichen Felder in den Raum hinaus. Nun ist es nicht möglich, dass sich das elektromagnetische Feld während einer
486
18 Zeitlich veränderliche Magnetfelder
Viertelperiode der Schwingung des Dipols beliebig weit ausdehnt, verschwindet und mit umgekehrtem Vorzeichen wieder zurückkehrt. Vielmehr löst sich das elektrische Feld vom Dipol ab und wandert als Wirbel mit Lichtgeschwindigkeit in den Raum hinaus. Nach den Maxwell-Gleichungen erzeugt es ein geschlossenes magnetisches Feld. Dieses hat wieder ein elektrisches Wirbelfeld zur Folge usw. Es entsteht eine elektromagnetische Welle. Die quantitative Berechnung zeigt, dass zwischen dem Nahfeld (Abstand r < Wellenlänge O ) und dem Fernfeld ( r ! O ) des Dipols zu unterscheiden ist. Am wichtigsten ist hier der zweite Fall. Wie wir gleich sehen werden, breitet sich in größerer Entfernung das elektromagnetische Feld in guter Näherung als ebene Welle aus. Zur Vorbereitung zeigen wir zunächst, dass solche Wellen die Maxwell-Gleichungen befriedigen.
18.11.2.1 Wellengleichung und ebene Wellen als deren Lösung
Elektromagnetische Wellen folgen wie mechanische Wellen aus einer Wellengleichung. In diesem Fall haben wir von den Maxwell-Gleichungen auszugehen. Wir beschränken uns zunächst auf die Herleitung der Wellengleichung für das Vakuum. Fehlen Raumladungen und Leitungsströme, so lauten die Maxwell-Gleichungen
G wB ; wt G 1 wE ; c 2 wt
G rot E G rot B
G di v E
0;
G di v B 0.
(18.124)
Durch Anwendung der Rotor-Operation auf die erste Gleichung folgt
G rotrotE
G 'E
G G grad di vE 2 E
G wB rot ; wt
G wB rot . wt
(18.125)
(18.126)
Zeitliche Differentiation der zweiten Gleichung ergibt
G wB rot wt
G w2 E H 0 P0 2 . wt
(18.127)
Durch Einsetzen dieser Gleichung in (18.126) folgt
G G w2 E 'E H 0 P0 2 . wt
(18.128)
18 Zeitlich veränderliche Magnetfelder
487
G G Eine analoge Gleichung erhalten wir durch Eliminierung von E für B . Wir bilden
G rotrotB
G G G wE 2 grad di vB B H 0 P0 rot . wt
(18.129)
Durch Differentiation der ersten Gleichung nach der Zeit folgt
G w rotE wt
G wE rot wt
G w2 B 2 . wt
(18.130)
In (18.129) eingesetzt ergibt sich
G G w2B 'B H 0 P0 2 . wt
(18.131)
Die Gln. (18.128) und (18.131) sind die Wellengleichungen für das elektrische und magnetische Feld. Der Vorfaktor auf der rechten Seite hat die Dimension einer reziproken quadratischen Geschwindigkeit, nämlich der Phasengeschwindigkeit der Welle:
v 2ph
c2
1
H 0 P0
.
(18.132)
Diesen Zusammenhang haben wir in Kap. 17.1 vorausgesetzt. Er folgt jetzt automatisch aus den Maxwell-Gleichungen. Zusammengefasst lauten also die Wellengleichungen
G 'E
G 1 w2 E c 2 wt 2
und
G 'B
G 1 w2 B . c 2 wt 2
(18.133)
Die Lösungen dieser Differentialgleichungen sind transversale Wellen. Wellen in Fortschreitungsrichtung würden Quellen und Senken der Felder erfordern (Abb. 18.46). Sofern sich die Wellen im ladungsfreien Raum aus- Abb. 18.46: Im ladungsfreien Raum existieren G breiten, gilt aber di v E 0 . Magnetische keine longitudinalen elektromagnetischen WeFelder sind per se quellenfrei. Durch llen Einsetzen können wir verifizieren, dass u. a. ebene harmonische Wellen Lösungen der Wellengleichungen sind.
488
18 Zeitlich veränderliche Magnetfelder
Wählen wir z. B. als Fortpflanzungsrichtung die x-Richtung, so können wir E y bzw. Ez schreiben als
E0, y ei (Zt kx ) ;
Ey
Ez
E0, z ei (Zt kx G ) .
(18.134)
E y und Ez sind voneinander unabhängig; der Phasenwinkel kann daher frei gewählt werden.
Im allgemeinsten Fall entsteht eine elliptisch polarisierte Welle. Wir interessieren uns hier für eine linear polarisierte Welle, bei der G 0 ist. Um die zugehörigen Komponenten Bz bzw. By des magnetischen Feldes zu gewinnen, dürfen wir nun nicht von der Wellengleichung G G ausgehen, denn dann blieben relative Amplitude und Phasenverschiebung von E - und B G G Welle unbestimmt. Wir müssen vielmehr beachten, dass E und B durch die MaxwellGleichungen verknüpft sind. Für Ex = 0 folgt aus der zweiten Gleichung
wBy
0;
wt
1 wBz c wt
wE y
H 0 P0
wx
c
iZ E0, y ei (Zt kx ) ;
(18.135a)
Integration ergibt
By
0;
G B
1 G G (k u E ) .
Bz
H0 E0, y ei (Zt kx ) P0
H0 E . P0 y
(18.135b)
(18.136)
Z
Elektrische und magnetische Feldstärke einer ebenen elektromagnetischen Welle stehen also senkrecht aufeinander und sind in Phase (Abb. 18.47).
x
r E (E x ,0,0)
r B(0,By ,0)
z y
Abb. 18.47: Elektrische und magnetische Feldstärke stehen senkrecht aufeinander und sind in Phase
18 Zeitlich veränderliche Magnetfelder
489
18.11.2.2 Das elektromagnetische Feld des Hertzschen Dipols Wir kehren nun zum Ausgangspunkt unserer Überlegungen zurück und wollen uns klarmachen, wie das Wellenfeld des Hertzschen Dipols zustande kommt und welche Form es hat. Wir beschränken uns dabei auf die Ausbreitung im Vakuum. Grundlage sind also die Maxwell-Gleichungen (18.102/103). Das Wellenfeld wird als Kugelwelle angesetzt. Hier sollen nur die wichtigsten Ergebnisse zusammengestellt und erläutert werden. Die nicht schwierige, aber etwas längliche Berechnung findet sich im Anhang. Sowohl das elektrische als auch das magnetische Feld besteht aus zwei Anteilen, deren Amplituden mit unterschiedlichen Potenzen von r mit der Entfernung abnehmen. Sie werden häufig als Nahfeld (r O ) und Fernfeld (r !! O ) bezeichnet. Das elektrische Feld setzt sich wie folgt zusammen
G G E (r , t ) Nah G
wobei p G p
G G 3( p rˆ)rˆ p 4SH 0 r 3
(r O ) ,
G G § r · wp (t r / c) . p (t r / c ) ¨ ¸ wt ©c¹
(18.137)
(18.138)
G Qd ist das elektrische Dipolmoment. Die Phasenverschiebung berücksichtigt, dass das
Feld zur Zeit t vom Dipol zur Zeit (t r / c) erzeugt wurde (Retardierung).
G G E (r , t ) Fern
2G 1 °§ w p(t r / c) G · G °½ ur ¸u r ¾ ® ¨ 4SH 0 c 2 r 3 ¯°© wt 2 ¹ ¿°
(r !! O ) .
(18.139)
Die Anteile des magnetischen Feldes sind
G G B(r , t ) Nah
G 1 § wp G · ¨ ur ¸ 4SH 0 c 2 r 3 © wt ¹
G G B(r , t ) Fern
G § w2 p G · 1 ur ¸ ¨ 4SH 0 c 3 r 2 © wt 2 ¹
(r O ) ,
(18.140)
und
(r !! O ) .
(18.141)
Wir diskutieren zuerst die beiden Nahfelder. Die Amplitude des elektrischen Feldes fällt mit 1/r3 ab, die des magnetischen mit 1/r2. Der zweite Term des elektrischen Feldes muss aus Gründen der Allgemeinheit mitgenommen werden. Interessiert nur das eigentliche Nahfeld, so kann es vernachlässigt werden. Dann ist auch die Retardierung zu vernachlässigen, so dass das Feld eines schwingenden Dipols (des Hertzschen Oszillators) übrig bleibt. Vergleichen wir das
490
18 Zeitlich veränderliche Magnetfelder
magnetische Nahfeld mit dem durch das Biot-Savartsche Gesetz gegebenen Magnetfeld eines stromführenden Leiters
G B
G G ds u r , 4SH 0 c 2 ³ r 3
I
G so erkennen wir, dass mit wp / wt
(17.26) G
³ Ids die Felder übereinstimmen. Das magnetische Nahfeld
ist also identisch mit dem Feld, das von der oszillierenden Stromstärke erzeugt wird. Wie G G bereits aus (18.137) und (18.140) hervorgeht, stehen BNah und ENah senkrecht aufeinander und haben eine Phasenverschiebung von S / 2 . Wir wenden uns jetzt den Feldern in großer Entfernung vom schwingenden Dipol zu. Der elektrische Feldvektor schwingt als Folge des doppelten Vektorproduktes in der Meridianebene G senkrecht zu r (Abb. 18.48). Die Feldamplitude nimmt mit 1/r ab. Das gilt auch für das G magnetische Feld. Der Betrag des elektrischen Feldes in einem Punkt r , der mit der Dipolachse den Winkel - bildet, schreibt sich
G E ( r ,- , t ) Fern
G sin - w 2 p(t r / c) . 4SH 0 c 2 r wt 2
(18.142)
G Wegen der Proportionalität zu sin - nimmt E bei kleinen - so kleine Werte an, dass der Nahfeld-Anteil, der nicht von - abhängt, nicht vernachlässigt werden darf. Er führt zu den Abrundungen der Feldlinien in diesem Bereich. Abb. 18.48 zeigt Momentaufnahmen der elektrischen Feldlinien im Verlauf einer Periode. Der magnetische Feldvektor schwingt wegen des Vektorproduktes senkrecht zur Dipolachse G G und senkrecht zu r (Abb. 18.49) und damit auch senkrecht zu E . G G G Die drei Vektorgrößen E , B, c bilden ein Rechtssystem. Die Entstehung des elektromagnetischen Feldes in der Fernzone hatten wir bereits zu Anfang des Kapitels angesprochen. Zum Abschluss der theoretischen Erörterungen wiederholen wir die Argumentation: Ein Beobachter an einem bestimmten Raumpunkt des Strahlungsfeldes messe z. B. ein sich zeitlich änderndes elektrisches Feld. Dieses erzeugt nach Maxwell ein zeitveränderliches sekundäres magnetisches Wirbelfeld, das wiederum ein sich zeitlich änderndes sekundäres elektrisches Wirbelfeld erzeugt usw.
18 Zeitlich veränderliche Magnetfelder
491
t=0
t = T/4
t = T/2
t = 3/4 T
t=T Abb. 18.48: Der elektrische Feldvektor schwingt in der Meridianebene senkrecht zum Ortsvektor der Welle (nach L.25.1)
r B(t 0 ) Abb. 18.49: Der magnetische Feldvektor schwingt senkrecht zur Dipolachse und zum Ortsvektor
492
18 Zeitlich veränderliche Magnetfelder
18.11.2.3 Energie und Leistung einer elektromagnetischen Welle Der Energieinhalt einer elektromagnetischen Welle setzt sich additiv aus einem elektrischen und einem magnetischen Anteil zusammen. Für die Energiedichte hatten wir früher gefunden ((15.53) und (18.31))
w
1 1 2 H0E2 B 2 2 P0
1 H 0 E 2 c2 B2 H 0 E 2 . 2
(18.143a)
Damit ergibt sich die pro Zeiteinheit durch eine Fläche senkrecht hindurch tretende Energie, die Energiestromdichte S w c zu
S
H 0 cE 2
G G
H 0 c2 E B .
(18.143b)
Die Abstrahlung der Energie erfolgt in der durch die elektromagnetische Welle festgelegten Richtung. (18.143b) legt daher nahe, dass die Energiestromdichte als Vektorgröße, Poyntingvektor genannt (J. H. Poynting 1852-1914) in der Form
G S
1
P0
G
G
E u B
(18.144)
G geschrieben werden kann (Anhang A.1.1.4.3). Benutzen wir für E das Fernfeld und setzen p Qd 0 sin(Zt kr ) , so erhalten wir
S
Q 2 d 02Z 4 sin 2 - sin 2 Zt kr ) . 16S 2H 0 c 3 r 2
(18.145)
Die stärkste Energieabstrahlung findet senkrecht zur Dipolachse statt. In Richtung der Dipolachse wird dagegen keine Energie abgestrahlt. Durch das Flächenelement einer Kugel mit Zentrum im Dipol-Nullpunkt, dA r 2 sin - d- dM , strömt die Leistung P S dA . Durch Integration ergibt sich die insgesamt in den Raum abgestrahlte Leistung zu
Ptotal
G G S v³ dA
Q 2 d 02Z 4 sin 2 Zt kr ) ; 3 6S H 0 c
(18.146)
Im zeitlichen Mittel wird die Leistung
Ptotal
Q 2 d 02Z 4 12S H 0 c 3
(18.147)
18 Zeitlich veränderliche Magnetfelder
493
abgegebent. Diese Energie wird dem schwingenden Dipol entzogen. Wird sie ihm nicht wieder zugeführt, so nimmt seine Schwingungsamplitude ab. Das entspricht einer Dämpfung des Oszillators. Sie wird als Strahlungsdämpfung bezeichnet. Die Energie sollte also exponentiell mit der Zeit abnehmen. Wir wollen das nachrechnen. Dazu erinnern wir uns daran, dass der Masse m eines mechanischen Federpendels die Ladung Q entspricht. Es vollführe (ungedämpfte) harmonische Schwingungen mit der Amplitude d0 und der Frequenz Z . Die mittlere Schwingungsenergie beträgt
W
E pot Ekin
1 mZ 2 d 02 . 2
(18.148)
Dies gilt für jeden Oszillator. Die relative Energieabnahme des Hertzschen Oszillators ergibt sich also zu
dW / dt W dW
³W
Q 2Z 2 : J . 6SH 0 mc 3
(18.149a)
J ³ dt ,
(18.149b)
W (t ) W0 e J t .
(18.149c)
Die mittlere Energie des Hertzschen Dipols nimmt wie vermutet exponentiell mit der Zeit ab. Zum Abschluss dieses Kapitels wollen wir uns noch überlegen, welches Frequenzspektrum der Hertzsche Oszillator bei Variation der Hochfrequenz des ihn treibenden Generators aussendet. Die pro Zeiteinheit abgestrahlte Energie ist nach (18.147) proportional zum Amplitudenquadrat des elektrischen Dipolmomentes. Dessen Betrag als Funktion der Erregerfrequenz müssen wir also ermitteln. Die Bewegungsgleichung der Elektronen in einem äußeren elektrischen Feld lautet
d2x dx Q 2J Z02 x Ex . 2 dt dt mel
Ex
E0eiZet .
(18.150)
Sie entspricht der eines mechanischen Oszillators mit äußerer Kraft. Die Lösung lässt sich also auf unseren Fall übertragen. Die Amplitude x0 der Auslenkung bzw. die des Dipolmomentes ist gegeben durch 2 0
p
Q 2 0
2
/ m 2 E02
2 2 e
(Z Z ) (2J Ze )
2
; p 2 e 2J t .
(18.151)
Da die Energie nach (18.149b) exponentiell mit J abfällt, muss 2J durch J ersetzt werden.
494
18 Zeitlich veränderliche Magnetfelder
Einsetzen von p02 Q 2 x02 { Q 2 d 02 in (18.147) ergibt das Frequenzspektrum der abgestrahlten Leistung (Abb. 18.50)
Ptotal P
Q 4 E04 Ze4 . 12S H 0 m 2 c3 (Z02 Ze2 ) 2 (J Ze ) 2 (18.152)
Z02 J 2 maximal Die Halbwertsbreite der Verteilung ergibt sich aus der Bedingung, dass der zweite Faktor auf die Hälfte seines Maximalwertes bei Ze abgefallen ist. Setzen wir näherungsweise J Ze | J Z0 , so folgt Die Leistung wird bei Ze
we / w0 Abb. 18.50: Frequenzspektrum der vom Dipol abgestrahlten Leistung auch
Ze
J
r 2
J2 4
Z02
o ('Ze )1/ 2
J.
(18.153/154)
18.11.2.4 Erzeugung und Nachweis elektromagnetischer Wellen
In Kap. 18.11.1.4 wurde besprochen, wie durch Rückkopplung von Energie ungedämpfte Schwingungen erzeugt werden können. Koppeln wir einen Hertzschen Dipol geeigneter Länge z. B. kapazitiv an den primären Schwingungskreis an, so haben wir UB damit einen Sender geschaffen R1 (Abb. 18.51). Wir wollen nun einige Antenne Experimente durchführen. Zuerst untersuchen wir Spannungs- und StromLC verteilung beim Hertzschen Oszillator. Ohmsche Verluste können wir dabei vernachlässigen. An den Enden des C k K Dipols muss die Stromstärke stets null Ua C2 R2 sein. Das ist nur dadurch zu realisieren, B dass die Stromverteilung die Form einer stehenden Welle hat. Bei jedem Oszillator erreicht die potentielle EnerAbb. 18.51: Durch Ankopplung einer Antenne gie ein Maximum, wenn die kinetische an den Schwingungskreis eines rückgekoppelten Energie null ist. Strom und Spannung Verstärkers entsteht ein Sender haben daher eine Phasenverschiebung
18 Zeitlich veränderliche Magnetfelder
495
von 90°. Die Spannung im Dipol ist ebenfalls durch eine stehende Welle darstellbar. An den Enden des Dipols befinden sich Spannungsbäuche, in der Mitte liegt ein Knoten. Außer diesen Grundschwingungen gibt es (wie etwa bei einer schwingenden Saite) mit geringerer Amplitude Oberschwingungen. Der Spannungsverlauf der Grundschwingung kann mittels einer Glimmlampe und der Stromverlauf mit Hilfe eines kleinen Drahtbügels mit dazwischen geschaltetem Glühlämpchen nachgewiesen werden (Abb. 18.52). Wir erhalten den unten dargestellten Verlauf.
kˆ 0
U (x,t 0 ) I (x,t 0 ) Abb. 18.52: Demonstration des Spannungsund Stromverlaufs eines Sendedipols mit einer Glimmlampe bzw. einer Glühbirne und
Sendedipol
Empfängerdipol J Abb. 18.53: Überprüfung der Polarisation und der Abstrahlcharakteristik der Welle
Jetzt wollen wir die abgeleiteten Eigenschaften der ausgesandten elektromagnetischen Welle überprüfen. Als Sonde dient ein identischer Dipol. Er sei in der Mitte aufgeschnitten, die Enden sind über ein Glühlämpchen oder einen Gleichrichter mit Galvanometer überbrückt (Abb. 18.53). Wir stellen ihn parallel zum Sendedipol und senkrecht zur Wellennormale auf. (a). Das Lämpchen brennt, denn durch die elektrische Komponente der Welle entsteht durch Influenz zwischen den Enden des Dipols eine Spannung. Außerdem wird der Dipol von den sich zeitlich ändernden magnetischen Feldlinien optimal durchsetzt. Wir drehen nun den Dipol in einer Ebene senkrecht zur Ausbreitungsrichtung der Welle. Weist seine Achse senkrecht zum Sendedipol, so erlischt das Birnchen. Das zeigt, dass die Welle wirklich linear polarisiert ist. Im nächsten Versuch (b) untersuchen wir die Winkelabhängigkeit der Strahlungsintensität in der Meridianebene. In Übereinstimmung mit dem theoretischen Befund wird die Stromstärke maximal für - 90q und null für - 0q,180q . – Zum Schluss messen wir noch die Wellenlänge der sich ausbreitenden Welle. Wir könnten sie aus der Länge des Sendedipols ermitteln, wenn wir annehmen, dass die Ausbreitungsgeschwindigkeit vph der Welle auf dem Metallstab gleich der Lichtgeschwindigkeit cVak im Vakuum ist. Zur Überprüfung erzeugen wir durch Reflexion an einem Metallschirm eine stehende Welle. Diese lässt sich mit dem SondenDipol abfahren. Bei richtiger Justierung des Schirms leuchtet das Birnchen im Abstand einer halben Wellenlänge periodisch auf. Am Metallschirm befindet sich ein Knoten der elektrischen Feldstärke. Anderenfalls würde sofort ein Ladungsausgleich stattfinden.
496
18 Zeitlich veränderliche Magnetfelder
Wir können auch die Stellung des Dipols fixieren und den Spiegel langsam verschieben. Die ermittelte halbe Wellenlänge entspricht der Länge des Sendedipols. Es gilt also vph = cVak. Das ist damit zu erklären, dass sich das elektromagnetische Feld des Stabes hauptsächlich im Raum außerhalb des Stabes befindet.
18.11.2.5 Röntgenbremsstrahlung und Synchrotronstrahlung
Die periodische Beschleunigung von Elektronen in einem Hertzschen Dipol führt zur Abstrahlung elektromagnetischer Wellen. Aber auch eine nichtperiodische Beschleunigung ist mit der Aussendung elektromagnetischer Strahlung verbunden. Beispiele sind die Röntgenbremsstrahlung. (Abb. 18.54) ( Röntgen, W. K. 1845-1923) und die Synchrotronstrahlung. Zur Erzeugung a)
b)
Anode
- Kathode
e- , E 0
Ze +
+ e- , E < E 0
Abb. 18.54: a) Ablenkung eines Elektrons im Feld des positiv geladenen Kerns; b) Röntgenröhre ersterer werden Elektronen aus einer Kathode durch eine Spannung von ca. 50 kV beschleunigt und im elektrischen Feld der Atomkerne der Anode (Cu, W) abgebremst. Dabei entsteht ein kontinuierliches Spektrum, das als Bremsstrahlung bezeichnet wird. Es erstreckt sich typischerweise über den Wellenlängenbereich von ca. 2-15 nm. Eine Beschleunigung liegt aber auch vor, wenn freie Elektronen mit konstanter Geschwindigkeit auf einer gekrümmten Bahn umlaufen wie z.B. in einem Elektronen-Synchrotron. In ihm durchlaufen die Elektronen eine Kreisbahn, die durch ein ringförmiges Magnetfeld erzeugt wird. Die Beschleunigung der Elektronen erfolgt an einer oder mehreren Stellen der Kreisbahn durch ein hochfrequentes elektrisches Feld. Magnetfeld und Beschleunigungsspannung müssen sorgfältig aufeinander abgestimmt sein. Nach diesem Prinzip können Elektronenpulse erzeugt werden, deren Geschwindigkeit sehr nahe an der Lichtgeschwindigkeit liegt. Auf Grund ein kontinuierliches Spektrum, das als Bremsstrahlung bezeichnet wird. Es erstreckt sich typischerweise über den Wellenlängenbereich von ca. 2-15 nm. Magnetfeld und Beschleunigungsspannung müssen sorgfältig aufeinander abgestimmt sein. Nach diesem Prinzip können Elektronenpulse erzeugt werden, deren Geschwindigkeit sehr nahe an der Lichtgeschwindigkeit liegt. Auf Grund relativistischer Effekte ist die Strahlung auf einen sehr engen Bereich in Richtung der Bahntangente beschränkt.
18 Zeitlich veränderliche Magnetfelder
497
Der Öffnungswinkel in der Bahnebene ergibt sich (ohne Beweis) zu
2D | 2m0c2/EElektr..
(18.155)
Ein weiterer Vorteil liegt darin, dass die Strahlung vollständig polarisiert ist. In der Bahnebene liegt lineare Polarisation vor, außerhalb ist sie elliptisch polarisiert. Die mittlere Frequenz bzw. Wellenlänge für eine gegebene Elektronenenergie lässt sich aus der Dauer 't eines den Beobachter erreichenden Pulses zu Z | 1/'t abschätzen. Wir berechnen 't. Während ein Lichtkegel den Ort des Beobachters überstreicht, legt es den Kreisbogen 2Dr zurück. Die dazu benötigte Zeit ist t1 = 2rD/c. Das vom Punkt P1 den Beobachter erreichende Licht muss um die Strecke 's = 2rsinD weiter laufen als das von P2 kommende Licht. Die zugehörige Zeit ist t2 = 's/c. Die Pulsdauer beträgt also für den Beobachter
't
t1 t2
2r rD 3 (D sin D ) | c 3c
(18.156a)
Das entspricht nach dem Fouriertheorem einer mittleren Frequenz von
Z|
3c . rD 3
(18.156b)
Die Strahlungsleistung kann weiter erhöht werden, geschickt werden. Dieser besteht aus einer Reihe alternierenden Polen, in dem sie eine wellige Bahn durchlaufen. Abb. 18.55 zeigt die spektrale Verteilung im Hamburger Speicherring DORIS für verschiedene Elektronenenergien (L18.1,2).
wenn die Elektronen durch einen Wiggler hintereinander angeordneter Magnete mit
W/nm 10
1
Abb. 18.55: Spektrale Strahlungsleistung durch den Speicherring DORIS in Hamburg für einige Elektronenenergien (aus dem Internet nachgezeichnet)
Strahlungsleistung
10-1 10-2
10
6 GeV
4 GeV
-3
10-4 2 GeV
10
-5
1 GeV
10-6 -3 10 10-2 10-1 0 1 Wellenlänge (nm)
102
498
18 Zeitlich veränderliche Magnetfelder
18.11.2.6 Experimentelle Bestimmung der Lichtgeschwindigkeit
Elektromagnetische Wellen erstrecken sich über einen Frequenzbereich von mehr als 20 Größenordnungen (Abb. 18.56).
Frequenz/s-1
10
24
10
22
10
20
10
18
1016 10
14
10
12
10
10
Wellenlänge/m -16 10 g -Strahlung
10-12 -10
Röntgenstrahlung UV-Strahlung
106 10
4
10
2
10
10-8 10-6
Infrarotstrahlung
108
10-14
Mikrowellen Kurze Radiowellen TV u.FM-Radio AM-Mittelund Langwellen
10-4 -2
10 1
102 104
Abb. 18.56: Das Spektrum der elektromagnetischen Wellen (schematisch) gut
106
Das Spektrum des sichtbaren Lichtes bildet also nur einen winzigen Ausschnitt. Bis um ca. 1800 war es allein bekannt. Eine wesentliche Erweiterung des Spektrums gelang erst mit der Entdeckung der Hertzschen Wellen 1888. Zu diesem Zeitpunkt war die eigentliche Lichtgeschwindigkeit durch die Arbeiten dreier Forscher bereits mit zunehmender Genauigkeit bestimmt worden. So ist es nicht verwunderlich, dass für die Geschwindigkeit aller elektromagnetischen Wellen wegen ihrer Wesensgleichheit der Name „Lichtgeschwindigkeit“ beibehalten wurde. Als Erster bestimmte O. Römer (1640-1710) die Lichtgeschwindigkeit auf der Basis astronomischer Beobachtungen. Er erhielt bereits die richtige Größenordnung. 1840 gelang es A. H. Fizeau (1819-1896) als Erstem, die Lichtgeschwindigkeit mit Hilfe eines experimentellen Aufbaus (Abb. 18.57) zu ermitteln. Er benutzte eine Laufzeitmessung, auch als ZahnradMethode bekannt. Licht gelangt von einer Quelle auf einen halbdurchlässigen Spiegel und
18 Zeitlich veränderliche Magnetfelder
499
anschließend auf ein rotierendes Zahnrad. Ein von diesem durchgelassener Lichtpuls fällt auf einen Spiegel, von dem er in sich selbst reflektiert wird. Bei passender Umdrehungsgeschwindigkeit des Zahnrades kann er dieses passieren Sind Q die Frequenz des Rades und n die Anzahl der Lücken, so beträgt die Zeit, während sich das Rad um eine Zahnlücke Lichtquelle weiter gedreht hat,
t 1/ nQ .
(18.157)
Der Lichtpuls muss nach Reflexion durch die nächste Zahnlücke treten kann, muss dessen Laufzeit währendes Weges 2s mit dieser Zeit übereinstimmen.
t
2s c
o c
2 snQ
Zahnrad
(18.158)
Abb. 18.57: Bestimmung der Lichtgeschwindigkeit mit Hilfe eines rotierenden Zahnrades (Fizeau, 1840)
Bei Steigerung der Frequenz kann das Licht das Zahnrad dann passieren, wenn die Frequenz Vielfache der kleinstmöglichen Frequenz erreicht. In der Fizeauschen Anordnung betrug der Lichtweg 8.633 km. Die „krumme“ Zahl ergab sich als die Entfernung zweier Berggipfel. L. Foucault (1850) konnte den Lichtweg durch Einsatz eines Drehspiegels auf wenige Meter verkürzen (Abb. 18.58). Ein Lichtbündel gelangt von der Quelle Q auf besagten Drehspiegel SD (Frequenz Z ) und wird von diesem unter 90° auf einen Hohlspiegel SH reflektiert. Das zurücklaufende Lichtbündel trifft den Drehspiegel in einer verdrehten Lage an und weicht daher von der Einfallsrichtung um einen Winkel 2D ab. Werden die Abstände
Q PS D , PS D PS H
Q PE (18.161)
mit s1, s2 und 's bezeichnet, so schreibt sich die Zeit zum Durchlaufen der Strecke zwischen Drehund Hohlspiegel als (18.161) folgt durch Elimination von D aus den beiden letzten Ausdrücken für die Lichtgeschwindigkeit
SD PD
PE PH
c
4 s1s2Z . 's
(18.162)
Inzwischen konnte die Genauigkeit
SH Abb. 18.58: Messung der Lichtgeschwindigkeit mittels eines Drehspiegels (Foucault, 1850)
500
18 Zeitlich veränderliche Magnetfelder
der Messungen durch den Einsatz elektrooptischer Komponenten, die höhere Modulationsfrequenzen gestatten, an Stelle eines Drehspiegels erheblich gesteigert werden. Die heute genaueste Messmethode beruht auf der separaten Messung der Frequenz und der Wellenlänge der Lichtwelle eines Lasers, woraus sich c aus c OQ ergibt. Aus solchen Messungen folgt c zu
c
2,99792458 108 m / s .
(18.163)
18.11.3 Koaxialkabel, Hohlleiter und Hohlraumresonatoren Um hochfrequente elektromagnetische Wellen dem „Verbraucher“ zuzuführen, werden geeignete Leitungen benötigt. Die in der Wechselstromtechnik üblichen Drahtleitungen sind dafür nicht brauchbar, da Verluste durch Abstrahlung zu groß sind. Wir müssen uns daher Anordnungen überlegen, welche solche Verluste möglichst vermeiden. Eine Möglichkeit besteht darin, die Wellen in einer nach E. E. Lecher (1856-1926) benannten Paralleldrahtleitung zu führen, die an einem Ende geschlossen ist. Ist der Abstand der beiden Drähte klein gegenüber der Wellenlänge, so zeigt sich, dass die Ströme in den beiden Leitungen um den Winkel S gegeneinander verschoben sind. Die Energieabstrahlung wird dadurch stark reduziert, da sich die von den Drähten ausgehenden Wellen weitgehend auslöschen. Eine noch vollständigere Abschirmung wird beim Koaxialkabel erreicht, das aus einem dünnen Draht in der Mitte eines kreisrunden metallischen Mantels besteht. Der Zwischenraum ist im Allgemeinen mit einem Dielektrikum ausgefüllt. Sie sind als Antennenkabel weit verbreitet. Es ist auch möglich, den Innenleiter wegzulassen. Wir sprechen dann von einem Hohlleiter. Sie spielen in der Mikrowellentechnik eine wichtige Rolle. Auch Lichtwellenleiter (Glasfaser-Kabel) sind dazu zu zählen. Wird ein Hohlleiter an seinen beiden Enden durch metallische Wände verschlossen, so entsteht bei geeigneter Dimensionierung ein Hohlraumresonator. Er dient zur Erzeugung sehr hochfrequenter elektromagnetischer Felder im GHzBereich. Im Folgenden besprechen wir zunächst das Koaxialkabel.
18.11.3.1 Koaxialkabel
Wie wir uns bereits klargemacht haben, verlaufen die elektrischen Feldlinien zwischen Innenund Außenleiter radial, während die magnetischen Feldlinien konzentrische Kreise bilden G G (Abb. 18.59). Die Richtung der E -Linien bzw. der Drehsinn der B -Linien ändert sich in Fortpflanzungsrichtung periodisch im Abstand einer halben Wellenlänge. Zur Ermittlung von Spannungs- und Stromverteilung leiten wir die entsprechenden Wellengleichungen her (Abb. 18.60). Induktivität und Kapazität pro Meter Leitung seien mit L´ und C´ bezeichnet. Den Ohmschen Widerstand können wir vernachlässigen.
18 Zeitlich veränderliche Magnetfelder
501
r E r E
r B
l Abb. 18.59: Ausbreitung einer elektromagnetischen Welle in einem Koaxialkabel
Nach dem Induktionsgesetz erhalten wir für die Spannungsdifferenz im Abstand eines Leiterelementes ' z
'U
U ( z 'z ) U ( z ) (18.164) dI L ' 'z dt
z
Im Grenzfall 'z o 0 folgt
wU wz
L '
wI . wt
Innenleiter
(18.165)
Die Ladung auf dem Leiterelement ' z beträgt
Q C 'U 'z .
Außenleiter
I(z)
I(z + D z)
U(z)
U(z + D z)
(z + D z)
Abb. 18.60: Zur Ableitung der Wellengleichung
(18.166)
Die zeitliche Änderung dieser Ladung ist
wQ wt
C'
wU 'z . wt
(18.167)
Damit sich die Ladung ändern kann, muss sich der in ' z hinein fließende Strom von dem heraus fließenden Strom unterscheiden.
'I
I ( z 'z ) I ( z ) C '
wU 'z . wt
(18.168)
502
18 Zeitlich veränderliche Magnetfelder
Im Grenzfall 'z o 0 wird
wI wz
C'
wU . wt
(18.169)
Nach Differentiation von (18.165) nach z und von (18.169) nach t lassen sich die erhaltenen Beziehungen entkoppeln:
w 2U wz 2 w2 I wz 2
w 2U wt 2 w2 I L 'C ' 2 wt
L 'C '
(18.170)
Dies sind die Wellengleichungen für Spannung und Strom. Im Hohlleiter breiten sie sich mit der Phasengeschwindigkeit
1
v ph
L 'C '
(18.171)
aus. Der Quotient
Z0
U0 I0
L' C'
(18.172)
heißt Wellenwiderstand des Koaxialkabels. Induktivität und Kapazität haben wir bereits berechnet. Bezeichnen Ra und Ri Außen- und Innenradius, so gilt
L'
1 2SH 0 c 2
ln( Ra / Ri ); (18.173)
C'
2SH 0 . ln( Ra / Ri )
Damit folgt für den Wellenwiderstand
Z0
1 2SH 0 c
ln( Ra / Ri ) .
(18.174)
Der Wert des Faktors 1/ 2SH 0 c beträgt 60 :. Da die Abmessungen des Kabels nur logarithmisch in Z0 eingehen, liegt die Impedanz typischer Weise in der Nähe dieses Wertes.
18 Zeitlich veränderliche Magnetfelder
503
Allerdings muss berücksichtigt werden, dass sich im Allgemeinen zwischen den beiden Leitern ein Dielektrikum mit der Dielektrizitätskonstanten H befindet, so dass sich die Kapazität um diesen Wert vergrößert. Zur Vermeidung von Verlusten muss die Reflexion am Ende der Leitung unterdrückt werden. Das wird durch Abschluss der Leitung mit dem Wellenwiderstand Z0 erreicht.
18.11.3.2 Rechteck-Hohlleiter
Wird der Innenleiter entfernt, so entsteht ein Hohlleiter. Betrachten wir ihn vom Standpunkt der Wechselstromtechnik, so erscheint es zunächst erstaunlich, dass durch ihn elektromagnetische Energie transportiert werden kann. Anders dagegen, wenn wir davon ausgehen, dass sich Licht direkt und durch Reflexion an den gut verspiegelten Wänden ausbreiten kann. Der Hohlleiter kann elliptisch, rund oder rechteckig geformt sein. Wir wollen hier x den letzten Fall betrachten, der wohl der Allgemeinste ist. Wir wählen eine mehr anschauliche Herleitung, die von der Fortpflanzung einer speziellen ebenen Welle entlang zweier metallischer Platten ausgeht -kx kx (Abb. 18.61). Diese mögen sich im Abstand kz kz a gegenüber stehen. Eine schräg einfallende G z elektromagnetische Welle E (0, E y , 0) mit G Abb. 18.61: Zur Herleitung der Wellendem Wellenvektor k (k x , 0, k z ) wird abformen in einem rechteckigen Hohlleiter wechselnd von der oberen und der unteren Platte gespiegelt. Während also kz erhalten bleibt, ändert kx bei jeder Reflexion sein Vorzeichen. Zwischen den Platten entsteht daher eine G G Welle, die aus der Überlagerung zweier Wellen mit k (k x , 0, k z ) und k (k x , 0, k z ) resultiert.
G E
G E0, y sin(Zt k x x k z x) sin(Zt k x x k z x) G 2 E0, y sin(k x x) cos(Zt k z z ).
(18.175)
Die in z-Richtung fortschreitende Welle besitzt eine von x abhängige Amplitude. An den beiden Metallplatten ist die Tangentialkomponente der elektrischen Feldstärke null. Die Werte von kx sind also durch die Randbedingungen
kx festgelegt.
nS a
(18.176)
504
18 Zeitlich veränderliche Magnetfelder
Die elektrische Feldstärke wird demnach null für
kx x S ,
(18.177)
G woraus sich die Knotenebenen von E ergeben zu
x a/n .
(18.178)
Jetzt wollen wir die Phasengeschwindigkeit der Welle berechnen. Wir können sie aus der Wellengleichung ermitteln, indem wir die Lösungsfunktion (18.175) einsetzen. Es ergibt sich die Bedingungsgleichung
k x2 k z2
Z2
.
c2
(18.179)
Die Werte für k x liegen bereits fest. k z muss also der Bedingung genügen
kz
Z
Z2
v ph
c2
Schreiben wir k z
n 2S 2 . a2
2S / Oeff und drücken Z mittels Wellenlänge O0 und Lichtgeschwin-
digkeit c im freien Raum (Vakuum), Z
Oeff
(18.180)
O0 1 (O0 / 2a ) 2
2S c / O0 , aus, so folgt
.
(18.181)
Die Wellenlänge einer elektromagnetischen Welle zwischen zwei metallischen Platten ist also größer als die Wellenlänge einer Welle gleicher Frequenz im freien Raum. Wie (18.180) zeigt, gibt es eine Grenzfrequenz, unterhalb derer sich in dem „Wellenleiter“ keine Welle ausbreiten kann. Sie ergibt sich aus der Forderung, dass der Radikand reell sein muss, zu
Z t ZG
nS c . a
(18.182a)
Dem entspricht eine obere Grenzwellenlänge OG .
O d OG
2a . n
Wir wenden uns nun der Berechnung der Phasengeschwindigkeit zu.
(18.182b)
18 Zeitlich veränderliche Magnetfelder
505
Sie folgt aus (18.180) zu
c
v ph
n 2S 2 c 2 1 2 2 aZ
!c.
(18.183)
An diesem Ausdruck sind mehrere Punkte bemerkenswert. Zunächst fällt auf, dass die Phasengeschwindigkeit größer als die Lichtgeschwindigkeit ist. Darauf kommen wir gleich zurück. Weiter sehen wir, dass die Phasengeschwindigkeit eine Funktion der Frequenz ist. Schließlich geht in den Ausdruck die Knotenzahl n ein. Die Geschwindigkeit der Welle hängt also von ihrer Modenstruktur ab. Die Übertragung eines Signals erfolgt mit der Gruppengeschwindigkeit v g . Sie ist definiert als vg :
dZ . dk
(18.184)
In unserem Fall wird v g
vg
dZ dk z
d Z dk dk dk z
c
kz k
c2 kz
Z
c2 c v ph
Die Gruppengeschwindigkeit der Welle ist also kleiner als die Lichtgeschwindigkeit. Die Abhängigkeit der Frequenz vom Wellenvektor wird als Dispersionsrelation bezeichnet. Sie ergibt sich aus (18.180) zu
Z2
c 2 k z2
n 2S 2 c 2 . a2
w
(18.186)
In Abb. 18.62 ist Z f (k z ) dargestellt. Wir erweitern nun unsere Überlegungen auf einen Hohlleiter mit rechteckigem Querschnitt. Das bedeutet, dass die elektrische Feldstärke jetzt auch eine Komponente in x-Richtung besitzen G G kann, E E ( Ex , E y ) . Die Lösungsfunktion muss also die Form haben
G E ( x, y , z )
(18.185)
G E0 ( x, y )cos(Zt k z z ). (18.187)
wg
kz Abb. 18.62: Frequenz einer elektromagnetischen Welle als Funktion der Wellenvektorkomponente kz, (Dispersionsrelation)
506
18 Zeitlich veränderliche Magnetfelder
Setzen wir diesen Ansatz in die Wellengleichung ein, so ergibt sich als Analogon zu (18.179)
Z2
k x2 k y2 k z2
c2
.
(18.188)
Die Randbedingungen für ky lauten entsprechend denen für kx
ky
mS / b ,
(18.189)
wobei b der Abstand der leitenden Wände in y-Richtung ist. Damit folgt für kz
kz
Z2 c2
n 2S 2 m 2S 2 2 a2 b
(18.190)
und die Grenzfrequenz wird
ZG
nS c
1 1 2 . 2 a b
(18.191)
G Die Komponenten von E ergeben sich zu
E0, x ( x, y ) E0, y ( x, y ) E0 z
§ nS · § mS A cos ¨ x ¸ sin ¨ © a ¹ © b § nS · § mS B sin ¨ x ¸ cos ¨ © a ¹ © b
· y ¸; ¹ · y ¸; ¹
(18.192)
0.
Wir haben uns im Bisherigen nur mit dem elektrischen Feld beschäftigt. Wie bereits in Kap. 18.11.2.1 gezeigt, muss das zugehörige Magnetfeld aus der 2. Maxwell-Gleichung berechnet werden.
G rot E
G wB . wt
(18.96)
Wir betrachten als Beispiel eine Welle mit Ex = Ez = 0 sowie n = 1, m = 0. Sie hat also die Form
Ey
§S E0 sin ¨ ©a
· x ¸ cos(Zt k z z ) . ¹
(18.193)
18 Zeitlich veränderliche Magnetfelder
507
Die Komponenten des zugehörigen Magnetfeldes ergeben sich aus (18.96) zu
kz
Bx
By
0;
Bz
Z kx
Z
E0 sin( k x x)cos(Zt k z z ); (18.194)
E0 cos(k x x)sin(Zt k z z ).
Die Feldverteilungen sind in Abb. 18.63 dargestellt. Es ist zu beachten, dass der magnetische Feldvektor zwar senkrecht zum elektrischen Feldvektor gerichtet ist, aber nicht mehr senkrecht auf der Fortpflanzungsrichtung steht. Da es sich in beiden Fällen um transversale Wellen handelt, werden sie als TEnm-Wellen bzw. als TMnm-Wellen bezeichnet. Die Indizes n und m geben die oben eingeführten Laufzahlen an.
y
x
z
r B Abb. 18.63: Verlauf der elektrischen und magnetischen Feldstärke einer elektromagnetischen Welle in einem Rechteckhohlleiter auf
r E
b a
18.11.3.3 Hohlraumoszillatoren
Wird ein Wellenleiter auf beiden Seiten durch leitende Wände verschlossen, so entsteht ein Hohlraumresonator, der durch Einspeisung elektromagnetischer Energie zu Schwingungen angeregt werden kann (Abb. 18.64). Die Eigenschwingungen können als stehende Wellen angesehen werden, die durch Reflexion an den Wänden entstehen. Die möglichen Frequenzen G ergeben sich wieder aus den Randbedingungen. Für E lauten sie
Ex
0
für
z
0, d und
y
0, b ;
Ey
0
für
x 0, a und
z
0, d ;
Ez
0
für
x 0, a und
y
0, b .
(18.195)
508
18 Zeitlich veränderliche Magnetfelder
G Diese sind erfüllt, wenn die Komponenten des Wellenvektors k
(k x , k y , k z ) auf die folgenden
Werte beschränkt werden:
kx
z
r nS / a ; k y
r mS / b ; k z
m, n, q = ganze Zahlen.
r qS / z (18.196)
G Der Betrag des Wellenvektors k folgt mit
c
G k
r k kz
k x2 k y2 k z2
(18.197a)
ky
kx
y
und den Randbedingungen zu
a
x
G k
b
Abb. 18.64: Beispiel einer Feldverteilung in einem Hohlraumoszillator (TE248-Mode)
Z
S
n2 m2 q 2 . a 2 b2 d 2
(18.197b)
Für die Frequenzen erhalten wir mit Q c/O o Z ck
cS n. L
(18.198)
Neben den elektrischen Eigenschwingungen („Moden“) gibt es die zugehörigen Moden des magnetischen Feldvektors. Für spätere Überlegungen benötigen wir den Begriff und den Wert der sog. Zustandsdichte. Sie ist definiert als Maß für die Zahl der Schwingungen pro Frequenzintervall 'Z 1s 1 im Volumen V L3 . Die erlaubten k-Werte bilden im k-Raum ein Punktgitter: In einem Oktanden G des k -Raumes beträgt die Anzahl der Gitterpunkte, wenn wir a b c L setzen
Z Mit v ph
1 4 3 §S · S kmax / ¨ ¸ 83 ©L¹
3
L3 3 kmax . 6S 2
(18.199)
Z / k ergibt sich für die Zahl aller möglichen Eigenfrequenzen
Z (Z )
Z 3 L3 . 6S 2 v3ph
(18.200)
18 Zeitlich veränderliche Magnetfelder
509
c erhalten wir damit als Zustandsdichte (Modendichte) den Ausdruck
Mit v ph
D(Z )
Z2 V 2S 2 c 3
dZ dZ
(18.201)
Ergänzung 1: Das elektromagnetische Feld des Hertzschen Dipols Ein dünner Metallstab befinde sich im Zentrum eines kartesischen Koordinatensystems längs der z-Achse. Wir betrachten ein Volumenelement dV2, in dem sich Elektronen der Gesamtladung q U dV2 befinden mögen (Abb. 18.A1). Die Ladung möge sich längs des Drahtes mit der Geschwindigkeit v bewegen. Die Stromdichte ist G j
G
Uv.
G
z
Das Vektorpotential A einer stationären Stromverteilung ist durch (17.22) gegeben.
G G A(r1 )
G G
P0 j ( r2 ) dV2 . 4S V³ r12
dV2
(18.A1)
2
x
r j
r r1
r r2
y
G P1 Hierin ist r12 der Abstandsvektor von dV2 zu einem Aufpunkt P1. Im vorliegenden Fall ist die Stromr r1 2 dichte zeitabhängig. Daher ist die endliche Ge0 schwindigkeit des elektromagnetischen Feldes, das vom Dipol ausgeht, zu berücksichtigen. Das zur Abb. 18A.1: Zum Feld eines Dipols Zeit t im Punkt P1 gemessene Vektorpotential G G A (r1 , t ) wird durch eine Stromverteilung verursacht, die zum Zeitpunkt (t r12 / c) bestand, wobei vorausgesetzt ist, dass die Laufzeitdifferenzen ' (r12 / c) (als Retardierung bezeichnet) von unterschiedlichen Punkten des Stabes zum Aufpunkt P1 klein sind gegenüber einer Schwingungsperiode T. Alle vom Stab zur Zeit t1 ausgehenden Wellen erreichen dann im nahezu gleichen Zeitpunkt den Punkt P1. Das ist der Fall, wenn die Geschwindigkeit v der Ladung q klein ist gegenüber der Lichtgeschwindigkeit c.
G G A(r1 , t )
G G
P0 j (r2 , t r12 / c) dV2 . 4S V³ r12 2
(18.A2)
510
18 Zeitlich veränderliche Magnetfelder
Wir setzen ferner voraus, dass die Länge des Stabes l r12 ist. Dann ist r12 | r nahezu G G konstant und kann somit vor das Integral gezogen werden. Setzen wir j U v ein, so wird aus (15A1.1a)
G G A(r1 , t )
P0 G G vU (r2 , t r / c) dV2 . 4S r V³
(18.A3)
2
G Da die Geschwindigkeit v (t ) aller Ladungselemente gleich ist, kann sie ebenfalls vor das Integral gezogen werden. Das Integral stellt demnach die Ladung q dar, die längs des Stabes mit der Geschwindigkeit v gegen den Schwerpunkt der positiven Ladungen (der Atomrümpfe) Schwingungen ausführt. Der Abstand d zwischen den Ladungsschwerpunkten ändert sich also periodisch. Deswegen sprechen wir von einem schwingenden Dipol. Da gilt
G dp dt
G qv ,
(18.A4)
können wir das Vektorpotential schreiben als
G G A(r1 , t )
P0 d G p (t r / c) . 4S r dt
(18.A5)
Das Vektorpotential hat also die Form einer Kugelwelle. Das Magnetfeld ergibt sich aus dem Vektorpotential mittels
G B
G rot A .
(17.19)
G Da A nur eine z-Komponente besitzt, sind nur
Bx
wAz wy
und
By
wAz wx
(18.A6)
zu berechnen. Als Erstes ermitteln wir Bx Wir erhalten
G
Bx
G
P0 ª wp (t r / c) w § 1 · § 1 · w § wp(t r / c) · º ¨ ¸¨ ¸ ¨ ¸» . wt wy © r ¹ © r ¹ wy © wt 4S «¬ ¹¼
Es ist aber wr / wy
y / r und
w §1· y ¨ ¸ 3 , ferner mit u t r / c wy © r ¹ r
(18A7)
18 Zeitlich veränderliche Magnetfelder
G w (w p / w t ) wy
G w (w p / w t ) w u w r wu w r wy
Unter Berücksichtigung von P0
Bx
1 4SH 0 c 2
511
G w2 p 1 y . w t2 c r
(18.A8)
1/(H 0 c 2 ) ergibt sich damit das Magnetfeld Bx zu
ª§ y ·§ wp (t r / c) · § y «¨ 3 ¸¨ ¸¨ 2 wt ¹ © cr ¬© r ¹©
2 · § w p (t r / c ) · º ¸» ¸¨ wt 2 ¹© ¹¼
(18.A9)
In derselben Weise erhalten wir
By
ª§ x ·§ wp (t r / c) · § x · § w 2 p(t r / c) · º «¨ 3 ¸¨ ¸» . ¸ ¨ 2 ¸¨ wt wt 2 4SH 0 c ¬© r ¹© ¹ © cr ¹ © ¹¼ 1
(18.A10)
2
Addition der beiden Beziehungen führt zu
Bx By
1 4SH 0 c 2
x y ª§ wp(t r / c) · § r · § w 2 p(t r / c) · º . r3
Erinnern wir uns daran, dass
Ǭ ©
G p
wt
¸ ¨ ¸¨ ¹ © c ¹©
wt 2
¸» ¹¼
(18.A11)
pz ist, so erkennen wir, dass wir die Gleichung als
Vektorprodukt schreiben können:
G B
1
1 2 3 4SH 0 c r
ª§ w pG (t r / c) · § r · § w 2 pG (t r / c) · º G «¨ ¸» u r . ¸ ¨ ¸¨ wt wt 2 ¹ © c ¹© ¹¼ ¬©
(18.A12)
Das ist die gewünschte Beziehung für das Magnetfeld des Hertzschen Dipols. Die elektrische Feldstärke lässt sich aus der 1. Maxwellgleichung, (18.96) und aus (17.19) ermitteln, wobei zeitliche und räumliche Differentiation bei letzterer zu vertauschen sind. Es ergibt sich
G G dB rotE dt
G G dA rot ( E ) 0 . dt
Wegen des Verschwindens dieser Gleichung lässt sich der Klammerausdruck als Gradient eines elektrischen Potentials Mel schreiben, denn rot grad Mel = 0. Damit folgt mit der Lorentzschen Eichbedingung
G E
G wA grad Mel , wt
(18.A13)
512
18 Zeitlich veränderliche Magnetfelder
Wenden wir uns also der Berechnung des Potentials Mel zu. Wie wir gerade gesehen haben, hat G G A nur eine z-Komponente. Folglich ist div A wAz / wt . Die Differentiation lässt sich in Analogie zur Berechnung von Bx durchführen und ergibt
G A
ª§ wp (t r / c) · w § 1 · 1 w § wp (t r / c) · º ¨ ¸ ¨ ¸ ¨ ¸» , wt wt 4SH 0 c «¬© ¹ wz © r ¹ r wz © ¹¼
G A
1 4SH 0 c 2
1
2
ª§ z ·§ wp(t r / c) · § z «¨ 3 ¸¨ ¸¨ 2 wt ¹ © cr ¬© r ¹©
2 · § w p (t r / c) · º ¸» . ¸¨ wt 2 ¹© ¹¼
(18.A14)
(18.A15)
In vektorieller Schreibweise wird
G A
G G 1 1 ª§ wp(t r / c) · § r · § w 2 p (t r / c) · º G «¨ ¸» r . ¸ ¨ ¸¨ wt wt 2 4SH 0 c 2 r 3 ¬© ¹ © c ¹© ¹¼
(18.A16)
Unter Anwendung von (18.13) erhalten wir für das Potential
Mel
1
1 4SH 0 r 3
G ªG § r ·§ wp(t r / c) · º G ( / ) p t r c ¨ ¸¨ ¸» r . « wt © c ¹© ¹¼ ¬
(18.A17)
Damit folgt aus (18.12) für das elektrische Feld nach etwas langwieriger Rechnung
G G E (r , t )
1
1 4SH 0 r 3
2G ª G* G* § 1 · § w p (t r / c ) G · G º ˆ ˆ ur ¸ur » , p p r r 3( ) « ¨ 2 ¸¨ wt 2 © c ¹© ¹ ¼ ¬
(18.A18)
wobei
G p*
G G § r ·§ wp(t r / c) · p (t r / c) ¨ ¸¨ ¸. wt © c ¹© ¹
(18.A19)
18 Zeitlich veränderliche Magnetfelder
513
Ergänzung 2: Die Energiestromdichte in einer elektromagnetischen Welle: Der Poyntingvektor Die Energiedichte ist nach (18.143a) gegeben durch
w
H0 2
E2
1 1 2 B ; 2 P0
(18..143a)
Daraus folgt für die zeitliche Änderung durch Differentiation
ww wt
H0E
wE 1 wB . B wt P0 wt
(18.A21)
Durch Benutzung der 1. und 2. Maxwell-Gleichung können die beiden zeitlichen Ableitungen durch räumliche Ableitungen ersetzt werden. Wir erhalten
ww wt
G G § G wE 1 G wB · 1 G G G G ¨H0E B ErotB BrotE ¸ wt P0 wt ¹ P0 © G 1 G G ½ di v ® E u B ¾ : di v S ¯ P0 ¿
(18.A22)
G Diese Beziehung besagt, dass sich der Poyntingvektor S aus der Energieänderung der elektromagnetischen Welle speist. Zur Verdeutlichung integrieren wir die Gleichung über ein beliebiges Volumen und wenden auf die rechte Seite den Gaußschen Satz an:
G di v S ³ dV
V
G G w S v³A dA wt V³ (w el w magn )dV .
(18.A23)
Die durch die geschlossene Fläche A eines Volumens V austretende Strahlungsenergie ist gleich der Abnahme der elektromagnetischen Feldenergie in diesem Volumen. Oder: Der Poyntingvektor ist gleich der Energiestromdichte durch die Oberfläche des betreffenden Volumens.
514
18 Zeitlich veränderliche Magnetfelder
Zusammenfassung x Die zeitliche Änderung des magnetischen Flusses ) m bewirkt eine elektrische Spannung
U ind
d)m ; dt
)m
G G
³ B dA ,
(Faradaysches Induktionsgesetz)
x Das negative Vorzeichen besagt, dass die Spannung der sie erzeugenden Ursache entgegen gerichtet ist (Energieerhaltung). Ändert sich der magnetische Fluss allein durch die zeitliche Änderung der elektrischen Stromstärke, so ist die Induktionsspannung
U ind
L
dI . dt
x Der Proportionalitätsfaktor heißt Selbstinduktionskoeffizient oder Induktivität des Leiters. Die in einem gekoppelten zweiten Leiter entstehende Induktionsspannung ist
U ind ,2
L12
dI1 , dt
wobei L12 als Gegeninduktivität bezeichnet wird. G x Die Energiedichte w magn des magnetischen Feldes B im Vakuum ist
w magn
B2 . 2 µ0
x Die Energiedichte des elektromagnetischen Feldes in Materie bzw. im Vakuum ist
w
1 ED BH . 2
x Der Wechselstromwiderstand einer Leiteranordnung (z.B. einer Spule) der Induktivität L ist RL = iZL, der Wechselstromwiderstand eines Kondensators der Kapazität C ist RC iZC . In einem Kreis ohne Ohmsche Verluste hinkt im ersten Fall der Strom der Spannung um 90° hinterher, im zweiten Fall eilt er der Spannung um 90° voraus.
18 Zeitlich veränderliche Magnetfelder
515
x Die mittlere Leistung des Wechselstromes ist
P U eff I eff cos M
1 U 0 I 0 cos M , 2
wobei M der Phasenwinkel zwischen Strom und Spannung ist. x Die Leerlaufspannung U2 auf der Sekundärseite eines Transformators ist bei vollständiger Kopplung proportional zum Verhältnis der Windungszahlen der Sekundär- und der Primärspule: U 2 ( N 2 / N1 )U1 . x Die Maxwell-Gleichungen im Vakuum lauten zusammengefasst in Integral- bzw. Differentialform
d G G ³ BdA dt A
G G ³ Edr
C
G bzw. rot E
G G 1 d G G Bdr µ I EdA 0 vC³ c 2 dt ³A G G 1 EdA ³ U dV v³ A
G G
v³ B dA
H0 V
G wB ; wt
G rot B
G G 1 wE ; P0 j 2 c wt
G div E
1
H0
U;
G div B 0.
0
A
Sie erfüllen die Kontinuitätsgleichung
G wU di v j wt
0.
x Die Frequenz einer ungedämpften elektromagnetischen Schwingung ist
Z0
1/ LC .
x Die Frequenz einer gedämpften Schwingung ist Z
Z02 G 2 ; G
R / 2L .
x Bei einer durch eine von außen angelegte periodische Spannung der Frequenz Z erzwungenen Schwingung ist die Stromamplitude
I0
U0 / L 2 0
2 2 e
(Z Z ) (2G Ze )
2
; wobei G
R 2L
und Z02
1 . LC
516
18 Zeitlich veränderliche Magnetfelder
x Zwei Schwingungskreise können induktiv oder andersweitig miteinander gekoppelt werden. Bei induktiver Kopplung ist der Kopplungsgrad
k
L12 L1 L2
.
x Die Wellengleichungen im Vakuum lauten
G G w2 E 'E H 0 P0 2 ; wt
G G w2 B 'B H 0 P0 2 . wt
Die Lösungen dieser Differentialgleichungen sind transversale Wellen. In einer ebenen elektromagnetischen Welle stehen elektrische und magnetische Feldstärke senkrecht aufeinander und sind in Phase. G x Die Energiestromdichte S einer elektromagnetischen Welle (Poyntingvektor) im Vakuum ist
G S
1
P0
G
G
E u B .
x Die Wellengleichungen für Spannung und Strom in einem beliebigen Leiter sind
w 2U wz 2
L 'C '
w 2U ; wt 2
w2 I wz 2
L 'C '
w2 I . wt 2
Die Striche an L, C bedeuten, dass diese Größen auf die Länge von 1 m bezogen sind.
Übungsaufgaben 1. Bei einer Bergwanderung entdecken Sie einen Weidezaun, der über ein kleines Kästchen mit einer 12 V Batterie verbunden ist. Da es im Kästchen geheimnisvoll klickt, fordert Ihr Begleiter eine physikalische Erklärung. Er fragt weiter, ob für dieses Einsatzgebiet nicht umweltfreundlichere Stromquellen eingesetzt werden können. 2. Ein Ohmscher Widerstand R und eine Induktivität L sind in Serie geschaltet und parallel zu dieser Anordnung eine Kapazität C. Bestimmen Sie die Frequenzabhängigkeit des Wechselstromwiderstandes und skizzieren Sie den Absolutbetrag des Gesamtwiderstandes gegen die Frequenz in einer doppeltlogarithmischen Auftragung. Berechnen und skizzieren Sie den Phasenwinkel und die gesamte von der Schaltung aufgenommene Leistung in Abhängigkeit von der Frequenz.
18 Zeitlich veränderliche Magnetfelder
517
3. Bestimmen Sie das Verhältnis von Ausgangs- zu Eingangsspannung U 2 / U1 der R1 C R1 C beiden Schaltungen (R2 = 10 R1) und tragen U2 U1 U2 U1 R2 R2 Sie den Absolutbetrag dieses komplexen Wertes in Abhängigkeit vom Logarithmus der Frequenz des Wechselspannungssignals auf. Welche Werte ergeben sich für beide Schaltungen bei den Grenzwerten der Frequenz null und unendlich? Welches Spannungsverhältnis folgt für verschwindendes R1 bei Z = 1/R2C und welcher Phasenwinkel? 4. Vergleichen Sie die Differentialgleichung für einen elektrischen Schwingungskreis mit der Bewegungsgleichung eines physikalischen Pendels. Welche Größen entsprechen einander? Wie lassen sich die Parallelen plausibel machen? 5. Was ist unter dem Kopplungsgrad zweier identischer induktiv gekoppelter Schwingungskreise zu verstehen? Welche Konsequenzen folgen für die Stromstärke im angekoppelten Kreis? Berechnen Sie seine Eigenfrequenzen für den Fall Z0 6 106 Hz, L 4 104 H, L12 kL mit k 0.06 . Diskutieren Sie weitere Möglichkeiten der Kopplung. 6. In eine Lecherleitung wird eine elektromagnetische Welle der Frequenz Q = 630 MHz eingespeist. Durch Reflexion der (als verlustfrei angenommenen) Welle entsteht eine stehende Welle. Betrachten Sie zwei Fälle: a) freies Ende der Leitung; b) kurzgeschlossenes Ende. In welchem Abstand vom Ende liegen Spannungs- bzw. Stromknoten und in welcher Entfernung wiederholen sie sich? Wie groß ist die Wellenlänge, wenn sich die Leitung an Luft befindet und welcher Wert ergibt sich, wenn sie in ein Medium der Dielektrizitätskonstante H eingebettet ist? 7. Ein Radiosender mit einer 35 m langen, linearen Antenne strahlt elektromagnetische Wellen ab. Berechnen Sie die Resonanzfrequenz und die gesamte abgestrahlte Leistung (der maximale Strom beträgt 45 A). Welche Intensität wird in 100 km Entfernung gemessen und wie groß G G sind dort das E - und das B -Feld? 8. Ein Rechteck-Hohlleiter habe die Abmessungen a = 20 mm und b = 10 mm. Wie groß ist die Grenzwellenlänge? Welches sind für k 2, 42 cm -1 O 2, 60 cm die möglichen Moden?
19
Elektromagnetische Felder in Materie
Trifft eine elektromagnetische Welle auf Materie, z. B. Licht auf ein Gas oder einen festen Körper, so wird ein Teil in das Medium eindringen, wo er mit den Atomen oder Molekülen in Wechselwirkung tritt. In einem anschaulichen Bild regt sie die Atome oder Moleküle zu erzwungenen Schwingungen an, die darauf ihrerseits Strahlung aussenden. Der andere Teil wird von der Grenzfläche zurückgeworfen. Die modellmäßige Behandlung hat von den Maxwellgleichungen auszugehen. Ist jedoch die Teilchendichte sehr klein, wie in Gasen unter Normalbedingungen, so kann die Amplitude der abgestrahlten Welle gegenüber der der einlaufenden vernachlässigt werden. Wir können dann das uns bekannte mechanische Modell des von außen angeregten Oszillators zu Grunde legen. Das vereinfacht die Diskussion. Dementsprechend wollen wir die Behandlung in zwei Stufen vornehmen. Zunächst besprechen wir den Fall optisch dünner Materie.
19.1 Elektromagnetische Felder in optisch dünner Materie 19.1.1 Brechungsindex Experimente zeigen, dass sich elektromagnetische Felder in Materie langsamer ausbreiten als im Vakuum. Wir können also schreiben
cMed (n)
c ; n !1. n
(19.1)
Der Wert von n hängt vom Medium ab und variiert im Allgemeinen mit der Wellenlänge O der Strahlung. Wir bezeichnen diese Eigenschaft als Dispersion.
cMed
cMed (O ) .
(19.1a)
r r iw t - z / c r r iw ( t -D t ) - z / c] E = E 0 e [ ] E= E 0 e [
r Qualitativ lässt sich die kleinere GeschwinE digkeit in Materie so verstehen: Eine eindringende elektromagnetische Welle regt die Elektronen der Atome oder diese selbst zu z erzwungenen Schwingungen an. Diese strahlen ihrerseits elektromagnetische Wellen der gleichen Frequenz aus, die sich der einl = lVak / n lVak gestrahlten Welle überlagern. Wie in Kap. 18.11 gezeigt wurde, besteht zwischen Abb. 19.1: Verkleinerung der Wellenanregendem Feld und Oszillationen des angelänge einer Lichtwelle beim Durchlaufen regten Dipols eine Phasenverschiebung, so eines Mediums mit dem Brechungsindex dass auch die Abstrahlung verzögert erfolgt. n>1 Durch die Überlagerung der verschiedenen Wellen, die in den einzelnen Ebenen entstehen, ist also am Ende des Mediums die resultierende Welle relativ zu der Welle, die sich im
520
19 Elektromagnetische Felder in Materie
Vakuum fortpflanzt, verzögert (Abb. 19.1). Das bedeutet aber, dass die Geschwindigkeit elektromagnetischer Strahlung in Materie kleiner als im Vakuum ist. Wir wollen nun diese Überlegung in eine quantitative Form bringen. Zum Durchlaufen einer Strecke 'z benötigt eine Welle im Vakuum die Zeit t 'z / cVak . In Materie ist cMed c / n , wobei n > 1 ist. Die zusätzliche Zeit wird daher
't
n 'z / c 'z / c ( n 1) 'z / c .
(19.2)
Damit lässt sich die elektrische Feldstärke in einem Punkt P hinter dem Medium schreiben als
G E( z)
E0 eiZ [( t 't ) z / c ] E0 e
iZ ( t z / c )
e
(19.3)
iZ ( n 1) 'z / c
Die Welle nach Verlassen des Mediums unterscheidet sich von der einlaufenden (Vakuum-) Welle (1. Faktor) durch den Phasenfaktor (2. Faktor). Mit n o 1 geht er gegen null. Wir entwickeln ihn und brechen nach dem linearen Term ab:
e iM | 1 iM
(19.4)
Damit ergibt sich für die Feldstärke
G E
G 'z G E0 eiZ ( t z / c ) iZ (n 1) E0 eiZ ( n 1)( t z / c ) . c
(19.5)
Der erste Term stellt die einlaufende Welle dar, während der zweite Term die von den AtomDipolen des Mediums sekundär abgestrahlten Wellen wiedergibt. Aus Gründen, die später klar werden, wird n als Brechungsindex bezeichnet. Voraussetzung der Gültigkeit der Näherung ist folglich ein hinreichend kleines n, so dass die Amplitude der Sekundärwellen gegenüber der
G
G
der erregenden Welle zu vernachlässigen ist, E0, Medium | E0 . Wir versuchen, den zweiten Term mit dem oben genannten mikroskopischen Modell der zu erzwungenen Schwingungen angeregten Elektronen im Rahmen eines klassischen Modells quantitativ zu fassen. Die quantenmechanische Herleitung führt zu einem Ausdruck, der eine analoge Struktur aufweist. Zur Erinnerung: Das Modell findet seinen Ausdruck in der Bewegungsgleichung
d2x dx 2G Z02 x 2 dt dt
e E0 eiZ ( t kz ) , m
(19.6)
wobei G R / 2m die Dämpfungskonstante und Z02 D / m die quadrierte Eigenfrequenz des ungedämpften Systems darstellen. Die Amplitude der Auslenkung eines elastisch an den Atomrumpf gebundenen Elektrons in der Ebene z = 0 ist
19 Elektromagnetische Felder in Materie
x0
521
eE0 / m
Z
2 0
(19.7)
Z 2 2iGZ
Nach Erweiterung mit dem Konjugiert Komplexen des Nenners folgt
x
x0 ei (Zt M )
eE0 / m
Z
2 0
Z
2 2
e i ( Z t M )
.
(19.8)
(2GZ ) 2
Mit der Auslenkung ist ein induziertes Dipolmoment pind = ex verbunden. Wie gesagt, strahlen die Dipole selbst elektromagnetische Wellen ab. Die elektrische Feldstärke hat im Punkt P(r) unter - 90q entsprechend (18.142) den Wert
E/ Dipol
eZ 2 x0 iZ ( t r / c ) e , 4SH 0 c 2 r
(19.9)
wobei der Retardierung Rechnung getragen wurde. Die Feldstärke setzt sich zusammen aus den Beiträgen aller Dipole im Medium. Die Wellenlänge der Strahlung ist im Allgemeinen groß gegenüber dem Abstand der Dipole. Wir brauchen daher die diskrete Struktur des Mediums nicht zu berücksichtigen. Die Anzahl der Dipole in einer Schicht der Dicke ' z in der Ebene z = const (Abb. 19.2) beträgt
'z ³ N dA ,
(19.10)
Zur Unterscheidung vom Brechungsindex bezeichnet N die Anzahldichte der Dipole. Damit ergibt sich das resultierende elektrische Feld, das von einer Schicht ' z um z = 0 herrührt, im Punkt P zu
E( z)
x
f iZ r / c eZ 2 x0 iZt e e ' z N 2S RdR . 2 ³ 4SH 0 c r r 0
(19.11)
r
R und r sind verknüpft durch
R
r2
R 2 z 2 , rdr
RdR .
(19.12)
P
Damit folgt das Feld zu
E( z)
iZ ex0 N 'z eiZ ( t z / c ) . 2H 0 c
Dz (19.13)
Abb. 19.2: Zur Berechnung des Brechungsindexes
z
522
19 Elektromagnetische Felder in Materie
Schließlich setzen wir für x0 den Ausdruck (19.8) ein und erhalten für das von den AtomDipolen herrührende elektrische Feld
E( z)
iZ 'z Ne 2 E0 eiZ ( t z / t ) . c 2H m ªZ 2 Z 2 2 (2GZ ) 2 º 0 ¬« 0 ¼»
(19.14)
Durch Vergleich mit (19.5) ergibt sich für n
n 1
Ne 2 2H 0 m ª¬Z02 Z 2 2iGZ º¼
.
(19.15)
Der Brechungsindex ist eine komplexe Größe.
19.1.2 Dispersion und Absorption Was für eine physikalische Bedeutung hat der komplexe Brechungsindex? Um das zu sehen, schreiben wir (19.15) als Summe seines Real- und Imaginärteils.
n
nc incc
(19.16)
Durch Erweiterung des Bruches mit dem Komplex-Konjugierten des Nenners erhalten wir die Dispersionsrelationen
Re{n} nc 1 Im{n} ncc
Z02 Z 2 Ne 2 2H 0 m Z 2 Z 2 2 (2GZ ) 2 0
GZ Ne 2 2 2 H 0 m Z Z 2 (2GZ ) 2
,
(19.17)
0
die so heißen, weil n´ und n´´ frequenzabhängige Größen sind. Wir betrachten nun eine Welle nach Verlassen eines Mediums der Dicke ' z ((19.5, zweiter Term)). Setzen wir hier (19.16) ein, so folgt
E
E0 eiZ ( t z / c ) e iZ ( n 1) 'z / c E0 e Z ncc'z / c e iZ ( nc1) 'z / c eiZ ( t z / c ) .
(19.18)
19 Elektromagnetische Felder in Materie
523
Der erste Exponentialfaktor beschreibt die Abnahme der Amplitude der Welle durch Absorption im Medium. Die Strahlungsintensität I cH 0 E 2 ist
I
I 0 eD 'z .
(19.19)
Beersches Gesetz
In diesem Ausdruck wird
D
2Z ncc / c
(19.20)
als Absorptionskoeffizient bezeichnet. Er ist näherungsweise proportional zum Dämpfungsfaktor G . An Stelle von n´´ wird in der Literatur auch der Buchstabe N verwendet. An zweiter Stelle steht der oben eingeführte Phasenfaktor, auf Grund dessen die Wellenlänge im Medium verkleinert ist:
'M
Z (nc 1)'z / c 2S (nc 1)'z / OVak .
Wählen wir 'z
'M
(19.21)
OVak , so beträgt die Differenz
( nc 1) 2S .
(19.22)
Die Wellenlänge einer ebenen Welle ist definiert als der Abstand zweier sich um 2S unterscheidender Flächen gleicher Phase. Folglich reduziert sich die Wellenlänge im Medium gegenüber der im Vakuum auf den Wert
OMed
OVak nc
.
(19.23)
In der Literatur findet sich häufig der Buchstabe n statt n´. Das liegt daran, dass für viele Substanzen die Absorption vernachlässigt werden kann, so dass n = n´ gesetzt werden darf. Mit der Wellenlänge ändert sich auch die Phasengeschwindigkeit vph zu
v cMed
OMed v
c v cMed nc
OMed v
c . nc
(19.24)
Die Dispersionskurven (19.17) sind in Abb. 19.3 wiedergegeben. Der Absorptionskoeffizient zeigt in der Nähe einer Eigenfrequenz ein resonanzähnliches Verhalten. In realen Gasen treten im Allgemeinen mehrere solcher Strukturen auf, da es mehrere Eigenschwingungen gibt. In zwei- oder mehratomigen Molekülen kommen auch Schwingungs- und Rotationsanregungen des Kerngerüstes vor. Der komplexe Brechungsindex wird für elektronische Anregungen in einer der Quantenmechanik adäquaten Formulierung
524
19 Elektromagnetische Felder in Materie
n 1
n' n'' n'
¦ k
Nk fk
Z
2 0k
Z 2 2iG k Z (19.25)
n''~a
Darin bedeuten me die Masse der Elektronen und f die quantenmechanisch zu berechnende Oszillatorenstärke. Sie gibt den Bruchteil des Absorptionsvermögens eines klassischen Oszillators an (f < 1). Eine Eigenfrequenz Zk eines quantenmechanischen Systems ist mit dessen Energiezuständen verknüpft durch die Beziehung
1
0
e2 2H 0 me
w
Abb. 19.3: Realteil und Imaginärteil des Brechungsindexes als Funktion der Frequenz (Dispersionsrelationen) aaa quantum ist,
Ek E0
=Z k ,
(19.26)
h / 2S und h das Plancksche Wirkungs-
wobei =
h 6,6260755 1034 Js .
(19.27)
n' n¢¢ : a
1
w
0
w01
w02 w
Abb. 19.4: Verlauf der Dispersionskurven bei mehreren Eigenschwingungen und zugehöriger Absorptionsfrequenz Der Realteil des Brechungsindexes ist ebenfalls frequenz- bzw. wellenlängenabhängig. Bei Frequenzen weit oberhalb der Eigenfrequenz besitzt er den Wert 1. Bei Annäherung an diese nimmt er zunächst ab, um in unmittelbarer Nähe sein Vorzeichen zu wechseln und steil anzuwachsen. Nach Erreichen eines Maximums fällt er bei weiterer Reduzierung der Frequenz auf einen konstanten Wert größer 1. Ein Bereich mit dnc / d Z ! 0 heißt Bereich mit normaler Dispersion, ein solcher mit dnc / d Z 0 Bereich mit anomaler Dispersion. Existieren mehrere Eigenfrequenzen, so ist zu beachten, dass sich mit abnehmender Frequenz die Beiträge der Oszillatoren mit höheren Eigenfrequenzen addieren (Abb. 19.4).
19 Elektromagnetische Felder in Materie
525
19.1.3 Streuung elektromagnetischer Wellen und Teilchen 19.1.3.1 Einteilung der Streuprozesse
Unter Streuung verstehen wir die Ablenkung eines Teils eines in einer bestimmten Richtung laufenden gebündelten Teilchenstrahls bzw. einer ebenen Welle beim Durchgang durch Materie (Abb. 19.5). Diese kann sowohl aus diskreten Korpuskeln als auch einem Kontinuum bestehen. Insofern lässt sich auch die Beugung elektromagnetischer Wellen als Streuung auffassen. Im engeren Sinn wird der Begriff der Streuung verwendet, wenn die streuende Materie als aus Korpuskeln bestehend angesehen wird. Ein einzelner Streuakt besteht in diesem Fall aus der Wechselwirkung der Strahlung mit einem einzelnen Streuzentrum, etwa einem Atom oder einem Atomkern. Im Teilchenbild besteht ein einzelner Streuvorgang in der Ablenkung eines Teilchens. Somit kann auch der nicht zentrale Stoß als Streuvolumen Streuprozess gelten. Im Wellenbild besteht der einzelne Streuvorgang in der Ausstrahlung Abb. 19.5: Streuung, etwa von Licht, einer Kugelwelle. an diskreten Korpuskeln Aus dem täglichen Leben ist uns die Lichtstreuung wohlbekannt. Ohne sie müssten wir auf das schöne Himmelsblau verzichten, der Himmel wäre schwarz. Lichtstreuung an Materie ist nicht das einzige Streuphänomen. Wir finden es auch bei kurzwelligerer Strahlung (z.B. als Röntgenstreuung). Auch Streuung von Teilchenstrahlung spielt eine wichtige Rolle. Z.B. ist die Neutronenstreuung eine wichtige Methode zur Untersuchung von Struktur und Anregungszuständen in kondensierter Materie. Streuvorgänge werden zweckmäßiger Weise in elastische und inelastische Prozesse eingeteilt. Bei Ersteren hat die Streuwelle die gleiche Frequenz wie die einfallende Welle. Bei inelastischen Prozessen dient ein Teil der Energie der einfallenden Welle zur Anregung von Energiezuständen des Mediums. Ein kleiner Teil der Streustrahlung hat dann eine andere Frequenz, sie ist in der „Frequenz verschoben“. Die Energiedifferenz entspricht der Anregungsenergie des Mediums. Im Folgenden wollen wir uns auf die elastische Lichtstreuung beschränken. Die meisten Resultate lassen sich auf Strahlung höherer Frequenzen übertragen. Erfolgt die Streuung an geordneten Strukturen (z.B. an Kristallgittern), so besteht zwischen den Phasenwinkeln der gestreuten Teilwellen eine feste Beziehung. In diesem Fall sprechen wir von kohärenter Streuung. Sind die Atome des Mediums dagegen unregelmäßig verteilt, so sind die Phasenwinkel der Teilwellen statistisch verteilt. Dieser Vorgang heißt inkohärente Streuung. Zwischen diesen beiden Grenzfällen gibt es Übergänge. In vielen Fällen existiert nur eine annähernde Ordnung in kleinen Bereichen, etwa in amorphen Stoffen, in Flüssigkeiten oder in manchen Suspensionen. Ein einfaches, gut untersuchtes System sind Polysterolkügelchen mit
526
19 Elektromagnetische Felder in Materie
Ze Ze -
Ze -
Ze -
Ze -
-
Ze -
Ze -
Ze -
Ze -
Ze -
Ze -
Ze -
Ze Ze -
typischen Durchmessern von 400 nm, die in Wasser gelöst sind. Die Teilchen besitzen auf ihrer Oberfläche saure (oder basische) Gruppen, die z.T. dissoziieren. Dadurch laden sich die Kügelchen negativ auf. Infolge der elektrostatischen Wechselwirkung sind sie nicht mehr unabhängig voneinander, sondern nächste Nachbarn sind miteinander korreliert (Abb. 19.6). Es bildet sich eine Nahordnung aus, die mit Hilfe der Licht- und Neutronenstreuung untersucht werden kann. Ist die Teilchendurchmesser klein gegenüber der Wellenlänge des Lichts, so wird sie als Rayleigh-Streuung bezeichnet, ist er groß, heißt sie Miestreuung.
Ze Ze -
Ze -
Abb. 19.6: Nahordnung in einer Lösung von geladenen Kügelchen
19.1.3.2 Formfaktor und Strukturfaktor
Wir wollen diese Überlegungen nun quantitativ formulieren. Eine ebene, in x-Richtung polarisierte Welle in z-Richtung treffe auf einen punktförmigen Teilchendipol. Dieser wird zu erzwungenen Schwingungen in x-Richtung angeregt. Die von ihm ausgehende Sekundärwelle bezeichnen wir entsprechend der obigen Einführung als Streuwelle. Die elektrische Feldstärke wurde in (19.9) zu
Ee
eZ 2 x0 iZ ( t r / c ) , e 4SH 0 c 2 r
bestimmt, wobei x0 die Amplitude ist. Infolge des Resonanznenners kann es für Frequenzen in der Nähe einer Eigenfrequenz zu einer stark überhöhten Streuamplitude kommen. Dieser Fall heißt Resonanzstreuung. Wir interessieren uns hier primär für die Streuung durch Partikel im Bereich des sichtbaren Lichtes. Ihre Eigenfrequenzen liegen im ultravioletten Spektralbereich. Wir können daher den Nenner näherungsweise gleich Z0 setzen, so dass x0 = const wird. Die resultierende Feldstärke ES am Ort des Empfängers ergibt sich durch Summation der Beiträge aller N Streuzentren im Volumen V.
ES ( q , t )
N
¦ bi (q)eiMi (t )) i 1
N
¦ b ( q )e i
i 1
GG iqRi ( t )
(19.28)
19 Elektromagnetische Felder in Materie
527
Hierin ist Mi der Phasenwinkel der vom i-ten Streuzentrum ausgehenden Streuwelle und bi ihre Amplitude. Wie Abb. 19.7 zeigt, kann Mi ausgedrückt werden durch die Differenz der WellenG vektoren von einlaufender und gestreuter Welle, multipliziert mit dem Ortsvektor Ri des jeweiligen Streuzentrums zur Zeit t.
Pi
r Ri
kˆ i
kkˆ a
b
kˆ i
kˆ a
r D = Ri (kˆa - kˆe ); r r r j = (2p / l ) (kˆa - kˆe )i Ri = (ka - ke )i Ri r r º qi Ri .
a
0
Abb. 19.7: Zur Ableitung der Feldstärke der von punktförmigen Teilchen herrührenden Streuwelle Der Empfänger misst nicht die Feldstärke, sondern die über die Zeit gemittelte Intensität. Sie wird formal geschrieben als I S (q, t ) T und ist definiert durch T
I S (q)
I S ( q, t )
T
1 2 ES (q, t ) dt T of T ³ 0 lim
ES ( q , t )
Wir erweitern unser Modell nun dahingehend, dass die Streuzentren eine endliche Größe haben sollen. In der von Rayleigh, Gans und Debye stammenden Näherung wird der einzelne Streuer in m Segmente unterteilt, deren Abmessungen so klein sind, dass sie wieder als Punktstreuer angesehen werden können. Die von ihnen ausgehenden Teilwellen haben alle die gleiche Amplitude. Der G Ortsvektor RiD des Segments D auf dem i-ten Teilchen ist nach Abb. 19.8 gegeben durch G RiD
G G Ri riD .
(19.30)
G Ri D bezeichnet den Ortsvektor des SchwerG punktes des i-ten Teilchens und riD den Orts-
2
ES (q, t ) ES (q, t ) . (19.29) T
T
Streuteilchen S r Ri
r r ia
Segment i r R ia
r r r R ia = R i + ria
0
Abb. 19.8: Erweiterung des Streuvorgangs auf ausgedehnte Teilchen
528
19 Elektromagnetische Felder in Materie
vektor des Segments D bezogen auf den Schwerpunkt des Teilchens. Ersetzen wir in (19.28) Ri durch diesen Ausdruck, so erhalten wir N N GG m GG GG G G ES (q ) ¦ eiqRi ¦ eiqriD : ¦ eiqRi f i (q , riD ) i 1
D 1
(19.31)
i 1
G G Der Term f i (q , riD ) hängt nur von der Anordnung der Segmente ab und heißt deswegen Formamplitude. Die Intensität des Streulichtes ergibt sich daraus durch Multiplikation mit dem Konjugiert Komplexen von ES zu
I S (q) b 2
N
N
¦¦ e
G G G iq ( Ri R j )
fi f j .
(19.32)
i 1 j 1
Der besseren Übersicht wegen zerlegen wir die Summierung in eine solche mit i = j und eine mit i z j .
I S (q)
ª 1 Nb 2 « fi 2 N «¬
N
¦e
G G G iq ( Ri R j )
iz j 1
º fi f j » »¼
(19.33)
Wir wollen nun voraussetzen, dass die Streuzentren alle identisch sind, so dass fi = fj .
I S (q)
Der Term
ª 1 Nb 2 f i 2 «1 ¬« N
N
¦e
iz j 1
G G G iq ( Ri R j )
º » . ¼»
(19.34)
f i 2 wird Formfaktor P (q ) genannt. Er ist einfach die zeitlich gemittelte quadra-
tische Formamplitude.
P(q)
1 m iqG ( rGD rGß ) . ¦e m2 D , ß
(19.35)
Der zweite Term in den eckigen Klammern hängt ab von der relativen Anordnung der Teilchen untereinander. Er heißt daher statischer Strukturfaktor S(q). In Kurzform schreibt sich also die Intensität
I S (q)
N b 2 P(q) S (q) .
(19.36)
Für kugelförmige Teilchen faktorisiert I S (q ) in den Formfaktor und den Strukturfaktor. Wir wenden uns nun einigen Spezialfälle zu.
19 Elektromagnetische Felder in Materie
529
19.1.3.3 Streuung an geordneten Strukturen – Kohärente Streuung
Wir betrachten ein Raumgitter, dessen Gitterpunkte mit Streuzentren besetzt sind (Abb. 19.9). Zunächst wollen wir annehmen, dass es sich um punktförmige Teilchen handelt. In diesem G G Fall sind die riD 0 und die Formamplitude G G f i (q , riD ) bzw. der Formfaktor P(q) haben den Wert 1. Im Ausdruck für die Feldstärke, G Gl. (19.28), bzw. im Strukturfaktor sind die Ri Gittervektoren; ein solcher wird üblicherweise G mit Rmnp bezeichnet. Er weist vom Punkt (000) c zu einem durch das Zahlentripel mnp festb G G G gelegten Gitterpunkt. Die Vektoren a , b , c sind die Grundvektoren des Gitters (Abb. 19.9) (0,0,0) a R mnp
G Rmnp
G G G ma nb pc .
(19.37)
Abb. 19.9: Raumgitter aus punktförmig vorausgesetzten Atomen. Die Grundvektoren sind mit a, b, c bezeichnet
Damit wird die elektrische Feldstärke N
GG
ES (q) ¦ eiqRi i 1
GG inqb
GG imqa
¦e ¦e ¦e m
n
GG ipqc
.
(19.38)
p
Maxima der Feldstärke treten auf, wenn die Phasenwinkel ein ganzzahliges Vielfaches von 2S sind. Die Glieder der Summen nehmen dann den Wert 1 an. Es müssen also die folgenden Bedingungen erfüllt sein:
G G a 'q 2S h G G b 'q 2S k . G G c 'q 2S l
(19.39)
Die ganzen Zahlen h, k, l heißen Laue-Indizes, die Gln. (19.39) Laue-Gleichungen. (M. v. Laue, 1879-1960). Zur Ermittlung der Streuintensität müssen obige geometrische Reihen aufsummiert werden. Wir beschränken uns hier auf eine lineare periodische Anordnung von Punktstreuern. Dieses Gitter liege senkrecht zur einfallenden Welle (Abb. 19.10). Es bleibt dann nur eine Summe übrig. GG
ES (q ) ¦ eimqa . m
(19.40)
530
19 Elektromagnetische Felder in Materie Das Resultat ist
r k2
N
¦e m 1
a
rr qa
GG
e
i
r k1
e Abb. 19.10: Lineare Kette aus punktfömigen Streuteilchen
GG qa
ka cos(90 D )
2S a
O
eiNqa 1 GG eiqa 1
GG i ( m 1) qa
i
N 1 GG qa 2
N 1 GG qa 2
e
i
N GG qa 2 GG
eiqa
i
N GG qa
e 2 GG e iqa
GG sin Nqa / 2 GG sin qa / 2
(19.41)
In unserer Geometrie ist der Phasenunterschied gegeben durch
sin D .
(19.42)
Damit wird die Feldstärke
ES e
i
N 1 GG qa 2
sin N S (a / O )sin D sin S ( a / O )sin D
:e
i
N 1 GG qa 2
sin NI sin I
(19.43)
und die Intensität
IS
sin 2 NI
sin 2 > N S (a / O )sin D @
sin 2 I
sin 2 >S (a / O )sin D @
.
(19.44)
Der Wert des Bruches zeigt im Allgemeinen schwache Oszillationen in der Nähe von 1. Nur dort, wo der Nenner und damit der Zähler null wird, ergibt sich mit der l‘Hospitalschen Regel der Wert N2. Der Streuwinkel ist dabei festgelegt durch die Bedingung
S (a / O )sin D sin D m
m
O a
mS .
(19.45) (19.46)
Die volle Breite der Intensitätskurven, definiert als der Abstand der ersten Nullstellen, ist
'I
S N
.
(19.47)
19 Elektromagnetische Felder in Materie
531
In realen Systemen ist N >> 1, so dass auf einem in den Strahlengang gehaltenen Schirm periodisch schmale Intensitätsmaxima entstehen, sonst aber Dunkelheit herrscht (Abb. 19.11).
-0.33
a / l = 3; N = 30 Intensität
a/l = 3 N=5
Intensität
0.33 sina
0.00
sina
Abb. 19.11: Intensitätsverteilung bei Streuung an einem Punktgitter für N = 5 und N = 30 Derartige Muster werden wir bei der Besprechung von Beugung und Interferenz wiederfinden. Anwendung findet die kohärente Streuung z.B. bei der Ermittlung der Struktur von Kristallen.
19.1.3.4 Streuung an ungeordneten Systemen – Inkohärente Streuung
Sind die weiterhin als punktförmig vorausgesetzten Streuzentren willkürlich im Raum verteilt, so gehen die festen Phasenbeziehungen verloren. In (19.34)
ª 1 Nb 2 f i 2 «1 «¬ N
I S (q)
N
¦e
G G G iq ( Ri R j )
iz j 1
º » »¼
(19.48)
G sind also die Ri , j unabhängig voneinander. Da alle Teilchen identisch sind, lässt sich der
zweite Term in den eckigen Klammern umschreiben in N
¦e
G G G iq ( Ri R j )
G G
G
N ( N 1) eiq ( R1 R2 ) .
(19.49)
iz j 1
Wegen der Unabhängigkeit der Teilchen voneinander kann die Mittelung über Teilchen (1) und Teilchen (2) getrennt vorgenommen werden. G G
G
eiq ( R1 R2 )
GG
eiqR1
GG
eiqR2
0.
(19.50)
532
19 Elektromagnetische Felder in Materie GG
Die Mittelwerte sind null, weil in der Gaußschen Zahlenebene z.B. eiqR1 alle Werte annimmt. (19.48) reduziert sich damit zu
I S (q)
Nb 2 f i 2 .
Der Formfaktor P (q)
fi 2
(19.51) ist für Punktstreuer, wie oben dargelegt, gleich 1. Bei vorgege-
bener Frequenz der einfallenden Lichtwelle ist die elektrische Feldstärke gleich der Summe der (hier als gleich angenommenen) Intensitäten der Einzelwellen und damit konstant.
19.1.3.5 Beispiele für inkohärente Streuung
Zu beachten ist die Frequenzabhängigkeit der Streustrahlung, wie wir sie bereits von (19.9) kennen. Die Intensität ist proportional zur 4-ten Potenz der Frequenz.
I S (q) Z 4 Diese Eigenschaft erklärt den blauen Himmel über uns (Abb. 19.12). Das Sonnenlicht wird an den Luftmolekülen, an Wassertröpfchen und Staubpartikeln unterschiedlichen Ursprungs gestreut. Deswegen erscheint der Himmel auch dort, wo uns die Sonne nicht gegenübersteht, hell. Die blaue Farbe rührt davon her, dass kurzwelliges Licht des Sonnenspektrums entspre-
Abb. 19.12: Entsprechend der Z4-Abhängigkeit der Streuintensität wird der kurzwellige Teil des Sonnenlichtes am stärksten gestreut. Der Himmel erscheint blau
Erde
Blickrichtung
chend (19.9) viel stärker gestreut wird als langwelliges. Das Frequenzverhältnis von blauem und rotem Licht ist etwa Zbl / Zrot | 1, 6 . Damit wird das Intensitätsverhältnis ungefähr 6 : 1. Je länger die von einem Lichtbündel durchstrahlte Strecke ist, umso mehr kurzwelliges Licht wird
19 Elektromagnetische Felder in Materie
533
aus diesem herausgestreut (Abb. 19.13), umso mehr ist das einen Beobachter direkt erreichende Licht in den roten Spektralbereich verschoben. Das ist der Grund, warum morgens und abends die Sonne, wenn sie besonders schräg steht, rötlich erscheint. Der Grad der Rotfärbung hängt dabei stark von der jeweiligen Beschaffenheit der Atmosphäre ab. Jetzt zur Frage, warum das Licht an Wolken so viel stärker gestreut wird als an den Luftpartikeln der weiteren Umgebung. Wir vereinfachen das Problem, indem wir davon ausgehen, dass die Luft außerhalb der Wolken im Wesentlichen aus Atomen und Molekülen besteht. In einer Wolke ist Erde der Wasserdampf zu kleinen Tröpfchen kondensiert. Solange ihr DurchAbb. 19.13: Bei langen Lichtwegen (am Morgen messer sehr klein gegenüber der und am Abend) wird das kurzwellige Licht zum Lichtwellenlänge ist, können wir Ingrößten Teil aus dem Sonnenlicht heraus geterferenzeffekte innerhalb solcher Küstreut, die Sonne erscheint rötlich gelchen vernachlässigen, der Formfaktor ist weiterhin konstant gleich 1. Daher ist die von den Atomdipolen ausgehende Lichtstrahlung kohärent. Nach den obigen Überlegungen bedeutet dies, dass die Streuintensität um den Faktor N größer ist als wenn die N Moleküle, wie in der umgebenden Luft, inkohärent strahlten. Das ist die qualitative Erklärung für die stärkere Streuung an Wolken.
19.1.3.6 Formfaktor für Kügelchen
Werden die Streuzentren größer, so müssen die Phasenverschiebungen der Teilwellen berücksichtigt werden. Solange der Durchmesser klein gegen die Wellenlänge ist, ist der Formfaktor durch (19.35) gegeben. Für Kügelchen kann er unschwer berechnet werden.
P(q)
1 m iqG ( rGiD rGiß ) . ¦e m2 D , ß
(19.52)
Bei sphärischen Teichen entfällt die Mittelung. 2
§ 1 m GG · P (q) ¨ ¦ eiqrD ¸ . © m D, ß ¹ Zur Berechnung formen wir die Summe in ein Integral um
(19.53)
534
19 Elektromagnetische Felder in Materie GG G · §1 P (q) ¨ ³ eiqr dr ¸ ©V V ¹ r
2
2S
(19.54a)
1
1 2 r dr ³ dM ³ eiqr cos D d (cos D ) . V ³0 0 1
(19.54b)
Als Ergebnis der Integration erhalten wir
P(q)
2
ª¬3/( qr )3 (sin( qr ) qr cos( qr )) º¼ .
(19.55)
Wie aus Abb. 19.14 ersichtlich, durchläuft P(q) mit wachsendem q Maxima und Minima. Das GG erste Minimum liegt bei qr = 4,2. Für Lichtstrahlung ist typischerweise qr d 1 . In diesem
1 P(qr) 10-1
1.0
a)
0.8
10-2
0.6
10-3
0.4
-4
10 10
b)
P(qr)
0.2
-5
0
2
4
6
8
10 qr
0.0
0
1
2
3 qr
Abb. 19.14: a) Formfaktor für Kügelchen als Funktion des Produktes aus dem Betrag des Streuvektors q und dem Teilchenradius r; b) vergrößerter Ausschnitt des Lichtstreubereichs a Bereich hat P(q) einen monoton abfallenden Verlauf. Die Streustrahlung ist in Vorwärtsrichtung im Bereich kleiner qr am intensivsten. Nimmt der Teilchendurchmesser Werte im Bereich der Wellenlänge an, so werden die Phasenverschiebungen zwischen den Teilwellen so groß, dass Interferenzeffekte nicht mehr vernachlässigbar sind. Die Teilwellen können verstärkt oder geschwächt werden. Zur Berechnung müssen die vollständigen Maxwell-Gleichungen herangezogen werden. Die Theorie ist von G. Mie (1868-1957) ausgearbeitet worden
19 Elektromagnetische Felder in Materie
535
19.1.3.7 Polarisation des gestreuten Sonnenlichtes
Jedem fotografisch Interessierten ist bekannt, dass das Himmelslicht teilweise polarisiert ist. Am ausgeprägtesten ist diese Polarisation, wenn wir senkrecht zum einfallenden Sonnenlicht blicken. Das lässt sich mit einem Polarisationsfilter zeigen. Ein solches lässt nur Licht einer Polarisation passieren (Abb. 19.15). Die dazu senkrechte Komponente wird unterdrückt. Der Aufbau eines solchen Filters wird in einem späteren Kapitel beschrieben. Der Grund für die Polarisation des Streulichtes liegt in der Ausstrahlungscharakteristik und der Polarisation der Dipolstrahlung (Kap. 19.11). Abb. 19.15: Eine Polarisationsfolie erzeugt Abb. 19.16 zeigt ein Atom, das durch das linear polarisiertes Licht unpolarisierte Sonnenlicht zu erzwungenen Schwingungen angeregt wird. Die Schwingungsrichtung aller Atome liegt in einer Ebene senkrecht zur Einfallsrichtung. Das von ihnen ausgehende Streulicht stellen wir durch die Strahlung zweier repräsentativer Dipole dar. Der erste oszilliert in der xy-Ebene und der andere senkrecht dazu. Entsprechend ist das Streulicht polarisiert. Die von einem Beobachter unter dem Winkel 4 zwischen der in der xy-Ebene liegenden Dipolachse und Beobachtungsrichtung gemessene Intensität ist
I & S I 0 sin 2 4 wobei E
I 0 cos 2 E ,
90 4 ist. Die von den senkrecht zur xy-Ebene orientierten Dipolen ausgesandte
Strahlung hat unabhängig vom Standort des Beobachters immer den maximalen Wert I S A .
r EP
r E^ Abb. 19.16: Zur Erklärung der Polarisation des Himmelslichtes
Ersatzdipole
xy-Ebene r k
536
19 Elektromagnetische Felder in Materie
Damit wird der Polarisationsgrad P
P:
I A I& I A I&
1 cos 2 E . 1 cos 2 E
(19.56)
Wie oben bereits vermerkt, ist das Licht unter einem Blickwinkel von E 90q vollständig polarisiert, denn in der xy-Ebene wird in Richtung der Dipolachse kein Streulicht abgestrahlt, I &,90q 0 . Am geringsten ist der Polarisationsgrad in Vorwärts- und Rückwärtsrichtung ( E | 0q,180q ). In einem Demonstrationsexperiment lässt sich eine Mastilklösung in einer länglichen Glasküvette als Streukörper verwenden. Das senkrecht zum einfallenden unpolarisierten Lichtbündel austretende Streulicht ist vollständig in der Ebene senkrecht zur Bündelachse polarisiert (Abb. 19.17). – Licht, das am hinteren Ende der Küvette austritt, ist unpolarisiert und erscheint wegen des längeren Lichtweges rötlich. – Erleuchtung im Hörsaal!
Abb. 19.17: Anordnung zur Polarisation des Himmelslichtes. Die Küvette ist mit einer Mastiklösung gefüllt
19.2 Elektromagnetische Felder in optisch dichter Materie Bei den bisherigen Überlegungen haben wir vorausgesetzt, dass die Atome des durchstrahlten Mediums so weit voneinander entfernt sind, dass die Feldamplitude der von ihnen ausgehenden Sekundärwellen gegenüber der der auftreffenden Welle vernachlässigt werden konnte. Die Erreger-Feldstärke am Ort eines beliebigen Atoms konnte deswegen durch die Feldstärke der einlaufenden Welle ausgedrückt werden. Damit mussten die Resultate auf optisch dünne Medien, also im Wesentlichen auf Gase, beschränkt werden. Nun haben wir es meistens mit kondensierter Materie zu tun, bei denen obige Voraussetzung nicht gegeben ist. Um die Ausbreitung elektromagnetischer Wellen in optisch dichter Materie verstehen zu können, müssen wir von den Maxwell-Gleichungen in Materie ausgehen. Diese wollen wir in einem ersten Schritt formulieren.
19 Elektromagnetische Felder in Materie
537
19.2.1 Maxwell-Gleichungen in Materie Die Maxwell-Gleichungen im Vakuum lauten
G G
v³ Edr C
G G
v³ EdA A
G G
H0 V
P0 I H 0 P0
v³ Bdr C
d G G BdA ; dt ³A 1 ³ U dV ;
G G
v³ BdA
d G G EdA dt ³A
0
(19.57a) (19.57b) (19.57c) (19.57d)
A
Beim Übergang vom Vakuum zu Materie müssen wir die Polarisation der Atome berücksichtigen. Die Gln. (19.57a/b) sind deswegen durch (15.71) zu ersetzen. Die zeitliche Änderung der Polarisationsladung bewirkt in (19.57b) einen zusätzlichen Polarisationsstrom. G G G Wir tragen ihm Rechnung, indem wir unter dem Integral zu E ({ EDiel ) den Term P / H 0 hinzufügen. Entsprechend (15.59b) setzen wir
G G P E
H0
G
HE.
(19.58)
Analog muss in (19.57c/d) das Vakuum-Magnetfeld ersetzt werden durch B / P . Damit ergeben sich die Maxwell-Gleichungen in Materie in Integralform zu
G G
d G G BdA dt ³A
v³ Edr
G G EdA v³
1
HH 0 V³
G G Bdr v³
PP0 I
C
A
C
G G
v³ BdA
0.
A
2 wobei cMed
1/(HH 0 PP0 ) ist.
U dV 1 d G G EdA 2 cMed dt ³A
(19.59a) (19.59b) (19.59c) (19.59d)
538
19 Elektromagnetische Felder in Materie
In Differentialform lauten die Gleichungen
G rot E
G wB ; wt
G rot B
G div E
1
G div B
H H0
U;
G G 1 wE ; P P0 j 2 cMed wt
(19.60a-d)
0.
19.2.2 Elektromagnetische Wellen in isotropen Dielektrika 19.2.2.1 Brechungsindex
Wir stellen uns nun die Frage, inwieweit der für verdünnte Materie abgeleitete Ausdruck für den komplexen Brechungsindex, Gl. (19.15), abzuändern ist. In Isolatoren existieren keine Raumladungen und Ströme. Die Maxwell-Gleichungen sind damit formal identisch mit denen für das Vakuum. Daher ergeben sich auch formal die gleichen Wellengleichungen.
G 'E
G 1 w2 E 2 cMed wt 2
G 'B
G 1 w2 B . 2 cMed wt 2
(19.61a,b)
Der einzige Unterschied liegt darin, dass die Lichtgeschwindigkeit im Medium cMed c / HP c / H ist. Diese Beziehung erlaubt eine Verknüpfung des Brechungsindex mit Eigenschaften des Mediums. Der Brechungsindex ist entsprechend (19.1) definiert als das Verhältnis aus Vakuumlicht- und Lichtgeschwindigkeit im Medium. Folglich gilt
n
H .
(19.62)
Um den Brechungsindex mit atomaren Größen zu verbinden, setzen wir (19.58) in (19.61a) ein und erhalten
G 'E
G G w2 E w2 P P 0H 0 2 P 0 2 . wt wt
(19.63)
Im isotropen Medium schwingt die dielektrische Polarisation parallel zur Schwingungsrichtung der einfallenden Welle. Als solche werde die x-Achse gewählt.
G E
Ex
E0 ei (Zt kz ) .
(19.64)
19 Elektromagnetische Felder in Materie
539
G G Wir benötigen nun eine Beziehung zwischen E und P . In einem 1. Schritt setzen wir
G P
Px
NDH 0 Ex .
(19.65)
Es sei noch einmal wiederholt, dass N die Anzahldichte bedeutet. Einsetzen in die Wellengleichung (19.63) führt zu der Beziehung
k 2 Ex
Z2 c2
Ex
Z 2 N H 0D c2
Ex .
(19.66)
Division durch Ex und Berücksichtigung von n Brechungsindex
ck / Z ( cMed
c / n Z / k ) ergibt für den
n 2 1 ND .
(19.67)
Für die Amplitude der erzwungenen Schwingung und damit für das induzierte Dipolmoment pind DH 0 E folgt unter Verwendung von (19.7)
pind
e2 E . m(Z02 Z 2 2iGZ )
(19.67a)
Damit ergibt sich für D
D
e2 / H 0 . m(Z02 Z 2 2iGZ )
(19.68)
Setzen wir dies in (19.67) ein, so erhalten wir
n2 1
n( A) e 2
H 0 m ª¬Z02 Z 2 2iGZ º¼
.
(19.69)
Dieser Ausdruck unterscheidet sich von dem vorher gefundenen Ausdruck für optisch dünne Medien durch das Quadrat in n; ferner fehlt ein Faktor „2“ im Nenner. Für Werte von n | 1 kann näherungsweise geschrieben werden
n 2 1 ( n 1)( n 1) | 2( n 1) , womit die Beziehung in (19.15) für optisch dünne Medien übergeht.
(19.70)
540
19 Elektromagnetische Felder in Materie
Nun noch einmal zurück zur Verknüpfung von x0 bzw. pind und E, Gl. (19.7 bzw. 19.7a). Dort hatten wir angenommen, dass das polarisierende elektrische Feld das von außen einfallende Feld ist. Die Aussagen galten daher nur für optisch dünne Materie. Jetzt müssen die Felder der umliegenden Atome mit berücksichtigt werden. Wir haben eine ähnliche Situation bereits bei der Untersuchung statischer elektrischer Felder in Dielektrika kennen gelernt (Kap. 15). Wie dort (Ergänzung 2) dargestellt, ist das am Ort eines Atoms zusätzlich auftretende Feld näherungsweise um den Betrag P / 3H 0 größer als das Feld der einlaufenden Welle. Das gilt allerdings nur für isotrope Medien sowie kubische Kristalle. Das gesamte lokale Feld ergibt sich also in solchen Fällen zu
Elokal
E
P . 3H 0
(19.71)
In (19.65) muss mithin E durch Elokal ersetzt werden.
P
NDH 0 Elokal
§ P · NDH 0 ¨ E ¸ 3H 0 ¹ ©
(19.72)
und damit
P
H 0 ND E. 1 ( ND / 3)
(19.73)
(19.67) ist somit umzuschreiben in
n2 1
ND . 1 ( ND / 3)
(19.74)
Diese Beziehung ist gleichbedeutend mit der Clausius-Mosotti-Formel (15.65).
3
n2 1 n2 2
ND ,
so dass (19.69) zu ersetzen ist durch
3
n2 1 n2 2
Ne 2
H 0 m ª¬Z02 Z 2 2iGZ º¼
.
(19.75)
19 Elektromagnetische Felder in Materie
541
19.2.3 Elektromagnetische Wellen in Metallen Im sichtbaren Spektralbereich sind Metalle undurchsichtig, werden aber z. T. schon im Ultravioletten transparent. Wir wollen dieses Verhalten durch ein einfaches Modell beschreiben. Schon früher wurde darauf hingewiesen, dass die äußeren Elektronen in erster Näherung als quasifrei angesehen werden dürfen, d.h. es existieren keine Rückstellkräfte. Den Einfluss zusätzlich vorhandener gebundener Elektronen, der sich erst im UV oder höheren Frequenzen bemerkbar macht, vernachlässigen wir. In der 2. Maxwell-Gleichung muss jetzt G G j V E berücksichtigt werden. Damit erhalten wir auf demselben Weg wie früher die Wellengleichung zu
G G 1 w2 E wE . PP0V 2 cMed wt 2 wt
G 'E
(19.76)
Wir suchen eine Lösung in Form einer ebenen Welle. Wie eine explizite Rechnung zeigt und wie sich durch Einsetzen beweisen lässt, ergibt sich das elektrische Feld zu
G E ( z, t )
G E0 e D z ei (Zt kz ) ,
(19.77)
Dies ist eine gedämpfte Welle mit D als Absorptionskoeffizient. Auf den Wert von D kommen wir unten zurück. Zunächst wenden wir uns dem Brechungsindex zu. Dabei ist zu beachten, dass wir von (19.69) ausgehen, das lokale Feld also gleich dem mittleren Feld setzen. Der Grund ist, dass die punktförmigen Elektronen in dauernder Bewegung sind, so dass feste Phasenbeziehungen nicht existieren. Wegen des Verschwindens der Rückstellkraft ist der Z02 x -Term in der Bewegungsgleichung null. Es wird also
n2 1
Ne 2 . H 0 m(Z 2 2iGZ )
(19.78)
Der Dämpfungsterm rührt davon her, dass die fluktuierenden Elektronen miteinander und mit den Atomrümpfen zusammenstoßen und dadurch in ihrer Bewegung gehemmt werden. Die Dämpfungskonstante 2G lässt sich damit durch die reziproke Stoßzeit ausdrücken.
2G
1/ W .
(19.79)
Dies entspricht der Relaxationszeitnäherung: Durch das äußere elektrische Feld werden die Elektronen beschleunigt gemäß
d vd dt
e E. m
(19.80)
542
19 Elektromagnetische Felder in Materie
Die Geschwindigkeitsänderung allein durch Stöße wird umso größer, desto größer die Differenz zwischen Momentangeschwindigkeit und mittlerer Geschwindigkeit der Elektronen am Ende der (mittleren) Stoßzeit W ist.
d vd dt
v d (t W ) v d (0)
W
:
v d (t )
W
.
(19.81)
Berücksichtigung in (19.80) ergibt die Differentialgleichung
oder
d vd vd dt W
d 2 x 1 dx dt 2 W dt
e E, m
(19.82a)
e E. m
(19.82b)
Wie in Kap. 16.6.1 gezeigt, sind Leitfähigkeit und mittlere Stoßzeit verknüpft durch
V
Ne 2 W. m
(16.35)
Einsetzen von (19.79) und (16.35) in (19.78) ergibt für n2
n2 1
V / H0 . iZ (1 iZW )
(19.83a)
Häufig wird diese Beziehung geschrieben als
n2 1
ZP2 , Z 2 (iZ / W )
(19.83b)
wobei ZP die Plasmafrequenz ist,
ZP :
Ne 2 / mH 0
V . H 0W
(19.84)
Die Plasmafrequenz ist die Frequenz, mit der ein Gas freier Elektronen der Ladung e, der Masse m und der Teilchenzahldichte N gegen die positiv geladenen Atomrümpfe schwingt. Wir wollen (19.83) für die beiden Grenzfälle ZW !! 1 und ZW 1 diskutieren. Für große Frequenzen gilt näherungsweise
19 Elektromagnetische Felder in Materie
n2 | 1
V / H0 , Z 2W
543
(19.85)
oder mit (19.84) 2
n
§Z · 1 ¨ P ¸ . ©Z ¹
(19.86)
Für Z ZP (aber weiterhin ZW !! 1 ) wird der Brechungsindex imaginär, d.h. die eindringende Welle wird – wie wir noch sehen werden – reflektiert. Oberhalb Z ! ZP ist ein metallischer Körper durchsichtig. Für niedrige Frequenzen wird unter Berücksichtigung von
i
(1 i ) / 2
n | V / 2H 0Z (1 i ) nc iN .
(19.87)
Realteil und Imaginärteil sind gleich groß. Für den Absorptionskoeffizienten D erhalten wir mit (19.20)
D
4SN
O0
2k0N
und für die Eindringtiefe G e
Ge
H 0c2 . 2VZ
2VZ , H 0c 2
(19.88)
1/ D
(19.89)
Zwei Beispiele mögen diese Ergebnisse erläutern: In den ionisierten Gasschichten der Atmosphäre ist N | 105 / cm3 und damit ZP | 20 MHz . Dieser Wert liegt oberhalb des Frequenzbereichs der kurzen Radiowellen, aber unterhalb des UKW-Bereichs. Es ist der Grund dafür, dass Radiowellen im Kurz-, Mittel- und Langwellenbereich infolge Reflexion auch in solchen Gebieten empfangen werden können, die nicht in Sichtweite des Senders liegen. Als zweites Beispiel betrachten wir mit Kupfer ein typisches Metall. Die Dichte der Elektronen in einwertigem Kupfer beträgt 8,5 1028 m 3 , die Leitfähigkeit V 5,88 107 ȍ -1m-1 , die aus (2.35) berechnete Stoßzeit W | 2, 7 1014 s . Daraus folgt die Plasmafrequenz zu 1, 6 1016 Hz . Für O 100 nm ist Kupfer transparent. Die Eindringtiefe variiert zwischen einigen cm bei 100 Hz und ca. 10 µm bei 1 GHz. Folglich ist der elektrische Widerstand bei
ZP
544
19 Elektromagnetische Felder in Materie
hohen Frequenzen relativ hoch. Er lässt sich dadurch reduzieren, dass ein kompakter Draht durch ein Bündel gegeneinander isolierter, dünner Drähte (Litze) mit einer insgesamt größeren Oberfläche ersetzt wird. – Bei Halbleitern lässt sich die Plasmafrequenz durch geeignete Dotierung in einem weiten Bereich einstellen. So kann z.B. erreicht werden, dass eine mit einer dünnen Schicht von dotiertem InSb bedampfte Glasscheibe Licht im Sichtbaren durchlässt, dagegen Wärmestrahlung im Infraroten reflektiert.
19.2.4 Reflexion und Brechung elektromagnetischer Wellen an nichtleitenden Grenzflächen In den vorangegangenen Kapiteln wurde die Ausbreitung elektromagnetischer Wellen in räumlich unbegrenzten Medien diskutiert. Jetzt wollen wir die Eigenschaften solcher Wellen beim Übergang von einem Medium zu einem anderen untersuchen. Die erste Aufgabe besteht darin, die Stetigkeitsbedingungen für die elektromagnetischen Feldgrößen aufzustellen. 19.2.4.1 Stetigkeitsbedingungen
Die beiden Medien seien durch die Dielektrizitätskonstante H1 bzw. H 2 und die magnetische G G Permeabilität P1 bzw. P2 charakterisiert. Wie verhalten sich E und B beim Übergang? Wir zerlegen die beiden Feldgrößen in eine Komponente parallel zur Grenzfläche und eine senkrecht zur Grenzfläche.
r E1 r E1t r Sn
r E1
r E1n r S1t r S2t
r E1t r E1t r Sn r E 2t r E2
r r E 2n E 2t
r E1n r r E1n A1ob V A r A 2unt r E 2n
r E2 r r E 2n E 2t
Abb. 19.18: Zur Berechnung der Tangential- und Normalkomponenten (rechts) des elektrischen und magnetischen Feldes an der Grenzfläche zweier nichtleitender Medien)
19 Elektromagnetische Felder in Materie
G E G B
545
G G Et En ; G G Bt Bn .
(19.90)
Gemäß Abb. 19.18a betrachten wir einen Umlauf C um ein beliebiges Teilstück der Grenzfläche. Auf die von C umrandete Fläche wenden wir die 1. Maxwell-Gleichung an.
G G
v³ Edr
C
d G G BdA . dt ³A
(19.59a)
Der Integrationsweg sei so gewählt, dass er sich entlang der Ober- und der Unterseite der G Grenzfläche anschmiegt, so dass die infinitesimal kleinen Wegstücke s senkrecht zur Oberfläche nichts beitragen. Das Flächenintegral auf der rechten Seite ist dann null, und wir erhalten für die Tangentialkomponente der elektrischen Feldstärke
G G G G E1t s1t E2t s2t G Da s1t
0.
(19.91)
G s2t ist, folgt
G E1t
G E2t .
(19.92)
Durch analoge Überlegungen ergibt sich für die Tangentialkomponenten der magnetischen Feldstärke
G B1t G B2t
P2 . P1
(19.93)
Wenden wir uns nun den Normalkomponenten zu. Unsere Ausgangsgleichung ist jetzt der Gaußsche Satz.
G G EdA v³
1
HH 0 V³
A
U dV .
(15.18b)
Abb. 19.18b zeigt einen Teil der Grenzfläche A und ein sie umgebendes Parallelepiped mit dem Volumen V. Wir lassen nun dessen Ausdehnung senkrecht zur Grenzfläche gegen null gehen, so dass V o 0 strebt. Es gilt dann mit V als Flächenladungsdichte
G G
G G
H1H 0 E1n A1ob H 2H 0 E2 n A2unt
G
und mit A1ob
G A2 unt
G
V nˆob A1ob ,
(19.94)
546
19 Elektromagnetische Felder in Materie
G
G
H1H 0 E1n H 2H 0 E2 n V nˆob
(19.95)
Analog ergibt sich für die magnetische Feldstärke
G B1n
G B2 n .
(19.96)
Die Tangentialkomponente der elektrischen Feldstärke und die Normalkomponente der magnetischen Feldstärke einer Welle verhalten sich beim Übergang von einem Medium zum anderen stetig.
Die Normalkomponente der elektrischen Feldstärke und die Tangentialkomponente der magnetischen Feldstärke einer Welle weisen beim Übergang von einem Medium zum anderen einen Sprung auf.
Erfahrungsgemäß wird im Allgemeinen eine schräg auf eine (als ideal glatt vorausgesetzte) Grenzfläche auftreffende Lichtwelle zum Teil reflektiert und zum Teil beim Eintritt in das zweite Medium gebrochen. Wir können nun daran gehen, das Reflexions- und das Brechungsgesetz herzuleiten.
19.2.4.2 Reflexions- und Brechungsgesetz
Auf die ebene Grenzfläche zweier Medien mit den Brechungsindizes n1, n2 falle eine ebene Welle (Abb. 19.19)
r ke
r n Grenzfl
a a ¢r kr
z y x
b
r kg
G Ee
(19.97)
Die reflektierte Welle werde beschrieben durch
G Er
GG G E0 r ei (Zr t kr r ) Mr
(19.98)
und die gebrochene Welle durch
G Eg
Abb. 19.19: Zur Ableitung des Reflexions- und Brechungsgesetzes
GG G E0 e ei (Zet ke r ) Me
G i (Z t kG rG ) M E0 g e g g g .
(19.99)
Das Koordinatensystem werde so gewählt, dass die Grenzfläche in der xz-Ebene liegt und G der Wellenvektor ke der einfallenden Welle in
19 Elektromagnetische Felder in Materie
547
G G der xy-Ebene. Als Einfallsebene wird die durch ke und die Normale nGrenzfl auf der Grenz-
fläche definierte Ebene bezeichnet. Auf Grund der Stetigkeit der Tangentialkomponenten der elektrischen Feldstärke gilt
Eet Ert
Egt .
(19.100)
Um die Frequenzverhältnisse der Teilwellen zu untersuchen, betrachten wir am Einfachsten die G G Wellen im Koordinatenursprung, r 0 .
G G E0 et eiZet E0 rt eiZr t
G iZ t E0 gt e g .
(19.101)
Diese Gleichung soll für beliebige Zeiten t gelten. Das ist nur möglich, wenn die Frequenzen gleich sind.
Ze Z r
Zg { Z .
(19.102)
Die Frequenz der einfallenden Welle ändert sich bei der Reflexion und der Transmission nicht. Davon haben wir bereits mehrfach stillschweigend Gebrauch gemacht. Vorgegeben die Einfallsebene der Welle bzw. deren Wellenvektor – in welcher Ebene liegen die Wellenvektoren der reflektierten und der gebrochenen Welle? Zur Klärung setzen wir (19.97), (19.98) und (19.99) in (19.100) ein. Damit die Beziehung für beliebige Ortsvektoren gilt, müssen die Exponenten gleich sein.
GG ke r
GG kr r
G G kg r .
(19.103)
G G Zu den Phasenfaktoren kommen wir weiter unten. Zunächst drücken wir die k und die r durch die Komponenten entlang den kartesischen Koordinatenachsen aus:
G r
xeˆx zeˆz .
(19.104)
Der Wellenvektor der Tangentialkomponente der einfallenden Welle ist
G ke
kex eˆx key eˆy .
(19.105)
G Da die Richtungen von kr , g noch unbestimmt sind, setzen wir zur Wahrung der Allgemeinheit
an
G kr G kg
krx eˆx kry eˆy krz eˆz k gx eˆx k gy eˆy k gz eˆz
(19.106)
548
19 Elektromagnetische Felder in Materie
Setzen wir dies in (19.72) ein, so erhalten wir
kex x
krx x krz z
k gx x k gz z .
(19.107)
Da diese Gleichung für beliebige Werte von x und z gelten muss, ergibt sich
kex
krx
k gx ,
krz
k gz
0.
(19.108)
Die Wellenvektoren von einfallender, reflektierter und gebrochener Welle liegen in einer Ebene.
Wir drücken nun diese Komponenten mit Hilfe der Winkel zwischen den Komponenten des G Wellenvektors und der Normale nGrenzfl aus. Aus Abb. 19.19 lässt sich ablesen
kex krx
ke sin D , kr sin D c,
k gx
k g sin E .
(19.109)
Unter Berücksichtigung von k
sin D c1Med
sin D c c1Med
Z / c folgt durch Einsetzen von (19.109) in (19.108)
sin E . c2 Med
(19.110)
Es ist also
D Dc .
(19.111)
Einfallswinkel und Reflexionswinkel sind gleich, D
Mit Hilfe von Z / cMed
sin D sin ß
n2 . n1
Dc .
nZ / c erhalten wir das Snelliussche Brechungsgesetz:
(19.112)
19 Elektromagnetische Felder in Materie
549
Zum Schluss fragen wir noch nach den Phasenwinkeln M der reflektierten und der gebrochenen Welle. Sie bestimmen sich aus
E0 et eiMe E0 rt eiMr
E0 gt e
iM g
oder durch Multiplikation mit e
E0 et e E0 rt ei (Mr Me )
(19.113a)
r E 0e
iM e
E0 gt e
i (M g Me )
.
E0ex
E0ey r ke
r kr
(19.113b) Diese Beziehung muss für jedes Me gelten, so dass sich Mr , M g ergeben zu
Mr Mg
Me Mr oder Me Mg
kgy kgx
Me r S (19.114) Me r S .
Es kann also höchstens ein Phasensprung von S auftreten. Wie im folgenden Abschnitt gezeigt wird, findet bei der Reflexion am optisch dichteren Medium ein Phasensprung von S statt. In den anderen Fällen bleibt die Phase erhalten.
r E 0r
E0ry E0rx
r kg
r E 0g
E0gy E0gx
Abb. 19.20: Zur Ableitung der Fresnelschen Formeln
19.2.4.3 Intensitäts- und Polarisationsverhältnisse bei Reflexion und Brechung – Die Fresnelschen Formeln
Zur vollständigen Beschreibung von reflektierter und transmittierter Welle fehlen noch die zugehörigen relativen Intensitäten und die Polarisationseigenschaften. Wir beginnen mit der G Ableitung der relativen Amplituden E0 . Dabei ist es zweckmäßig, diese wieder zu zerlegen G (Abb. 19.20) in eine Komponente E0& ( E0 x , E0 y , 0) parallel zur Einfallsebene und in eine senkrecht zu ihr, E0 A (0, 0, E0 z ) . Letztere ist tangential zur Grenzfläche. Dabei werden die G G G G G G Richtungen von Ee& , Er & , Eg & so festgelegt, dass die jeweiligen Vektoren E& , EA , k ein Rechtssystem bilden. Wir suchen nun nach den Amplitudenverhältnissen
§ E0 r · § E0 g · § E0 r · § E0 g · ¨ ¸ : U A und ¨ ¸ : W A sowie ¨ ¸ : U& und ¨ ¸ © E0 e ¹ A © E0 e ¹ A © E0 e ¹& © E0 e ¹&
:W &
(19.115, 116)
550
19 Elektromagnetische Felder in Materie
Die Größen U ,W heißen Reflexions- bzw. Transmissionskoeffizient.
G Beispielhaft berechnen wir hier U A und W A . Auf Grund der Stetigkeit von Es an der Grenzfläche ergibt sich mit (19.101) und (19.102)
G G E0 e A E0 r A
G E0 g A .
(19.117)
Wir setzen voraus, dass die zu untersuchenden Materialien keinen kollektiven Magnetismus G G G besitzen. Es ist dann nach (18.136) B (k u E ) / Z und es folgt
G G G G (ke u Ee ) x (kr u Er ) x
G G (k g u Eg ) x .
(19.118)
G Für die Komponente EA (0, 0, E0 z ) ergibt sich nach der Definition des Vektorproduktes
key E0 e A kry E0 r A Da kry
k gy E0 g A .
(19.119)
key ist, folgt
E0 e A E0 r A
k gy key
E0 g A : aE0 g A .
(19.120)
Mittels (19.120) lässt sich E0 r A bzw. E0 g A eliminieren und wir erhalten
UA
§ E0 r · ¨ ¸ © E0 e ¹ A
1 a ; 1 a
(19.121a)
WA
§ E0 g · ¨ ¸ © E0 e ¹ A
2 . 1 a
(19.121b)
Es ist zweckmäßig, die Wellenvektorkomponenten durch Einfalls-, Reflexions- und Brechungswinkel auszudrücken (Abb. 19.19).
key ke Damit wird a
cos D ;
k gy kg
k gy n1 ke n2
cos E .
(19.122)
19 Elektromagnetische Felder in Materie
551
n2 cos E . n1 cos D
a
(19.123)
Setzen wir a in (19.121) ein, so erhalten wir als Endergebnis die Fresnelschen Formeln (A. J. Fresnel, 1788-1827):
UA
§ E0 r · ¨ ¸ © E0 e ¹ A
n1 cos D n2 cos E n1 cos D n2 cos E
§ E0 g · ¨ ¸ © E0 e ¹ A
WA
sin(D E ) ; sin(D E )
2n1 cos D n1 cos D n2 cos E 2sin E cos D . sin(D E ) (19.124)
Analog ergibt sich für die Komponenten parallel zur Einfallsebene
U&
§ E0 r · ¨ ¸ © E0 e ¹&
n2 cos D n1 cos E , n2 cos D n1 cos E tg (D E ) ; tg (D E )
W&
§ E0 g · ¨ ¸ © E0 e ¹&
2n1 cos D n2 cos D n1 cos E
.
(19.125)
2sin E cos D . sin(D E ) cos(D E )
Die Fresnelschen Formeln bilden die Grundlage zur Berechnung aller Eigenschaften der reflektierten und transmittierten Wellen. Im Folgenden wollen wir sie benutzen, um die Intensitätsverhältnisse bei der Reflexion und Transmission auszurechnen. Absorption wird dabei zunächst vernachlässigt.
552
19 Elektromagnetische Felder in Materie
19.2.4.4 Reflexions- und Transmissionsvermögen einer Grenzfläche
Unter dem Reflexionsvermögen verstehen wir das Verhältnis der über die Zeit gemittelten Intensitäten der reflektierten und der einfallenden Welle. Die Intensität der einfallenden Welle ist durch den Poynting-Vektor gegeben. Für eine elektromagnetische Welle im Vakuum gilt (18.144).
G S
1
P0
G G ( E u B) .
In einem Medium mit der Dielektrizitätskonstante H und der magnetischen Permeabilität µ ist dieser Ausdruck zu ersetzen durch
G S
1
PP0
G G G G 2 ( E u B) HH 0 cMed ( E u B) .
(19.126)
G Der Betrag von S ist also
G S
GG
HH 0 cMed E02 ei (Zt kr )
(19.127)
und die gemittelte Intensität wird
I
G S
1 c HH 0 E02 . 2 n
(19.128)
Mit diesem „Rüstzeug“ versehen, berechnen wir nun das Reflexionsvermögen (auch als Reflektivität bezeichnet) R und das Transmissionsvermögen T (auch als Transmission bezeichnet). Die auf die Grenzfläche bezogene, auf diese auftreffende Energie pro Fläche und Zeit ist I e cos D und die von dieser reflektierte Intensität I r cos D c . Da D D c , fallen die Kosinusterme heraus und da beide Wellen im gleichen Medium verlaufen, ergibt sich für R
R:
I r cos D c I e cos D
E02r . E02e
(19.129)
Analog ist das Transmissionsvermögen definiert durch
T:
I t cos E . I e cos D
Hierin drücken wir die mittleren Intensitäten entsprechend (19.128) aus.
(19.130)
19 Elektromagnetische Felder in Materie
553
It
1 H 2H 0 c2 Med E02g 2
1 n2 2 E0 g , 2 P0 c
(19.131)
Ie
1 H1H 0 c1Med E02e 2
1 n1 2 E0 e , 2 P0 c
(19.132)
womit wir für T erhalten
T:
n2 cos E E02g n1 cos D E02e
.
(19.133)
Die relative Amplitude ist durch die entsprechende Fresnelsche Formel gegeben. Wir wenden uns nun genauer dem Reflexionsvermögen, (19.129) zu. Quadrieren wir die relative Amplitude E0 r / E0 e , so erhalten wir für die beiden Komponenten senkrecht und parallel zur Einfallsebene 2
§ E0 r · ¨ ¸ © E0 e ¹ A
RA
§ n1 cos D n2 cos E · ¨ ¸ © n1 cos D n2 cos E ¹
2
2
R&
§ E0 r · ¨ ¸ © E0 e ¹&
2
§ n2 cos D n1 cos E · ¨ ¸ © n2 cos D n1 cos E ¹
2
2
§ sin(D E ) · ¨ ¸ ; © sin(D E ) ¹
§ tg (D E ) · ¨ ¸ ; © tg (D E ) ¹ (19.134a,b)
In Abb. 19.21a/b sind Reflexionskoeffizient und Reflexionsvermögen dargestellt. Es wurde
ρ
0.2
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
R
0.0 -0.2
ρP
-0.4
b)
a)
ρ^
-0.6
-1.0
R^
0.2
-0.8 a
0°
30°
60°
90°
RP
0.0 0°
30°
60°
0.2 a
0.0 90°
Abb. 19.21: Verlauf des Reflexionskoeffizienten (a) und des Reflexionsvermögens (b) in Abhängigkeit vom Einfallswinkel
554
19 Elektromagnetische Felder in Materie
n2 ! n1 gewählt. Bei der Reflexion am optisch dichteren Medium tritt für U& ein Pha-
sensprung von S auf, wenn D E ! 90q wird (Abb. 19.22). In diesem Fall ist nämlich
U&
§ E0 r · ¨ ¸ ! 0 und U A © E0 e ¹&
§ E0 r · ¨ ¸ 0. © E0 e ¹ A
(19.135)
1.0 0.6
r^
Abb. 19.22: Reflexionskoeffizient U&
rP
0.2 0.0
aB
-0.2
a
und UA beim Übergang vom optisch dichteren zum optisch dünneren Medium
Wir wollen nun einige Spezialfälle diskutieren.
19.2.4.5 Der Fall senkrechter Inzidenz
Besonders einfach werden die Ausdrücke für senkrechten Lichteinfall. Aus Symmetriegründen darf in diesem Fall R nicht von der Polarisationsrichtung der Wellen abhängen. Es ergibt sich 2
R (D
§n n · 0) ¨ 2 1 ¸ . © n2 n1 ¹
(19.136)
Das Reflexionsvermögen ist unabhängig davon, ob die Welle am optisch dichteren oder dünneren Medium reflektiert wird.
19.2.4.6 Brewsterwinkel
Aus (19.125) folgt, dass für (D E ) 90q der Nenner gegen unendlich strebt, so dass die Amplitude der Parallelkomponente des reflektierten Lichts null wird. Derjenige Winkel D , bei dem dies eintritt, wird Brewsterwinkel D B (D. Brewster, 1781-1868) genannt. Der Wellenvektor der transmittierten Welle und der der reflektierten Welle bilden in diesem Fall einen
19 Elektromagnetische Felder in Materie
555
rechten Winkel. Das reflektierte Licht ist vollständig in der Ebene senkrecht zur Einfallsebene polarisiert. Dieses Ergebnis lässt sich anschaulich verstehen, wenn wir das Bild der zu Schwingungen angeregten induzierten Dipole zu Hilfe nehmen, das wir schon früher benutzt haben (Abb. 19.23). Wir zerlegen das unter dem Winkel D B einfallende unpolarisierte Licht in einen Anteil, der in der Einfallsebene schwingt und einen, der senkrecht dazu oszilliert. Die von den beiden Teilwellen an der Grenzfläche zu erzwungenen Schwingungen angeregten Atomdipole können in Reflexionsrichtung aber nur die senkrechte Komponente abstrahlen, denn sie sind gerade in Richtung der reflektierten Wellen orientiert. Für den Brewsterwinkel ergibt sich unter Berücksichtigung des Brechungsgesetzes und (D B E ) 90q r r kr
ke
n2 . n1
tgD B
(19.137)
Da keine Energie verloren geht, tritt unter D B einfallendes, parallel zur Einfallsrichtung polarisiertes Licht ohne Reflexionsverluste durch das 2. Medium, d.h. das Transmissionsvermögen ist gleich eins, T& 1 . Solche „Brewsterfenster“ werden vor allem in Verbindung mit Lasern verwendet. Obiger Fall ist ein Spezialfall der allgemeinen Beziehung
T& R&
1
TA RA
1,
aB
Ersatzdipole
b r kg
Abb. 19.23: Anschauliche Erklärung der Polarisation des unter dem Brewsterwinkel reflektierten Lichtes (19.138)
die ohne Berücksichtigung der Absorption gilt. Überzeugen Sie sich davon!
19.2.4.7 Totalreflexion
Ist der Brechungsindex des 1. Mediums größer als der des 2. Mediums, so gibt es einen kritischen Einfallswinkel, bei dem die Wurzel in
a
n2 cos E n1 cos D
imaginär wird.
n22 n12 sin 2 D n1 cos D
(19.139)
556
19 Elektromagnetische Felder in Materie
Wir tragen diesem Sachverhalt Rechnung, indem wir schreiben
a
iJ { i
n12 sin 2 D n22 n1 cos D
.
(19.140)
Aus früheren Überlegungen wissen wir, dass ein imaginärer Wellenvektor eine Abnahme der Amplitude der eindringenden Welle in dieser Richtung bedeutet. Die elektrische Feldstärke ist
G Eg
G i (Zt kGg rG ) G i (Zt ( kgx x kgy y )) E0 g e E0 g e G i (Zt kgx x ) J key y . E0 g e e
(19.141)
Das ist eine inhomogene Welle, die sich längs der Grenzfläche in x-Richtung ausbreitet und deren Amplitude senkrecht zur Fortpflanzungsrichtung ein Stückchen G in das optisch dünnere Medium hineinreicht. Wir sprechen von einer quergedämpften Welle. Die Eindringtiefe G ist gegeben durch
G
1 k yJ
OVak
.
2 1
2S n sin 2 D n22
(19.142)
Die Intensität ist
I g Eog2 e
2J key y
Eog2 e2 y / G ,
(19.143)
Das Reflexionsvermögen ist in diesem Fall 2
RA
§ E0 r · ¨ ¸ © E0 e ¹A
R&
§ E0 r · ¨ ¸ © E0 e ¹&
2
§ 1 iJ · ¨ ¸ © 1 iJ ¹
2
1 J 2 1 J 2
§ 1 i (n1 / n2 ) 2 J · ¨ 2 ¸ © 1 i (n1 / n2 ) J ¹
2
1;
(19.144a)
1 (n1 / n2 ) 2 J
2
1 (n1 / n2 ) 2 J
2
1.
(19.144b)
Das Licht wird also, obwohl es ein wenig in das 2. Medium eindringt, vollständig reflektiert. Der Grenzwinkel der Totalreflexion ergibt sich aus (19.139) zu
sin DT
n2 . n1
(19.145)
19 Elektromagnetische Felder in Materie
557
Der Eintritt der Totalreflexion lässt sich gut beobachten, wenn ein mit Wasser gefüllter Glastrog von unten mit Licht bestrahlt wird (Abb. 19.24). Bei kleinen Eintrittswinkeln des Lichtstrahls in das Wasser tritt ein Teil des Lichtbündels an der oberen Grenzfläche Wasser ( n 1,33 )-Luft ( n2 1 ) wieder aus. Erreicht der Einfallswinkel D DT 48,8q , so wird das Lichtbündel totalreflektiert. Die Eindringtiefe in Luft Abb. 19.24: Anordnung zur beträgt bei D 60q G 166 nm . Demonstration der TotalreDer gleiche Versuch lässt sich mit Mikrowellen flexion b ( O | 3 c m ) durchführen. Diese werden an der hinteren Fläche eines 45°-Prismas aus Paraffin ( n 1,5 ) totalreflektiert. Wird an die Rückseite ein zweites Prisma gesetzt, so dass die Grenzfläche „verschwindet“, so tritt die Strahlung in das Prisma ein (Abb. 19.25). Zwischen diesen beiden Grenzfällen gibt es einen kontinuierlichen Übergang, der sich wegen der großen Wellenlänge der Mikrowellen gut beobachten lässt. Schieben wir nämlich das zweite Prisma langsam an das erste heran, so beobachten wir bereits einen Energieübertritt, wenn der Abstand noch von der Größe der Wellenlänge ist.
Abb. 19.25: Frustrierte Totalreflexion: Mikrowellenstrahlung wird von einem aus Paraffin gefertigten Prisma total reflektiert. Wird ihm ein zweites Prisma auf einige Wellenlängen genähert, so zeigt der Detektor hinter diesem eine ansteigende Intensität
Dieses Phänomen wird frustrierte (behinderte) Totalreflexion genannt. Es ist das klassische Analogon des quantenmechanischen Tunneleffekts. Mit Hilfe der Totalreflexion lassen sich Lichtbündel umlenken, am einfachsten mittels eines Prismas (Abb. 19.26). Je nach Lichteinfall wird mit einem 90°-Prisma eine Umlenkung um 90° oder 180° erzielt. Letzteres ist das Prinzip eines Rückstrahlers oder Retroreflektors („Katzenauge“). Eine besonders wichtige Anwendung erfährt die Totalreflexion bei Lichtleiterfasern (Abb. 19.27). Diese bestehen im einfachsten Fall aus einem Kern aus Quarzglas mit dem Brechungsindex n1, der von einem Mantel mit optisch dünnerem Material umgeben ist. Liegen die Kerndurchmesser im Bereich einiger Wellenlängen, so werden mehrere Moden angeregt, die analog (18.180) unterschiedliche Phasengeschwindigkeit besitzen.
558
19 Elektromagnetische Felder in Materie
5
1 b)
a)
1 2 3
1
3 2 1
Abb. 19.26: Umlenkung elektromagnetischer Strahlung mit Hilfe von Prismen
5
Dies führt zu einer Verbreiterung eines Lichtpulses. Der Effekt kann durch Verwendung von Ein-Moden-Lichtleitern vermieden werden.
n1 n2
Abb. 19.27: Fortpflanzung einer Lichtwelle in einem Lichtleiter durch Totalreflexion
Die Abhängigkeit des Winkels der Totalreflexion vom Brechungsindex wird in einem Refraktometer zur Messung von n ausgenutzt. Abb. 19.28 zeigt dazu das Prinzip des Abbeschen Refraktometers (E. Abbe, 1840-1905).
Prüfflüssigkeit Abb. 19.28: Prinzip des Abbeschen Refraktometers
19 Elektromagnetische Felder in Materie
559
19.2.5 Reflexion an Metalloberflächen Metalle sind erfahrungsgemäß im sichtbaren Frequenzbereich und bei kleineren Frequenzen undurchsichtig und reflektieren Licht stark. Das ist in Übereinstimmung mit dem Modell des freien Elektronengases (Kap. 19.4.3), nach dem ein Metall unterhalb der Plasmafrequenz für elektromagnetische Strahlung undurchsichtig ist. Jetzt fragen wir, wie wir das Reflexionsvermögen einer Metalloberfläche modellmäßig beschreiben können. Dafür bieten sich die Fresnelschen Formeln an. Um sie anwenden zu können, muss in ihnen zuvor der reelle Brechungsindex durch den komplexen Brechungsindex ersetzt werden.
n nc o nc incc nc iN .
(19.146)
Für senkrechte Inzidenz ergibt sich mit (19. 134)
§n n · R ¨ 1 2¸ © n1 n2 ¹
2
§ n1c ( n2c iN ) · ¨ ¸ © n1c (n2c iN ) ¹
2
(n1c n2c ) 2 2i (n1c n2c )N N 2 (n1c n2c ) 2 2i ( n1c n2c )N N 2
(19.147)
Je größer N wird, umso mehr nähert sich der Bruch dem Wert „1“ an. Im Fall n1c 1 (Luft) und n2 iN (Metall) wird R 1 . Starke Absorption geht also mit starker Reflexion einher. Dabei bedeutet „starke Absorption“ geringe Eindringtiefe der Strahlung, längs derer diese schwach absorbiert wird! Eben dieses Verhalten ist für Metalle charakteristisch. – Bei wellenlängenabhängiger Absorption ist die Farbe des reflektierten Lichts komplementär zu der des durchgehenden Lichts. Z.B. erscheint ein dünnes („goldgelbes“) Goldblättchen in der Durchsicht blau.
19.2.6 Ausbreitung elektromagnetischer Wellen in anisotropen Medien In den vorangegangenen Kapiteln haben wir vorausgesetzt, dass die durchstrahlte Materie im Mittel isotrop war. Das gilt auch für kubische Kristalle, in denen jedes Atom von sechs äquivalenten nächsten Nachbarn umgeben ist. Die drei zueinander senkrecht stehenden kubischen Achsen sind also gleichwertig. Viele in der Natur vorkommende Kristalle besitzen aber eine niedrigere Symmetrie. Das bedeutet, dass auf ein gebundenes äußeres Elektron in unterschiedlichen Richtungen z.T. unterschiedliche elektrische Kräfte wirken. Die PolarisierG barkeit ist demnach jetzt richtungsabhängig. Infolgedessen ist die Polarisation P im AllgeG meinen nicht mehr parallel zum elektrischen Feld E . Es gibt jedoch mindestens einen Satz G G dreier zueinander senkrechter Richtungen, längs derer E und P parallel sind. Sie werden als Hauptachsen bezeichnet. Werden die Koordinatenachsen x, y, z parallel zu diesen HauptG achsen gelegt, so ergeben sich je nach Größe von P in diesen Richtungen unterschiedliche Dielektrizitätskonstanten bzw. Brechungsindizes. Letztere heißen Hauptbrechungsindizes nx , n y , nz .
560
19 Elektromagnetische Felder in Materie
19.2.6.1 Der dielektrische Tensor
Der gerade formulierte Sachverhalt folgt aus den Maxwell-Gleichungen. Für Dielektrika ( P | 1 ) sind sie durch (19.160) mit j U 0 gegeben. Wir schreiben sie in der allgemeinen Form
G rot E
G wB ; wt
G di v D 0;
G rot B
G wD P0 ; wt
G di v B 0.
(19.148)
Darin haben wir zur Abkürzung die in Kap. 15.7.3 eingeführte dielektrische Verschiebung benutzt,
G G G D : H0E P . Für isotrope Medien konnten wir schreiben
G G P H 0 Fe E ,
(15.6.1)
G G In anisotropen Medien sind E und P nicht mehr parallel zueinander, wir wollen aber weiterhin einen linearen Zusammenhang zwischen den beiden Größen annehmen. Das G G bedeutet, dass P jetzt eine lineare Vektorfunktion von E wird und F e bzw. H Tensoren:
G G D HH 0 E ,
(19.149)
wobei H der Dielektrizitätstensor ist.
§ H xx H xy H xz · ¨ ¸ H ¨ H yx H yy H yz ¸ . ¨ ¸ © H zx H zy H zz ¹
(19.150)
G in Komponenten-Schreibweise wird D
Dx
H 0 (H xx Ex H xy E y H xz Ez ),
Dy
H 0 (H yx Ex H yy E y H yz Ez ),
Dz
H 0 (H zx Ex H zy E y H zz Ez ) .
(19.151)
19 Elektromagnetische Felder in Materie
561
Die Zahl der Tensorkomponenten kann noch reduziert werden: Dazu betrachten wir den Energiesatz. Für die elektrische bzw. magnetische Energiedichte soll wie bisher gelten
w el
1 GG E D; 2
w mag
1 2 P0
B2 .
(15.7.4/18.3.1)
G wobei D durch (19.151) gegeben ist. Für isotrope Medien ist w el mit der elektrischen
Energiedichte in (15.7.4) identisch. Die Energiebilanz wird jetzt
G G G G 1 w ° G G 1 2 °½ ( ) B rot E E rot B B ) dV ¾ ®³ ( E D ³ P0 V P0 2 wt °¯V °¿ G G G 1 G wD G wE 2 G wB ³ (E D B )dV . 2V wt wt P0 wt 1
(19.152)
Der dritte Term unter dem Integral ist die zeitliche Ableitung der magnetischen Energiedichte w mag (1/ 2 P0 ) B 2 . Damit sich auch die zeitliche Ableitung der elektrischen Energiedichte ergibt, müssen der erste und der zweite Term gleich sein.
G G G wD G wE E D wt wt
0.
(19.153)
Das führt auf die Bedingungsgleichung
(H yx H xy ) Ex E y (H zx H xz ) Ex E z (H xy H yx ) E y E x (H zy H yz ) E y E z (H xz H zx ) Ez E x (H yz H zy ) Ez E y
(19.154)
0
G Da diese Beziehung für jedes E gelten muss, folgt
H xy
H yx , H yz
H zy , H zx
H xz
(19.155)
Der dielektrische Tensor H ist also symmetrisch. Durch eine geeignete Transformation des Koordinatensystems (Drehung des Koordinatensystems) lässt er sich immer auf Diagonalform bringen. Das neue Koordinatensystem heißt Hauptachsensystem, die Diagonalterme werden als Hauptdielektrizitätskonstanten bezeichnet.
562
19 Elektromagnetische Felder in Materie
§ H1 0 0 · ¨ ¸ ¨ 0 H2 0¸ . ¨0 0 H ¸ 3 ¹ ©
HHa
(19.156)
Im Folgenden legen wir als Koordinatensystem das Hauptachsensystem (x, y, z) zu Grunde.
19.2.6.2 Ebene Wellen im Medium
Wir wollen jetzt die Ausbreitung einer ebenen Welle im Kristall untersuchen. Der elektrische Feldvektor ist also
G E
GG G E0 ei (Zt k r )
G
G iZ ( t cr nˆ ) Med E0 e .
(19.157)
G k bzw. nˆ gibt die Richtung der Phasenfläche der Welle an, cMed deren Geschwindigkeit im Medium. Mit diesem Ansatz folgt aus den beiden unteren Maxwell-Gleichungen (19.154)
G di v D 0 und
G G Dk
0
G di v B 0 , G G und B k 0 .
(19.158)
G G G Sowohl D als auch B stehen senkrecht auf dem Wellenvektor k . Wir wenden nun die beiden anderen Maxwell-Gleichungen an,
G rot E
G wB ; wt
G rot B
G wD P0 ; wt
(19.159)
Wir betrachten zuerst die 1. Gleichung. Es gilt
eˆx G rot E
eˆy
eˆz
w w w . wx wy wz Ex E y Ez eˆx i (k y Ez k z E y ) eˆy i ( k z Ex k x Ez ) eˆz i( k x E y k y Ex ) G G iE u k
(19.160)
19 Elektromagnetische Felder in Materie G Bilden wir wB / wt
G B G wobei k0
G iZ B , so wird mit Z / k
563 cMed
1 G G E u k0 , cMed
(19.161)
G G k / k ist.
Analog folgt aus der zweiten Gl. (19.165)
G D
G G 1 B u k0 . P0 cMed
(19.162)
Für die Energieströmung gilt weiterhin
G S
G sˆ0 S
G
G
H 0 c 2 ( E u B) .
(19.163)
G G G G G G Aus (19.160) und (19.162) ergibt sich, dass B A E und B A D , aus (19.163), dass E A S , sˆ0 . Insgesamt erhalten wir also,
G G G G G B A E , B A sˆ0 sowie B A D
(19.164)
G G G Die Größen kˆ0 , E , D und sˆ0 liegen mithin in einer Ebene. B steht auf dieser Ebene senkrecht.
r D
r E
sˆ 0
r S
J kˆ 0
r B
r D r E
sˆ 0 kˆ 0
G G G Abb. 19.29/30: Veranschaulichung von Gl. (19.162) und (19163). Die Vektorgrößen k 0 , D, B G G G sowie s0 , E, B bilden ein rechtwinkliges Dreibein
564
19 Elektromagnetische Felder in Materie
G G G G Die Vektorgrößen kˆ0 , D, B und sˆ0 , E , B bilden jeweils ein rechtwinkliges Dreibein. G und sˆ0 sind nicht mehr parallel zueinander, sondern schließen, wie auch D und einen Winkel - miteinander ein (Abb. 19.29).
kˆ0 G E,
Wir haben demnach zwei Möglichkeiten, ebene Wellen im anisotropen Medium zu G G beschreiben. Das Vektortripel kˆ0 , D, B charakterisiert eine Welle durch die Richtung kˆ0 G G ihrer Phasenebene; in ihr liegen die zueinander senkrechten Größen D und B . Das Tripel G G sˆ0 , E, B beschreibt die in Richtung sˆ0 gerichtete Energieströmung der Welle; per DefinitioG G nem liegen die zueinander senkrechten Vektorgrößen E und B senkrecht zu sˆ0 . G G In beiden Fällen lässt sich der Zusammenhang zwischen E und D durch ein Ellipsoid im Hauptachsensystem veranschaulichen. Wir gehen dazu vom Ausdruck für die Energiedichte aus. Zur Darstellung gibt es zwei Möglichkeiten: G 1) Wir tragen von einem Punkt aus die Vektoren E als gerichtete Strecken ab, für die GG H 01 E D const ist. G 2) Wir tragen von einem Punkt aus die Vektoren D als gerichtete Strecken ab, für die GG E D const ist. G G Im ersten Fall erhalten wir, wenn der Endpunkt von E durch den Vektor r ( x, y, z ) beschrieben wird, bei geeigneter Normierung im Hauptachsensystem die Fläche
H1 x 2 H 2 y 2 H 3 z 2
H0 .
(19.165)
Dieses Ellipsoid heißt Fresnelsches oder Strahlen-Ellipsoid. Es hat die Achsen 1/ H1 , 1/ H 2 , 1/ H 3 . Bewegen wir uns auf dem Ellipsoid vom Punkt (x, y, z) um ein Stück (dx, dy, dz) weiter, so gilt
H1 xdx H 2 ydy H 3 zdz 0 .
(19.166)
G D.h. die Vektorgröße mit den Komponenten (H1 x H 2 y H 3 z ), also D , steht auf dem Ellipsoid im Punkt (x, y, z) senkrecht. G Die Vektorgröße D steht senkrecht auf dem Strahlenellipsoid im Endpunkt des G Durchmessers der Richtung E . Sein Betrag ergibt sich (nach den Methoden der G Tensorrechnung) als reziproker Wert der Projektion von r auf die Normalenrichtung.
19 Elektromagnetische Felder in Materie
565
G Im 2. Fall folgt im Hauptachsensystem, da E
x2
H1
y2
H2
z2
H3
G
H 1 D ,
1.
(19.167a)
Die Achsen dieses Ellipsoids sind also durch die Wurzeln aus den Hauptdielektrizitätskonstanten gegeben. Ersetzen wie Letztere durch die Hauptbrechungsindizes, so ergibt sich
x2 y 2 z 2 n12 n22 n32
1.
(19.167b)
Es heißt daher Index- oder auch Normalen-Ellipsoid. Durch Einführung der zugehörigen Lichtgeschwindigkeiten im Medium, cMed , können wir auch schreiben 2 2 2 2 2 2 cMed , x x cMed , y y cMed , z z
c2 .
(19.167c)
G Die Vektorgröße mit den Komponenten x / H1 , y / H 2 , z / H 3 , also E , steht senkrecht auf dem Normalen-Ellipsoid im Endpunkt (x, y, z) des Durchmessers der G Richtung D .
Wir kehren jetzt wieder zu den Maxwellgleichungen, Gln. (19.154), zurück und fragen nach Geschwindigkeit und Polarisation der ebenen Wellen. Wir stellen zunächst die beiden Aus G G gangsgleichungen zusammen, zunächst für das Vektortripel kˆ0 , D, B . Unter der Benutzung von
G G G GG G GG G A u ( B u C ) ( AC ) B ( AB)C folgt aus (19.161) und (19.162)
G D
G 1 E u kˆ0 u kˆ0 2 P0 cMed
G G 1 E E kˆ0 kˆ0 . 2 P0 cMed
^
G G c2 G D H 0 2 E E kˆ0 kˆ0 . cMed
^
`
`
(19.168)
(19.169)
Der Ausdruck in der geschweiften Klammer entspricht der senkrecht zu kˆ0 stehenden KompoG nente von E (Abb. 19.30).
566
19 Elektromagnetische Felder in Materie
G Eine entsprechende Gleichung ergibt sich für das elektrische Feld E : Nach (19.164) steht G G G E in der sˆ0 , D -Ebene senkrecht auf kˆ0 . Folglich hat E die Richtung der Vektorgröße G G D D kˆ0 kˆ0 . Da cos - nach Abb. 19.30 gegeben ist durch
^
`
G G E E kˆ0 kˆ0 G E
cos -
G G D D sˆ0 sˆ0 G D
(19.170a)
folgt mit (19.163)
G E
2 G G cMed D D sˆ0 sˆ0 ; H 0 c 2 cos 2 -
^
`
(19.171)
- ist gleichzeitig der Winkel zwischen der Richtung der Energieströmung und der der Wellennormalen,
kˆ0 sˆ0
cos G E
cMed / cMed , SG .
(19.170b)
2 G G G cMed ,S D D sˆ0 sˆ0 . H 0c2
^
`
(19.172)
Die Geschwindigkeit cMed , SG heißt auch Strahlgeschwindigkeit.
19.2.6.3 Wellen in optisch einachsigen Kristallen
Wir spezialisieren .nun die abgeleiteten Ergebnisse auf den einfachsten Fall eines anisotropen Kristalls, den einachsigen Kristall (Tab. 19.1) Vertreter sind z. B. Quarz oder Kalkspat.
Substanz
no
nao
TiO2 (Rutil) K2SO4 MgF2 SiO2 (Quarz)
2,6131 1,4550 1,3777 1,5442
2,9089 1,5153 1,3895 1,5533
(+) (+) (+) (+)
CaCO3 (Kalkspat) Al2O3 (Saphir) Turmalin
1,6584 1,7682 1,6425
1,4854 1,6598 1,4864
(-) (-) (-)
Tab. 19.1: Brechungsindizes einiger einachsiger Kristalle, O = 589 nm, Na-DLicht
19 Elektromagnetische Felder in Materie
567
Bei einachsigen Kristallen ist eine Richtung durch die Anordnung seiner Bausteine besonders ausgezeichnet (Abb. 19.31). In einer zu dieser Richtung senkrechten Ebene finden sich drei, vier oder sechs gleichberechtigte Richtungen. Die ausgezeichnete Richtung hat dann drei-, vier- oder sechszählige Symmetrie. Bei geeigneter Wahl der Achsen ist H x H y z H z bzw. vx
v y z v z . Ist H z ! H x
Fall, H z H x
H y , so nennen wir den Kristall optisch positiv, im umgekehrten
H y , optisch negativ einachsig.
Sechszählige optische Achse
z y x
Abb. 19.31: Schematische Darstellung eines einachsigen Kristalls mit Symmetrieachse G Zur Ermittlung der Polarisationsrichtungen der E -Felder der Lichtwellen und der Lichtgeschwindigkeiten für eine gegebene Strahlrichtung sˆ0 haben wir von dem Vektortripel G G G sˆ0 , E , B auszugehen. Wir wissen aus den Verknüpfungen (19.164), dass D in der Ebene liegt, G die durch die Strahlrichtung sˆ0 und dem zu ihr senkrechten elektrischen Feldvektor E gebildet wird (Abb. 19.29). G G Wegen der Rotationssymmetrie des H -Tensors liegt D gleichzeitig in der zˆ, E -Ebene. Das G G ist nur möglich, wenn D entweder die Richtung von E hat oder wenn die beiden Ebenen G zusammenfallen (Abb. 19.32). Im ersten Fall muss E senkrecht auf zˆ und damit senkrecht G auf der sˆ0 , zˆ -Ebene stehen, im zweiten Fall liegt E in der sˆ0 , zˆ -Ebene. Wegen der Rotationssymmetrie fällt die sˆ , zˆ -Ebene mit der aus der Wellennormale kˆ und der z-Achse ge0
0
bildeten Ebene zusammen. Eine aus der Strahlrichtung sˆ0 bzw. der Wellennormale kˆ0 und der dielektrischen HauptG achse (hier die z-Achse) aufgespannte Ebene wird als Hauptschnitt bezeichnet. Das E -Feld der Welle schwingt, also entweder senkrecht zum Hauptschnitt, sˆ0 und kˆ0 sind gleichgerichtet, oder im Hauptschnitt, sˆ und kˆ haben unterschiedliche Richtungen. Im ersten Fall 0
0
sprechen wir vom ordentlichen Strahl, im zweiten Fall vom außerordentlichen Strahl. G G Die Geschwindigkeit des ordentlichen Strahls berechnet sich aus (19.172). Da E & D ist, folgt
568
19 Elektromagnetische Felder in Materie
G c2 G D H0 2 E. cMed , S
z
sˆ 0
(19.173)
G Da E in der x,y-Ebene liegt, gilt
Abb. 19.32: Zur Ermittlung der Eigenschaften eines einachsigen Kristalls
r E
G c2 G D H0 2 E. cMed , x
Die Geschwindigkeit des ordentlichen Strahls ist unabhängig von der Strahlrichtung, (19.175)
cMed , x .
cMed , S
(19.174)
Die Geschwindigkeit des außerordentlichen Strahls ergibt sich ebenfalls mittels (19.172). Lassen wir zunächst den Hauptschnitt mit der xz-Ebene zusammenfallen, so wird
Dx
G c2 s0, x ( sˆ0 D ) H 0 2 Ex , Dz cMed
G c2 s0, z ( sˆ0 D) H 0 2 E z , Dy cMed
Ey
0. (19.176)
Das dielektrische Verhalten ist gegeben durch
Dx
H0
c2 2 Med , x
c
Ex , Dz
H0
c2 2 Med , z
c
Ez .
(19.177)
G Gleichsetzen der jeweiligen Komponenten von D liefert
Ex
2 cMed ,S 2
2 s0, x cMed ,x 2 Med , S
H0 c c
c
2 Med , x
G sˆ0 D , E z
2 cMed ,S 2
2 s0, z cMed ,z 2 Med , S
H0 c c
2 Med , z
c
G sˆ0 D .
(19.178)
Multiplikation der Komponenten mit s0, x bzw. s0 z und Addition führt unter Berücksichtigung G von E sˆ0 0 zu 2 s0,2 x cMed ,x 2 2 cMed , S cMed , x
2 s0,2 z cMed ,z 2 2 cMed , S cMed , z
0.
(19.179a)
19 Elektromagnetische Felder in Materie
569
Daraus folgt für cmed , S
1
s0,2 x
2 cMed ,S
2 cMed ,z
s0,2 z 2 cMed ,x
.
(19.179b)
Lassen wir die Einschränkung fallen, dass der Hauptschnitt mit der xz-Ebene zusammenfällt, ergibt sich
1
s0,2 x s0,2 y
2 G cMed ,S
2 cMed ,z
s0,2 z 2 cMed ,x
.
(19.180)
Zur Veranschaulichung können wir cMed , SG in der Strahlrichtung sˆ abtragen. Die dabei entstehende zweiblättrige Fläche nennen wir die Strahlenfläche. Dem ordentlichen Strahl entspricht eine Kugel, dem außerordentlichen Strahl ein Ellipsoid. Auf der z-Achse berühren sich die beiden Blätter (Abb. 19.33a). Zur Veranschaulichung lässt sich auch das Fresnelsche oder Strahlenellipsoid, Gl. (19.165), heranziehen. Für den einachsigen Kristall vereinfacht sie sich zu
x2 y 2 z2 2 2 cMed cMed ,x ,z
1 . c2
(19.181a)
Wir schneiden das Ellipsoid mit einer zu sˆ senkrechten Ebene, die durch seinen Mittelpunkt verläuft.
s0, x x s0, y y s0, z z
0.
(19.181b)
Die Hauptachsen der Schnittellipse geben die zur Strahlrichtung möglichen beiden Richtungen G von E an. Die Länge der senkrecht zum Hauptschnitt stehenden Halbachse ist cMed , x / c , also cMed , S / c des ordentlichen Strahls. Zur Vereinfachung liege die Strahlrichtung in der xz- Ebene. Für die gemeinsamen Koordinaten x, z des außerordentlichen Strahls und der Schnittellipse müssen dann gleichzeitig die aus obigen Gleichungen (19.181) folgenden Beziehungen erfüllt sein.
x2 2 Med , x
c
z2
1 , c2
2 Med , z
c
s0, x x s0, z z
0
(19.182)
(19.183)
570
19 Elektromagnetische Felder in Materie
cMed,z a)
cMed,x
b)
cMed,x
cMed,z
cMed,z cMed,x
cMed,z cMed,z cMed,x
cMed,z
Optische Achse
Abb. 19.33a: Geschwindigkeiten und Polarisationsrichtungen des o. und ao. Strahls für einen optisch positiven (links) und optisch negativen (rechts) einachsigen Kristall o Die erste Gleichung können wir schreiben
° x 2 z 2 ½° ( s0,2 x s0,2 z ) ® 2 2 ¾ °¯ cMed , x cMed , z °¿
1 , c2
(19.182a)
denn der linke Klammerausdruck hat den Wert 1. Aus der zweiten Gleichung folgt
s0,2 x x 2
s0,2 z z 2 ,
(19.183a)
Ersetzen wir mittels dieser Beziehung x2 bzw. z2 in (19.182a), so erhalten wir
° s0,2 x s0,2 z ½° (x z ) ® 2 2 ¾ °¯ cMed , z cMed , x °¿ 2
2
1 . c2
(19.184)
Für den zweiten Klammerausdruck setzen wir (19.181) ein. Das ergibt
( x2 z 2 )
2 cMed ,S
c2
(19.185)
Die Länge dieser Halbachse ist gleich der Strahlgeschwindigkeit des außerordentlichen Strahls. Wir können also zusammenfassen:
19 Elektromagnetische Felder in Materie
571
Wird das Strahlenellipsoid mit einer Ebene senkrecht zur Strahlrichtung und durch seinen Mittelpunkt geschnitten, so geben die Richtungen der Halbachsen der Schnittellipse die G Schwingungsrichtungen von E und ihre Länge die zugehörigen Brechungsindizes an (Abb. 19.33b). G G Ganz analog lässt sich das Vektortripel kˆ 0 ,D,B behandeln. Entsprechend der AusgangsG G gleichung (19.169) sind E und D bei der Argumentation miteinander zu vertauschen. Für die Normalengeschwindigy keit, also die Geschwindigkeit der Phax senfläche der Welle, folgt
k0,2 x k0,2 y 2 2 cMed cMed ,x
k0,2 z 2 2 cMed cMed ,z
O
0;
n2
A nao
sˆ 0
n2 C
n1
z
(19.186a) 2 cMed
2 2 2 (k0,2 x k0,2 y ) cMed , z k0, z cMed , x
(19.186b)
Optische Achse 19.33b: Fresnelsches oder Strahlenellipsoid
Für die ordentliche Welle ist die Normalengeschwindigkeit
cMed
cMed , x .
(19.187)
Im allgemeinen Fall verschiedener Hauptbrechungsindizes, nD z n ß z nJ , existieren zu jeder Strahlrichtung sˆ0 zwei zueinander senkrecht polarisierte Wellen mit unterschiedlichen Strahlgeschwindigkeiten. Analoges gilt für die Richtung der Wellennormalen. In Erweiterung der Situation in einachsigen Kristallen gibt es jetzt zwei Richtungen, bei denen die beiden Normalen-Geschwindigkeiten zusammenfallen. Diese werden sinngemäß als optische Achsen bezeichnet. Derartige Kristalle heißen deshalb optisch zweiachsig. Tab. 19.2 listet einige Vertreter auf.
Substanz BaSO4 CaSO4 u 2H2O KH2Al3(SO4)2 Al2FSiO3
(Baryt) (Gips) (Glimmer) (Topas)
nD
1,6480 1,5208 1,5601 1,6190
nß 1,6810 1,5228 1,5936 1,6200
nJ
1,5309 1,5298 1,5977 1,6270
Tabelle 19.2. Brechungsindizes einiger zweiachsiger Kristalle (O = 589 nm)
572
19 Elektromagnetische Felder in Materie
19.2.6.4 Doppelbrechung
Die besprochene Aufspaltung einer unpolarisierten Welle in eine ordentliche und eine außerordentliche Welle wird Doppelbrechung genannt. Wir wollen uns die erarbeiteten Zusammenhänge mit Hilfe des Huyghensschen Prinzips veranschaulichen. Die ordentliche Welle befolgt das Snelliussche Brechungsgesetz, die außerordentliche dagegen nicht. Die Teilwellen laufen im Allgemeinen in unterschiedlichen Richtungen durch den Kristall. Nur wenn die Lichtwelle in Richtung der optischen Achse eingestrahlt wird, verhält sie sich „normal“, d.h. sie läuft mit einheitlicher Geschwindigkeit durch den Kristall. Breitet sich die Welle senkrecht zur optischen Achse aus, tritt ebenfalls keine Aufspaltung auf, aber ordentlicher und außerordentlicher Strahl haben unterschiedliche Geschwindigkeiten, so dass die resultierende Welle elliptisch polarisiert ist. Wir hatten oben herausgefunden, dass die Wellenflächen der ordentlichen Welle eine Kugelfläche darstellt, während die der außerordentlichen Welle ein Ellipsoid ist. In der Sprache des Huygensschen Prinzips (s. Kap. 20) gehen von jedem Punkt einer Strahlenfläche Elementarwellen aus, deren Ausbreitungsrichtung durch den Strahlvektor sˆ0 festgelegt ist und deren Tangentialebene die beobachtete Phasenfläche bildet; ihre Richtung wird durch den Vektor kˆ0 charakterisiert. (Abb. 19.34). Bei der ordentlichen Welle fallen Strahlen- und Phasen-
Abb. 19.34: Verlauf des o. und ao. Strahls in einem einachsigen Kristall bei senkrechter Inzidenz, konstruiert nach dem Huygensschen Prinzip. Die Polarisationsrichtungen der beiden Strahlen (Wellen) liegen senkrecht zueinander Wunsch
flächen zusammen. In Abb. 19.34 ist der relativ leicht zu überblickende Fall dargestellt, dass das Lichtbündel unter einem gewissen Winkel zur optischen Achse senkrecht auf den Kristall auftrifft. Die optische Achse möge in der Zeichenebene liegen. Die Ausbreitungsrichtung der kugelförmigen Strahlenfläche, und damit des ordentlichen Strahls, ist, wie gesagt, durch das Snelliussche Brechungsgesetz bestimmt. Lage und Ausbreitung der ellipsoidförmigen Strahlungsfläche ist durch die Richtung der optischen Achse bzw. durch die Hauptlichtgeschwindigkeiten bestimmt. Das Brechungsgesetz versagt, weil es sich entsprechend der Definition des Brechungsindexes auf die Geschwindigkeit der Wellennormale kˆ0 bezieht. Als solches bleibt es auch für anisotrope Medien gültig
19 Elektromagnetische Felder in Materie
573
19.2.7 Erzeugung und Nachweis polarisierten Lichtes Die meisten zu Beleuchtungszwecken dienenden Lampen senden unpolarisiertes Licht aus. In Glühlampen z.B. werden Atom-Elektronen durch Stöße in einen angeregten Zustand versetzt. Beim Übergang in den Grundzustand geben sie ihre Energie in Form von Licht wieder ab. Dabei ist keine Richtung vor einer anderen ausgezeichnet, das Licht ist unpolarisiert. Viele Untersuchungen erfordern aber polarisiertes Licht. Weiter unten werden wir gleich einige Messmethoden kennen lernen. Auf der anderen Seite stehen wir häufig vor der Aufgabe, Licht bezüglich seiner Polarisation analysieren zu müssen, nicht nur im sichtbaren Spektralbereich, sondern auch bei höheren bzw. kleineren Frequenzen. Wir benötigen also Polarisatoren und Analysatoren, die natürlich auf den gleichen Prinzipien beruhen. Hier wollen wir uns auf sichtbares Licht beschränken. Licht kann linear, zirkular oder elliptisch polarisiert sein. Linear polarisiertes Licht ist uns bereits begegnet. Es liegt dann vor, wenn der elektrische Feldvektor in einer bestimmten Richtung senkrecht zur Ausbreitungsrichtung schwingt. Als solche möge die z-Richtung H fungieren. Der E -Vektor muss dann in der xy-Ebene liegen. Die Welle hat also die Form (Abb. 19.35a)
G E
G E0 ei (Zt kz ) ;
G E0
E0, x eˆx E0, y eˆy ,
(19.188,189)
Zirkular polarisierte Wellen entstehen, wenn x- und y-Komponente der Feldamplitude gleich groß sind, aber eine Phasenverschiebung von 90° aufweisen (Abb. 19.35b). Es gilt also z.B.
Ex
E0 ei (Zt kz ) ,
Ey
E0 ei (Zt kz S / 2) .
(19.190)
Die Projektion des Vektors
G E
( E0 eˆx E0 eiS / 2 eˆy ) ei (Zt kz ) E0 (eˆx ieˆy ) ei (Zt kz )
(19.191)
G auf die xy-Ebene beschreibt einen Kreis, der E -Vektor selbst also eine Kreisspirale um die z-Richtung. G Sind die Amplituden der beiden Teilwellen unterschiedlich, so beschreibt der E -Vektor eine elliptische Spirale. Eine solche entsteht auch, wenn bei gleichen Amplituden die Phasenverschiebung ungleich 90° ist. Die Wellen heißen in diesen Fällen elliptisch polarisiert.
574
19 Elektromagnetische Felder in Materie
19.2.7.1 Erzeugung linear polarisierten Lichtes
Wenn unpolarisiertes Licht unter dem Brewsterwinkel auf ein Dielektrikum fällt, z.B. auf eine Glasplatte, ist das reflektierte Licht vollständig linear polarisiert (Kap. 19.2.4), das transmittierte Licht dagegen nur zu einem geringen Teil. Aus den Fresnelschen Formeln ergibt sich mit R T 1 , dass die Intensität der senkrecht zur Einfallsrichtung schwingenden Komponente um 15% gegenüber derjenigen des einfallenden Lichtbündels gleicher Polarisationsrichtung verringert ist. Der Polarisationsgrad des transmittierten Lichts
P
I& I A I& I A
y
y
a)
z
b) z x
x y
y r E0 j
E 0x = E 0 sinj
E 0y = E 0 cosj
E0
E 0y = E 0 cosj
j (t)
x
x E 0x = E 0 sinj
Abb. 19.35: Darstellung einer linear (a) und einer zirkular polarisierten (b) Welle beträgt daher nur 8%. Er kann jedoch erhöht werden, indem wir das Licht durch mehrere Brewster-Platten schicken. Es wird immer nur die Komponente I A aus dem Lichtbündel heraus reflektiert, während die parallel polarisierte Komponente I & den Plattenstapel ungeschwächt passiert. Daher kann die Hälfte der Intensität des unpolarisiert auf die erste Platte fallenden Lichts transmittiert werden. Eine andere Möglichkeit zur Erzeugung linear polarisierten Lichts besteht in der Ausnutzung der gerade besprochenen Doppelbrechung. Ordentlicher und außerordentlicher Strahl sind senkrecht zueinander linear polarisiert. Da sie im Allgemeinen unter verschiedenen Winkeln durch den Kristall laufen, kann einer der Teilstrahlen ausgeblendet werden, so dass das transmittierte Licht vollständig linear polarisiert ist. Es gibt dazu mehrere Anordnungen, die erste wurde von W. Nicol ( | 1768-1851) ersonnen und trägt den Namen Nicolsches Prisma.
19 Elektromagnetische Felder in Materie
575
Beim Nicolschen Prisma wird der ordentliche Strahl durch Totalreflexion und anschließende Absorption aus dem Strahlengang entfernt. Zur Erzeugung der beiden Teilstrahlen wird ein Optische o Kalkspatkristall verwendet, der die Form eines Achse Rhomboeders hat. Zur Ausblendung des ordent67° lichen Strahls sind die beiden Stirnflächen des Kristalls so weit abgeschliffen, dass sie mit den ao Längskanten einen Winkel von 67° bilden (Abb. 19.36). Der längs der Diagonalebene P1 P2 unpolarisiertes Licht durchgeschnittene Kristall wird mit einer Schicht aus Kanadabalsam versehen und Abb. 19.36: Erzeugung linear polarisierten wieder verkittet. Für den ordentlichen Strahl Lichtes durch ein Nicholsches Prisma ist die Schicht (n = 1,54) optisch dünner als der Kristall (n0 = 1,66). Für den außerordentlichen Strahl gilt mit n = 1,49 das Umgekehrte. Durch den vorgenommenen Schliff fällt der ordentliche Strahl unter einem Winkel auf die Kanadabalsam-Schicht, der größer als der Grenzwinkel der Totalreflexion ist, so dass er total reflektiert wird. Der außerordentliche Strahl passiert dagegen nach entsprechender Brechung den Kristall. Der Nachteil eines solchen Polarisators ist die durch die Brechung entstehende Strahlversetzung. Außerdem ist das Gesichtsfeld ziemlich klein, da mit zunehmender Divergenz Optische des Strahls Totalreflexion nicht mehr möglich Achse ist. Diese Nachteile werden beim Glan-Thompson Prisma (P. Glan, 1846-1898, S. P. Thompson, 1851-1916) vermieden(Abb. 19.37). Es hat senkrechte Endflächen und die optische Achse liegt parallel zur Eintrittsfläche, der einfallende Strahl verläuft also senkrecht zur optischen Achse. Es tritt deshalb keine Doppelbrechung auf, aber wie beim Nicolschen Prisma wird der unpolarisiertesLicht ordentliche Strahl an der Kittfläche total-reflekAbb. 19.37: Erzeugung linear polarisiertiert. Der Öffnungswinkel des einfallenden ten Lichtes durch ein Glan-ThomsenLichtbündels kann bis zu 40° betragen, dagegen Prisma sind beim Nicolschen Prisma nur ca. 27° zulässig. Das Gesichtsfeld ist gleichmäßig polarisiert, weil die Schwingungsrichtungen symmetrisch zu der durch die optische Achse und das Einfallslot gelegten Hauptschwingungsebene orientiert sind, was beim Nicolschen Prisma nicht der Fall ist. Außerdem kann das Glan-Thompson Prisma kürzer sein als dieses. Bei den bis jetzt besprochenen Methoden zur Erzeugung polarisierten Lichtes waren die Materialien farblos, d.h. ihre elektronischen Eigenfrequenzen liegen im UV, so dass sie im Sichtbaren praktisch nicht absorbieren. Jetzt wollen wir eine dritte Möglichkeit besprechen, welche darauf beruht, dass bestimmte Stoffe den ordentlichen und den außerordentlichen Strahl unterschiedlich stark absorbieren (Abb. 19.38). Das liegt daran, dass die Eigenfrequenzen auf Grund der strukturellen Anisotropie von der Polarisationsrichtung abhängen.
576
19 Elektromagnetische Felder in Materie
Solche Materialien werden dichroitisch genannt („zweifarbig“). Sie bestehen entweder aus anisotropen Kriställchen, die orientiert in eine Gelatineschicht eingebettet sind, oder aus einer Zellulosehydratfolie, die durch Dehnung dichroitisch gemacht wird (s. unten).
Stark absorbierte horizontale Komponente
Abb. 19.38: Erzeugung linear polarisierten Lichts mittels eines dichroitischen Kristalls. Strahlung einer Polarisationskomponente wird absorbiert
Nur schwach absorbierte vertikale Komponente
19.2.7.2 Erzeugung zirkular und elliptisch polarisierten Lichtes
Die Erzeugung elliptisch polarisierten Lichtes beruht auf der in Kap. 19.2.6 erläuterten Phasenverschiebung zwischen ordentlichem und außerordentlichem Strahl, wenn diese eine dünne planparallele Platte der Dicke d passieren, die senkrecht zur optischen Achse geschnitten ist (Abb. 19.39). Die beiden Teilstrahlen werden aus linear polarisiertem Licht gewonnen, dessen Polarisationsrichtung mit der optischen Achse einen Winkel von r45q bildet.
Unpolarisiertes Licht r Eo
Optische Achse r E ao
Zirkular polarisiertes Licht
d
Abb. 19.39: Erzeugung elliptisch polarisierten Lichts durch Ausnutzung der Phasenverschiebung von o. und ao. Strahl in einem O / 4 - Plättchen Wunsch
19 Elektromagnetische Felder in Materie
577
Die Phasenverschiebung beträgt
'M
2S
O0
d (nao no ) .
(19.192)
Um zirkular polarisiertes Licht zu erhalten, muss nach Kap. 19.4.7 'M die Dicke so gewählt sein, dass
d ( nao no ) O0 / 4
S / 2 sein. Dazu muss
(19.193)
wird. Ein solches Plättchen heißt „ O / 4 -Plättchen“. Wird als Material Quarz verwendet, so ergibt sich für O0 600 nm eine Dicke von 600 /(4 0, 011) | 15µm .
19.2.7.3 Polarisationsdreher
Bei praktischen Anwendungen muss häufig die Richtung von linear polarisiertem Licht um einen Winkel D gedreht werden. Dies ist durch Verwendung eines O/2-Plättchens möglich. Seine optische Achse möge wieder in der Plattenebene liegen. Ist M der Winkel des G E Vektors des einfallenden Lichtes gegenüber der optischen Achse, so können wir die Welle in die Komponenten parallel und senkrecht zur optischen Achse zerlegen: i (Zt k& d )
E&
E0 cos M e
,
(19.194a)
EA
E0 sin M ei (Zt kA d ) .
(19.194b)
Infolge der geringeren Geschwindigkeit der senkrechten Komponente (des außerordentlichen Strahls) im Plättchen besitzen sie hinter diesem eine Phasenverschiebung von S. Für z = d gilt also
(kA k& ) d
S o kA d
k& d S ,
(19.195)
Es ist ik& d iZt
E&
E0 cos M e
EA
E0 sin M e
e
i ( k& d S ) iZt
E0 sin M e
e
(19.196)
ik& d iZt
e .
G Der Sachverhalt ist in Abb. 19.40 dargestellt. Der E -Vektor hat sich um den Winkel D = 2 M gedreht. Durch Drehung des O/2-Plättchens in der Ebene senkrecht zur Einfalls-
578
19 Elektromagnetische Felder in Materie
richtung des Lichtes kann jeder Winkel M und damit jede gewünschte Drehung D eingestellt werden.
r E (z = 0) E ^ = E sinj
a)
b) d
EP = E cosj
j
a
r E (z = d)
a
Optische Achse
Optische Achse Abb. 19.40: Drehung der Polarisationsebene des Lichtes infolge optischer Aktivität eines Mediums
19.2.7.4 Optische Aktivität
Bestimmte Festkörper, Flüssigkeiten und Lösungen zeigen bei beliebiger Lage der Polarisationsebene des einfallenden linear polarisierten Lichtes nach Durchstrahlung eine Drehung der Polarisationsebene (Abb. 19.41). Diese Erscheinung wird als optische Aktivität bezeichnet.
a
d
Abb. 19.41: Drehung der Polarisationsebene einer linear polarisierten Welle infolge optischer Aktivität
Der Drehwinkel ist proportional der Dicke d des Mediums und bei Lösungen auch proportional der Konzentration c des gelösten Stoffes.
D D s (c ) d .
(19.197)
D s heißt spezifisches optisches Drehvermögen. Es existieren rechts- und linksdrehende Stoffe. Sie werden auch als positiv und negativ drehend bezeichnet. Bei Ersteren ist der Drehsinn so definiert, dass die Schwingungsrichtung für einen dem Lichtbündel entgegen blickenden Beobachter im Uhrzeigersinn gedreht wird.
19 Elektromagnetische Felder in Materie
579
Der Grund für die Drehung liegt bei kristallinen Festkörpern in einer schraubenförmigen Kristallstruktur, bei Flüssigkeiten in einer spiralförmigen Struktur der einzelnen Moleküle. Eine genauere Erklärung kann nur mit Hilfe der Quantentheorie gegeben werden. Wir können uns aber das Phänomen in seinen Grundzügen bereits in einem klassischen Modell klarmachen. Dieses geht davon aus, dass gerade umgekehrt wie oben unter Kap. 19.4.7.2 besprochen die linear polarisierte Welle aus zwei zirkular polarisierten Wellen entsteht. Auf CH3 CH3 Grund der Asymmetrie von Struktur bzw. Bausteinen der Stoffe haben die Teilwellen unterschiedliche GeschwinCH2OH digkeiten, woraus eine PhasenverschieCH OH 2 bung und damit eine linear polarisierte C C Welle mit gedrehter Schwingungsebene resultiert. Ein Festkörper dieser H C2H5 C2H5 H Art ist kristalliner Quarz, der längs der optischen Achse durchstrahlt wird. Er Abb. 19.42: Zwei spiegelsymmetrisch zueinander kommt als rechts- und links-drehender aufgebaute Amylalkohol-Moleküle Quarz vor. In Flüssigkeiten und Lösungen tritt optische Aktivität auf, wenn die Moleküle ein asymmetrisches Kohlenstoffatom enthalten, wie in Rohrzucker, Milchsäure oder Amylalkohol. Abb. 19.42 zeigt die zwei spiegelsymmetrischen Molekülformen. Diese Tatsache heißt Spiegelisomerie. Liegt ein 1:1 Gemisch aus beiden Modifikationen einer chemischen Verbindung vor, so dass sich die Drehungen kompensieren, so nennen wir es ein razemisches Gemisch. Die Messung des Drehwinkels wird in einem Polarimeter zur Konzentrationsbestimmung gelöster (optisch aktiver) Stoffe herangezogen (Abb. 19.43).
Abb. 19.43: Aufbau eines Polarimeters zur Bestimmung der Konzentration gelöster (optisch aktiver) Stoffe b
zu untersuchende Lösung
Laser Polarisator
a
Detektor Analysator
580
19 Elektromagnetische Felder in Materie
19.2.8 Durchgang von Licht durch isotrope Medien bei Anlegung äußerer Felder 19.2.8.1 Faraday-Effekt
Wir knüpfen an den vorhergehenden Abschnitt an und denken uns ein isotropes Medium in ein Magnetfeld gebracht, dessen Richtung mit der des durchtretenden Lichtbündels übereinstimmt. Ist das einfallende Licht linear polarisiert, so erscheint die Schwingungsebene des austretenden Lichtbündels gedreht. Die Drehung lässt sich wie oben durch zirkulare Doppelbrechung erklären. Im Magnetfeld ist das Medium optisch aktiv geworden. Dieses Phänomen trägt den Namen Faraday-Effekt oder Magnetorotation. Die Drehung der Schwingungsebene ist proportional zur magnetischen Feldstärke.
D ZV d B . Die Proportionalitätskonstante heißt Verdetsche Konstante (M. E. Verdet, 1824-1866). Eine um Größenordnungen stärkere Magnetorotation kann durch Orientierung atomarer Dipole, vor allem in dünnen ferromagnetischen Schichten, auftreten. Befindet sich ein isotropes Medium in einem transversalen äußeren Feld, so wird dieses einachsig und damit doppelbrechend. Hier seien drei solcher Effekte kurz besprochen.
19.2.8.2 Elektrische Doppelbrechung (Kerr-Effekt)
Bestimmte Flüssigkeiten und Suspensionen werden bei hinreichend großen elektrischen Feldern ( E t 10 4 eV/cm ) doppelbrechend. Die optische Achse fällt mit der RichU= tung des Feldes zusammen. Benannt ist dieser elektrooptische Effekt nach seinem Entdecker J. Kerr (1824-1907). Die Flüssigkeit befindet sich in einer transKerrzelle parenten „Kerrzelle“ (Abb. 19.44). Der Polarisator wird so eingestellt, dass die Polarisation des einfallenden Lichtes mit der Richtung des elektrischen Feldes einen Winkel von 45° bildet. Das Licht besteht dann aus zwei Komponenten r E gleicher Intensität, deren Polarisation parallel zum äußeren Feld und senkrecht Polarisator Elektroden l / 4 -Plättchen zu diesem liegt. Nach Durchlaufen der Küvette besitzen sie als ordentlicher und Abb. 19.44: Aufbau einer Kerrzelle zur Unteraußerordentlicher Strahl eine Phasenversuchung der elektrischen Doppelbrechung schiebung, die proportional zu E 2 ist:
19 Elektromagnetische Felder in Materie
M
2S
d (n0 nao )
O0
2S
O0
581
K d E2
(19.198)
Infolgedessen ist das Licht nach seinem Austritt elliptisch polarisiert. Mittels eines O/4-Plättchens, dessen langsame Achse mit der Richtung des äußeren Feldes einen Winkel von 3S/4 bildet, wird es wieder in linear polarisiertes Licht umgewandelt, dessen Schwingungsrichtung gegenüber der des einfallenden Lichtes um M / 2 gedreht ist. Dies lässt sich wie folgt einsehen: Das äußere elektrische Feld zeige in x-Richtung, die y-Richtung liegt senkrecht dazu und zur Richtung des k-Vektors des Lichtes. Der Polarisator steht in x-Richtung, wobei gelten soll
X
1 2
( x y ), Y
1 2
( x y ) .
(19.199)
Die linear polarisierte Lichtwelle ist
x
A0,lin 2
sin Zt ,
y
A0,lin 2
sin Zt .
(19.200)
Das austretende Licht ist gegeben durch
x
A0,lin 2
sin(Zt M ),
y
A0,lin 2
sin Zt .
(19.201)
Einsetzen in (19.199) ergibt für die Schwingungsrichtungen
X
A0,lin cos(M / 2) sin(Zt M / 2),
Y
A0,lin sin(M / 2) cos(Zt M / 2).
(19.202)
Diese Beziehungen beschreiben eine elliptisch polarisierte Welle mit den Halbachsen
A0,lin cos(M / 2) , A0,lin sin(M / 2). Nach Passieren des O/4-Plättchens in der oben angegebenen Orientierung gilt
X
A0,lin cos(M / 2) cos(Zt M / 2)
Y
A0,lin sin(M / 2) cos(Zt M / 2).
(19.203)
Das Licht ist demnach linear polarisiert; seine Schwingungsrichtung ist gegenüber der des einfallenden Lichtes um den Winkel M /2 gedreht.
582
19 Elektromagnetische Felder in Materie
Hinter dem in Y-Richtung stehenden Analysator wird die Intensität gemessen
I
A0,2 lin sin 2 M / 2 .
(19.204)
Bei Drehung des Analysators um den Winkel D aus der Y-Richtung wird die Intensität
I
^A
0,lin
sin D cos(M / 2) A0,lin cos D sin(M / 2)`
2
A0,2 lin sin 2 (D M / 2). (19.205)
Die Intensität wird maximal, wenn der Analysator um den Winkel D M / 2 aus seiner ursprünglichen Y-Richtung gedreht wird. Die materialabhängige Proportionalitätskonstante K in (19.196) wird als Kerr-Konstante bezeichnet. Für einige Flüssigkeiten ist ihr Wert aus Tab. 19.3 zu ersehen. Festkörper zeigen einen um ca. eine Größenordnung kleineren Kerr-Effekt, bei Gasen ist er noch wesentlich geringer. Der Kerr-Effekt kann durch die Ausrichtung polarer Moleküle, wie solcher in obiger Tabelle, entstehen sowie durch die Beeinflussung der Elektronenzustände der Materialien. Die Relaxation der Moleküle erfolgt mit einer sehr geringen Zeitkonstante von typischerweise 10 11 s. Der Effekt kann daher zum Bau schneller Lichtverschlüsse eingesetzt werden. Dazu wird die Kerrzelle zwischen zwei gekreuzte Polarisatoren gebracht. Immer dann, wenn das angelegte Hochfrequenzfeld den Wert null passiert, sperrt die Anordnung den Lichtdurchgang.
Flüssigkeit
K/1014 Vm-2
Benzol Kohlenstoffdisulfid Chloroform Wasser Nitrotoluol Nitrobenzol
0,67 3,59 -3,85 5,23 137 245
Tab. 19.3: Kerrkonstante einiger Flüssigkeiten (O = 589 nm, t = 20° C)
19.2.8.3 Magnetische Doppelbrechung (Cotton-Mouton-Effekt)
Wird das elektrische Feld durch ein magnetisches Feld ersetzt, so tritt eine dem Kerr-Effekt analoge magnetische Doppelbrechung auf, die von A. Cotton (1869-1941) und H. Mouton erstmals beobachtet wurde. Es gilt also
'M
2S
O0
d (n0 nao )
2S
O0
K cd B 2 .
Die Cotton-Mouton-Konstante K c ist wesentlich kleiner als die Kerr-Konstante.
(19.206)
19 Elektromagnetische Felder in Materie
583
19.2.8.4 Spannungsdoppelbrechung
Wir wollen nun auf einen isotropen (durchsichtigen) Körper einen einseitigen Druck bzw. Zug ausüben. Als Beispiel wählen wir einen Plexiglasstab, der sich im Strahlengang zwischen zwei gekreuzten Polarisationsfolien befindet (Abb. 19.45). Ohne Einwirkung äußerer Kräfte ist das Gesichtsfeld dunkel. Wird der Stab gebogen, so wird das linear polarisierte Licht infolge Doppelbrechung elliptisch polarisiert und auf dem Schirm tritt Aufhellung an solchen Stellen auf, die einer Stauchung oder Dehnung im Stab entsprechen. Im isotropen Bereich der neutralen Faser (s. Bd. 1, Kap. 12.2) bleibt der Schirm dunkel. Der Versuchsaufbau lässt sich so abändern, dass zwischen Stauchung und Dehnung unterschieden werden kann. Dazu wird die erste Polarisationsfolie durch ein O / 2 -Plättchen ersetzt und die zweite entfernt. In diesem Fall addieren bzw. subtrahieren sich die Phasenunterschiede des Lichtes im Stab und im Plättchen, je nachdem, ob Stauchung oder Dehnung vorliegt. Bei weißem Licht ergeben sich charakteristische Farbeffekte. Die Spannungsdoppelbrechung wird in weitem Umfang bei der Materialprüfung angewandt, z.B. bei der Herstellung optischer Gläser.
Abb. 19.45: Demonstration der Spannungsdoppelbrechung
584
19 Elektromagnetische Felder in Materie
19.3 Nichtlineare Optik 19.3.1 Nichtlineare Suszeptibilität Bei der Behandlung optischer Fragestellungen sind wir bisher davon ausgegangen, dass – im klassischen Oszillatormodell – auf das Elektron bei einer Auslenkung eine ihr proportionale Rückstellkraft wirkt. Auf Grund dieser Feldkraft führt es harmonische Schwingungen aus. Die korrekte Bearbeitung des Problems mittels der Quantenmechanik führt zum gleichen Resultat. Wie bei jedem schwingenden System ist das aber nur eine Näherung für kleine Auslenkungen, also für hinreichend kleine wirkende Feldkräfte. Wächst die Feldstärke mehr und mehr, so machen sich Abweichungen von der linearen Kennlinie bemerkbar. Während im linearen Bereich die Polarisation konstant ist, für die Komponenten also gilt
Pi
H 0 F ij E j ,
(i,j = 1,2,3),
(15.61)
wird sie im nichtlinearen Bereich eine Funktion der Feldstärke.
Pi
H 0 F ij ( E ) E j .
(19.207)
Entwickeln wir die Suszeptibilität in eine Taylorreihe, so wird hieraus
Pi
(3) H 0 ^F ij(1) E j F ijk(2) E j Ek F ijkl E j Ek El ...` .
(19.208)
G
G
Wird nun das Medium von einer ebenen Welle durchlaufen, E E0 cos(Zt kz ) , so erkennen wir durch Einsetzen von E, dass jetzt auch Wellen mit höheren Frequenzen auftreten.
19.3.2 Optische Frequenzverdopplung Im einfachsten Fall der Berücksichtigung nur des ersten nichtlinearen Terms erhalten wir für isotrope Medien bei z = 0
Px
H 0 ^ F (1) E0 x cos Zt F (2) E02x cos 2 Zt` .
(19.209)
Analoge Gleichungen gelten für die beiden anderen Komponenten. Umformung des quadratischen Terms führt zu der Beziehung
Px
1 ¯2
1 2
½ ¿
H 0 ® F (2) E02x F (1) E0 x cos Zt F (2) E02x cos(2Zt ) ¾ .
(19.210)
19 Elektromagnetische Felder in Materie
585
Die Polarisation besteht also aus einem konstanten Anteil, einem Term mit der Frequenz Z und einem Anteil, der mit der Frequenz 2Z schwingt. Jeder induzierte Dipol strahlt also eine Welle mit der Frequenz Z und eine mit der doppelten Frequenz ab.
19.3.3 Optische Frequenzmischung Wir wollen jetzt den Fall untersuchen, dass zwei ebene Wellen mit den Frequenzen Z1 und Z2 im nichtlinearen Medium überlagert werden.
G E1 G E2
GG E01eˆx cos(Z1t k1r ) GG E02 eˆx cos(Z2t k2 r )
(19.211)
Beschränken wir uns auf den Frequenzanteil. Die resultierende Feldstärke bewirkt eine Polarisation, deren nichtlinearer Anteil sich nach (19.211) wie folgt zusammensetzt:
P (2) (Z ) H 0 F (2) ^E012 cos 2 Z1t E022 cos 2 Z2t 2 E01 E02 cos Z1t cos Z2t` 1 H 0 F (2) ª¬( E012 E022 ) E012 cos 2Z1t E022 cos 2Z2t 2 2 E01 E02 ^cos(Z1 Z2 )t cos(Z1 Z2 ) t`¼º
(19.212)
Neben den Wellen mit der doppelten Frequenz treten auch Wellen mit der Summen- und der Differenzfrequenz auf.
19.3.4 Phasenanpassung Die das nichtlineare Medium verlassenden Wellen haben nur dann eine merkliche Amplitude, wenn sich die von den einzelnen Dipolen des Mediums abgestrahlten Wellen phasenrichtig überlagern. Zur Erläuterung kehren wir noch mal zur Erzeugung einer Welle mit der doppelten Frequenz zurück. Wie wir in Kap. 19.3.2 gesehen haben, läuft die lineare Polarisation G zusammen mit dem elektrischen Feld E (t , z ) mit der Phasengeschwindigkeit v1 = c/n durch das Medium. Infolge der Dispersion gilt das für die Oberwelle nicht mehr. Diese breitet sich mit der Geschwindigkeit v2 = c/n(2Z) aus. Deswegen addieren sich die Wellen, die in den einzelnen Bereichen entstehen, nicht mehr phasenrichtig. Die Phasenanpassung,
c1Med (Z ) c2 Med (2Z ) ,
(19.213)
n1Med (Z ) n2 Med (2Z )
(19.214)
586
19 Elektromagnetische Felder in Materie
r k
n ao (w )
n o (w ) n o (2 w ) n ao (2 w )
Abb. 19.46: Zur Phasenanpassung zwischen den Wellen der Frequenz Z und der Oberwelle der Frequenz Z
kann in einem optisch einachsigen Kristall erreicht werden. Die Situation ist in Abb. 19.46 dargestellt. Wie wir gesehen haben, gibt es in einem solchen Kristall eine ordentliche und eine außerordentliche Welle, die im Allgemeinen unterschiedliche Geschwindigkeiten besitzen. Dieser Umstand kann zur Phasenanpassung ausgenutzt werden. Die Phasenflächen von ordentlicher Welle der Frequenz Z und die Phasenfläche der außerordentlichen Welle der Frequenz 2Z schneiden sich nämlich. Der Schnittpunkt definiert also die Richtung, in der die primäre Welle und die frequenzverdoppelte Welle mit gleicher Geschwindigkeit laufen und sich daher phasenrichtig überlagern.
19.3.5 Die Erhaltungssätze bei der Frequenzverdopplung Die Phasenanpassungsbedingung (19.214b) lässt sich auch schreiben als
1
2
O2
O1
,
(19.215a)
G oder durch Einführung des Wellenvektors k
k2
k1 k1 .
2S / O als
(19.215b)
Verwenden wir hierin noch die Verknüpfung von Wellenzahl und Impuls, so folgt, wenn wir dessen Vektorcharakter berücksichtigen
G G p1 p1
G p2
(19.215c)
(19.215b) wird als Wellenvektor-Erhaltungssatz bezeichnet, (19.215c) stellt den Impulserhaltungssatz dar. Zur optimalen Phasenanpassung muss also außer des Energieerhaltungssatzes auch der Impulserhaltungssatz gelten.
=Z =Z 2 =Z , G G G p1 p1 p2
(19.216)
19 Elektromagnetische Felder in Materie
587
Zur Phasenanpassung bei der Erzeugung der Summen- und Differenzfrequenz gilt nach (19.212) und (19.213) entsprechend
k1 k2
k3 .
(19.217)
19.3.6 Nichtlineare Absorption Bisher wurde die Absorption eines nichtlinearen Mediums vernachlässigt. Wir lassen diese Voraussetzung jetzt fallen. Es zeigt sich, dass auch der Absorptionskoeffizient eine Funktion der Bestrahlungsstärke werden kann. An einem Beispiel möge dies verdeutlicht werden. Wir betrachten dazu ein Lösungsmittel, in dem sich N/V Moleküle (V = Volumen der Lösung) befinden mögen. Von ihnen sollen N1/V Moleküle im energetisch niedrigsten Zustand, dem sog. Grundzustand der Energie E1, sein und N2/V im energetisch höheren Zustand der Energie E2. Die Transmission des Mediums ist nach dem Beerschen Gesetz gegeben durch
T
I I0
e D d
(19.19)
wobei d die Dicke des Mediums und D = V N/V der Absorptionskoeffizient ist. Er ist gleich dem Produkt aus Wirkungsquerschnitt V und der Differenz der Besetzungszahlen '(N/V). Wir setzen voraus, dass die Differenz der beiden Energieniveaus einer Frequenz im sichtbaren Spektralbereich entspricht. Da die Frequenz bzw. die Energiedifferenz gegenüber der thermischen Energie sehr groß ist, ist nur der Grundzustand besetzt. In diesem Fall hat der Absorptionskoeffizient seinen größten Wert. Fällt intensives Licht auf die Lösung, so wird intensitätsabhängig ein Teil der Moleküle in den Zustand mit der Energie E2 angeregt. Die Verringerung der Besetzungszahl-Differenz erniedrigt also den Absorptionskoeffizienten. Maximal kann die Hälfte der Moleküle die Energie E2 annehmen. Bei dieser Gleichbesetzung wird nach (19.19) die Lösung transparent.
19.3.7 Selbstfokussierung von Licht Wir haben bis jetzt nur die Auswirkungen des ersten nichtlinearen Terms in der Suszeptibilität diskutiert und wollen es auch dabei belassen. Es sei nur darauf hingewiesen, dass sich auf Grund des kubischen Terms von F u.a. ein geringer intensitätsabhängiger Beitrag zum Brechungsindex ergibt. Der Kristall werde von einem intensiven Laserstrahl der Feldstärke E(t) = E0 cos Zt durchlaufen. Setzen wir diese in den 3. Ordnung-Term der Polarisation ein,
P (3) (Z )
F (3) E 3 cos3 Zt ,
(19.218)
588
19 Elektromagnetische Felder in Materie
so folgt mit der Beziehung
cos3 Zt
1 3 cos(3Zt ) cos Zt . 4 4
(19.219)
1 (3) 3 3 F E cos(3Zt ) F (3) E 3 cos Zt . 4 4
(19.220)
Der Ausdruck
P (3) (Z )
(19.220) zeigt, dass die nichtlineare Polarisation einen Term enthält, der mit der gleichen Frequenz oszilliert wie das eingestrahlte Feld. Folglich liefert er einen Beitrag zum Brechungsindex des Mediums. Dieser führt zur Selbstfokussierung eines intensiven Laserstrahls. Entspricht die Intensitätsverteilung der Laserwelle einer TEM00-Mode (Abb. 19.47), bei der die elektrische Feldstärke im Zentrum maximal ist und nach außen glockenförmig auf null abnimmt, so wird der Brechungsindex in der Strahlmitte am stärksten erhöht. Die Randstrahlen
n
nE=0
r r Abb. 19.47: a) Gauß-Profil der normierten Intensität einer Lasermode; b) Erhöhung des Brechungsindexes eines durch den Term 3. Ordnung in (19.215) durchstrahlten Mediums als Funktion des Abstandes von der Strahlmitte
laufen schneller durch das Medium als der Mittelstrahl, so dass eine Fokussierung der Welle erfolgt. Diese führt in der Mitte zu einer weiteren Vergrößerung des Brechungsindexes, was die Fokussierung verstärkt usw.
19 Elektromagnetische Felder in Materie
589
Zusammenfassung x Die Phasengeschwindigkeit elektromagnetischer Wellen in Materie hängt vom Brechungsindex n(Z) ab. Diese Abhängigkeit wird als Dispersion bezeichnet.
cmed
c / n(Z ) .
Der Brechungsindex ist eine komplexe Größe.
n n ' in '' { n ' iN . Der Realteil gibt den Brechungsindex an, der Imaginärteil den zienten. Beide sind durch die Dispersionsrelation (19.17) verknüpft.
Absorptionskoeffi-
x Die Intensität einer in z-Richtung durch ein Medium laufenden Welle nimmt (bei nicht zu großen Intensitäten) exponentiell ab.
I
I 0 e D 'z ; D
2Z ncc / c ; (Beersches Gesetz)
x Licht wird an Atomen, Molekülen und Partikeln gestreut. Kohärente Streuung liegt vor, wenn die Streuzentren eine räumliche Ordnung aufweisen. Die Phasenwinkel der gestreuten Teilwellen stehen dann zueinander in einer festen Beziehung. Bei willkürlicher Verteilung der Streuzentren existieren keine festen Phasenbeziehungen, und die Streuung heißt inkohärent. Im ersten Fall ergibt sich die Intensität zu
I
¦ A k
k
2
,
im zweiten Fall zu
I
¦
k
Ik .
x Die Maxwell-Gleichungen in Materie lauten in Integralform
G G
v³ Edr C
d G G B dA ; dt ³A
G G BdA 0. v³ A
G G
v³ Bdr C
PP0 I
1 d G G EdA ; c dt ³A 2 Med
590
19 Elektromagnetische Felder in Materie und in Differentialform
G rot E
G wB ; wt
G di v E
1
H H0
G rot B
G G 1 wE P P0 j 2 ; cMed wt
G di v B 0.
U;
x Aus den Maxwell-Gleichungen folgen die Wellengleichungen in Materie zu
G 'E
G 1 w2 E 2 cMed wt 2
und
G 'B
G 1 w2 B . 2 cMed wt 2
x An der Grenzfläche zweier Medien mit den Brechungsindizes n1 und n2 wird eine elektromagnetische Welle z.T. reflektiert und z.T. gebrochen. Reflexions- und Transmissionsvermögen lassen sich aus den Fresnelschen Formeln, (19.124/125), berechnet. Für die Summe aus Reflexionsvermögen R und Transmissionsvermögen T gilt bei vernachlässigbarer Absorption R + T = 1. Bei senkrechtem Einfall ist R gegeben durch 2
§n n · R ¨ 2 1¸ . © n2 n1 ¹ x Stark absorbierende Materialien besitzen ein hohes Reflexionsvermögen. Bei schrägem Lichteinfall gibt es einen Winkel DT, bei dem Totalreflexion einsetzt,
sin D T
n2 , n2 > n1. n1
x Fällt Licht unter dem Brewsterwinkel DB auf ein Medium, so ist das reflektierte Licht vollständig in der Ebene senkrecht zur Einfallsebene polarisiert,
tgD B
n2 . n1
x In einem optisch anisotropen Medium wird das dielektrische Verhalten durch einen Tensor 2. Stufe, den Dielektrizitätstensor H beschrieben.
19 Elektromagnetische Felder in Materie
591
G G x In einem optisch anisotropen Medium sind E und D nicht mehr parallel zueinander, G G G G sondern die Vektorgrößen kˆ0 , D, B und sˆ0 , E , B bilden jeweils ein rechtwinkliges Dreibein. Wellennormale kˆ0 und Richtung der Energieströmung sˆ0 sind nicht mehr parallel G G zueinander, sondern bilden, wie auch D und E , miteinander einen Winkel - .
x Eine einfallende ebene Welle spaltet im Allgemeinen in eine ordentliche und eine außerordentliche Welle auf, die senkrecht zueinander polarisiert sind. Der Brechungsindex für die o. Welle ist unabhängig von der Ausbreitungsrichtung, es gilt das Snelliussche Brechungsgesetz. Für die ao. Welle hängt der Brechungsindex von dem Winkel zwischen Ausbreitungsrichtung und optischer Achse ab. x Polarisiertes Licht lässt sich durch Reflexion unter dem Brewsterwinkel erzeugen, mit Hilfe dichroitischer Kristalle und durch Ausnutzung der Doppelbrechung. x Erreicht die elektrische Feldstärke einer elektromagnetischen Welle große Werte, so müssen auch nichtlineare Terme der dielektrischen Polarisation berücksichtigt werden. x Bei Beschränkung auf das zweite Glied der Taylorentwicklung der dielektrischen Suszeptibilität kommt es zur Erzeugung einer Welle der doppelten Frequenz. Die Überlagerung zweier ebener Wellen ergibt Wellen mit der Summenfrequenz und der Differenzfrequenz der beiden Wellen. x Die phasenrichtige Überlagerung der entstehenden und der eingestrahlten Welle in einem nichtlinearen Medium kann mit Hilfe eines optisch einachsigen Kristalls bewerkstelligt werden. x Die Einstrahlung hinreichend intensiven Lichts in ein nichtlineares Medium reduziert die Absorption. x Die Berücksichtigung des kubischen Terms der elektrischen Suszeptibilität liefert u.a einen intensitätsabhängigen Beitrag zum Brechungsindex des Mediums.
592
19 Elektromagnetische Felder in Materie
Übungsaufgaben 1. Welche Bedeutung hat der statische Strukturfaktor einer wässrigen Lösung von Makromolekülen? Was ist unter dem Formfaktor zu verstehen? Wie ist der qualitative Verlauf des Formfaktors in Abhängigkeit vom Streuwinkel? Wie lässt er sich bei sphärischer Form der Moleküle berechnen? 2. Eine ebene elektromagnetische Welle der Frequenz Z = 3 1010 Hz im Vakuum läuft gegen eine Metallwand, an der sie in sich selbst reflektiert wird. Berechnen Sie für einen Punkt 0,804 m vor der Metallwand der Wegunterschied der beiden Wellen, die Amplitude der resultierenden Welle und die relative Intensität im Vergleich zur Maximalintensität der miteinander interferierenden Wellen. 3. Atomarer Wasserstoff absorbiert Licht u.a. bei 656,3 nm. Was für einen Verlauf würde der Brechungsindex n nehmen, wenn nur diese Linie zu berücksichtigen wäre? Welchen Wert hätte n bei 500 nm? In Wirklichkeit werden weitere Linien bei höheren Frequenzen beobachtet. Wie wirkt sich das qualitativ auf den Brechungsindex aus? 4. Tritt Totalreflexion ein, wenn ein Lichtstrahl (O = 500 nm) auf eine Glasscheibe trifft? Wie werden Gläser entspiegelt? Wo ist das wichtig? 5. Ein Lichtstrahl mit der Leistung von 0,5 W läuft durch ein 4 cm langes absorbierendes Medium. Welchen Bruchteil der Ausgangsleistung hat der Lichtstrahl beim Austritt aus dem Medium, wenn a) D = 4 10-3 cm-1; b) D = 10-1 cm-1 ist? 6. Wie dick muss eine Silberschicht sein, damit die Amplitude einer elektromagnetischen Welle der Wellenlänge O = 3 cm auf 2 0/00 abnimmt?
20
Geometrische Optik
20.1
Grundlagen der Strahlenoptik
Licht lernen wir zunächst als Lichtstrahlen oder -bündel kennen. Sprechweisen wie „durch eine Ritze fällt ein Lichtstrahl“ oder „ein von einem Spiegel reflektiertes bzw. von einem Scheinwerfer ausgesandtes Lichtbündel“ etc. sind uns allen geläufig. Die geradlinige Ausbreitung des Lichtes in eng begrenzten Lichtbündeln ist Gegenstand der geometrischen oder Strahlenoptik. Besonders die Abbildungseigenschaften optischer Komponenten, von Spiegeln und Linsen, können so einfach formuliert werden. Die Beschreibung stößt allerdings überall dort an ihre Grenzen, wo räumliche Begrenzungen eines Lichtbündels ins Spiel kommen, also z. B. beim Durchgang von Licht durch Blenden. Nur solange der Durchmesser des Lichtbündels sehr viel größer als die Wellenlänge des Lichtes ist, können solche als Beugungseffekte bekannte Abweichungen von geometrisch konstruierten Strahlengängen vernachlässigt werden. Ein Beispiel möge das verdeutlichen. Denken wir uns eine große Blende mit einem variablen kreisrunden Loch und einer Mattscheibe dahinter (Abb. 20.1). Durch die Schirm Blende wird jeder Punkt eines Gegenstandes als Kreisscheibe abgebildet. Das Bild ist daher undeutlich. Seine „Schärfe“ lässt sich durch Zusammenziehen der Blende erhöhen. Jedes Kreisscheibchen geht dann näherungsweise in einen Punkt über. Aber das funktioniert nicht mehr, wenn das LichtbünAbb. 20.1: Eine Kreisblende bildet jeden del auf Durchmesser von der GrößenordPunkt eines Gegenstandes als Scheibchen nung der Wellenlänge begrenzt wird, denn ab dann setzt zunehmend Beugung ein. Die Grundlagen der Strahlenoptik sind: 1) Können bei der Ausbreitung einer Lichtwelle Interferenz-, Beugungs- und Polarisationseffekte vernachlässigt werden, so kann die Ausbreitung der Welle durch Lichtstrahlen beschrieben werden. In optisch homogenen Medien breiten sich diese geradlinig aus. 2) An den Grenzflächen zweier Medien werden Lichtstrahlen nach dem Reflexionsgesetz (19.110) reflektiert und nach dem Snelliusschen Brechungsgesetz (19.112) gebrochen. 3) Lichtstrahlen beeinflussen sich (im Rahmen der linearen Optik) nicht. Die drei Sätze können auf das Fermatsche Prinzip (P. Fermat, 1601-1665) zurückgeführt werden. Es lautet
594
20 Geometrische Optik
Ein Lichtstrahl durchläuft zwischen zwei Punkten stets den Weg, für den die entsprechende optische Weglänge ein Extremwert ist. 2
Extremwert .
³ nds 1
Ist der Brechungsindex n konstant, so ist der Extremwert ein Minimum. Damit wird auch die Laufzeit des Lichtes minimal. Dazu ein Beispiel: Ein vom Punkt P1 ( x1 , y1 ) ausgehender Lichtstrahl werde in der Ebene y = 0 im Punkt PR ( x, 0) in den Punkt P2 ( x2 , y2 ) reflektiert (Abb. 20.2). Der vom Lichtstrahl zurückgelegte Weg ist
s
P1 (x1 ,x 2 )
s1 s2 ( x x1 ) 2 y12 ( x2 x) 2 y22 .
y s1
(20.1)
PR (x,0)
x s2
Minimale Lichtlaufzeit bedeutet dt/dx = 0, also
x x1 2
2 1
( x x1 ) y
x2 x
0
( x2 x) 2 y22
(20.2)
P2 (x1 ,x 2 ) Abb. 20.2: Anwendung des Fermatschen Prinzips ergibt das Snelliussche Brechungsgesetz
o
sin D1
sin D 2 o D1 D 2 .
Das ist das Snelliussche Reflexionsgesetz.
20.2 Optische Abbildung Die häufigste Aufgabe im Rahmen der linearen Optik besteht in der Vergrößerung eines Gegenstandes. Zur Definition führen wir zunächst einige Grundbegriffe ein (Abb. 20.3). Der Winkel, unter dem wir einen Gegenstand sehen, heißt Sehwinkel. Betrachten wir ohne optische Elemente einen Gegenstand in der Entfernung von s0 25 cm , so nennen wir diese deutliche Sehweite. Die Erfahrung zeigt, dass unser Auge bei weiterer Annäherung einen Gegenstand nur unter stärkerer Anspannung scharf sehen kann. Wird die Größe eines
20 Geometrische Optik
595
Gegenstandes mit YG bezeichnet und die des durch eine optische Anordnung erzeugten Bildes mit YB , so definieren wir als Abbildungsmaßstab oder Lateralvergrößerung das Verhältnis
E:
YB YG
(20.3)
Sei nun der Sehwinkel in deutlicher Sehweite H 0 und der Winkel, unter dem der Gegenstand mit einer optischen Anordnung gesehen wird, H , so definieren wir als Vergrößerung den Quotienten
V:
a
YG
H . H0
(20.4)
YB
a
Zur optischen Abbildung geeignete Elemente sind Hohlspiegel und Linsen.
20.3
YG
b
Abb. 20.3: Zur optischen Abbildung
Abbildung durch Hohlspiegel
Zur Abbildung von Gegenständen lassen sich je nach Problemstellung verschiedene Typen konvexer oder konkaver Spiegel verwenden. Wir besprechen zunächst den sphärischen Hohlspiegel (Abb. 20.4). Die vom Mittelpunkt M zum Scheitel S verlaufende Gerade heißt Hauptachse. Betrachten wir einen im Abstand d parallel zur Hauptachse einfallenden Lichtstrahl, der den Spiegel im Punkt A trifft. Er bilde mit der Normalen den Winkel D . Unter dem gleichen Winkel wird er in den Punkt F reflektiert. Nach Abb. 20.4 gilt
MF
FA
MA 2cos D
R , 2cos D
(20.5)
wobei R der Krümmungsradius des Spiegels ist. Da sin D d / R ist, wird für achsennahe, oder paraxiale Strahlen, cos D | 1 . Solche Strahlen schneiden sich also im Schnittpunkt F, dem Brennpunkt. Die Brennweite f ist also
f
R . 2
(20.6)
R
d M
a a
F
f
S
Abb. 20.4: Strahlengang beim sphärischen Hohlspiegel
596
20 Geometrische Optik
Für größere Abstände ergeben sich Abweichungen, die zu fehlerhafter Abbildung führen. Jetzt wollen wir einen Strahl betrachten, der von einem Punkt G auf der Achse außerhalb M im Punkte A auf den Spiegel fällt (Abb. 20.5) und nach Reflexion die Achse in einem Punkt B schneidet. Mittels der Dreiecke GAM und MAB folgt nach dem Sinussatz
sin E sin(S D )
A
R
d G
ß
ß a
F b
a
f
S
Abb. 20.5: Zur Ableitung der Abbildungsgleichung beim sphärischen Spiegel
1 1 a b
MG AG
MB . AB (20.7)
B
M
sin E sin D
1 f
Für kleine Winkel D , E , also für paraxiale Strahlen, ist AG = SG = a und AB = SB = b. Damit folgt
aR a
Rb , b
(20.8)
oder nach Umordnung mit 2/R = 1/f
(20.9)
Diese Beziehung heißt Abbildungsgleichung Die Summe aus reziproker Gegenstandsweite und reziproker Bildweite ist gleich der reziproken Brennweite. Zur Charakterisierung eines Hohlspiegels wird die reziproke Brennweite in Dioptrien (m-1) angegeben. Zur Bestimmung des Abbildungsmaßstabes (s. Abb. 20.6) entnehmen wir aus der Ähnlichkeit der Dreiecke SGGS und SBBS die Beziehung
VA :
YB YG
BBS GGS
b a
(20.10)
oder mit Hilfe der Abbildungsgleichung (20.9)
VA :
YB YG
b a
f a f
b f . f
(20.11)
20 Geometrische Optik
597 a)
GS
b)
R
G G
M BS
F
S
B
c)
G
F
M
B F
Abb. 20.6: Zur Ableitung der Abbildungsgleichung beim sphärischen Hohlspiegel a) Gegenstand außerhalb der doppelten Brennweite: es entsteht ein reelles umgekehrtes und verkleinertes Bild; b) Gegenstand bei der doppelten Brennweite: es entsteht ein reelles umgekehrtes gleich großes Bild c) Gegenstand innerhalb der einfachen Brennweite: es entsteht ein virtuelles aufrechtes und vergrößertes Bild Dabei haben wir stillschweigend festgelegt, dass die Größen f, a, b positive Werte annehmen, wenn sie vor dem Spiegel liegen und negative, wenn sie hinter dem Spiegel liegen. Die Größen f und a sind beim Hohlspiegel positive Größen; b kann auch negativ werden. Bezüglich der Lage von Gegenstand und Bild und dessen Größe sind bei gegebener Brennweite drei Bereiche zu unterscheiden, die in den Abb. 20.6a-c dargestellt sind. Im Falle a d f erscheint dem Auge des Beobachters das virtuelle Bild hinter dem Spiegel (b < 0), da es die vom beleuchteten Gegenstand ausgehenden Strahlen nach hinten verlängert. Virtuell heißt das Bild, weil es nicht auf einem Schirm aufgefangen werden kann, sondern nur im Auge des Beobachters entsteht. Es wurde eingangs bereits darauf hingewiesen, dass es für spezielle Anforderungen auch spezielle Hohlspiegel gibt. Geht es bietet sich ein Parabolspiegel an. Er konzentriert alle parallel zur optischen Achse einfallenden Strahlen, also auch achsenferne, im Brennpunkt. Solche Spiegel werden in der Astronomie und Astrophysik als Teleskope eingesetzt. Ein Beispiel, bei dem der Lichtweg umgekehrt durchlaufen wird, ist näherungsweise der Autoscheinwerfer. – Soll dagegen ein Punkt in einen anderen Punkt abgebildet werden, so kann das besonders gut mit einem elliptischen Spiegel bewerkstelligt werden. Neben Hohlspiegeln gibt es auch Wölbspiegel. Wie der Name besagt, ist bei diesen eine konkav gekrümmte Fläche verspiegelt. Mit einem solchen Spiegel lassen sich virtuelle, aufrechte, verkleinerte Bilder erzeugen, die dem Auge des Betrachters hinter dem Spiegel erscheinen. Sie finden z. B. als Außen-Rückspiegel von Autos oder an unüberB sichtlichen Straßenverläufen Verwendung. Die R G Bildkonstruktion ist aus Abb. 20.7 zu ersehen, Brennweite und Bildweite sind negativ. Abb. 20.7: Bei der Abbildung durch einen sphärischen Wölb- oder Konkavspiegel entsteht ein virtuelles aufrechtes und verkleinertes Bild
F
M
598
20.4
20 Geometrische Optik
Strahlengang in durch Ebenen begrenzten Körpern
Körper mit ebenen Flächen haben natürlich keine fokussierenden Wirkungen. Im Bereich der Optik sind solche aber trotzdem wichtig, vor allem als ebene Spiegel, planparallele Platten und Prismen.
G
GSP
Abb. 20.8: Abbildung eines Gegenstandes durch einen ebenen Spiegel ergibt ein virtuelles aufrechtes Bild mit dem Abbildungsmaßstab 1:1
20.4.1 Ebener Spiegel Blicken wir in einen ebenen Spiegel, so sehen wir bekanntlich ein virtuelles Bild unser selbst, das uns aus dem Raum hinter dem Spiegel in gleicher Entfernung und Größe anzublicken scheint. Wie alle virtuellen Bilder entsteht es dadurch, dass unser Auge einer Knickung der Lichtstrahlen nicht folgen kann, sondern diese nach hinten verlängert (Abb. 20.8).
20.4.2 Planparallele Platte Ist ein Körper, dessen Dicke klein gegenüber seinen Abmessungen senkrecht dazu ist, durch zwei parallele Ebenen begrenzt, so bezeichnen wir ihn als planparallele Platte. Ein einfallender Lichtstrahl tritt wegen der Brechung an der gegenüberliegenden Seite parallel verschoben aus (Abb. 20.9). Wir wollen diese Parallelverschiebung s ausrechnen. Es ist
s
d c sin(D E ) d
sin(D E ) cos E
d
(sin D cos E cos D sin E ) cos E
§ § sin E cos D · nL cos D · d sin D ¨1 ¸. ¸ d sin D ¨1 © sin D cos E ¹ © nPl cos E ¹
(20.12)
Die Größen nL und nPl sind die Brechungsindizes von Luft und Platte. Den Term cos ß formen wir wie folgt um
20 Geometrische Optik
cos E
1 sin 2 E
599
1
sin 2 E sin 2 D sin 2 D
nL nPl
nPl2 sin 2 D . nL2
(20.13)
Einsetzen in (20.12) ergibt für s
s
§ ¨ ¨ d sin D ¨1 ¨ ¨ ©
· ¸ cos D ¸ ¸ (20.14) 2 nPl sin 2 D ¸¸ nL2 ¹
nL
a
b d
Bei gegebener Dicke d und gegebenem Einfallswinkel D kann durch Messung der Parallelverschiebung s der Brechungsindex der Platte oder des umgebenden Mediums bestimmt werden. Planparallele Platten sind auch für die optische Spektroskopie von Bedeutung. Darauf kommen wir im nächsten Kapitel zurück.
nPL d¢
a
s
Abb. 20.9: Strahlversatz durch eine planparallele Platte
20.4.3 Prismen Ein Prisma ist ein Körper, dessen Grundflächen kongruente Vielecke sind; die Seitenflächen sind Parallelogramme. Im Folgenden betrachten wir ein dreiseitiges, durchsichtiges Prisma (Abb. 20.10). Die zur Einfalls- bzw. Ausfallsebene senkrechten Flächen werden brechende Flächen genannt. Sie schließen miteinander den brechenden Winkel J ein; ihre gemeinsame Schnittd a1 linie heißt brechende Kante. Die der h d a dieser gegenüber liegende Fläche wird a2 b1 Basis genannt. Ausfalls- und Einfallsb2 winkel unterscheiden sich um einen von der Wellenlänge abhängigen Winkel G . Auf dieser Eigenschaft beruht die optil sche Spektroskopie. Wir überlegen uns nun, wie groß die Abb. 20.10: Strahlverlauf bei einem Prisma; Strahlablenkung G als Funktion des EinJ wird als brechender Winkel bezeichnet trittswinkels D1 bei gegebenem J wird. ausführen
600
20 Geometrische Optik
Es gilt
G
D1 E1 D 2 E 2
J
E1 E 2
(20.15)
und damit
G
D1 D 2 J .
(20.16)
Mit dem Brechungsgesetz folgt
sin D 2
nPr i sin E 2 nL
nPr i sin(J E1 ) nL
sin D 2
nPr i n sin J cos E1 Pr i sin E1 cos J nL nL
(20.17)
Abermalige Benutzung des Brechungsgesetzes führt zu
sin D 2
nPr i n2 sin J 1 2L sin 2 D1 sin D1 cos J nL nPr i
sin D 2
n2 sin J Pr2 i sin 2 D1 sin D1 cos J nL
(20.18)
Setzen wir D 2 in (20.16) ein, so folgt für die Strahlablenkung
G
§
D1 J arcsin ¨ sin J ¨ ©
· nPr2 i sin 2 D1 sin D1 cos J ¸ . 2 ¸ nL ¹
(20.19)
Mit zunehmendem Einfallswinkel wird G zunächst kleiner, erreicht ein Minimum, und wächst dann wieder an. Wir wollen die Minimumbedingung berechnen. Dazu bilden wir die Ableitung d G / dD1 und setzen diese gleich null. Mit (20.16) folgt
dG d D1
1
dD 2 d D1
0.
(20.20)
20 Geometrische Optik
601
Schreiben wir
dD 2 d D1
dD 2 d E 2 d E1 . d E 2 d E1 dD1
Aus dem Brechungsgesetz sin D 2
cos D 2 dD 2
n sin E 2 , n
nPr i / nL folgt nach Differentiation nach E 2
n cos E 2 d E 2 und analog cos D1dD1
Außerdem ergibt sich aus J
d E2 d E1
(20.21)
n cos E1d E1 .
(20.22)
E1 E 2 , da J nicht von E1 abhängt,
1 .
(20.23)
Berücksichtigen wir diese drei Ausdrücke in (20.21), so erhalten wir
dD 2 d D1
cos D1 cos E 2 . cos E1 cos D 2
(20.24)
Setzen wir dies in (20.20) ein, so ergibt sich
dG d D1
1
cos D1 cos E 2 cos E1 cos D 2
0
(20.25)
Eliminieren wir E1 , E 2 mittels des Brechungsgesetzes, so resultiert als Minimumsbedingung
(n 2 1)(sin 2 D1 sin 2 D 2 ) 0 .
(20.26)
Da n z 1 ist, folgt
D1 D 2 .
(20.27)
Es ist ferner d 2G / dD12 ! 0 , so dass ein Minimum vorliegt. Der Fall minimaler Ablenkung bedeutet, dass der Strahl im Prisma senkrecht auf der brechenden Kante steht, das Prisma also symmetrisch durchläuft (Abb. 20.11). Nach Abb. 20.10 wird in diesem Fall E1 J / 2 und damit mit (20.15)
D1
1 (G min J ) , 2
(20.28)
602
20 Geometrische Optik
Setzen wir dies in das Brechungsgesetz ein, so folgt g
a
b
n
b
a
Abb. 20.11: Beim Minimum der Ablenkung verläuft der Strahl in einem gleichschenkligen Prisma parallel zur Basis
20.5
sin D min sin J / 2
sin (G min J ) / 2 sin J / 2
.
(20.29)
Durch Messung des Einfallswinkels beim Minimum der Ablenkung, der sehr genau eingestellt werden kann, und des brechenden Winkels lässt sich der Brechungsindex des Prismenmaterials bestimmen. Ein Hohlprisma, dessen brechende Flächen aus planparallelen Platten bestehen, eignet sich auch zur Untersuchung von Flüssigkeiten. Die Strahlablenkung selbst folgt aus (20.29) zu
G min
2arc sin n sin J / 2 .
(20.30)
Linsen
Die meisten optischen Instrumente sind aus Linsen aufgebaut, z.B. Lupen, Mikroskope, Fotoapparate, Fernrohre und Projektoren. Es ist daher wichtig, ihre Abbildungseigenschaften näher zu untersuchen, wobei wir uns hier nur auf die Brechung durch sphärische Flächen beschränken. Linsen können unterschiedlich dick und auf ihren beiden Seiten unterschiedlich gekrümmt sein. (Abb. 20.12). Ist der größte Abstand d zwischen den zwei Seiten sehr klein gegenüber der Brennweite, so sprechen wir von dünnen Linsen. Bei ihnen können die beiden
Abb. 20.12: Zusammenstellung der unterschiedlichen Linsentypen
R1 > 0
R1 = 0
R1 > 0
R1 < 0
R2 < 0
R2 < 0
R2 < 0
R2 > 0
R1 > R 2
R1 = R 2
R1 = R 2
R1 > R 2 > 0
brechenden Flächen in den meisten Fällen durch eine solche in der Mittelebene der Linse ersetzt werden. Dadurch sind ihre Eigenschaften leicht zu übersehen.
20 Geometrische Optik
603
20.5.1 Brechung an einer sphärischen Fläche Stellen wir uns einen durch ein Glas ausgefüllten Halbraum vor, der auf der linken Seite von einer sphärischen Fläche mit Radius R begrenzt ist (Abb. 20.13). Ein achsennaher Lichtstrahl parallel zur Symmetrieachse im Abstand y falle auf die Grenzfläche. Der Brechungsa P index von Luft sei mit n1 bezeichnet, der des n2 Glases mit n2. Der Lichtstrahl wird an der h n b Grenzfläche im Punkt P gebrochen und 1 R schneidet die Achse im Abstand f von S im F M Punkt F. Da y << R ist, kann der Bogen SP f ausgedrückt werden durch
p SP
RD | f J
f (D E )
Abb. 20.13: Zur Brechung an einer sphärischen Fläche
Daraus folgt für f
f
D D E
(20.31)
R
1
E 1 D
R.
(20.32)
Wir drücken den Quotienten durch das Brechungsgesetz aus. Da nach Voraussetzung D , E klein sind, folgt
D n2 | . E n1
(20.33)
Damit ergibt sich für f
f
n2 R. n2 n1
(20.34)
Die Größe f ist unabhängig von Einfalls- und Brechungswinkel, alle paraxialen Parallelstrahlen schneiden sich im Punkt F. Wir bezeichnen ihn deswegen als Brennpunkt, f ist die Brennweite im Medium. Analog ergibt sich bei umgekehrtem Strahlengang vom Medium 2 nach 1
f
n1 R. n1 n2
(20.35)
Wir denken uns jetzt einen Achsenpunkt Pa im Abstand a von S auf einen Achsenpunkt Pb im Medium im Abstand b von S abgebildet (Abb. 20.14). Wir fragen danach, wie a, b und f
604
20 Geometrische Optik
miteinander verknüpft sind. Aus den Winkelsummen in den Dreiecken PAPM bzw. MPPB entnehmen wir D G H und E G J ,
n1
a
S
n1 (G H ) | n2 (G J ) .
g
M b
a
Ersetzung im Brechungsgesetz ergibt
n2
h R b d
e PA
P
PB
Abb. 20.14: Zur Ableitung der Abbildungsgleichung für eine brechende Fläche
n1 n2 a b
n2 n1 . R
(20.36)
Der Bogen PS kann näherungsweise ausgedrückt werden durch
p PS
RG | bJ | aH .
(20.37)
Berücksichtigung von G , H , J in (20.36) ergibt (20.38)
Ersetzen wir auf der rechten Seite R durch (20.34) bzw. (20.35), so erhalten wir als Verknüpfung zwischen a, b und f
n1 n2 a b
n2 f2
n1 . f1
(20.39)
20.5.2 Dünne Linsen Eine Konvexlinse (Abb. 20.12, Mitte) möge von Luft umgeben sein, so dass wir für die beiden Brechungsindizes nLuft 1 und n Lin n setzen können. Mindestens eine der Grenzflächen ist (im Rahmen unserer Behandlung) sphärisch gekrümmt. Den Krümmungsradius definieren wir als positiv, wenn der Krümmungsmittelpunkt auf der dem Gegenstand abgewandten Seite liegt. Die Grenzfläche heißt dann konvex gekrümmt. Liegt der Krümmungsmittelpunkt auf der dem Gegenstand zugewandten Seite, so ist der Krümmungsradius negativ und die Grenzfläche nennen wir konkav gekrümmt. Wie oben schon festgelegt, sehen wir die Linse als dünn an, wenn ihre Dicke d im Bereich der Symmetrieachse sehr viel kleiner als die Brennweiten ist. Die optische Abbildung eines Gegenstandes durch eine beiderseits gekrümmte Linse kommt also durch sukzessive Teilabbildungen durch die zwei Grenzflächen zustande (Abb. 20.15). Für die erste Grenzfläche gilt gemäß (20.38)
1 n a1 b1
n 1 . R1
(20.40)
20 Geometrische Optik
605
Das Bild B´ des Gegenstandes G fungiert für die zweite Grenzfläche als Gegenstand G´. Es ist jetzt n1
1 , a2
n, n2
(b1 d ) .
Da der Krümmungsradius negativ ist, folgt
n 1 b1 d b2
1 n . R2
R2
(20.41)
R1
G
n
1 d b2 1 b1
b1
a1
Dies lässt sich schreiben als
n b1
d
B
B1
a2 b2
1 n . R2
a
b
Abb. 20.15: Zur Ableitung der Abbildungsgleichung für eine dünne Linse
(20.42) Multiplikation mit (1 d / b1 ) führt zu
n 1 b1 b2
1 n d §1 n 1 · 1 n d n ¨ ¸ R2 b1 © R2 b2 ¹ R2 b1 (b1 d )
(20.43)
Einsetzen von (20.40) auf der linken Seite ergibt
1 1 a1 b2
§ 1 1 · d n . (n 1) ¨ ¸ © R1 R2 ¹ b1 (b1 d )
(20.44)
Definieren wir Gegenstands- und Bildweite durch die jeweiligen Abstände von der Linsenmitte aus
a
a1
d 2
und
b
b2
d , 2
(20.45)
und berücksichtigen, dass für dünne Linsen d a1 , b2 ist, so folgt
1 1 a b
§ 1 1 · ¸¸ . (n 1) ¨¨ © R1 R2 ¹
(20.46)
606
20 Geometrische Optik
Wir drücken die rechte Seite durch die Brennweite aus. Dazu betrachten wir einen achsenparallelen Strahl ( a f ), der von links auf die Linse fällt. Er schneidet die Symmetrieachse im Punkt b f . Gl. (20.46) ergibt
1 f
§ 1 1 · (n 1) ¨ ¸ . © R1 R2 ¹
(20.47)
Damit wird (20.46) zur Abbildungsgleichung dünner Linsen für paraxiale Strahlen:
a
x
b f´
f
1 1 a b
1 . f
x´
Abb. 20.16: Ein Gegenstand zwischen der einfachen und doppelten Brennweite wird vergrößert und
(20.48)
Zur zeichnerischen Ermittlung eines Bildes lassen sich wie beim sphärischen Spiegel Parallel-, Brenn- und Mittelpunktsstrahl heranziehen (Abb. 20.16).Die Versetzung des Letzteren kann dabei vernachlässigt werden. Der Abbildungsmaßstab folgt mit Hilfe des Strahlensatzes zu
VA
B G
b a
f f a
(20.49)
Ist a > f, so entstehen reelle, umgekehrte Bilder des Gegenstandes; für a d f ergeben sich virtuelle, aufrecht stehende Bilder. Die Abbildungsgleichung nimmt eine besonders einfache Form an, wenn wir statt a und b die auf die Brennpunkte bezogenen Werte von Gegenstands- und Bildweite einführen.
a
f x und b
f xc .
(20.50)
Wir erhalten dann, je nachdem die Brechungsindizes auf den beiden Seiten der brechenden Fläche gleich oder unterschiedlich sind, die sog. Newtonsche Abbildungsgleichung
xx '
f2
bzw.
x a xb
fa fb
(20.51a,b)
20 Geometrische Optik
607
20.5.3 Dicke Linsen Bei dünnen Linsen konnten wir die Brechung des Lichtstrahls an den beiden Grenzflächen näherungsweise durch eine fiktive Brechung an der Mittelebene ersetzen. Ist aber die Dicke der Linse gegenüber den Krümmungsradien nicht mehr vernachlässigbar, so ist dies nicht mehr statthaft. Fassen wir wieder einen von links kommenden Parallelstrahl ins Auge (Abb. 20.17). Nach der Brechung an den zwei Flächen geht er als Brennstrahl durch den bildseitigen Brennpunkt F´ der Linse. Sein Ort ist bestimmt durch
Abb. 20.17: Zur Ableitung der Brennweiten f und f´ und der Hauptebenen H, H´ bei einer dicken Linse
F2cF c [ ;
f1 n1
f1¢
F1¢
d
F2
f2
f 2¢
F2¢
n1¢ = n 2
f 2 f 2c
[G
x
F¢
f¢
H¢
n ¢2
(20.52)
Die zweite Beziehung entsteht durch Anwendung der Newtonschen Abbildungsgleichung auf die Abbildung von F1c durch die zweite Fläche. Die bildseitige Brennweite der Linse wird festgelegt durch den Abstand des Brennpunktes F´ von der bildseitigen Hauptebene H´. Letztere wird definiert durch die auf der Symmetrieachse senkrecht stehende Ebene durch den Schnittpunkt (als Hauptpunkt bezeichnet) des Parallelstrahles mit dem durch F´ gehenden Brennstrahl. Da wir paraxiale Strahlenführung voraussetzen, erhalten wir mittels des Strahlensatzes für die Brennweite f´ (f´ < 0)
f ' f 2c [ Setzen wir darin
f '1 . f2 G
[
(20.53)
aus (20.52) ein, so ergibt sich nach Ausklammern von f '2
f ' f '1 f '2
1 f2 / G f2 G
f '1 f '2
G
.
(20.54)
Aus Abb. 20.17 entnehmen wir für G
G
d f '1 f 2 ,
wobei d die Dicke der Linse ist.
(20.55)
608
20 Geometrische Optik
Folglich erhalten wir für die bildseitige Brennweite
f'
f '1 f '2 , f '1 f 2 d
(20.55)
Analog ergibt sich für die gegenstandseitige Brennweite
f
f1 f 2 . f '1 f 2 d
(20.56)
Diese Beziehungen enthalten nicht den Abstand von der Symmetrieachse. Im Rahmen der paraxialen Näherung geht also jeder anfängliche Parallelstrahl durch F´ bzw. durch F. Für das Verhältnis f´/f folgt
f '1 f ' 2 f1 f 2
f' f
n'1 n' 2 n1 n2
n' 2 . n1
(20.57)
Sind die Medien auf beiden Seiten der Linse gleich, so ist f f ' . Wir wenden uns nun der Berechnung der Abstände h bzw. h´ der Hauptebenen von den Scheitelpunkten S bzw. S´ zu. Der bildseitige Hauptebenenabstand ist nach Abb. 20.17
h'
f 2 ' [ f ' .
(20.58)
Einsetzen von [ aus (20.52) und von G aus (20.54) resultiert in
h'
f 2 '
f' ( f '1 f 2 ) f '1
f 2 '
f' (d G ) , f '1
(20.59)
Abermaliges Einsetzen von G führt zu
h'
f' d f '1
n1c f ' d. n1 f1
(20.60)
Entsprechend ergibt sich für die gegenstandseitige Brennweite
h
f d f2
n2 f d. n2c f '2
(20.61)
Ist die Linse von Luft umgebe ( n1 n '2 1 ), so erhalten wir, wenn wir für den Brechungsindex n '1 n2 des Linsenmaterials den Buchstaben n verwenden, für die reziproke Brennweite
20 Geometrische Optik
1 f
609
§ 1 1 (n 1) d · (n 1) ¨ ¸. nR1 R2 ¹ © R1 R2
(20.62)
Die Abstände der Hauptebenen von den Scheiteln der Linse ergeben sich zu
h
(n 1) f d nR2
h'
und
(n 1) f d nR1
(20.63a/b)
H1
H¢
H
H2
1 S¢
F
F
S
2 h
d
h
R1 > R 2 > 0; f < 0
f
f a
b
Abb. 20.18: Von Luft umgebene symmetrische Linse, bei der die Hauptebenen innerhalb der Linse liegen auch
Abb. 20.19: Lage der Hauptebenen bei einer Konvexlinse
Die Hauptebenen für eine bikonvexe Linse liegen bei nicht zu großer Dicke im Bereich der Linse (Abb. 20.18). Für andere Linsentypen finden wir sie aber auch außerhalb des Glaskörpers, wie das Beispiel in Abb. 20.19 zeigt. Bei der Bildkonstruktion können wir genau so vorgehen wie bei dünnen Linsen, wenn Gegenstands- und Bildweite wie die Brennweiten von den Hauptebenen aus gemessen werden (Abb. 20.18). Zwischen diesen verlaufen die Strahlen parallel zur Symmetrieachse. Für den Abstand x zwischen Gegenstand G und gegenstandseitigen Brennpunkt F sowie der Abstand x´ zwischen Bild B und bildseitigem Brennpunkt F´ erhalten wir nach dem Strahlensatz
x f
G B
und
x' f'
B , G
xx'
ff'
f2.
(20.64)
Setzen wir wie in Kap. 20.5.2 x = a – f und x´ = b – f’ = b – f, so ergibt sich wiederum die bekannte Linsengleichung, die also so auch für dicke Linsen gilt.
1 1 a b
1 . f
(20.65)
610
20 Geometrische Optik
20.5.4 Linsensysteme Optische Instrumente bestehen im Allgemeinen aus mindestens zwei Linsen. Auch zur Korrektur von Abbildungsfehlern werden Linsenkombinationen verwendet. Es ist daher zweckmäßig, dass wir uns zunächst mit deren Abbildungseigenschaften vertraut machen Als Erstes fragen wir nach der Brennweite eines Systems aus zwei dünnen Linsen, die im Abstand d voneinander angeordnet sind (Abb. 20.20). Wir können die gerade erarbeiteten Ergebnisse auf diesen Fall übertragen, wenn wir den dort verwandten Abstand d der
L1
L2
d
f1 a2
f2
f2
b2
Abb. 20.20: Zur Brennweite eines Systems aus zwei dünnen Bikonvexlinsen (Sammellinsen) und
brechenden Flächen als Abstand der beiden dünnen Linsen voneinander auffassen. Da sich die Linsen an Luft befinden sollen, haben wir zu setzen
n1 ' n1 und n 2 ' n2 .
(20.66)
In (20.55) und (20.56) werden damit f´1 = f1 und f´2 = f2. Die Brennweite des Systems ist folglich
f
f'
f1 f 2 . f1 f 2 d
(20.67)
Eine Kombination aus zwei dünnen bikonvexen Linsen wirkt nur als Sammellinse, solange der Nenner positiv ist. Wird ihr Abstand d > f1+ f2 gewählt, so bilden sie eine Zerstreuungslinse. Werden die Linsen aneinander geschoben ( d o 0 ), so ergibt sich die Brechkraft des Systems als Summe der Brechkräfte der einzelnen Linsen.
1 f
1 1 . f1 f 2
(20.68)
Die Brechkräfte zweier dicht hintereinander angeordneter zentrierter Linsen addieren sich.
20 Geometrische Optik
611
d* F1¢ F2 Abb. 20.21: Zur Brechkraft zweier dicht hintereinander angeordneter dicker Bikonvexlinsen
h1 h1¢
f1¢
F¢
F2¢
f2
h 2 h ¢2 f 2¢
b¢2
Dies gilt auch für dicke Linsen, wie wir jetzt zeigen wollen. Die Brennweiten seien f1 und f2 (Abb. 20.21). Ihr Abstand sei durch die Entfernung d* der einander gegenüber liegenden Hauptebenen festgelegt. Ein von links einfallender Parallelstrahl wird in den bildseitigen Brennpunkt F1c abgelenkt. Nach der Brechung durch die zweite Linse L2 schneidet er als Brennstrahl der Linsenkombination die Symmetrieachse im Brennpunkt F c . Auf diese zweite Linse bezogen, ist also F c das Bild des als Gegenstand fungierenden „Zwischenbildes“ F1c . Die Gegenstandsweite bezüglich L2 ist a2 d * f1 . Setzen wir a2 in die Abbildungsgleichung ein, so erhalten wir für die entsprechende Bildweite b2
b2
a2 f 2 a2 f 2
(d * f1 ) f 2 d * f1 f 2
f1 f 2 d * f2 . f1 f 2 d * f1 f 2 d *
(20.69)
Definieren wir den ersten Term als die Brennweite f des Systems, so muss der zweite Term gleich dem Abstand der neuen bildseitigen Hauptebene von der äußeren Hauptebene H 2c der zweiten Linse sein. Die Rechnung verläuft wie in Kap. 20.5.3 und bestätigt die Behauptung. Definieren wir den ersten Term als die Brennweite f des Systems, so muss der zweite Term gleich dem Abstand der neuen bildseitigen Hauptebene von der äußeren Hauptebene H 2c der zweiten Linse sein. Die Rechnung verläuft wie in Kap. 20.5.3 und bestätigt die Behauptung.
20.5.5 Abbildungsfehler Bei der Abbildung eines Gegenstandes durch Hohlspiegel und Linsen hatten wir uns auf die paraxiale Näherung beschränkt. In diesem Fall wird ein Punkt eines senkrecht zur Symmetrieachse liegenden Gegenstandes (näherungsweise) in einen Punkt einer zur Gegenstandsebene parallelen Bildebene abgebildet. Bei Linsen gilt das aber nur bei der Verwendung von monochromatischem Licht. Besteht das Licht aus Wellen verschiedener Wellenlängen, so treten farbige Säume und dergleichen auf. Sie kommen durch die Dispersion des Linsenmaterials zustande: die Brechkraft hängt von der Wellenlänge ab. Weitere Bildfehler entstehen,
612
20 Geometrische Optik
wenn Licht unter größeren Abständen von der Achse oder schief einfallende Strahlen zugelassen werden, die paraxiale Näherung also ihre Gültigkeit verliert. Auf die sphärische Abberation wurde bereits hingewiesen. Das Bild wird zunehmend unscharf und es treten Verzerrungen auf. Durch spezielle Linsenkombinationen können die einzelnen Fehler stark reduziert werden. Im Folgenden sollen die wichtigsten Abbildungsfehler erläutert werden und soweit hier möglich Maßnahmen zu ihrer Korrektur angegeben werden.
20.5.5.1 Chromatische Aberration
Als Folge der Dispersion hängt die Brennweite von der Wellenlänge des Lichtes ab. Wie wir gesehen haben, nimmt der Brechungsindex (bei normaler Dispersion) von rot nach blau zu (Kap. 19). Daher liegt der Brennpunkt für blaues Licht von der Linse aus gerechnet vor dem für rotes Licht. Diese Wellenlängenabhängigkeit lässt sich gut beobachten, wenn weißes Licht durch einen kreisförmigen Schlitz einer Blende auf eine Linse fällt (Abb. 20.22). Wird ein Schirm langsam von der Linse aus in Richtung größerer Abstände verschoben, so tritt als Bild rot zuerst ein blauer Ring mit rotem Rand und dann ein roter Ring mit blauem Rand auf. Eine Verringerung der chromatischen Aberraion ist durch Verwendung eines Linsensystems FblauFrot aus zwei Linsen mit unterschiedlichen Brechungsindizes n1 und n2 möglich. Mit einem blau solchen Achromaten kann erreicht werden, dass die Brennweite für zwei Wellenlängen (Farben) Abb. 20.22: Chromatische Aberration O A und OB gleich sind. Zur Vereinfachung der einer Linse Schreibweise führen wir eine Größe ri ein:
ri
Ri1 Ri 2 , Ri1 Ri 2
(20.70)
wobei Ri1 , Ri 2 die beiden Krümmungsradien der jeweiligen Linse i sind. Setzen wir die Linsen unmittelbar hintereinander, so ist die resultierende Brechkraft des Achromaten nach (20.67) und (20.68)
1 f
(n1 1) r1 (n2 1)r2 .
(20.71)
Damit die Brechkraft für Licht der beiden Wellenlängen O A und OB gleich ist, muss die Beziehung gelten
(n1 A 1)r1 ( n2 A 1)r2
(n1B 1)r1 (n2 B 1)r2
(20.72)
20 Geometrische Optik
613
Es folgt
r1 r2
n 2B n 2A . n1B n1A
(20.73)
Für das Verhältnis der Brennweiten der beiden Linsen folgt durch Einsetzen in (20.55) oder (20.56)
f2 f1
n 2B n 2A n 2 1 . n1B n1A n1 1
(20.74)
aa aa aa aa aa aa
Da beide Brüche positiv sind, ergibt sich, dass die Linsenkombination aus einer Sammellinse und einer Zerstreuungslinse be- Abb. 20.23: Korrektur der chromatischen stehen muss (Abb. 20.23). Sind Aberration für eine gegebene Wellenländie beiden Materialien und die ge durch Kombination einer bikonvexen gewünschte Brennweite f vorge- und einer plankonkaven Linse geben, so können die Brennweiten der Einzellinsen berechnet werden. Bei der Festlegung der Linsenradien haben wir weitgehend freie Hand. Zweckmäßigerweise werden die beiden Innenradien gleich groß gewählt, so dass die Linsen verkittet werden können. Einer der drei Radien kann dann immer noch willkürlich festgelegt werden. Das Linsensystem wirkt als Sammellinse, wenn diese die geringere Dispersion hat.
20.5.5.2 Sphärische Aberration
Schon bei der Diskussion der Abbildungseigenschaften eines sphärischen Spiegels haben wir gesehen, dass ein unendlich ferner axialer punktförmiger Gegenstand nur dann näherungsweise als Punkt abgebildet wird, wenn der Öffnungswinkel bzw. Abstand y des Strahls von der Symmetrieachse hinreichend klein ist. Im Folgenden wollen wir einen zur Achse parallelen Strahl betrachten und die Brennweite als Funktion von y für eine reflektierende und eine brechende Fläche aufschreiben. Betrachten wir zuerst einen Hohlspiegel (Abb. 20.24). Die Brennweite ist
f
R c.
Dabei bestimmt sich c mittels des Sinussatzes :
(20.75)
614
20 Geometrische Optik
c
R 2cos D
R
1 2
1 sin 2 D
R
(20.76)
y2 1 2 R
Damit ergibt sich für f
§ ¨ 1 1 R ¨1 ¨ 2 y2 1 2 ¨ R ©
f
y2 1 2 R
| 1
(20.77)
Mit wachsendem Abstand y nimmt die Brennweite ab. Für nicht zu große D bzw. y/R können wir den zweiten Faktor annähern durch
Abb. 20.24: Sphärische Aberration bei einem sphärischen Spiegel und 1
· ¸ ¸. ¸ ¸ ¹
1 y2 , 2 R2
(20.78)
womit sich für f ergibt
f a P
y
b
R
c´
F
f n1=1
n2= n
f
Abb. 20.25: Zur Ableitung der Brennweite einer sphärischen Grenzfläche bei unterschiedlichem Achsenabstand des einfallenden Parallelstrahls und
§ · sin E R ¨1 ¸ © sin D cos E sin E cos D ¹
(20.79)
Für die Brechung an einer sphärischen Grenzfläche erhalten wir, wenn der Brechungsindex des ersten Mediums n = 1 und der des zweiten Mediums n = n ist, mit Hilfe des Sinussatzes (Abb. 20.25)
g
M
R§ y2 · 1 ¨ ¸. 2 © 2R 2 ¹
R c' § sin E · R ¨1 ¸ sin J ¹ ©
§ · 1 R ¨1 ¸ © n cos E cos D ¹
§ sin E · R ¨1 ¸ sin( D E) ¹ ©
(20.80a) (20.80b)
20 Geometrische Optik
615
§ 1 R ¨1 ¨ n 1 sin 2 E 1 sin 2 D ©
§ · 1 ¨1 ¸ n 2 sin 2 D 1 sin 2 D ¹ ©
· ¸. ¸ ¹
(20.80c)
§ ¨ 1 R ¨1 2 ¨ y y2 ¨ n 1 2 2 1 2 n R R ©
· ¸ ¸ ¸ ¸ ¹
(20.80d)
Dieser Ausdruck ist in Abb. 20.26 für R = 60 mm und n = 1,5 als Funktion von y aufgetragen. Es zeigt sich, dass auch in diesem Fall die Brennweite mit y abnimmt. Um die Abhängigkeit besser überblicken zu können, entwickeln wir wie oben die Wurzel bis zum zweiten Glied. § · 2nR 2 R ¨1 2 2 2 2 2 ¸ n R y nR ny 2 2 © ¹ 2
2
2
§ n(2nR y ) y · . R¨ 2 2 ¸ © (n 1)(2nR y ) ¹
f
§ · ¨ n ¸ 1 ¸ R¨ ¨ (n 1) 2n(n 1) R 2 ( 1 1 ) ¸ ¨ y 2 2nR 2 ¸¹ © (20.81)
Der zweite Term stellt das Korrekturglied erster Ordnung für die jeweilige Brennweite dar.
Brennweite (mm)
f
180 160 140 120 0.0 0.2 0.4 0.6 0.8 Relativer Strahlabstand y/R Abb. 20.26: Brennweite in Abhängigkeit des relativen Achsenabschnittes
20.5.5.3 Koma
Bei der Diskussion der sphärischen Aberration haben wir Strahlen symmetrisch zur Achse der brechenden Fläche betrachtet. Jetzt soll ein außeraxialer Gegenstandspunkt durch ein Parallelbündel bzw. ein weites Strahlenbündel abgebildet werden. Die Brechwinkel zugehöriger Strahlen diesseits und jenseits der Mittellinie (Abb. 20.27) sind jetzt unterschiedlich. Daher schneiden die Strahlen die Mittellinie an unterschiedlichen Stellen. Der Gegenstandspunkt wird verzerrt abgebildet. Aus einem Punkt wird eine einem Kometenschweif - ähnelnde Figur, die als Koma (vom Griechischen „Haar“) bezeichnet wird. Der Abbildungsfehler heißt KomaFehler. Ein Beispiel zeigt Abb. 20.28.
616
Abb. 20.27: Zur Entstehung des Komafehlers einer sphärischen Linse
20 Geometrische Optik
Abb. 20.28: Komafehler
20.5.5.4 Astigmatismus
Bei der Abbildung eines Gegenstandspunktes außerhalb der Symmetrieachse der Linse tritt auf Grund des unsymmetrischen Strahlengangs bereits bei kleinen Öffnungswinkeln ein weiterer Bildfehler auf. Statt eines Punktes entstehen zwei senkrecht zueinander liegende Bildlinien. Betrachten wir dazu Abb. 20.29. In dem vom abzubildenden Punkt G ausgehenden Strahlenbüschel sind zwei Ebenen hervorgehoben. Die eine Ebene ist durch die Punkte G, P1 , P2 festgelegt. Sie enthält die Symmetrieachse der Linse und die Mittelachse des Büschels und heißt Meridionalebene. Die andere, ebenfalls die Büschelachse enthaltene Ebene liegt senkrecht zu der ersten. Sie wird als Sagittalebene bezeichnet. Die Linsenkrümmungen in diesen Ebenen sind unterschiedlich. In der Meridionalebene wird der Strahl GP1 stärker, der Strahl GP2 schwächer als der Strahl GD gebrochen. Alle drei schneiden sich im Punkt GM . Die Strahlen in der Sagittalebene vereinigen sich aber wegen der schwächeren Brechung erst im Punkt BS , bilden also in der Bildebene von BM eine Linie. Im Punkt BS andererseits sind die Strahlen in der Meridionalebene bereits wieder zu einer Linie auseinandergelaufen. Ein außeraxialer Punkt wird also als zwei zueinander senkrecht liegende Linien in unterschiedlicher Entfernung von der Linse abgebildet. Die Differenz der Bildorte heißt astigmatische Differenz. Eine Korrektur kann durch eine Kombination einer konvexen mit einer Zylinderlinse erreicht werden. Letztere fokussiert ja nur die Strahlen, die senkrecht zur Zylinderachse liegen.
20 Geometrische Optik
617
Meridianebene
Bmeri
Bsag
Sagittalebene
Meridian
G
Abb. 20.29: Astigmatismus: Aus einem außeraxialen Punkt G entstehen in unterschiedlicher Entfernung zwei senkrecht zueinander liegende Linien BM und BS und
20.5.5.5 Bildfeldwölbung
Auch bei korrigiertem Astigmatismus erscheint das Bild von Punkten, die in einer zur Symmetrieachse der Linse senkrechten Ebene in unterschiedlicher Entfernung von der Achse liegen, nicht wieder in einer Ebene, sondern auf einer gewölbten Fläche (Abb. 20.30). Das liegt wieder an der unterschiedlichen Brechung der unter verschiedenen Winkeln einfallenden Strahlen. Auch die Bildfeldwölbung kann durch die Kombination verschiedener Linsen korrgiert werden
618
20 Geometrische Optik
a)
BiSchS BiSchM
b)
P1 P2 P3 Abb. 20.30: Bildfeldwölbung; a) Entstehung b) Je nach Entfernung des Bildschirms sind die abgebildeten Ringe unterschiedlich scharf
20.5.5.6 Verzeichnung
Zur Verringerung der sphärischen Aberration können durch eine kreisförmige Blende die Randstrahlen ausgeblendet werden. Dadurch tritt aber ein zusätzlicher Fehler auf. Der
Abb. 20.31: Tonnenförmige Verzeichnung
Abb. 20.32: Kissenförmige Verzeichnung
Abbildungsmaßstab ändert sich nämlich mit zunehmendem Einfallswinkel. Je nachdem die Blende vor oder hinter der Linse steht, kommt es zu einer tonnen- oder einer kissenförmigen Verzerrung, die als Verzeichnung bezeichnet wird (Abb. 20.31 und 20.32). Abhilfe kann geschaffen werden durch Benutzung eines Systems aus mindestens zwei Linsen, zwischen denen die Blende steht.
20 Geometrische Optik
619
20.5.5.7 Aplanatische Abbildung
In der Praxis geht es darum, nicht nur einen axialen Punkt, sondern auch dessen Umgebung verzerrungsfrei abzubilden. Zur Erzielung einer hinreichend großen Lichtstärke muss dabei der Öffnungswinkel möglichst groß sein. Das ist nur möglich, wenn die Abbesche Sinusbedingung (E. Abbe, 1840-1905) eingehalten wird. Befinden sich Gegenstand G und Bild B in Luft mit n = n´ = 1, lautet sie
sin u sin u c
B . G
(20.82)
Abb. 20.33: Zur Abbeschen Sinusbedingung für aplanatische Abbildung und
G u
u¢
B
Die Winkel u und u´ beschreiben die Öffnungswinkel zugehöriger Strahlen links und rechts der Linse (Abb. 20.33). Eine Abbildung unter Einhaltung der Sinusbedingung wird aplanatische Abbildung genannt. Soll ein ganzes Volumenelement mittels eines weit geöffneten Strahlenbüschels ohne Verzerrungen abgebildet werden, so müssen auch zwei benachbarte Punkte auf der Symmetrieachse verzerrungsfrei abgebildet werden. Die Bedingung dafür ergibt sich zu
sin 2 (u / 2) sin 2 (u c / 2)
nc dxc . n dx
(20.83)
Die Ableitung findet sich als Ergänzung 2 am Ende des Kapitels. Die beiden Ausdrücke widersprechen sich; ein Volumenelement kann also mittels großer Öffnungswinkel nicht verzerrungsfrei abgebildet werden. Das ist nur im Rahmen der paraxialen Näherung möglich.
20.5.6 Die Wirkung von Blenden Blenden im Strahlengang eines optischen Systems haben große Bedeutung. Wie aus der Entstehung der einzelnen Abbildungsfehler hervorgeht, können fast alle durch eine Verringerung der Öffnung geeigneter Blenden reduziert werden. Damit steigt auch die Schärfentiefe einer Abbildung. Natürlich geht das auf Kosten der Helligkeit. Blenden bestimmen darüber hinaus die Größe des Gesichtsfeldes. Dabei hängt die Güte der Abbildung entscheidend von
620
20 Geometrische Optik
ihrer Positionierung ab. Im Folgenden werden Öffnungsblende (Aperturblende) und Gesichtsfeldblende besprochen. Zunächst sei aber auf die Schärfentiefe bei der Abbildung durch eine Linse (bzw. eines Hohlspiegels) eingegangen. Wir denken uns dazu einen Gegenstand G0 dessen scharfes Bild in der Bildebene B0 erscheint. Bildfehler bleiben unberücksichtigt. Bei G einer Verschiebung des Gegenstandes in Richtung B v v GhG0 oder entgegengesetzt zur Linse entsteht aus einem d Punkt ein verwaschenes Scheibchen mit DurchF D F messer d. Diejenige Abweichung von a0, bei der das Scheibchen gerade so groß wie das Auflösungsvermögen des Auges in der deutlichen Sehgv bh g0 b0 weite ist, wird als Schärfentiefe bezeichnet. Wir gh bv; wollen diesen Bereich 'x zu beiden Seiten einer Blende Bildebene gewählten Gegenstandsweite g0 ermitteln Dazu denken wir uns auch die Brennweite sowie einen Abb. 20.34a: Zur Erläuterung des Blendendurchmesser DBl festgelegt, so dass wir Schärfentiefenbereichs die zugehörige Bildweite b0 ausrechnen können. Bei bekanntem Auflösungsvermögen lassen sich mit Hilfe des Strahlensatzes die Begrenzungen des bildseitigen Schärfebereiches (Abb. 20.34a) bestimmen. Das B -Zeichen steht für die Indizes l, r. 1
b l,r
§ d · b0 ¨1 B ¸ ; © D Bl ¹
Mit der Linsengleichung folgt für die Schärfentiefen 'x h
'x l
b0 f 2 d ; 'x r b0 f DBl b0 D Bl f df
a h a 0 und 'x v
a0 av
b0 f 2 d . b0 f DBl b0 DBlf df
Infolge des verschiedenen Vorzeichens des letzten Terms im Nenner unterscheiden sich die beiden Bereiche etwas.
20.5.6.1 Öffnungsblende
Die Öffnungsblende bestimmt die Helligkeit des Bildes. In Abb. 20.34b ist eine solche eingezeichnet. Es ist offensichtlich, dass sie, in Verbindung mit der vor ihr stehenden Linse, den maximalen Öffnungswinkel auf der Seite des Gegenstandes festlegt. Die von den beiden Linsen erzeugten Bilder der Blende heißen Pupillen. Das auf der Gegenstandseite des optischen Systems entstandene Bild wird als Eintrittspupille bezeichnet, das auf der Bildseite als Austrittspupille. Wird wie in Abb. 20.34c nur eine Linse verwendet, so
20 Geometrische Optik
621
fallen Öffnungsblende und Eintrittspupille (oder Öffnungsblende und Austrittspupille) zusammen. Der abzubildende Gegenstand sei als so klein vorausgesetzt, dass von allen seinen Punkten (gleich viel) Strahlungsenergie den Bildschirm erreicht. Das Verhältnis des Durchmessers der Eintrittspupille zur Brennweite einer Objektivlinse wird als Öffnungsverhältnis bezeichnet, wobei der Gegenstand als im Unendlichen liegend vorausgesetzt ist. Sein Kehrwert heißt Blendenzahl.
B
G E-Pup
Ö-Ble
A-Pup
Abb. 20.34b: Abbildung durch zwei Linsen: Eintrittspupille, Öffnungsblende und Austrittspupille
G Ö-Ble
B A-Pup
Abb. 20.34c: Bei der Abbildung mit nur einer Linse fallen Eintrittspupille und Öffnungsblende zusammen
20.5.6.2 Gesichtsfeldblende
Wir wollen jetzt einen transparenten ausgedehnten flächenhaften Gegenstand G betrachten (Abb. 20.35), der von einer punktförmigen Lichtquelle beleuchtet wird. Er wird von der Linse L in die Bildebene B abgebildet. In ihr befinde sich eine Blende GB L GB, die das zur Abbildung beitragende Lichtbündel begrenzt. Es B G wird also nur der Teil des Gegenstandes abgebildet, der innerhalb dieses Lichtbündels liegen. Die Blende fungiert als Gesichtsfeldblende. Es kann eine reale Blende sein, oder auch nur ihr Bild. Abb. 20.35: Wirkung der Gesichtsfeldblende GB Das gegenstandseitige Bild eines optischen Systems heißt Eintrittsluke, das bildseitige Austrittsluke. In Abb. 20.36 befinde sich im Bildpunkt der Lichtquelle eine Öffnungsblende ÖB. Die Eintrittspupille E-Pup fällt also mit der Quelle zusammen. Jeder im Gesichtsfeld liegende Punkt des Gegenstandes wird durch ein Lichtbündel, dessen Öffnungswinkel durch
622
20 Geometrische Optik
Abb. 20.36: Übersicht über die Lage der in den Abb. 20.34/35 eingeführten Blenden
E-Pup E-Luk
ÖB GB ZB-Eb A-Pup A-Luk
den Blendendurchmesser bestimmt ist, in der Ebene ZB abgebildet. Durch die dort angeordnete Gesichtsfeldblende kann das durch eine zweite Linse entstandene Bild scharf begrenzt werden. Austrittspupille und Austrittsluke sind aus Abb. 20.36 ebenfalls zu entnehmen. – Ist nur eine Linse vorhanden, so fallen Gesichtsfeldblende und Eintrittsluke (oder Gesichtsfeldblende und Austrittspupille) zusammen.
20.6 Anwendung der Strahlenoptik auf die Atmosphäre Das Zusammenwirken von Reflexion, Brechung und Beugung in der Atmosphäre führt zu einer Reihe von optischen Erscheinungen, von denen wir das des Himmelsblaus und einer roten Sonne bereits kennen gelernt haben. Hier wollen wir zwei weitere Phänomene erläutern, die vollständig oder in ihren wesentlichen Zügen auf der Grundlage der Strahlenoptik erklärt werden können. Es sind dies die Auswirkungen der Lichtbrechung und -spiegelung sowie das Auftreten des Regenbogens.
20.6.1 Lichtablenkung in der Atmosphäre Wie uns die barometrische Höhenformel zeigt, nimmt die Dichte der Luft mit wachsender Höhe ab. Damit verringert sich auch der Brechungsindex n. Ein Lichtstrahl, der von der Sonne oder einem Fixstern schräg in die Atmosphäre eintritt, wird daher zur Erdoberfläche hin gekrümmt. Bei hohem Luftdruck und niedrigen Temperaturen am Boden kann diese als atmosphärische Refraktion bezeichnete Abweichung große Werte annehmen. Der Krümmungsradius ergibt sich aus der Bedingung, dass bei einer radialen Abhängigkeit n = n(r) die optischen Wege ds1 und ds2 zwischen zwei Phasenflächen eines Parallelstrahlbündels gleich sein müssen (Abb. 20.37).
20 Geometrische Optik
623
(n-dn) ds1
Scheinbare Sternposition
a)
b)
Phasenflächen
dr n ds2
Zenit wirkliche Sternposition
s
r B Erde
dj
Abb. 20.37: a) Astronomische Refraktion des Sternenlichtes; b) Krümmung eines Lichtstrahls durch einen radialen Dichtegradienten
Es sind
ds1
n( r ) r d M ;
ds2
n(r dr ) (r dr ) dM ,
(20.84)
so dass wir erhalten
r
n . dn / dr
(20.85)
Setzen wir dies in die linke obere Gleichung ein, so ergibt sich längs des Weges ds eine Strahlablenkung
dM
1 dn ds . n dr
(20.86)
Der Winkel zwischen dem Zenit und der geraden Verbindungslinie zwischen Beobachtungsort und Stern wird als Zenitdistanz bezeichnet. Es ist als zwischen scheinbarer und wirklicher Zenitdistanz zu unterscheiden. Für Winkel ] 80q lässt sich die atmosphärische Refraktion aus dem Ausdruck r 0,9 tan ] berechnen. Bei größeren ] müssen vertikale Temperaturschwankungen berücksichtigt werden. Auf die Krümmung der Lichtstrahlen ist auch das Auftreten von Luftspiegelungen zurückzuführen, etwa über einem heißen Straßenbelag oder in entsprechenden Wüstengegenden. Die meisten von uns haben sicher mit den erschöpften Reisenden gefühlt, denen eine Fata Morgana eine nahe kühlende Oase vortäuschte! In Abb. 20.38a ist die Situation nachgestellt. Von einer verlockend sprudelnden Quelle ausgehende gekrümmte Lichtstrahlen erreichen eine Karawane im Punkt B. Da die Reisenden mit
624
20 Geometrische Optik
ihren Augen der Krümmung nicht folgen können, erscheint vor Ihnen ein über dem Boden schwebendes umgekehrtes Bild der labenden Quelle
grad n
Wolkenloser, heller Himmel grad n Gleißend heller Bereich
Heiße Autobahn
Abb. 20.38a) dn/dr > 0: Fata Morgana einer Kühlung verheißenden nahen Oase; b) dn/dr < 0 Über heißen Flächen kommt auch der Fall vor, dass sich eine bodennahe heiße Luftschicht bildet, d.h. der Dichtegradient nimmt mit wachsender Höhe zunächst zu (Abb. 20.38b). Fällt ein Lichtbündel unter kleinen Winkeln ein, so wird er von der Erde weg gekrümmt. Das Auge des Beobachters sieht ein aufrechtes Bild des Gegenstandes im Punkt P. Auch der Effekt, dass der Beobachter über heißen Ebenen (z.B. der Autobahn) dicht über dem Horizont eine scheinbar in Bewegung befindliche „Wasseroberfläche“ sieht, beruht auf einer solchen Luftschichtung. Es handelt sich um das scheinbar gespiegelte Himmelslicht.
20.6.2 Regenbogen Ein Regenbogen erscheint einem Beobachter, der in Richtung einer von der Sonne S in seinem Rücken beschienenen Regenwand blickt (Abb. 20.39). Er bildet den Abschnitt eines Kreises, dessen Mittelpunkt M auf der über B hinaus verlängerten Gerade SB liegt. Ein nahezu halbkreisförmiger Regenbogen ist also nur zu beobachten, wenn die Sonne dicht am Horizont steht. Der Winkel zwischen den einfallenden Einfallendes NebenregenSonnenstrahlen und der Richtung, Sonnenlicht bogen unter der ihn der Beobachter sieht, beträgt ca. 42°. Häufig wird noch ein zweiter Regenbogen mit geringerer Intensität beobachtet. Er erscheint Sonne B oberhalb des Ersten unter einem Hauptregen42° 51° Öffnungswinkel von ca. 51°. Der bogen intensivere der beiden Regenbögen, M der Hauptregenbogen, kommt durch einmalige Totalreflexion der LichtAbb. 20.39: Haupt- und Nebenregenbogen
20 Geometrische Optik
625
strahlen in einem Wassertropfen zustande, der Nebenregenbogen durch zweimalige. Deswegen folgen die Spektralfarben einander in umgekehrter Reihenfolge wie im Hauptregenbogen. Entsprechend der normalen Dispersion von Wasser erscheinen hier von außen nach innen die Spektralfarben mit abnehmender Wellenlänge. Der Öffnungswinkel für den Hauptregenbogen ergibt sich wie folgt (Abb. 20.40): Ein Lichtstrahl treffe einen kugelförmigen Regentropfen im Punkt A. Der gebrochene Strahl erreicht die Rückseite im Punkt B. Nach Reflexion gelangt er im Punkt C wieder an den vorderen Rand, wo er erneut gebrochen wird. Die Verlängerung des Einfallsstrahls und des Ausfallsstrahls schneiden sich im Punkt P. Für den Ablenkwinkel M gilt 2(D u ) M 2S . (20.87)
a
A j
b
u
P
B
Abb. 20.40: Zur Ableitung des Öffnungswinkels des Hauptregenbogens j C
Aus dem Dreieck AOB folgt
2ßu S .
(20.88)
Durch Einsetzen von (20.89) in die obere Gleichung lässt sich u eliminieren
2D 4 ß M
0.
(20.89)
Den Winkel ß können wir mit Hilfe des Brechungsgesetzes eliminieren.
sin D sin E
nWasser {n nLuft
(20.90)
Damit erhalten wir für den Zusammenhang zwischen Ablenk- und Einfallswinkel
M
§ sin D 4arcsin ¨ © n
· ¸ 2D . ¹
(20.91)
Mit sin D = z/R können wir dies auch schreiben als
M
4arcsin( z / nR ) 2arcsin( z / R ) .
(20.92)
626
20 Geometrische Optik
Der Ablenkwinkel durchläuft mit wachsendem Einfallswinkel D bzw. z ein Maximum. Differentiation ergibt
dM d ( z / R)
4/n 1 ( z / nR )
2
2 1 ( z / R)2
.
(20.93)
Nullsetzen der Ableitung führt zu
z
R
1 (4 n 2 ) 3
(20.94)
Mit dem Brechungsindex des Wassers, n = 1,33, folgt für den Ablenkwinkel
Mmax
42q .
(20.95)
Auf ähnliche Weise lässt sich der Ablenkwinkel für den Nebenregenbogen finden. Da es sich bei den Winkeln um Extrema handelt, häufen sich in ihrer Nähe die reflektierten Strahlen, so dass die Intensität dort maximal wird. Haupt- und Nebenregenbogen in der beschriebenen Form lassen sich also allein durch Anwendung des Reflexions- und Brechungsgesetzes erklären. Die Betrachtungsweise geht auf R. Descartes (1596-1650) zurück. Allerdings können feinere Details auf diese Weise nicht erklärt werden. Das betrifft z.B. schwache, sog. sekundäre Regenbögen, die im Bereich des Hauptregenbogens auftreten können; dazu muss die Wellennatur des Lichtes berücksichtigt werden.
Ergänzung 1: Matrizenmethoden der paraxialen Optik Wir sprechen von der paraxialen Näherung der Optik, wenn in den Gleichungen für Ausbreitung und Brechung der Lichtstrahlen die Winkelfunktionen so kleine Werte annehmen, dass sie linearisiert werden können. In diesem Sinn ist ein Lichtstrahl in jedem Punkt P(x,y) durch Angabe seines Abstandes y von der optischen Achse und seinen Winkel D gegen die Achse festgelegt (Abb. 20A.1). Die beiden Parameter lassen sich in einer Matrix anordnen. Da
y a
Abb. 20A.1: Festlegung eines Lichtstrahls in paraxialer Näherung und
P(x,y) x
20 Geometrische Optik
627
das für jeden Punkt des Lichtweges möglich ist, kann wegen der Linearität auch der Verlauf des Lichtstrahls von einem Punkt zu einem anderen Punkt durch eine Matrix dargestellt werden. Durch Einbeziehung des Brechungsgesetzes bzw. des Reflexionsgesetzes lässt sich der Gesamtverlauf eines Lichtstrahls durch die Multiplikation der entsprechenden Matrizen berechnen, was in vielen Fällen die Problemlösung erheblich erleichtert. Wir besprechen hier die Grundoperationen der Matrix-Methode und wenden sie beispielhaft auf einige einfache Fälle an.
20A1.1
Die Brechungsmatrix
Wir betrachten eine sphärische Grenzfläche (1) mit dem Krümmungsradius R1. Der Brechungsindex auf der linken Seite sei mit n bezeichnet, der auf der rechten Seite mit n´ (Abb. 20A.2). Das Brechungsgesetz schreiben wir in der Form
nD
ncß
(20A1.1)
Entsprechend Abb. 20A.2 gelten die Verknüpfungen
D D1 J , ß D1c J .
a1
a
r r1
n¢
n (20A1.2)
x1
a1¢ ß rr ¢ 1 R1 g
x¢1
Die Winkel D, ß, Dp sind positiv, wenn sich die Strahlrichtung durch Drehung entgegen dem Uhrzeigersinn ergibt. Damit erhalten wir
n(D1 J ) nc(J D1c) , (20A1.3a)
Abb. 20A.2: Zur Ableitung der Brechungsmatrix
ncD1c nD1 (nc n)J ,
(20A1.3b)
( nc n ) x1 . R1
(20A1.3c)
ncD1c nD1
Der zweite Term auf der rechten Seite stellt die Brechkraft P der Grenzfläche dar.
P1
( nc n ) . R1
(20A1.4)
628
20 Geometrische Optik
Den Lichtstrahl auf der linken und rechten Seite beschreiben wir durch die Spaltenmatrizen
r1
§ nD1 · ¨ ¸. © x1 ¹
und
§ ncD c · r1c ¨ 1 ¸ © x1c ¹
(20A1.5)
und die Brechung des Strahls gemäß (20A1.3c) durch die Brechungsmatrix B1
B1
( nc n ) · § § 1 P1 · ¨ 1 R1 ¸ . ¨ ¸ ¨ ¸ 0 1 © ¹ ¨0 ¸ 1 © ¹
(20A1.6)
Damit können wir die Brechung eines Lichtstrahls durch die Grenzfläche (1) beschreiben durch
r1c B1 r1 .
20A1.2
(20A1.7)
Die Translationsmatrix
Wir fragen nach der Translationsmatrix, die einen Lichtstrahl innerhalb eines Mediums mit Brechungsindex n von der rechten Seite eines optischen Elements zur linken Seite eines zweiten Elements überführt. Nach Abb. 20A.3 ist
nD 2 x2
a2
wobei x12
a1¢
(20A1.8a/b)
x2 x1c | d12 .
In Matrixschreibweise lässt sich das schreiben als
x12 x1¢
nD1c , x1c x12D1c .
x2
§ 1 § nD 2 · ¨ x12 ¨ ¸ © x2 ¹ ¨¨ © n
0· ¸ § nD1c · , (20A.1.9) ¨ ¸ 1 ¸¸ © x1c ¹ ¹
wobei Abb. 20.A3: Zur Ableitung der Transformationsmatrix einer Linse
T12
§ 1 ¨ ¨¨ x12 © n
0· ¸ 1 ¸¸ ¹
(20A1.10)
als Translationsmatrix bezeichnet wird. Der Brechungsindex n in (20A1.8a) wurde aus Gründen der Allgemeinheit hinzugefügt.
20 Geometrische Optik
20A1.3
629
Die Transformationsmatrix
Wir wollen den Fall betrachten, dass ein Lichtstrahl aus einem Medium mit dem Brechungsindex n auf eine Linse mit den Krümmungsradien R und R´ und dem Brechungsindex nL fällt und von dieser in ein Medium mit dem Brechungsindex n´ gebrochen wird (Abb. 20A.4). Die Brechkräfte der linken bzw. rechten Grenzfläche sind entsprechend (20A1.4)
P
( nL n) und Pc R
n
Abb. 20A.4: Zur Berechnung der Transformationsmatrix einer Linse mit den Krümmungsradien R und R´
( n c nL ) Rc
nL
R
n´
R¢
(20A1.11a/b)
wobei die Vorzeichen von R, R´ zu beachten sind. Die Transformationsmatrix, die den Lichtstrahl r1
§ nD1 · § ncD 2c · ¨ ¸ in den Lichtstrahl ¨ c ¸ x © 1 ¹ © x2 ¹
überführt (s. Abb. 20A.4), muss die Form haben
ML
B 2T12 B1 .
(20A1.12)
Die Matrizen beschreiben (nach den Regeln der Matrizenrechnung von rechts nach links) die Brechung an der linken Grenzfläche (1), die Ausbreitung innerhalb der Linse von der linken zur rechten Seite und die erneute Brechung an der rechten Grenzfläche (2). Die Einzelmatrizen sind folglich nach den Abschnitten 20A1.2 und 20A1.3 gegeben durch:
( n n) · § 1 L ¨ B R ¸ ¨¨ ¸¸ 1 ©0 ¹
T12
§ 1 ¨ ¨ x12 ¨n © L
0· ¸. 1 ¸¸ ¹
und
( nc nL ) · § 1 ¨ c B Rc ¸ ¨¨ ¸¸ 1 ©0 ¹
(20A1.13a/b)
(20A1.14)
630
20 Geometrische Optik
Die Multiplikation ergibt
§ (nc nL ) x12 ¨1 R c nL ¨ ¨ x12 ¨ nL ©
M L
( nL n) (nc nL ) ( nL n) (nc nL ) x12 · R Rc R Rc nL ¸ ¸ (20A1.15) ¸ (nL n) x12 1 ¸ R nL ¹
Für eine dünne Linse gilt x2 – x1 | 0 und die Transformationsmatrix vereinfacht sich zu
M Ldünn
20A1.4
( nL n ) ( n c nL ) · § ¨1 R Rc ¸ . ¨ ¸ ¨0 ¸ 1 © ¹
(20A1.16)
Hauptebenen
Die Brechung durch eine dünne Linse kann bekanntlich ersetzt werden durch eine solche an ihrer Mittelebene. Die Abbildungsgleichung einer dünnen Linse lässt sich auch für eine dicke Linse oder ein Linsensystem beibehalten, wenn die Mittelebene der Linse durch die Hauptebenen H und H´ ersetzt werden, an denen – formal – die Brechung erfolgt. Dieses bewährte Konzept soll hier in Matrixschreibweise formuliert werden. In (Abb. 20A.5) bezeichne H´ H das schraffierte Gebiet ein irgendwie geartetes Linsensystem, z.B. eine dicke Linse. Ihre Scheitelpunkte seien mit S und S´ bezeichnet, die Hauptebenen H und H´ haben von ihnen den Abstand d und d´. Der Wert von d ist größer null, wenn H links von S liegt; entsprechend ist d´ > 0, wenn H´ sich rechts S S´ von S´ befindet. Der Brechungsindex auf der n n´ linken Seite des Linsensystems sei mit n benannt, der auf der rechten Seite mit n´. Wir gehen davon aus, dass die Matrix, die einen d d´ Lichtstrahl in der zur Symmetrieachse der Linse senkrechten Ebene durch S in eine solche Abb. 20A.5: Zur Einführung der Hauptin der Ebene durch S´ überträgt, bekannt ist. ebenen einer dicken Linse in Matrixform und
20 Geometrische Optik
631
Sie hat die allgemeine Form
M SS '
§ M 11 ¨ © M 21
M 12 · ¸ M 22 ¹
(20A1.17)
mit der zusätzlichen Bedingung
det M SS ' 1 .
(20A1.18)
Die Verknüpfung zwischen dieser Matrix und der Matrix der Hauptebenen-Darstellung ist
M HH '
T c M SS ' T ,
(20A1.19)
wobei die Translationsmatrizen gegeben sind durch
§ 1 0· ¸ T c ¨ d c ¨¨ 1 ¸¸ © nc ¹
und
T
§1 ¨ ¨¨ d ©n
0· ¸ . 1 ¸¸ ¹
(20A1.20a/b)
Damit erhalten wir für
M HH '
d § M 11 M 12 ¨ n ¨ c c d d d d ¨M ¨ 11 nc M 12 nnc M 21 M 22 n ©
· ¸ ¸. dc ¸ M 22 M 12 ¸ nc ¹ M 12
(20A1.21)
Diese Matrix muss die gleiche Form wie die entsprechende Matrix (20A1.16) für eine dünne Linse haben; also ist sie von der Gestalt
M HH '
§ 1 M 12 · ¨ ¸. ©0 1 ¹
(20A1.22)
Durch Vergleich ergibt sich
M 11 M 12
d n
1
und
M 22 M 12
dc 1. nc
(20A1.23a/b)
632
20 Geometrische Optik
Lösen wir sie nach d und d´ auf, so folgt für die Lage der Hauptebenen bezogen auf die Scheitelpunkte S, S´
n (1 M 11 ) M 12
d
und
dc
n' (1 M 22 ) . M 12
(20A1.24a/b)
Die Brechkraft des optischen Systems lässt sich durch Vergleich von (20A1.22) mit (20A1.15) ermitteln:
PLi S y
M 12 .
(20A1.25)
Für die rechte Seite erhalten wir durch Vergleich des (2,1)-Elementes in M HH ' und M Ldünn
M 11
dc d dc d M 12 M 21 M 22 nc nnc n
0
(20A1.26)
und mit (20A1.25)
PLi S y
M 12
nM 11 nc M 22 nnc M 21 . d dc d dc
(20A1.27)
20A1.5 Anwendung auf dicke Linsen Als Beispiel wollen wir die allgemeinen Ergebnisse des letzten Abschnitts auf dicke Linsen anwenden. Nach (20A1.15) sind die Elemente der Transformationsmatrix M S , S c , wenn wir der Übersichtlichkeit halber die Brechkräfte P und P´ benutzen
Pcd L ; M 11 1 nL PPcd L P Pc; M 12 nL M 21
dL ; nL
Pd M 22 1 L . nL
(20A1.28)
20 Geometrische Optik
633
Daraus folgt mit (20A1.27) für die Brechkraft
PLdick
P Pc
PPcd L , nL
(20A1.29)
und die Lagen der Hauptebenen ergeben sich zu
d
nPc dL nL Pl
und
dc
nc P dL . nL Pl
(20A1.30a/b)
Schließlich erhalten wir für den Abstand der Hauptebenen voneinander
dH H c
§ nPc nc P · d L d d c d L ¨1 ¸. © nL Pl nL Pl ¹
(20A1.31)
Die Brechkräfte der beiden Grenzflächen der Linse seien hier noch einmal angefügt.
P
( nL n) ; R
Pc
( n c nL ) . Rc
(20A1.4)
20A1.6 Abbildungsmatrix einer Linse Es fehlt noch die Beschreibung der Abbildung eines Objektpunktes A durch eine Linse (oder ein optisches System) in einen Bildpunkt B (Abb. 20A.6). Sie wird dargestellt durch
§ ncD c · ¨ c ¸ © x ¹
§ nD · M ABB ¨ ¸ © x ¹
.(20A1.32)
Hierin bezeichnet M ABB die Abbildungsmatrix. Diese ist gegeben durch
M ABB
T cM HH cT ,
(20A1.33)
wobei M HH c wie in (20A1.15) die Brechung der Lichtstrahlen in der Hauptebenendarstellung bedeutet.
a
A X
n
n´
a¢ B x’
Abb. 20A.6: Abbildung eines Objektpunktes A in einen Bildpunkt B durch ein optisches System
634
20 Geometrische Optik
Die Ausrechnung ergibt
M ABB
§ 1 0· §1 ¨ ¸ § 1 M 21 · ¨ ¨¨ b 1 ¸¸ ¨© 0 1 ¸¹ ¨¨ a © nc ¹ ©n
M ABB
PL a § · PL ¸ ¨ 1 n ¨ ¸; ¨ a b PL ab 1 PL b ¸ ¨ ¸ nc ¹ © n nc nnc
PL
PLdick
P Pc
0· ¸; 1 ¸¸ ¹
(20A1.34a)
(20A1.34b)
PPcd L . nL
(20A1.35)
Für eine Linse, die von Luft umgeben ist (n = n´ = 1), vereinfacht sich die Abbildungsmatrix zu
PL · § 1 PL a ¨ ¸; © a b PL ab 1 PL b ¹
M ABB
PL
1 f
°§ 1 1 · d ½° ( nL 1) ®¨ ¸ (nL 1) L ¾ . RRc °¿ ¯°© R Rc ¹
(20A36)
Setzen wir diesen Ausdruck in die Ausgangsgleichung (20A1.32) ein, so erhalten wir die Abbildungsgleichung für eine Linse in Luft
a 1 · § 1 ¸ ¨ f f §D · § Dc· ¨ ¸¨ ¸ ¨ c¸ © x ¹ ¨ a b ab 1 b ¸ © x ¹ ¨ f f ¸¹ ©
§ § a· D ¨1 ¸ ¨ f ¹ © ¨ ¨ § · ¨ D ¨ a b) ab ¸ ¨ f ¹ © ©
x f
· ¸ ¸. ¸ x f b ¸¸ f ¹
(20A1.37)
20 Geometrische Optik
20A1.7
635
Darstellung des elektrischen Feldvektors
Ein beliebiger elektrischer Feldvektor ist bei Benutzung kartesischer Koordinaten gegeben durch
G E
Ex eˆx E y eˆy .
(20A1.38)
Zwischen den beiden Komponenten können Phasendifferenzen bestehen, so dass die Feldkomponenten komplex werden. In Matrixschreibweise schreibt sich das Feld deswegen
G E
§ Ex · ¨ ¸ © Ey ¹
§ E0 x eiM x ¨ ¨ E eiM y © 0y
· ¸. ¸ ¹
(20A1.39)
Wollen wir allein die Polarisationsrichtung des Feldes darstellen, so ist es zweckmäßig, den auf G E normierten Vektor zu verwenden.
G § Jx · J ¨ ¸ © Jy ¹
1 G E
§ E0 x eiM x ¨ ¨ E0 y eiM y ©
· ¸. ¸ ¹
(20A1.40)
Da es nur auf die Phasendifferenz der Feldkomponenten ankommt, können wir z.B. Mx = 0 G setzen. Der Vektor J heißt Jones-Vektor.
Ergänzung 2: Abbesche Sinusbedingung Es sollen achsennahe Punkte mittels eines weiten Strahlenbündels durch eine brechende Fläche in entsprechende Bildpunkte verzerrungsfrei abgebildet werden (Abb. 20A.7). Dazu muss die Abbesche Sinusbedingung erfüllt werden, die wir hier ableiten wollen. G G Wir betrachten dazu ein Geradenstück dG , das in ein solches mit dB bezeichnetes abgebildet werden soll. Ein vom unteren Ende G1 ausgehender Strahl habe die Richtung sˆ1 , treffe die brechende Fläche im Punkt P1 und erreiche in der Richtung sˆ2 den Bildpunkt B1. Der obere Endpunkt G2 werde durch den Strahl der Richtung sˆ1 dsˆ1 und sˆ2 dsˆ2 in den Bildpunkt B2 überführt. Wird der Brechungsindex auf der linken Seite der brechenden Fläche mit n1 bezeichnet, auf der rechten Seite mit n2 , so gilt nach Abb. 20A.7
L1
(G1 B1 ) n1s1 n2 s2 und L2
(G2 B2 ) n1 ( s1 ds1 ) n2 ( s2 ds2 ) . (20A2.1)
636
20 Geometrische Optik
G G Die Abbildung erfolge durch Lichtbündel, deren Mittelstrahlen s1 und s2 sind. Nach dem Fermatschen Prinzip sind die Lichtwege L1 und L2 für alle Strahlen des Büschels konstant,
r da
r r s + ds
s + ds
x
s n
G rs
-u
r r s¢ + ds¢
r db
s’
n´
s¢ + ds¢
s´ u´
r da ¢ x ¢
B
Abb. 20A.7: Ableitung der Bedingung für verzerrungsfreie Abbildung eines achsennahen Punktes durch weite Strahlenbündel (Abbesche Sinusbedingung) d
G G folglich auch ihre Differenz. Diese können wir durch sˆ1 , sˆ2 , dG, dB ausdrücken.
Die Summe der Begrenzungen im geschlossenen Viereck G1G2P1P2 ist
G G dG ( s1 ds1 )( sˆ1 dsˆ1 ) dc s1sˆ1
0.
(20A2.2)
Multiplizieren wir diesen Ausdruck skalar mit sˆ1 , so ergibt sich
ds1
G G sˆ1 dc sˆ1 dG .
(20A2.3)
Analog erhalten wir durch Betrachtung des Vierecks B1B2P1P2
ds2
G G sˆ2 dB sˆ1 dc .
(20A2.4)
Damit folgt für L1-L2
L1 L2
const
G G G G G n1 sˆ1 dG n1 sˆ1 dc n2 s2 dc n2 sˆ2 dB .
(20A2.5)
Es ist nun
G sˆ1 dc
G G dc cos( sˆ1 , dc ) : dc cos J 1 und sˆ2 dc
G dc cos( sˆ2 , dc ) : dc cos J 2 ,
Das Brechungsgesetz lautet
n1 sin D
n1 sin(90 J 1 )
n1 cos J 1
n2 sin E
n2 cos J 2 ,
(20A2.6)
20 Geometrische Optik
637
also erhalten wir durch Einsetzen der Gln. (20A2.6)
G n1sˆ1 dc
G n2 sˆ2 dc .
(20A2.7)
G Es lässt sich zeigen, dass diese Beziehung auch noch gilt, wenn dc nicht in der Einfallsebene G G von s1 bzw. s2 liegt. Durch Einsetzen in (20A2.5) ergibt sich
L1 L2
const
G G n1sˆ 1dG n2 sˆ2 dB .
(20A2.8)
G G Ein Strahl des Lichtbüschels bilde mit dG (dB) den Winkel [ 0,1 ([ 0,2 ) .
Dann gilt für jeden Strahl
n1 dG cos [1 n2 dB cos [ 2
n1 dG cos [ 0,1 n2 dB cos [ 0,2
(20A2.9)
G G Es mögen nun die Vektoren dG, dB senkrecht zur Symmetrieachse eines rotationssymmetrischen abbildenden Systems liegen, so dass [ 0,1 [ 0,2 S / 2 ist.
Da [1
S / 2 u1 , [ 2 S / 2 u2 ist, folgt mit dA o A, dB o B
n1 A sin u1
n2 B sin u2
(20A2.10)
Dies ist die Abbesche Sinusbedingung. Sie muss erfüllt sein, damit ein achsensenkrechter Gegenstand punktweise auch mit großen Öffnungswinkeln verzerrungsfrei abgebildet wird. Um zu prüfen, ob ein Volumenelement verzerrungsfrei abgebildet werden kann, legen wir G dG in die Symmetrieachse. Es ist also
[1 u1 , [ 2
G u2 , dG
G dx1 , dB
dx2 .
(20A2.11)
Damit erhalten wir jetzt als Bedingung für die Tiefenschärfe
n1 dx1 sin 2 (u1 / 2) n2 dx2 sin 2 (u2 / 2)
(20A2.12)
Die beiden Bedingungen widersprechen sich, sofern u1, u2 nicht sehr klein sind. Es ist also nicht möglich, ein Volumenelement mit weiten Lichtbündeln verzerrungsfrei abzubilden. Nur bei der Reflexion an einem ebenen Spiegel (n1 = n2 , A = B, u1 = -u2) finden wir das nicht.
638
20 Geometrische Optik
Zusammenfassung x Können bei der Ausbreitung einer Lichtwelle Interferenz-, Beugungs- und Polarisationseffekte vernachlässigt werden, so kann diese mit Hilfe von Lichtstrahlen beschrieben werden. x Der Winkel, unter dem wir einen Gegenstand sehen, heißt Sehwinkel. Der Abbildungsmaßstab ist definiert als das Verhältnis von Bild- zur Gegenstandsgröße. x Bei einem Prisma mit dem brechenden Winkel J besteht im Minimum der Ablenkung zwischen dem Ablenkungswinkel Gmin und dem Einfallswinkel die Relation
D1 (G min J ) / 2 x Die Abbildungsgleichung einer dünnen Linse mit den Krümmungsradien R1 und R2 und dem Brechungsindex n ist
1 1 a b
§ 1 1 · ( n 1) ¨ ¸ © R1 R2 ¹
1 ; f
a bzw. b sind Gegenstands- bzw. Bildweite. x Bei einer dicken Linse treten an die Stelle der Mittelebene einer dünnen Linse die Hauptebenen. Bei einer beiderseits von Luft umgebenden bikonvexen Linse mit Brechungsindex n der Dicke d und den Krümmungsradien R1 und R2 ist ihr Abstand von den Scheitelpunkten
h
(n 1) f d nR2
bzw.
h'
( n 1) f d . nR1
x Die Brennweite der Linse f ergibt sich aus den Einzelbrennweiten f1 und f2 der beiden Begrenzungsflächen zu
f
f1 f 2 . f1 f 2 d
Diese Beziehung gibt auch die Brennweite eines aus zwei dünnen Linsen bestehenden Systems an, die voneinander den Abstand d haben. x Jedes optische System erzeugt Abbildungsfehler. Bei Linsen sind die wichtigsten Fehler die chromatische und die sphärische Aberration, der Astigmatismus, die Bildfeldwölbung und der Komafehler.
20 Geometrische Optik
639
x Für achsennahe Strahlen (in der paraxialen Näherung) lässt sich die optische Abbildung mit Hilfe von Matrizen darstellen. Die Abbildung durch eine Kombination mehrerer Linsen ergibt sich als Produkt der Matrizen der einzelnen Komponenten. Die Berechnungen von Linsensystemen werden dadurch wesentlich vereinfacht. x Die Öffnungsblende bestimmt die Helligkeit des Bildes; sie legt in Verbindung mit der vor ihr stehenden Linse den maximalen gegenstandseitigen Öffnungswinkel fest. Die Gesichtsfeldblende begrenzt das zur Abbildung beitragende Lichtbündel.
Übungsaufgaben 1. Ein monochromatisches Lichtbündel fällt unter dem Winkel D = 45° auf die Seitenfläche eines gleichseitigen Glasprismas (n = 1,5), das sich in einer Luftatmosphäre befindet. Um welchen Winkel wird das Licht abgelenkt? 2. Ein paralleles Lichtbündel fällt symmetrisch zur optischen Achse auf einen Spiegel und wird von diesem in einem Punkt fokussiert. Was für ein Spiegel leistet das? Begründen Sie ihre Antwort durch Anwendung des Fermatschen Prinzips. 3.
Auf einen sphärischen Hohlspiegel mit dem Krümmungsradius R = 0,8 m fallen achsenparallele Lichtstrahlen im Abstand h von der optischen Achse ein. Wo liegen ihre Schnittpunkte mit der optischen Achse für die Fälle h = 4 cm bzw. h = 30 cm?
4
Eine dünne Linse entwirft von einem 9 m entfernten Gegenstand im Abstand von 4,5 m auf einem Schirm ein scharfes Bild. Welche Brennweite besitzt die Linse?
5.
Es sei eine Bikonvexlinse (n = 1,5) mit dem Krümmungsradius von 9 cm und einer Dicke von 3,5 cm gegeben. Berechnen Sie den Abstand der Hauptebenen von der Mitte der Linse.
6. Ein Teleobjektiv besitze eine Brennweite von 135 mm. Bei der Einstellung auf unendliche Entfernung beträgt der Abstand des Scheitels der Frontlinse von der Filmebene 120 cm. Zur Scharfstellung auf einen 1 m entfernten Gegenstand (gemessen von der Filmebene) muss das Objektiv um 25,8 mm nach vorne verschoben werden. Berechnen Sie die Lage der Hauptebenen bezüglich des Frontlinsenscheitels. 7.
Zum Bau eines Teleobjektivs stehen Ihnen zwei dünne Linsen mit den Brennweiten f1 = 60 mm und f2 = 120 mm zur Verfügung. In welchem Abstand voneinander ordnen Sie die Linsen an?
8. Eine dünne Linse mit den Krümmungsradien R1 = 12 cm und R2 = 25 cm. Wie groß sind die Brechungsindizes, wenn die Brennweite bei O= 600 nm f = 475,8 mm und für O = 400 nm f = 461,5 mm beträgt?
640 9.
20 Geometrische Optik Berechnen Sie mit Hilfe der Matrixmethode die Brechkraft und die Lage der Hauptebenen für die Kombination zweier Linsen mit der gleichen (positiven) Brechkraft P im Abstand d voneinander für die Fälle a) d = 1/P; b) d = (3/4)(1/P). y2
10. In nebenstehender Skizze ist als Gegenstand eine ausgedehnte, flächenhafte Lichtquelle zu sehen. Weiter sind einige charakteristische Strahlen eingezeichnet. Diskutieren Sie die Auswirkungen der beiden Blenden auf das entstehende Bild.
y1 0
-y1 -y2
21
Interferenz und Beugung
Interferenz und Beugung sind typische Welleneigenschaften. Wir haben sie schon bei der Besprechung mechanischer Wellen kennen gelernt; denken wir z.B. an die stehenden Wellen bei Musikinstrumenten, die durch Interferenz zweier gegenläufiger Wellen zustande kommen oder an die Überlagerung zweier sich radial von benachbarten Punkten ausbreitenden Wasserwellen. Auch die Beugung von Schallwellen kennen wir von Kindesbeinen an, denn Schall nehmen wir auch dann wahr, wenn sich etwa die Schallquelle hinter einer Hausecke befindet: Schall geht „um die Ecke“. Das liegt daran, dass die Wellenlänge von Schallwellen vergleichbar ist mit den Abmessungen von Hindernissen im täglichen Leben. Interferenz und Beugung von Lichtwellen machen sich wegen ihrer um Größenordnungen kleineren Wellenlängen nur in Sonderfällen bemerkbar, zumal das Licht der meisten Lichtquellen aus unterschiedlichen Wellenlängen besteht. Ein Beispiel sind die auf Interferenzen beruhenden „Farben dünner Blättchen“, die bei dünnen Ölhäuten oder Seifenblasen zu beobachten sind. Das Auftreten von Interferenzen setzt in der Regel (nahezu) monochromatisches Licht voraus, das Licht muss kohärent sein. Im Folgenden soll dieser Begriff genauer gefasst werden. Anschließend werden typische Interferenzphänomene besprochen. Der zweite Teil behandelt Beugungserscheinungen. Interferenz bzw. Beugung bestimmen das geometrische Auflösungsvermögen optischer Instrumente. Auf ihnen beruhen weiter die Wirkungsweise der Spektralapparate und andere Anwendungen.
21.1
Interferenz
21.1.1 Zeitliche und räumliche Kohärenz Es sei eine Lichtquelle gegeben, die zeitlich begrenzte Wellenzüge der spektralen Breite 'Q bzw. 'Z abstrahlen möge. Wir betrachten zwei Wellen mit den Frequenzen Z + 'Z/2 und Z - 'Z/2.
G E1
G i (Z 'Z / 2)t M1` E01e ^ 0
und
G E2
G i (Z 'Z / 2)t M2 ` E02 e ^ 0 .
(21.1)
Ihre Phasendifferenz in einem gegebenen Raumpunkt P beträgt
'M (t ) (Z1 Z2 )'t
(21.2)
Das Zeitintervall 'tc , in dem sich die Phasendifferenz der zwei (und aller anderer) im Punkt P überlagerten Wellen um maximal 2S ändern, heißt Kohärenzzeit 'tc . Wie wir (21.2) entnehmen können, ist sie mit der spektralen Breite 'Q des gegebenen Lichtfeldes verknüpft. Nach der Kohärenzzeit 'tc wird 'M 2S , so dass sich für erstere ergibt
'tc
1 'Q
2S . 'Z
(21.3)
642
21 Interferenz und Beugung
Unter der Kohärenzlänge verstehen wir die Strecke 'lc , die das Licht während der Kohärenzzeit zurücklegt.
'lc
c 'tc
1 'Q
(21.4)
Weitere wichtige Größen sind Kohärenzfläche und -volumen. Betrachten wir eine flächenhafte Lichtquelle AB (Abb. 21.1), die aus vielen voneinander unabhängig strahlenden Sendern besteht, die alle Licht der gleichen Frequenz, aber unterschiedlicher Phase aussenden können. Jeder Phasensprung eines einzelnen Senders beeinflusst die Phase der am Beobachtungsort eintreffenden Wellen. Für die Wellen, die unter einem Winkel u gegen die Flächennormale ausgesendet werden, kommt noch ein vom Wegunterschied bedingter PhasenunterP2 schied hinzu. Damit die Kohärenz der Wellen gewährleistet ist, muss gelten
D s2
AB sin u O / 2
oder ' rMi S . (21.5)
Das Wellenfeld wird in diesem Fall als räumlich kohärent bezeichnet. Die Kohärenzfläche Ac ist dadurch definiert, Q dass auf einer zur Ausbreitungsrichtung D s1 P1 senkrechten Ebene die Phasendifferenz null ist. Das Produkt aus Kohärenzfläche Abb. 21.1: Durchlaufen zwei aus der gleichen und -länge definiert schließlich das Kohäpunktförmigen Quelle stammende phasengleirenzvolumen. che Wellen identischer Frequenz unterschiedEin Beispiel für eine kohärente Welle lich lange Wege QP1 und QP2 , so besteht an ist eine monochromatische, ebene Welle den Punkten P1 und P2 zwischen ihnen ein (harmonische W.). Nach (21.4) ist ihre Phasenunterschied durch Kohärenzlänge unendlich. Wie lässt sich interferenzfähiges Licht erzeugen? Dazu existieren zwei Möglichkeiten. Alle Lichtquellen beruhen darauf, dass in ihnen Elektronen durch Zuführung von Energie in einen angeregten Zustand versetzt werden. Meistens werden mehrere energetisch unterschiedliche Niveaus besetzt. Im Allgemeinen gehen die Elektronen nach kurzer Zeit wieder in ihren ursprünglichen stabilen Zustand, den sog. Grundzustand, zurück, wobei sie ihre Anregungsenergie in Form von Lichtquanten, d.h. elektromagnetischer Strahlung, abgeben (Abb. 21.2). Es entstehen also kurze Wellenzüge, die statistisch ausgesandt werden und daher keine Kohärenz ihrer Phasen aufweisen. Das resultierende Wellenfeld ist daher inkohärent. Diesen Prozess nennen wir spontane Emission. Beispiele sind das Licht von Glühlampen und Gasentladungslampen.
21 Interferenz und Beugung
643
Daneben gibt es die induzierte oder stimulierte Emission. Darunter ist die Erzeugung eines Lichtquants (einer Lichtwelle) durch Einstrahlung eines bereits vorhandenen Angeregte Quants der gleichen Energie (einer entZustände sprechender Lichtwelle) zu verstehen. Beide Lichtquanten oder Wellen besitzen die gleiche Phase. Sie regen andere angeregte Atome zu stimulierter Emission von Quanten der gleichen Frequenz und Phase an. Es entsteht so ein kohärentes Wellenfeld hoher Intensität. Die auf dieGrundzustand ser Grundlage basierenden Strahlungsquellen heißen Laser (Light AmplificaAbb. 21.2: Anregung von Elektronen in tion by Stimulated Emission of Radiaenergetisch höhere Energiezustände und ion). Zur Demonstration von Interferenzspontane Aussendung von Licht beim erscheinungen ist das kohärente Laseranschließenden Übergang in den Grundlicht besonders geeignet; aber auch inkozustand härentes Licht kann interferenzfähig gemacht werden. Dazu muss ein Wellenzug durch einen Strahlteiler in zwei oder mehrere Teilwellen aufgespalten werden. Wird dafür gesorgt, dass diese unterschiedlich lange Wege durchlaufen, so führt dies nach Überlagerung der Wellen auf einem Schirm zu Interferenzmustern. Es gibt zahlreiche derartige Anordnungen. Wir besprechen einige von ihnen, zunächst solche, bei denen zwei Strahlen bzw. Wellen miteinander interferieren.
21.1.2 Anordnungen zur Zweistrahlinterferenz 21.1.2.1 Fresnelscher Spiegelversuch Licht einer möglichst kleinen Quelle wird mittels zweier Spiegel Sp1 und Sp2, die gegeneinander um den Winkel H gekippt sind (Abb. 21.3), in zwei Teilbündel aufgespalten. Auf einem Schirm S erzeugen sie ein Interferenzmuster, dessen Struktur wir berechnen wollen. Für einen Beobachter in der Schirmebene scheinen die Lichtbündel von den virtuellen Lichtpunkten L1 und L2 herzukommen. Ihre Koordinaten sind
(x
d / 2, y
0, z
l)
und
Ihre Wegdifferenz an einem Punkt P ( x, y, z
's
(x
d / 2, y
0, z
l) .
(21.6)
0) in der Beobachtungsebene ist
( x d / 2) 2 y 2 l 2 ( x d / 2) 2 y 2 l 2
(21.7)
644
21 Interferenz und Beugung
d L1
L2
Sp2
l
Sp1
Q
z
x Abb. 21.3: Fresnelscher Spiegelversuch zur Erzeugung zweier kohärenter Lichtbündel und
Abb. 21.4: Durch Interferenz entsteht auf dem Schirm ein Muster konfokaler Hyperbeln zusammen
Alle Punkte P( x, y ) , für die ' s konstant ist, liegen auf einer Hyperbel, denn die Hyperbel ist der geometrische Ort, für den die Differenz der Abstände von zwei Punkten (den Brennpunkten) konstant ist. Beträgt die Wegdifferenz ein ganzzahliges Vielfaches m der Wellenlänge, 's mO , so sind die beiden Wellen in Phase und die Intensität wird maximal. Ist dagegen die Wegdifferenz ein ungeradzahliges Vielfaches der halben Wellenlänge, 's (2m 1)O / 2 , so löschen sich die Wellen aus, die Intensität ist null. Auf dem Schirm erscheint folglich ein Intensitätsmuster aus konfokalen hellen Hyperbeln (Abb. 21.4). Die Ausdehnung der Interferenzfigur hängt von der Kohärenzlänge der Lichtwellen ab. Die Wegdifferenz der Wellen darf die Länge eines Wellenzuges nicht überschreiten.
21 Interferenz und Beugung
645
21.1.2.2 Fresnelsches Biprisma Statt zwei Spiegeln können zur Erzeugung zweier kohärenter Teilwellen auch zwei aneinanderstoßende flache Prismen, ein sogenanntes Biprisma, benutzt werden (Abb. 21.5). Das Interferenzmuster ist natürlich mit dem gerade beschriebenen identisch.
d Q L2 L1
l
Abb. 21.5: Anordnung zur Erzeugung kohärenter Teilwellen durch ein Biprisma
z
x
21.1.2.3 Youngscher Doppelspaltversuch Auf T. Young (1773-1829) geht eine andere Anordnung zur Sichtbarmachung von Lichtinterferenzen zurück. Strahlung einer flächenhaften Lichtquelle der Breite b, die Licht mit statistisch verteilten Phasen aussenden möge, fällt auf zwei Spalte Sp1 und Sp2, die voneinander den Abstand d haben (Abb. 21.6). Damit die von den Spalten ausgehenden Lichtwellen
a)
E1 dA Abb. 21.6: a) Erzeugung interferenzfähiger Lichtwellen durch einen Doppelspalt (Young) b) Zugehöriges Interferenzmuster
b
x
Sp1
P(x)
b)
d
D
I(x
E2 Sp2
kohärent sind, müssen zwischen dem Abstand der Spalte, ihrer Entfernung von der Quelle und deren seitlicher Ausdehnung bestimmte Relationen bestehen, die wir ausrechnen wollen. Für ein beliebig herausgegriffenes Flächenelement dA der Quelle legen die beiden die Spalte errei-
646
21 Interferenz und Beugung
chenden Wellen im Allgemeinen verschieden lange Wege zurück. Die Wegdifferenz 's wird maximal für Flächenelemente an den beiden Enden der Quelle. Aus Abb. 21.6 folgt
'smax
E1Sp2 E1 Sp1
E2 Sp1 E2 Sp2 .
(21.8)
Wählen wir den Abstand D eines Spaltes von der Quelle hinreichend groß, so ist d << D und wir können die Wege E1 Sp1 und E2 Sp1 als annähernd parallel zueinander ansehen; es wird
's | b sin - .
(21.9)
Ist die zugehörige Phasendifferenz
'M M Sp1 M Sp2
2S
O
's
(21.10)
größer als S , so geht bei statistischer Schwankung der Phase die Korrelation zwischen den beiden Wellenfeldern am Ort der Spalte verloren, das Interferenzbild verschwindet. Für die Ausdehnung der Lichtquelle bedeutet dies
b sin - O / 2 .
(21.10a)
Diese Beziehung ist identisch mit der Kohärenzbeziehung von (21.5). Je kleiner der Abstand der Spalte voneinander bzw. je weiter die Quelle von den Spalten entfernt ist, umso ausgedehnter darf die Quelle sein. Die Amplitude der Interferenzfigur folgt durch Addition der beiden Teilwellen. Bildung des Absolutbetrages ergibt die zugehörige Intensität. I v \1 \ 2
2
\12 \ 22 2\1\ 2
(21.11)
21.1.2.4 Erzeugung von Interferenzen mit einer planparallelen Platte Eine ebene Lichtwelle falle auf eine transparente planparallele Platte der Dicke d (Abb. 21.7). Ihr Brechungsindex sei n. Ein Teil des Lichtes wird an der Vorderseite reflektiert, ein anderer Teil wird gebrochen. An der Rückseite tritt ein Teil aus, ein anderer wird wieder reflektiert usw. Der Gangunterschied zwischen dem an der Vorderseite reflektierten und dem nach Reflexion an der Rückseite auf der Vorderseite wieder austretenden Strahl ist
's
n( AB BC ) AD 2nd 2d tg E sin D . cos E
(21.12)
21 Interferenz und Beugung
647
Drücken wir sin D mit Hilfe des Brechungsgesetzes aus, so ergibt sich
's
2nd 2nd sin 2 E cos E cos E
2nd cos E
2d n 2 sin 2 D . (21.13) Die entsprechende Phasendifferenz ist unter Berücksichtigung des am dichteren Medium auftretenden Phasensprungs von S
'M
2S
O
's S .
(21.14)
nL d
a D
A C
b
nPL
d¢ B
a
s
Verstärkung tritt auf für 'M m 2S , Auslöschung für 'M (2m 1) S . Abb. 21.7: Erzeugung von Interferenzen Analoge Überlegungen können wir für das mit einer planparallelen Platte transmittierte Licht anstellen. Der Gangunterschied der beiden Strahlen ist wieder durch (21.13) gegeben. Bei der Berechnung des Phasenunterschiedes ist zu berücksichtigen, dass keiner der beiden Wellen (Strahlen) einen Phasensprung erleidet. Es gilt also
'M
2S
O
's .
(21.15)
Konstruktive Interferenz tritt für ' s mO auf. Zur Demonstration eignet sich ein Glimmerplättchen von ca. 0,1 mm Dicke, das mit divergentem monochromatischem Licht bestrahlt wird. Maximale Intensität in Reflexion entsteht an den Orten, für die nach (21.14) bzw. (21.13) gilt
2d n 2 sin 2 D
1 (m )O . 2
(21.16)
Auf einem Schirm werden also abwechselnd helle und dunkle konzentrische Ringe beobachtet (Abb. 21.8).
Abb. 21.8: Interferenz divergenter monochromatischer Strahlung beim Durchgang durch eine Glimmerfolie
648
21 Interferenz und Beugung
21.1.2.5 Michelson-Interferometer Das Michelson-Interferometer wurde bereits im Zusammenhang mit der Diskussion der ÄtherHypothese in Kap. 2 erwähnt. Ein monochromatisches paralleles Lichtbündel fällt auf einen Strahlteiler, der zur Erzeugung der beiden interferenzfähigen Teilstrahlen dient. Für die Benutzung im sichtbaren Bereich ist eine einseitig teilverspiegelte Glasplatte geeignet. Der GrundaufSp1 bau ist in Abb. 21.9a dargestellt. Da Welle 2 die Platte in Abb. 21.9a dreimal durchläuft, dagegen Welle 1 nur einmal, entsteht bei gleichen 1 Armlängen zwischen den Wellen 2 eine optische Wegdifferenz. Diese muss durch eine zusätzliche Platte Strahlteiler Sp2 im Interferometerarm 1 kompen1 siert werden. Spiegel Sp1 ist fixiert, d 2 Spiegel Sp2 lässt sich verschieben. Nach Fokussierung der beiden Bündel lassen sich die Interferenzen Auge bzw. auf einem Schirm oder mittels eines Detektor Detektors als elektrisches Signal Abb. 21.9a: Prinzip des Michelson-Interferometers. beobachten. Bei gleichen optischen Mit monochromatischer Strahlung entsteht durch Weglängen der beiden Teilwellen Verschiebung des Spiegels Sp2 am Detektor ein erscheint ein kreisrunder heller sinusförmiges Signal Fleck. Wird Sp2 langsam verschoben, so schwankt die Intensität im Zentrum periodisch zwischen einem maximalen und einem minimalen Wert. Ein solcher Verlauf ist zu erwarten. Maxima bzw. Minima treten auf, wenn für den Gangunterschied gilt
bzw.
'
2d
mO
'
2d
(2m 1)
O 2
;
m 0,1, 2,3,...
(21.17a)
Zusätzlich quellen helle Ringe aus dem Zentrum heraus (Abb. 21.10). Diese entstehen ähnlich wie im letzten Abschnitt erläutert durch die immer vorhandene leichte Divergenz des „Parallelbündels“. Eine unter dem Winkel D in das Interferometer einfallende Welle wird in zwei Teilwellen aufgespalten, die abhängig von der Position von Sp2 einen Gangunterschied von
'
2d cos D
(21.17b)
besitzen (Abb. 21.11). Zu einem gegebenen Wert von m gibt es diskrete Werte D , für welche die Bedingung der konstruktiven Interferenz, ' mO , erfüllt ist. Diese entsprechen den hellen Ringen.
21 Interferenz und Beugung
649
d
a a
A a a
B
C
cos a =
d
; AB BC BC = cos(2a ) = cos a ; d AB d D= {1 + cos(2a )} = 2d cos a . cos a
Abb. 21.10: Durch die Divergenz der einfallenden Strahlung entsteht beim Michelson-Interferometer nicht nur ein zentraler Fleck, sondern eine Ringstruktur dazu
Abb. 21.11: Zur Ableitung des Gangunterschiedes bei divergenter Strahlführung
Anwendungen: Das Interferometer lässt sich bei bekannter Wellenlänge zu präzisen Längenmessungen bzw. durch Messung der Verschiebung umgekehrt zur Bestimmung der Wellenlänge einer monochromatischen Strahlungsquelle verwenden. „Weißes Licht“ kann mittels eines Fourierspektrometers analysiert werden (s. unten). Weiter können mit Hilfe eines Michelson-Interferometers die sehr kleinen Brechungsindizes von Gasen ermittelt werden. Dazu wird in jeden der beiden Arme eine gleichartige Küvette der Länge l gestellt. Die eine ist evakuiert, die andere wird langsam mit dem interessierenden Gas gefüllt. Durch Auszählung der beim Gaseinlass entstehenden Ringe lässt sich der Brechungsindex bestimmen. Die optische Wegdifferenz der Teilwellen nach Füllung ist
'
n 2l 2l
(n 1)2l .
Dieser Differenz entspricht eine Anzahl 'm heller Ringe.
(21.18a)
650
21 Interferenz und Beugung
Folglich gilt
(n 1)2l
'mO
o
n 1
O 2l
'm .
(21.18b)
Es können Streifenverschiebungen von 'm 0,1 gemessen werden. Bei Verwendung einer 0,1 m langen Küvette kann bei einer Wellenlänge von 632,8 nm (He-Ne-Laserlicht) ein Unterschied im Brechungsindex von 'n n 1 3,16 107 bestimmt werden.
21.1.2.6 Das Michelson-Morley-Experiment
Wie pflanzen sich Lichtwellen fort? Diese Frage bewegte Ende des 19. Jahrhunderts viele Physiker. Benötigen sie zur Ausbreitung ein den ganzen Weltraum ausfüllendes ruhendes Medium? Eine solche Vorstellung lag in Analogie zur Natur der Schallwellen nahe. Die Luft kann also quasi als Träger der Schallwellen angesehen werden. Als Träger der Lichtwellen wurde der bereits angesprochene „Äther“ postuliert. In ihm sollte sich Licht in alle Richtungen mit gleicher Geschwindigkeit ausbreiten. Wenn dieser Gedanke richtig wäre, müsste auf der Erde, die sich durch den Äther bewegt, die Lichtgeschwindigkeit davon abhängen, ob sich das Licht parallel, entgegengesetzt oder senkrecht zur Erdbahn ausbreitet. Denken wir uns als Analogon etwa ein mit der Geschwindigkeit vS fahrendes Schiff auf dem Bodensee. Werfen wir einen Stein in das Wasser, so ist die Phasengeschwindigkeit v ± der sich mit der Geschwindigkeit v ph relativ zum Wasser ausbreitenden Wellen relativ zum Schiff
vr
v ph B v S .
Das obere Vorzeichen bezeichnet die Geschwindigkeit der Welle v+ in Fahrrichtung, das untere die entgegen der Fahrrichtung. Aus den Messwerten für v ± lassen sich die Phasengeschwindigkeit v ph und die Geschwindigkeit vS des Schiffs ermitteln. Zur Klärung führten A. Michelson und E. Morley 1887 und in der Folgezeit die berühmt gewordenen Versuche mit einem Zweistrahl-Interferometer durch, das seitdem als MichelsonInterferometer in die Literatur eingegangen ist. Dieses wurde so angeordnet, dass der eine Arm parallel und der andere Arm senkrecht zur Erdgeschwindigkeit wies. Bei Gültigkeit der Ätherhypothese beträgt die Laufzeit des Lichtes vom Strahlteiler zum Spiegel Sp1 und zurück
t&
l l c vE c vE
2cl c 2 v 2E
J2
2l ; J c
1 v2 1 2E c
.
(21.19a)
21 Interferenz und Beugung
651
Die Laufzeit vom Strahlteiler zum Spiegel Sp2 und zurück ist
2l cA
tA
2l 2
c v
2 E
J
2l . c
(21.19b)
Der Unterschied 't zwischen den Laufzeiten der beiden Wellen beträgt demnach
2l 2 (J J ) . c
't
(21.19c)
Die Erdgeschwindigkeit beträgt v E | 3 104 m/s ; somit ergibt sich für (v E / c) 2 | 108 , so dass wir J und J2 annähern können durch
J
1
1 v 2E , 2 c2
J 2 1
v 2E . c2
Sp1
Damit erhalten wir für den Zeitunterschied
't
Strahlteiler
l v 2E c3
(21.19d)
und für den zugehörigen Phasenunterschied
'M
2S c
O
't
2 E 2
2S l v O c
(21.20a)
Hsp2’ Sp2
Hsp2 Hsp1
Hsp1
Das Interferometer war um die Abb. 21.11a: Erhöhung der Empfindlichkeit des vertikale Achse drehbar auf einer Michelsoninterferometers durch Mehrfachreflexion Grundplatte montiert. Michelson und Morley ließen die Teilstrahlen mittels je zweier zusätzlicher Hilfsspiegel Hsp1, Hsp1‘ und Hsp2, Hsp2‘ in den beiden Armen mehrmals reflektieren (Abb. 21.11a). Dadurch erreichten sie einen effektiven Spiegelabstand von l | 11 m. Sind die beiden eigentlichen Interferometerspiegel ein wenig gegeneinander verkippt, so entstehen statt der sonst zu erwartenden konzentrischen Ringe in der Beobachtungsebene äquidistante helle Interferenzstreifen, ähnlich wie sie ein schmaler Keil erzeugt.
652
21 Interferenz und Beugung
Der Phasenverschiebung 'M entspricht gemäß 'M = 2Sx eine Verschiebung um x Streifen,
x
l v 2E . O c2
(21.20b)
Wird das Gerät um 90° gedreht, so vertauschen die beiden Interferometerspiegel ihre Funktion und es ist eine Streifenverschiebung um
z
2x
2l v 2E O c2
(21.20c)
zu erwarten. Einsetzen von l = 11 m, -, O = 5 10-7 m (Sternlicht) ergibt z = 0,4. Die Beobachtungsgrenze lag bei z = 0,1. Das Experiment ergab keinerlei Streifenverschiebung, auch Ergebnisse späterer, mit höherer Messgenauigkeit durchgeführter Messungen von G. Joos (1894-1995) u. a. mit einem effektiven Spiegelabstand von 21 m waren negativ. Demnach breitet sich Licht in alle Richtungen gleich schnell aus; es gibt keinen Äther. Aber auch nach Fall der Ätherhypothese wurden weitere Anstrengungen unternommen, die Messgenauigkeit weiter zu verbessern. Durch die Ersetzung der optischen Interferometer durch Resonatoren konnte sie sukzessiv um fünf Größenordnungen gesteigert werden (L21.1,2). Die Untersuchungen wurden durch neuere theoretische Überlegungen zur Vereinigung von Gravitation und Quantentheorie zur sog. Quantengravitation stimuliert, die sehr geringe Abweichungen von der Isotropie der Lichtgeschwindigkeit möglich erscheinen lassen. Bisher wurde jedoch eine solche nicht gefunden.
21.1.2.7 Fourierspektroskopie
Bei der Fourierspektroskopie wird das zu untersuchende Licht nicht einem dispergierenden Element zugeführt, sondern die Messapparatur besteht aus einem Michelson-Interferometer in Verbindung mit einem Rechner. Letzterer ermittelt aus dem erzeugten Interferogramm durch eine Fourieranalyse dessen spektrale Zusammensetzung. Fourierspektrometer werden besonders im infraroten und Submillimeterbereich eingesetzt, wo andere Spektralapparate hohen Auflösungsvermögens nicht zur Verfügung stehen. Als Strahlteiler dienen u.a. Polymerfolien. Sie sind so dünn, dass die optischen Wege für beide Teilwellen als gleich angesehen werden können. Jede von ihnen passiert den Strahlteiler einmal und wird einmal an ihm reflektiert. Daher kann in diesem Fall auf den Kompensator verzichtet werden. Wir wollen die Intensität im Zentrum der Beobachtungsebene als Funktion der Wegdifferenz berechnen. Der Betrag des elektrischen Feldvektors der einfallenden ebenen Welle sei
Ee
E0 e cos(Zt k0 z ) .
(21.21)
Nach einmaliger Reflexion und Transmission ergeben sich die Beträge der Feldstärken in der Beobachtungsebene zu
21 Interferenz und Beugung
E1
653
RT E0 e cos(Zt k0 z ); E2
RT E0 e cos(Zt k0 z 's (t )) .
(21.22)
R, T bedeuten Reflexions- und Transmissionsvermögen des Strahlteilers, die Größe 's(t ) den durch die Verschiebung des Spiegels bewirkten Gangunterschied der beiden Teilwellen. Mit den Abkürzungen M1 kz , M 2 kz 's erhalten wir durch Superposition der Teilfeldstärken
E
RT E0 e ^cos(Zt M1 ) cos(Zt M2 )` 2 RT E0 e cos ^Zt k0 ( z 's / 2)` cos(k0 's / 2)
(21.23)
und die Intensität ergibt sich durch Anwendung des Additionstheorems
2cos ^(D E ) / 2` cos ^(D E ) / 2` zu
cos D cos E
I (t ) cH 0 ( E1 E2 ) 2
2cH 0 RT E0 e cos 2 ^Zt k0 z (k0 's / 2)` cos 2 (k0 's / 2) . (21.24)
Den schnellen Oszillationen des Lichtfeldes kann der Detektor nicht folgen, er registriert eine über die Zeit gemittelte Intensität. Wir erhalten damit
I (t ) cH 0 RTE02e cos 2 (k0 's / 2)
(21.25)
cH 0 RTE02e 1 cos k0 's .
Die Intensität schwankt periodisch um den Mittelwert von I 0 : cH 0 RTE02e . Bei unendlicher Verschiebung würde die Fouriertransformation wieder die Ausgangsfunktion liefern. Bei endlicher Verschiebung des Spiegels bis zu einem Wert 'smax/2 ergibt sich stattdessen (L21.3) eine spektrale Verteilung der Form
I (Z ) smax
sin ^(k k0 ) 'smax ` (k k0 )'smax
.
(21.26)
Dies ist eine oszillierende Funktion vom Typ sin x/x mit dem Maximum bei x = 0 und abnehmenden schwachen Nebenmaxima zu größeren und kleineren x. Die jetzt endliche Halbwertsbreite G (1/O) folgt zu
§1·
G¨ ¸ ©O¹ oder mit
1, 21 1 . | 2'smax 2'smax
(21.27)
654
21 Interferenz und Beugung
1
O1 zu
GO
1
O2
|
GO O2
(21.28)
.
(21.29)
O2 2'smax
Damit wird das Auflösungsvermögen
O GO
2'smax
O
2m ,
(21.30)
wobei m die Interferenzordnung ist. Für den Fall, dass O = 1 µm und die maximale Wegdifferenz 100 mm sind, folgt O/GO = 2 105. Ein Echelettegitter vergleichbarer Auflösung mit einer Gitterkonstanten von d | 5O = 5µm müsste eine Breite von 1 m haben! Im Allgemeinen besitzt die zu analysierende Strahlung ein breiteres Spektrum. Dann sind die Nebenmaxima recht störend, da sie eine falsche Struktur vortäuschen können. Sie lassen sich durch Faltung der Daten mit einer geeigneten Funktion eliminieren oder stark reduzieren. Allerdings hat das seinen Preis: die Halbwertsbreite steigt je nach verwendeter Funktion um ca. einen Faktor 2. Dieser Eingriff wird Apodisation genannt (L.21.3; 21.12). Fourierspektrometer haben den Vorteil, dass ein Spektrum gleichzeitig gemessen werden kann, was als Muliplexvorteil bezeichnet wird. Ein Gitterspektrometer misst die einzelnen Frequenzintervalle nacheinander, sofern nicht ein flächenhafter Detektor benutzt werden kann. Wie wir noch sehen werden, ist außerdem (bei vergleichbarer spektraler Auflösung) die Lichtstärke größer. Die Theorie zur Fourierspektroskopie wurde nach 1950 von P. B. Fellgett, L. Genzel (19222003), P. Jacquinot u.a. entwickelt. Das erste, 1957 von Genzel für den Bereich des fernen Infrarot, realisierte Gerät bestand aus einem Laminargitter-Interferometer. Seine Abmessungen waren so gewählt, dass es ein Glanzwinkel-Echelettegitter von 448 mm Breite in dessen Strahlengang ersetzte. Das Laminargitter war aus zwei kammartigen Teilgittern aufgebaut. Während ein Teilgitter fest montiert war, glitt das andere in den Lücken des ersten mit einer einstellbaren Geschwindigkeit periodisch hin und her. Dadurch entstand am Detektor ein kosinusförmiges Signal, das in einer frequenzselektiven Elektronik verstärkt und von einem xy-Schreiber aufgezeichnet wurde. Die einzelnen Fourierkomponenten wurden also – in Ermangelung eines Computers – noch nacheinander gemessen. Vor jeder Messung mussten die beiden Teilgitter relativ zueinander sorgfältig justiert werden, denn an den Umkehrpunkten wurde das Gerät mechanisch stark beansprucht. In der Anfangsphase waren bei dieser Justierung einfühlsame Hammerschläge eine große Hilfe!
21 Interferenz und Beugung
655
21.1.3 Vielstrahlinterferenz Bisher haben wir einige Anordnungen kennen gelernt, bei denen zwei Wellen miteinander interferieren. Jetzt wollen wir überlegen, was für Interferenzerscheinungen auftreten, wenn viele Wellen der gleichen Frequenz überlagert werden. 21.1.3.1 Überlagerung von Wellen gleicher Amplitude
Zunächst wollen wir die Intensität berechnen, die durch Überlagerung von N (kohärenten) ebenen Wellen gleicher Amplitude entsteht. Der Phasenunterschied benachbarter Teilwellen sei mit M bezeichnet. Die resultierende elektrische Feldstärke ergibt sich zu
Eres
E0 ei (Zt kz ) ^1 e iM e 2iM .... e i ( N 1)M ` .
(21.31)
Die Summe dieser geometrischen Reihe ist
Eres
E0 ei (Zt kz )
1 e iNM . 1 e iM
(21.32)
Für die Intensität erhalten wir
cH 0
E02 1 cos( NM ) 2 1 cos(M ) (21.33)
I
cH 0
E02 sin 2 ( NM / 2) 2 sin 2 (M / 2)
(21.34)
Intensität (willk. Einheiten)
* cH 0 Eres Eres
I
40
20
0
Das ist eine oszillierende Funktion der Form sin (F / 2) 2 § sin ( Nx) · Abb. 21.12: Intensitätsverteilung bei ¨ ¸ ; sie ist in Abb. 21.12 darge© sin x ¹ Interferenz von Teilwellen gleicher stellt. Ihre Minima liegen dort, wo der ZähAmplitude (N = 6) und ler seine Nullstellen hat, also bei Werten M 2 pS / N ( p 0,1, 2,3,...) , vorausgesetzt der Nenner ist nicht gleichzeitig null. Das ist immer dann der Fall, wenn p/N = m eine ganze Zahl ist, wenn M = 2Sm ist. An diesen Stellen treten Maxima auf. Der Bruch nimmt nämlich dann die unbestimmte Form 0/0 an. Nach der l´ Hospitalschen Regel ergibt sich sein Wert zu N2. Der Abstand der ersten Nullstellen zu beiden Seiten eines Hauptmaximums beträgt 4S / N . Die Halbwertsbreite ist also 2S /N. Sie ist umso kleiner, desto größer die Zahl der interferierenden Teilwellen ist.
656
21 Interferenz und Beugung
Diese Art der Interferenz bestimmt im Wesentlichen die Intensitätsverteilung hinter einem optischen Gitter. Bevor wir sie besprechen, wollen wir aber den Fall diskutieren, dass die Amplitude jeder Teilwelle gegenüber jener der Vorhergehenden um einen bestimmten Faktor geringer ist.
21.1.3.2 Überlagerung von Wellen abnehmender Amplitude
Eine geeignete Anordnung zur Erzeugung vieler interferenzfähiger Wellen abnehmender Amplitude entsteht durch Teilverspiegelung einer planparallelen Platte (Abb. 21.13). Durch wiederholte Reflexion an der vorderen und der hinteren Grenzfläche spaltet eine Primärwelle in Teilwellen auf, deren Anzahl vom Grad der Verspiegelung abhängt. Bei einer Reflexion wird eine Welle um den Faktor A1 A2 A3 A4 A5 A0 R geschwächt, die Amplituden aufnL einander folgender austretender Wellen unterscheiden sich demnach um den d nPL Faktor R; Die gebrochene Welle hat bei Vernachlässigung von Absorption eine um den Faktor 1 R geringere AmpliB1 B2 B3 B 4 B5 tude. Da jede austretende Welle, mit B1 bzw. A2 beginnend, auf ihrem Weg zweimal gebrochen wurde, ergeben sich Abb. 21.13: Anordnung zur Demonstration die Amplituden der reflektierten und der Interferenz von Teilwellen abnehmender transmittierten Wellen Am und Bm zu Amplitude
A1
R A0 ;
A2
(1 R) R R 0 A0 ;
B1
(1 R ) R 0 A0
A3
(1 R ) R R1 A0 ;
B2
(1 R) R1 A0
A4
(1 R) R R 2 A0 ;
B3
(1 R ) R 2 A0
Am
(1 R) R R m 2 A0 ;
Bm
(1 R) R m 1 A0
(21.35)
Die Amplituden der Teilwellen müssen nun phasenrichtig addiert werden. Dabei ist zu berücksichtigen, dass die zur Einfallsebene senkrechte Komponente des elektrischen Feldvektors bei der Reflexion am optisch dichteren Medium einen Phasensprung von S erleidet, dagegen tritt am optisch dünneren Medium keine Phasenverschiebung auf. Für die Parallelkomponente erfolgt am optisch dichteren Medium ein Phasensprung von S nur oberhalb des Brewsterwinkels D B , dagegen tritt am optisch dünneren Medium ein Phasensprung von S auf,
21 Interferenz und Beugung
657
solange D D B ; im Bereich D B D DT ( DT Grenzwinkel der Totalreflexion) ist die Phasenverschiebung null. Dieses Verhalten führt dazu, dass folgende Relationen bestehen:
A1s
ReiS A0
R A0
(21.36)
und abhängig davon, ob D kleiner oder größer als D B ist,
A1 p
r R A0 .
(21.37)
Weitere Phasensprünge wirken sich auf die Teilwellen nicht aus. Die resultierende Amplitude der reflektierten Teilwellen berechnet sich aus p
A
A1 ¦ Am e i ( m 1)G m 2
r R A0 ª¬ 1 ^(1 R )e iG (1 R ) Re 2iG (1 R ) R 2 e3iG ...`º¼ r R A0 ª¬1 (1 R )e iG ^1 Re iG R 2 e 2iG ...`º¼ p2 ª º r R A0 «1 (1 R )e iG ¦ R m e imG » m 0 ¬ ¼
ª 1 R l e ilG r R A0 «1 (1 R )e iG 1 Re iG ¬
(21.38)
º ». ¼
Wir wollen annehmen, dass der Einfallswinkel sehr klein ist, so dass p entsprechend groß wird. Mit p o f verschwindet der zweite Term des Zählers und wir erhalten
ª 1 e iG A r R A0 « iG ¬1 Re
º ». ¼
(21.39)
Damit wird die Intensität
I r e fl
2(1 cos G ) 1 R 2 2 R cos G 2 4 R sin (G / 2) . I0 (1 R ) 2 4 R sin 2 (G / 2) cH 0 AA*
I0 R
Analog ergibt sich die Amplitude des auf der Rückseite austretenden Lichtes zu
(21.40)
658
21 Interferenz und Beugung
(1 R ) 2 . (1 R) 2 4 R sin 2 (G / 2)
I trans I 0
(21.41)
Diese Ausdrücke wurden zuerst von G. B. Airy (1801-1892) hergeleitet und heißen deswegen Airy-Formeln. Dividieren wir Zähler und Nenner noch durch (1-R)2, so folgen mit der Abkürzung
F
4R , (1 R ) 2
(21.42)
die Beziehungen
I r e fl
Relative Intensität I trans/I 0
I trans
F sin 2 (G / 2) ; 1 F sin 2 (G / 2) 1 I0 . 1 F sin 2 (G / 2) I0
Airy - Formeln
1.0 R = 0,1 R = 0,3 R = 0,6
0.5
R = 0,8 R = 0,95
0.0
2(m+1)p 2mp Phasendifferenz j
Abb. 21.14: Relative Intensität bei Vielfachreflexion für unterschiedliche Reflexionsvermögen R an den Grenzflächen
H
4 F
2(1 R ) . R
(21.43)
Der Unterschied in den Intensitäten ist auf die an der Vorderseite reflektierte Welle A1 zurückzuführen, die kein Pendant auf der Rückseite hat. Ferner ist A2 bereits um den Faktor R gegenüber B1 reduziert. Die relative transmittierte Intensität ist in Abb. 21.14 als Funktion der Phasendifferenz G für verschiedene Werte von R dargestellt. Maxima treten für solche G auf, für die der sin-Term verschwindet, also für G mS . Zwischen zwei benachbarten Maxima nimmt die Intensität umso kleinere Werte an, desto größer das Reflexionsvermögen ist, d.h. je mehr Wellen miteinander interferieren. Die Halbwertsbreite der Transmissionskurve H 2G ergibt sich mit I trans / I 0 1/ 2 zu
(21.44)
21 Interferenz und Beugung
659
21.1.3.3 Fabry-Perot-Interferometer
Die Vielfachinterferenz kann zur Spektralanalyse ausgenutzt werden. Bekannte Anordnungen sind das auf C. Fabry (1867-1945) und A. Perot (1863-1925) zurückgehende Fabry-PerotInterferometer (FPI) (L21.4) und die nach O. Lummer (1860-1925) und E. J. Gehrcke (18781960) benannte Lummer-Gehrcke-Platte. Zum Einsatz im sichtbaren Bereich wird das FPI aus zwei parallel zueinander angeordneten durchsichtigen Platten aus Glas oder geschmolzenem Quarz, deren Abstand variabel ist, gefertigt (Abb. 21.15). Ihre einander zugewandten Flächen sind teilverspiegelt, die Außenseiten zur Vermeidung störender Reflexe entspiegelt oder gegen die InnenAntireflexschichten seiten geneigt geschliffen. Angenommen, die Quelle sende Licht gleicher Intensität zweier benachbarter Wellenlängen aus. Wir wollen berechnen, wie groß ihr Wellenlängenunterschied GO sein darf, damit sie noch getrennt wahrgenommen werden können. Wir legen fest, dass eine TrenTeilverspiegelte nung gerade noch möglich ist, wenn sich die Flächen zugehörigen Intensitätsmaxima in der Wellenlänge um ihre Halbwertsbreite H unterAbb. 21.15: Fabry-Perot-Interferometer scheiden (Abb. 21.16), Rayleighkriterium aus zwei polierten Glasplatten. Die Innen(Lord J. W. Rayleigh, 1842-1919) Auf Grund flächen liegen exakt parallel zueinander der Bedingung für konstruktive Interferenz, auch
's 'M
2d cos D : 2d c mO ; m 1, 2,3... 2S
O
Antireflexschichten 's ,
G ('M ) 4S d c
(21.45)
GO O2
folgt
2S m
GO O
(21.46)
Das (-) Zeichen bedeutet, dass mit zunehmendem GO der Phaenwinkel 'M kleiner wird. Das maximale spektrale Auflösungsvermögen ist definiert als
A:
O . GO
Teilverspiegelte Flächen Abb. 21.16: Zur Definition des RayleighKriteriums (21.47)
660
21 Interferenz und Beugung
Mit dem Kriterium G ('M ) H folgt für dieses
ªO º « GO » ¬ ¼ max
mS
R . 1 R
(21.48)
Eine weitere wichtige Größe ist der nutzbare oder freie Spektralbereich. Darunter verstehen wir den Bereich, in dem eine eindeutige Zuordnung der Wellenlänge möglich ist. Ist die Wellenlänge O j um einen solchen Betrag 'O größer als eine andere, Oi , dass die m-te Interferenzordnung von O j mit der (m+1)-ten Ordnung von Oi zusammenfällt, so gilt
(m 1)Oi
o 'O
Oi m
mO j ;
m(Oi 'O ) Freier Spektralbereich.
(21.49)
Der Quotient aus freiem Spektralbereich und kleinstem auflösbaren Wellenlängenbereich wird als Finesse F* bezeichnet:
FR*
S R 1 R
.
Reflektivitäts-Finesse.
(21.50)
Bei ideal ebenen und parallelen Spiegeln ist also das maximale (theoretische) Auflösungsvermögen durch das Reflexionsvermögen FR der Resonatorspiegel bestimmt. Durch Einsetzen von FR in (21.48) lässt sich das Auflösungsvermögen schreiben als
ªO º « GO » ¬ ¼ max
mFR*
Das theoretische Auflösungsvermögen ist sehr hoch. Wählen wir als R 0,98, d 5 mm, O 500 nm, m 2 104 , so wird FR =155 und > O / GO @max
(21.51)
Beispiel 3,1 106 .
Dagegen ist der freie Spektralbereich mit 'O 0,025 nm sehr gering. Das FPI ist daher dort von Nutzen, wo es innerhalb eines schmalen Wellenlängen- bzw. Frequenzbereiches auf sehr hohe Auflösung ankommt, z.B. zur Aussonderung einer einzelnen Resonatormode im EinModen-Laser. In anderen Fällen muss eine Vorzerlegung mit Hilfe eines Prismas oder eines Beugungsgitters erfolgen. Es soll angemerkt werden, dass in der Praxis das Auflösungsvermögen auch empfindlich von der Ebenheit der Spiegel abhängt. Bei einem Reflexionsvermögen von 95% und einer maximalen Abweichung von der Ebenheit von nur O/50 ergibt sich FR | 60 und FS | 50.
21 Interferenz und Beugung
661
Entsprechend
1 F *2
1
¦F i
*2
(21.52)
i
erhalten wir F = 38. Mit FR =100 folgt F = 45 und mit FR = 150 ergibt sich F = 47. Es hat also keinen Sinn, das Reflexionsvermögen der Spiegel über ein bestimmtes Maß zu steigern, wenn es nicht gelingt, die anderen Beiträge zur Finesse zu verkleinern. Ein wesentlich größeres F lässt sich bei Verwendung sphärischer Spiegel erreichen [L21.5].
21.1.3.4 Lummer-Gehrcke-Platte
Das Interferometer nach O. Lummer (1860-1925) und E. Gehrcke (1878-1960) besteht aus einer unverspiegelten streifenförmigen, planparallelen Glasplatte (Abb. 21.17). Die Primärwelle fällt unter einem so großen Winkel auf die Platte, dass das Licht an beiden Seiten fast streifend austritt. Das Reflexionsvermögen beträgt in einem solchen Fall (n = 1,5) ca. 95%. Das bedeutet, dass sehr viele Teilwellen zur Interferenz beitragen. Zur Beobachtung dient ein Fernrohr. Die reflektierten und die transmittierten Wellen verhalten sich wie beim FPI komplementär. Das liegt wie dort an der Sonderstellung der Abb. 21.17: Streifender Ausfall des Lichtes ersten Teilwelle. Es ist zweckmäßig, den bei einer Lummer-Gehrcke-Platte ersten, sehr intensiven reflektierten Teilstrahl zu eliminieren. Das kann mit einem kleinen aufgesetzten gleichschenkligen Prisma der gleichen Glassorte erreicht werden. Gleichzeitig kann dadurch die Lichtenergie optimal ausgenutzt werden. Das ist besonders wichtig, weil die Eintrittsfläche ziemlich klein ist. Die beiden Interferenzmuster sind jetzt natürlich in Phase. Der Vorteil der Lummer-Gehrcke-Platte liegt in der einfachen Handhabung. Nachteilig wirkt sich vor allem der Umstand aus, dass der Wellenlängenbereich durch die vorgegebene Dicke festgelegt ist. Auch ist das Auflösungsvermögen wegen des nach oben begrenzten Reflexionsvermögens kleiner als beim FPI.
662
21 Interferenz und Beugung
21.1.4 Antireflexschicht Spiegelungen an Glasflächen können sich sehr nachteilig bemerkbar machen, vor allem wenn sich, wie in optischen Instrumenten, mehrere von ihnen im Strahlengang befinden. Zum einen entstehen beträchtliche Verluste, zum anderen können lästige Geisterbilder auftreten. Aber auch Spiegelungen an Brillengläsern oder bei verglasten Bildern sind störend. Wird eine dünne dielektrische Schicht auf die Oberfläche aufgebracht, die so ausgelegt ist, dass das von ihr reflektierte Licht mit dem von der zu entspiegelnden Oberfläche zurückgeworfenem Licht destruktiv interferiert, so kann die Reflexion zum Verschwinden gebracht werden. Das ist allerdings streng nur für eine bestimmte Wellenlänge möglich. Durch Aufbringung weiterer Schichten gelingt eine breitbandige Unterdrückung der Reflexion. Um die Bedingungen zu ermitteln, unter denen Auslöschung eintritt, schreiben wir (für den Fall einer Schicht) die Amplituden der reflektierten Wellen auf. Das Vorgehen entspricht der obigen Behandlung der planparallelen Platte. Es ist lediglich zu berücksichtigen, dass jetzt die Brechungsindizes auf den beiden Seiten der Schicht unterschiedlich sind. Wir setzen senkrechte Inzidenz der Lichtwelle voraus. Mit den Bezeichnungen in (Abb. 21.18) folgt
A1
A0 A1 A2
Abb. 21.18: Unterdrückung der Reflexion für eine gegebene Wellenlänge durch Aufbringung einer Antireflexschicht
R1 A0 ;
A2
(1 R1 ) R2 A0
A3
(1 R1 ) R2 R1 A0
A4
(1 R1 ) R23 / 2 R1 A0
A5
(1 R1 ) R22 R13 / 2 A0
A6
(1 R1 ) R25 / 2 R12 A0 ....
(21.53)
Die Amplitude einer Teilwelle (m t 2) unterscheidet sich also von der der Vorhergehenden um den Faktor R1 R2 . Aus der Forderung, dass die resultierende Amplitude gleich null sein muss, ergibt sich für den Brechungsindex n2 der Antireflexschicht unter Beachtung von
R1 n2
2
n1 n2 / n1 n2
2
,
n1n3 .
(21.54)
Damit die Wellen destruktiv miteinander interferieren, müssen sie einen Phasenunterschied von (2m 1) S aufweisen. Daraus folgt für die Dicke d der Schicht
d
2m 1 OVak ; m 0,1, 2,3,.... 4 n1
(21.55)
21 Interferenz und Beugung
663
21.1.5 Dielektrische Spiegel Im vorangegangenen Abschnitt ging es darum, Spiegelungen zu vermeiden. In anderen Fällen ist es wünschenswert, das Reflexionsvermögen R zu optimieren, z. B. im Bereich der LaserTechnik. Durch Bedampfung mit einer metallischen Schicht können Spiegel mit maximal R | 90-95% hergestellt werden, was für solche Anwendungen nicht ausreicht. Eine Steigerung von R lässt sich durch Aufbringung mehrerer dielektrischer Schichten erreichen. Sie müssen so ausgelegt sein, dass die durch Reflexion erzeugten Teilwellen miteinander konstruktiv interferieren. Das lässt sich erreichen, indem ihr Brechungsindex abwechselnd einen hohen (nh) und einen niedrigen (nl) Wert hat, wobei bei senkrechter Inzidenz die einleuchtende Forderung
nh d h
nl d l
OVak
(21.56)
4
erfüllt sein muss. Abb. 21.19 illustriert den Sachverhalt. Das Reflexionsvermögen ergibt sich zu
n2 n2 n2 A0
2
§ 1 ( nh / nl ) 2 N · R ¨ . 2N ¸ © 1 (nh / nl ) ¹
(21.57)
Es ist umso größer, desto größer das Verhältnis (nh / nl ) ist. Mit wachsendem N geht R gegen den Wert 1. In der Praxis werden Spiegel mit 10 - 20 Schichten verwendet.
Glas A7
n1 n1 n1
n3
Abb. 21.19: Dielektrischer Spiegel zur Optimierung des Reflexionsvermögens durch Bedampfung mit Schichten abwechselnd hohen und niedrigen Brechungsindexes
21.2 Beugung 21.2.1 Huygens-Fresnelsches Prinzip In allen optischen Anordnungen werden seitlich begrenzte Lichtbündel verwendet. Diese Einengung des Lichtstromes kann durch Blenden, Linsenfassungen oder Spiegel erfolgen, die sich im Strahlengang befinden. Bei genauem Hinsehen stellen wir fest, dass sich das Licht auch außerhalb des geometrischen Schattenbereichs ausbreitet. Die Lichtwelle wird an dem Hindernis gebeugt. Abhängig von dessen Form entstehen charakteristische Intensitätsmuster. Sie sind besonders ausgeprägt, wenn die Öffnung der Blende nicht viel größer als die Wellenlänge ist. Die entstehenden Beugungsmuster müssen sich aus der Wellengleichung des elektromagnetischen Feldes ableiten lassen. Das ist ein sehr schwieriges Unterfangen. Einen ersten Schritt in dieser Richtung ist das Huygenssche Prinzip (Ch. Huygens, 1629-1695) , das
664
21 Interferenz und Beugung
wir u. a. bereits zur Ableitung des Reflexions- und Brechungsgesetzes benutzt haben. In der von A. J. Fresnel (1788-1827) vorgenommenen Erweiterung lautet es Jeder Ort einer Phasenfläche einer Welle ist selbst wieder Ausgangspunkt einer Elementarwelle. Die an einem Aufpunkt P beobachtete Wellenerscheinung ergibt sich durch Überlagerung dieser Elementarwellen
G. K. Kirchhoff zeigte, dass das H.-F. Prinzip tatsächlich näherungsweise eine Lösung der Wellengleichung darstellt. Allerdings trägt sie nicht dem Vektorcharakter der Feldgrößen Rechnung. Polarisationseigenschaften der Wellen vermag sie folglich nicht zu beschreiben. Für die Feldamplitude E(P) in einem Aufpunkt P(r) ergibt die Kirchhoffsche Theorie mit den Bezeichnungen in Abb. 21.20 (s. Ergänzung 1 am Ende des Kapitels)
P(x ,h )
y
E ( P)
G G E0 ik cos( rQ , dA) 2S rQ r
³³ e
ik ( rQ r )
d [ dK
Öff
x
RQ
bP
(21.58)
z
r rP
aP
r RP P (r )
Abb. 21.20: Zur Erläuterung der Kirchhoffschen Integralformel aaa
Die Beugungsfiguren hängen von der Entfernung der Quelle und des Beobachtungsschirms ab. Zur Klassifizierung entwickeln wir (rQ + r) nach [ und K . Wie am Ende des Kapitels (Ergänzung 2) abgeleitet, ergibt sich 2
I ( P)
³³ e
ik ) ([ ,K )
d [ dK ,
(21.59)
Öff
wobei
) ([ ,K ) 1 °§ 1 1 · 2 2 ¸ ([ K ) 2 ¯°© RQ RP ¸¹
[ (cos D Q cos D P ) K (cos EQ cos E P ) ®¨ ¨
([ cos D Q K cos E P ) 2 RQ
(21.60)
([ cos D P K cos E P ) 2 ½ ¾ ... KK RP ¿
In diesem Ausdruck stehen die Kosinus-Terme für den Ort der Quelle und des Aufpunktes:
21 Interferenz und Beugung
cos D Q cos E Q
xQ RQ yQ RQ
665
; cos D P
xP ; RP
; cos E P
yP . RP
(21.61)
Werden nur lineare Terme in der Entwicklung berücksichtigt, so sprechen wir von Fraunhoferscher Beugung (A. J. Fraunhofer, 1787-1826). Das bedeutet, dass die Beugungsfigur im Fernfeld ( rQ , r o f ) zu untersuchen ist. Den allgemeinen Fall, in dem also Quelle und Beobachtungsschirm in endlicher Entfernung von der beugenden Öffnung liegen, bezeichnen wir als Fresnelsche Beugung (A. J. Fresnel, 1788-1827). Oft reicht die Mitnahme quadratischer Glieder aus. Besteht die beugende Öffnung aus einem Spalt, dessen Längsausdehnung größer als der Durchmesser des Lichtbündels ist, oder mehreren parallelen Spalten, so muss das Integral nur über [ geführt werden. Ersetzen wir DQ und Dp durch den Einfallswinkel D und den Ausfallswinkel E, so geht 21.59 für Fraunhofersche Beugung über in 2
I ( P) ³ e
ik[ (sin D sin ß )
d[ .
(21.62)
21.2.2 Fraunhofersche Beugung Zur Realisierung von Fraunhoferscher Beugung wird ein Beugungsschirm mit einer oder mehreren Öffnungen mit parallelem monochromatischem Licht bestrahlt (Abb. 21.21). Dieses wird entweder durch eine Quelle im Brennpunkt einer Sammellinse erzeugt oder von einem kleinen Laser, dessen Strahl zunächst mittels einer Zerstreuungslinse aufgeweitet wird. Die Beugungfigur lässt sich nach Fokussierung des abgebeugten Lichtbündels f auf einem Schirm betrachten. Wir besprechen nun einige typische Fälle, wobei zur f einfacheren mathematischen Beschreibung Abb. 21.21: Anordnung zur Demonstration angenommen wird, dass die einfallende ebeder Fraunhoferschen Beugung ne Welle senkrecht auf den Beugungsschirm trifft.
666
21 Interferenz und Beugung
21.2.2.1 Beugung am rechteckigen Spalt
Die beugende Öffnung sei ein Spalt der Breite b und der Länge l >> b (Abb .21.22). Die einfallende monochromatische ebene Welle wird in alle Richtungen gebeugt. Der Winkel zwischen der Betrachtungsrichtung und der Spaltnormalen sei mit - bezeichnet. Das Beugungsbild besteht aus einer Anzahl heller und dunkler Streifen, die gemäß (21.62) durch phasenrichtige Überlagerung unendlich vieler von der Spaltöffnung ausgehender Elementarwellen entstehen. Wir wollen die Bedingungen für das Auftreten der Maxima und Minima ableiten. Dazu denken wir uns den Spalt in unendlich viele Teile zerlegt, von denen Elementarwellen ausgehen. Eine von der Mitte des Spaltes abgestrahlte gebeugte Welle ergibt am Beobachtungsort die Feldstärke
G E ( P)
r rx P
x r rs x
x z
x sinJ
b
Abb. 21.22: Zur Berechnung der Intensitätsverteilung wird die einfallende ebene Welle in unendlich viele Teilwellen zerlegt b/2
E ( P)
³
e ikx sin - dx b
b / 2
(21.63)
Eine in der Spaltebene im Abstand x entstehende Welle besitzt gegenüber dieser einen Phasenunterschied x sin -. Sie wird also beschrieben durch
r r0P
J
G E0 e i (Zt kr0 P ) .
G E' x ( P )
G E0 e i (Zt k ( r0 P x sin - )) .
(21.64)
Wir müssen nun über alle Wellen im Bereich -b/2 < x < b/2 summieren. Gehen wir zu skalaren Größen über und tragen E(P) in (21.58) ein, so haben wir das Integral zu bilden
sin ^(kb sin - ) / 2` (kb sin - ) / 2
S b ½ sin ® sin - ¾ O ¿ b ¯ Sb sin -
(21.65a)
O
Diese Amplitudenfunktion wird auch als Spaltfunktion bezeichnet. Für die Intensität I(P) folgt damit
M
kb sin -
2S
b
O
sin -
(21.65b)
Anstatt zu integrieren, hätten wir auch wie bei der Behandlung der Interferenz in Kap. 21.1.1 über m diskrete Teilwellen summieren und anschließend m o f streben lassen können. Ein Blick auf (21.34) zeigt, dass die Ergebnisse in der Tat identisch sind.
21 Interferenz und Beugung
667
Die Intensität als Funktion von sin- ist in Abb. 21.23 gezeigt. Das Hauptmaximum liegt an der Stelle sin- bzw. - = 0. Es wird als Maximum nullter Ordnung bezeichnet. Kleinere Maxima, sog. „Nebenmaxima“, treten auf für
sin -
r
2N 1 O ; ( N 1, 2,3,...) , 2 b
(21.66a)
Minima liegen an den Stellen
rN
O b
.
(21.66b)
Die Zone gebeugten Lichtes ist nur merklich ausgeprägt, wenn die Wellenlänge in der Größenordnung der Spaltbreite liegt, O | b, und b > O ist. Optische Elemente sind im Allgemeinen kreisrund. Deswegen sind Beugungseffekte, die durch eine Kreisblende (Radius R) verursacht werden, besonders wichtig. Die Rechnung, die nicht mehr elementar durchführbar ist, liefert für die Intensitätsverteilung (L21.6) 2
I (- )
§ 2 I ( x) · I0 ¨ 1 ¸ ; x © x ¹
2S R
O
sin -
0,0625 0,25
1.0 Intensität I/I 0
sin -
0.8 b/l =1
0.4
4 16
0.0 - p/2
0 p/4 p/2 -p/4 Beugungswinkel J
Abb. 21.23: Intensitätsverteilung bei der Beugung an einem Spalt der Breite b für verschiedene b/O in Abhängigkeit vom Beugungswinkel
(21.67) Darin ist I1(-) die Besselfunktion erster Ordnung. Aus Symmetriegründen ergibt sich eine ringförmige Struktur. Die erste Nullstelle liegt bei x1 = r 1,22 S. Im Vergleich zur Spaltbeugungsfunktion nimmt die Intensität mit wachsendem - schneller ab. Das ist plausibel, weil damit die Radien der Ringe anwachsen und die Intensität pro Fläche somit immer geringer wird. Auf den ersten Blick erstaunlich ist es, dass bei Vertauschung der Blende durch eine kleine Scheibe im Zentrum ebenfalls ein heller Fleck erscheint (Poisson-Fleck). Aber auch dieser ist nur eine Folge der Wellennatur des Lichts.
21.2.2.2 Beugung am linearen Gitter
Wird eine größere Zahl gleichartiger Spalte in einer Reihe angeordnet, so sprechen wir von einem linearen Gitter. Derartige optische Gitter sind für die Spektroskopie von großer Bedeutung, allerdings werden nicht Transmissionsgitter („Strichgitter“), sondern Reflexionsgitter (Abb. 21.24) verwendet, die sich durch Ritzung einer Glasplatte oder durch
668
21 Interferenz und Beugung
holographische Techniken herstellen lassen. Neben der leichteren Herstellbarkeit bieten Reflexionsgitter den Vorteil, nahezu die gesamte Strahlung auszunutzen, während beim Transmissionsgitter immer der auf die Gitterstege fallende Teil verloren geht.
d
d
Abb. 21.24: Echelettegitter und Sinusgitter Hinzu kommt, dass es durch bestimmte Formgebung der Oberfläche möglich ist, das gebeugte Licht eines gegebenen Wellenlängenbereichs im Wesentlichen in eine Beugungsordnung zu konzentrieren. Die prinzipielle Struktur der Beugungsfigur ist unabhängig vom Gittertyp. Die „Spalte“ der Breite b dienen dazu, interferenzfähiges Licht zu erzeugen. Zwei von verschiedenen Spalten ausgehende Teilwellen besitzen einen von der Gitterkonstante d und der x-Koordinate abhängigen Phasenunterschied.
M (nd x)sin - ;
n 1, 2, 3,..., N 1
(21.68)
Die Amplitude ergibt sich zu N 1 b / 2 ½° ° E ( P) ¦ ® ³ e ik ( nd x )sin - dx ¾ °b / 2 n 0¯ ¿°
N 1
¦ eikdn sin- n 0
b/2
³
e ikx sin - dx \ Interf \ Spalt
b / 2
(21.69) Die Interferenzfunktion ist identisch mit der durch 21.34 gegebenen Interferenzfunktion
\ gitter
sin( pM / 2) sin( N ) / 2) , o sin(M / 2) sin() / 2)
Wobei N die Anzahl der Gitteröffnungen („Spalte“) und ) 2
2
sin( N ) / 2) ½ sin(M / 2) ½ I ( P) ® ¾ ® ¾ , ¯ sin() / 2) ¿ ¯ (M / 2) ¿ mit I
2S
d
O
sin - ;
kd sin - ist. E(P) wird so
M
2S
b
O
sin - .
(21.70)
21 Interferenz und Beugung
669
Die Intensität als Funktion von sin- ist in Abb. 21.25a wiedergegeben. Die Intensitätskurve des Einzelspaltes zerfällt in diskrete, schmale durchlässige Bereiche. Entsprechend ihrer Entstehung heißen sie Maxima nullter, erster, …, m-ter Ordnung. Ihre Anzahl und Schärfe wächst mit der Zahl der Gitteröffnungen N. Analog der Diskussion der Interferenzfunktion (21.34) treten Maxima auf, wenn
N
) 2
2S
O
'
2S
O
d sin -
2S m ;
m
0,1, 2,... .
(21.71a)
ist, also wenn bei senkrechter Inzidenz gilt
d sin -
mO ; m 0, r1, r2... ;
(21.71b)
60 40 20
Spaltbeugungsfunktion
Interferenzfunktion
1.0
Intensität I/I 0
I (willk. Einh.)
Die Eigenschaft des Gitters, einfallende Strahlung entsprechend ihrer Wellenlänge aufzufächern, wird in Spektrometern ausgenutzt.
0.8 0.6 0.4 0.2
0
-3. -2. -1. 0. 1. 2. 3. Ordn. sinJ
0.0
x
Abb. 21.25: a) Intensitätsverteilung beim Strichgitter als Funktion des Sinus des Beugungswinkels-; b) Zur Ableitung des Auflösungsvermögens
Wir wollen wieder ausrechnen, wie groß der Wellenlängenunterschied zweier Spektrallinien sein muss, damit sie infolge der Beugung noch voneinander getrennt werden können. Dabei gehen wir vom Rayleigh-Kriterium aus: Zwei (gleich intensive) Spektrallinien können noch getrennt werden, wenn die durch Beugung verbreiterte Spektrallinie m-ter Ordnung der Wellenlänge O +GO in das erste Minimum der Beugungsfigur m-ter Ordnung der Linie der Wellenlänge O fällt (Abb. 21.25b), wenn also gilt
m(O GO ) mO O / N 1 ; mN GO O .
(21.72a) (21.72b)
670
21 Interferenz und Beugung
Bei vorgegebener Wellenlänge und Ordnung ist der auflösbare Wellenlängenunterschied umgekehrt proportional der Anzahl der interferierenden Teilwellen. Das Auflösungsvermögen wird damit
O GO
Nm .
(21.73)
Der nutzbare Spektralbereich, der dadurch definiert ist, dass eine eindeutige Zuordnung der Wellenlänge möglich ist, folgt wie beim FPI (Kap. 21.1.2.1) zu
'O
O/m .
(21.74)
Zurück zum Reflexionsgitter. Eine wichtige Realisierung ist das Echelettegitter, Abb. 21.26, („Leiterchen“-Gitter). In Spektrometern bilden einfallende und ausfallende Welle einen festen Winkel U miteinander. Zur Wellenlängenanalyse wird das Gitter um einen Winkel D aus der Position der nullten Ordnung herausgedreht. Es ist daher zweckmäßig, die allgemeine Interferenzbedingung (-0 = Einfallswinkel bez. der Gitterebenennormalen, - = Beugungswinkel)
d (sin -0 sin - ) mO
(21.75)
entsprechend umzuschreiben. Gemäß Abb. 21.26 gilt
-0
U / 2 D; - U / 2 D
(21.76)
Setzen wir dies in (21.65) ein, so erhalten wir nach trigonometrischer Umformung als Verknüpfung der Wellenlänge und des Gitterdrehwinkels
2d cos( U / 2) sin D
J0
(21.77)
Wir setzen nun voraus, dass die Furchenbreite d´ groß gegen die Wellenlänge ist, d´ >> O. Die Gitterkonstante d ist mit der Stufenhöhe H und dem Furchenwinkel G verknüpft über
r /2
d¢ d
mO .
J
d
H a
Abb. 21.26: Zur Charakterisierung des Echelettegitters
H
d sin G .
(21.78)
Berücksichtigen wir dies in der vorhergehenden Beziehung, so ergibt sich im Falle D = G
2 H cos( U / 2) mO .
(21.79)
21 Interferenz und Beugung
671
Das bedeutet, dass in dieser Gitterposition die Beugung einfallender benachbarter Strahlen geometrisch optischer Reflexion an den Furchenflächen entspricht. Die Winkel D´, ß´ zwischen der Einfalls- bzw. Ausfallsrichtung der Wellen und der Furchennormale sind gleich:
-0c -0 G ;
-c - G .
(21.80)
Einsetzen von (21.76) führt für D = G zu -0c - c U / 2 . Alle von den verschiedenen Furchenflächen ausgehenden Teilwellen sind in Phase. Sie merken sozusagen nicht, dass sie durch Beugung und Interferenz entstanden sind und sehen daher – vereinfacht – auch keinen Anlass, einen Teil ihrer Energie in andere Beugungsordnungen zu verteilen. Die gesamte Energie einer einfallenden Welle mit einer durch (21.79) bestimmten Wellenlänge wird in eine Richtung konzentriert. Näherungsweise gilt das auch noch für Strahlung benachbarter Wellenlängen, aber je mehr diese von der Glanzwellenlänge abweichen, desto stärker verteilt sich die Energie auf andere Beugungsordnungen. Der Gitterdrehwinkel D = G wird „Blaze-Winkel oder Glanzwinkel genannt. Bilden die Gitterelemente (im Querschnitt) kleine rechtwinklige Dreiecke, so entsteht ein Stufengitter. Dies wird unmittelbar einsichtig, wenn wir in obiger Darstellung D = 90° wählen. Solche Gitter finden sich in den Flügeln der Schmetterlinge und erzeugen deren vielfältige Farben.
21.2.2.3 Beugung am Flächen- und Raumgitter
Zur Charakterisierung kristalliner Strukturen ist die Beugung kurzwelliger elektromagnetischer Wellen (Röntgen- und J-Strahlen) von großer Bedeutung. Das Auftreten von Intensitätsmaxima ist jetzt in letzteren Fall an drei Bedingungen geknüpft, die in den Laue-Gleichungen formuliert sind und bereits in Kap. 19.3 im Rahmen der Diskussion der (Licht-) Streuung abgeleitet wurden. Sie lauten in der dort angegebenen Form (im Frequenzbereich der Gitterschwingungen wird für die Wellenzahl der Buchstabe q statt k verwendet.)
G G a 'q 2S h G G b 'q 2S k G G c 'q 2S l
h, k , l
0,1, 2, ...
(21.81)
Hierin bedeuten a, b, c die Abstände der als punktförmig angenommenen Atome in den drei G Raumrichtungen. 'q (2S / O )( sˆ0 sˆ) ist die Differenz der Wellenvektoren von einfallender und gebeugter Strahlung (Abb. 21.27). Sind D 0c , E 0c , J 0c und D c, E c, J c die Winkel zwischen den Achsen und den Fortpflanzungsrichtungen sˆ0 , sˆ der einfallenden und der gebeugten Welle, so geht (21.81) über in
672
21 Interferenz und Beugung
a (cos D 0c cos D c) hO ; b (cos E 0c cos E c) k O ; c (cos J 0c cos J c) l O .
(21.82)
sˆ
(h, k , l ) 1, 2,3 Translationsr vektor t
Durch Ersetzung der Winkel durch die zugehörigen Einfalls- und Beugungswinkel werden (D = 90 - D´, ß = 90 - ß´, …)
c
sˆ 0 a
b
Abb. 21.27: Beugung am kubischen Raumgitter
aus diesen Beziehungen die Gleichungen
a (sin D 0 sin D )
hO ;
b (sin E 0 sin E ) k O ; c (sin J 0 sin J )
(21.83)
lO .
Zur Veranschaulichung setzen wir die Einfallswinkel gleich null. Die primäre Welle möge parallel zur z-Achse auf eine kubische Anordnung von Atomen fallen (Abb. 21.28). Zunächst betrachten wir eine lineare Atomkette. Denken wir uns einen kugelförmigen Film um das mittlere Atom gelegt, so zeigen sich auf Ersterem als Beugungsfigur konzentrische Kreise.
Lineares Punktgitter
Abb. 21.28: Lineares Punktgitter im Zentrum einer Kugel. Die gebeugten Strahlen bilden Kegelmäntel, deren Schnittlinien mit der Kugeloberfläche gezeichnet sind
Flächenhaftes Gitter Abb. 21.29: Bei einem flächenhaften Gitter treten Maxima nur dort auf, wo sich die Mäntel der senkrecht zueinander liegenden Kegel schneiden und
21 Interferenz und Beugung
673
Sie entstehen als Schnittlinien der von den Atomen ausgehenden Strahlungskegeln mit dem Film. Jeder Kreis entspricht einer bestimmten Beugungsordnung. Ersetzen wir das lineare Gitter durch ein Flächengitter in der xy-Ebene, so folgen aus (21.83) zusätzliche Schnittlinien in der xz-Ebene. Nur in ihren Schnittpunkten sind beide Interferenzbedingungen erfüllt. Abb. 21.29 zeigt das auf einen ebenen Schirm projizierte Beugungsbild eines Kreuzgitters. Bei einem dreidimensionalen Gitter reduziert sich die Anzahl dieser Punkte auf solche, für welche auch die dritte Laue-Gleichung erfüllt ist. Den Laue-Gleichungen äquivalent ist die von W. L. Bragg (1890-1971) aufgestellte BraggGleichung. Sie beruht auf der Erkenntnis, dass den Atomen eines Kristalls bestimmte Gitterebenen zugeordnet werden können (Abb. 21.30). Auf Grund der periodischen Anordnung der Atome gibt es zu einer gegebenen Gitterebene viele zu ihr parallele Ebenen. Eine einfallende ebene Welle wird an den Atomen dieser Gitterebenen gebeugt. Die gebeugten Teilwellen haben einen bestimmten Gangunterschied '. Damit sie konstruktiv interferieren können, muss dieser ein ganzzahliges Vielfaches der Wellenlänge betragen. Bezeichnen wir den Abstand (die Gitterkonstante) zwischen zwei benachbarten Ebenen mit d, so lautet die Bedingung
2d cos D
mO ; m 1, 2,3,...
(21.84)
Wie Abb. 21.30 zeigt, lässt sich das Zustandekommen der konstruktiven Interferenz formal als Reflexion an den Gitterebenen auffassen. Daraus entstand die Bezeichnung „Bragg-Reflexion“. In Wirklichkeit handelt es sich aber um einen Beugungs- und Interferenzvorgang; die Bragg-Gleichung kann aus den Laue-Gleichungen abgeleitet werden. Einkristalle können wie lineare Gitter im Sichtbaren zur spektralen Zerlegung von Röntgenstrahlung oder Materiewellen (z. B. von Neutronen geeigneter Wellenlänge) eingesetzt werden.
a a
L
L
d d d
Abb. 21.30: Zur Ableitung der Bragg-Gleichung
21.2.3 Fresnelsche Beugung 21.2.3.1 Fresnelsche Zonenplatte
Auf eine runde Lochblende falle eine ebene monochromatische Welle der Wellenlänge O (Abb. 21.31a/b). Von jedem Punkt der Blendenebene gehen nach dem Huygens-Fresnelschen Prinzip Elementarwellen aus. Die resultierende Amplitude in einem gegebenen Punkt ergibt sich durch Überlagerung der Amplituden der einzelnen Teilwellen (L21.4). Wir fragen nach der Intensität in einem Punkt P auf der Symmetrieachse der Blende. Der Phasenunterschied der
674
21 Interferenz und Beugung
Rm = mr0 l
r0 +ml / 2
r0
Abb. 21.31: a) Zur Ableitung der Fresnelschen Zonen b) Fresnelsche Zonen; zu jedem Punkt einer Zone gibt es einen Punkt in einer benachbarten Zone, dessen Abstand von P sich umO/2 unterscheidet
F
b)
a)
Teilwellen hängt vom Lochdurchmesser 2R und dem Abstand r0 des Punktes P von der Blende ab. Die Punkte mit gleich großem Abstand von P liegen auf Kreisen mit dem Radius R bzw. r = r0 sin -. Zu einem Abstand rm = r0 + mO/2 von P gehört ein Kreis mit eben diesem Radius; ein nächster besitzt den Radius rm+1 = r0 + (m + 1)O/2. Die Bereiche zwischen solchen Kreisen heißen Fresnelsche Zonen. Zu jedem Punkt einer Zone gibt es einen Punkt in der benachbarten Zone, dessen Abstand r von P sich um O/2 unterscheidet. Die elektrische Feldstärke einer von einem Zonenelement dAm ausgehenden Elementarwelle ist gegeben durch
dE
K
E0 i (Zt kr ) e dA . r
(21.85)
Hierin ist
dA 2S RdR
2S rdr .
(21.86)
Der Faktor K berücksichtigt die Abhängigkeit der Amplitude der von dA ausgehenden Welle vom Winkel -; er ist nur schwach veränderlich. Damit ergibt sich rm
E
2S KE0
³e
i (Zt kr )
dr ;
rm1
Em
rm 2S K m E0 ª¬ e ikr º¼ rm1 ik 2S K m ik r ( m 1) O / 2@ E0 e ik ( r0 mO / 2) e > 0 ik 2S K m E0 (1) m 1 . ik
^
`
(21.87)
21 Interferenz und Beugung
675
Wie zu erwarten ändert sich die Phase der elektrischen Feldstärke von Zone zu Zone um den Faktor S. Dieses Faktum wird bei der Fresnelschen Zonenplatte zur Steigerung der im Punkt P auftretenden Intensität ausgenutzt. Setzen wir nämlich eine so bedampfte Glasplatte, dass sie das Licht jeder zweiten Zone zurückhält, hinter die Lochblende, so interferieren die durchtretenden Teilwellen alle konstruktiv miteinander. Es tritt kein Intensitätsverlust durch destruktive Interferenz mehr auf. Die Radien und die Breite der transmittierenden Zonen hängen vom Abstand des Aufpunktes P von der Zonenplatte ab. Der Radius ergibt sich aus
Rm
(r0 mO / 2) 2 r02 | mr0 O .
(21.88)
Die Zonenbreite nimmt mit wachsendem m ab:
'Rm
Rm 1 Rm
r0 O
m 1 m .
(21.88a)
Das ist verständlich, denn damit die den Zonen zugeordneten Feldstärken gleich sind, müssen ihre Flächen gleich sein, d.h. bei zunehmendem Radius muss die Breite abnehmen. Es ergibt sich für A
A S ( Rm2 1 Rm2 ) S r0 O .
(21.89)
Die Flächen der Fresnelschen Zonen sind alle gleich groß. Eine Fresnelsche Zonenplatte wirkt als Sammellinse mit der Brennweite f = r0. Mit (21.88) ergibt sich
f
Rm2 mO
R12
O
.
Die Brennweite ist durch den Radius R1 der ersten Fresnelschen Zone und die Wellenlänge des Lichtes bestimmt. Obgleich solche „Beugungslinsen“ also eine erhebliche chromatische Aberration besitzen, werden sie häufig in Scheinwerfern, Overheadprojektoren, Suchern in Fotoapparaten etc. verwendet. Eine wichtige Rolle spielen sie bei der Fokussierung von Röntgenstrahlen (L21.7) und neuerdings auch von Atomstrahlen. Im weichen Röntgenbereich
(O = 2,4 nm 620 eV bis etwa O = 0,17 nm 7 keV) gibt es keine hinreichend stark fokussierenden „Brechungslinsen“, da der Brechungsindex nahezu eins ist. In dem oben gewählten Beispiel wird die Zonenplatte mit einer ebenen Welle beleuchtet. Der Brennpunkt kann als reelles Bild einer unendlich entfernten punktförmigen Lichtquelle angesehen werden. Zusätzlich entsteht ein virtuelles Bild der Quelle in gleichem Abstand vor der Platte. Bei den bisherigen Überlegungen haben wir nämlich nicht berücksichtigt, dass zu jeder unter einem Winkel - abgestrahlten Welle auch eine unter dem Winkel -- gehört. Das Auge verlängert die entsprechenden Strahlen nach vorne bis zu ihrem virtuellen Schnittpunkt, dem Ort des virtuellen Bildes. Im vorderen Halbraum wirkt die Zonenplatte zusätzlich als Zerstreuungslinse.
676
21 Interferenz und Beugung
Fresnelsche Zonenplatten in der besprochenen Art nutzen nur die Hälfte der auffallenden Strahlung aus. Die andere Hälfte wird von den undurchlässigen Zonen zurückgehalten. Sie kann ebenfalls nutzbar gemacht werden, wenn diese Zonen so angeätzt werden, dass zwischen einem Punkt in einer Rinne und dem entsprechenden Punkt eines benachbarten Steges neben dem bereits vorhandenen Gangunterschied von O/2 ein zusätzlicher Wegunterschied von O/2 entsteht. In diesem Fall können wir uns die kammförmige Zonenplatte als aus zwei Zonenplatten zusammengesetzt denken, deren Teilwellen konstruktiv miteinander interferieren (Abb. 21.32). Der Gangunterschied zwischen dem m-ten und dem (m+1)-ten Strahl ist bei einem Brechungsindex n der Platte
'sm, m 1
(n 1) H
O 2
.
(21.90)
Konstruktive Interferenz im Punkt P tritt ein, wenn der erste Summand zu einem ungeradzahligem Vielfachen von O/2 gewählt wird,
(n 1) H
H
sm
sm+1
O . 2
(21.91)
Das Auflösungsvermögen einer Zonenplatte ist durch die Breite der äußersten Zone gegeben. Eine hochauflösende Zorm n nenplatte mit einer Breite der äußersten Zone von 25 nm ergibt unter ZugrundeleF gung des Rayleigh-Kriteriums ' = 1,22 drn den Wert ' = 30 nm. Soll das Auflösungsvermögen weiter gesteigert werden, etwa für die Mikroskopie einer Materialprobe unter Ausnutzung der Strahlung eines FreieElektronen-Lasers, müssen andere Wege Abb. 21.32: Kammförmige Fresnelsche beschritten werden. Derzeit werden sog. Zonenplatte zur Optimierung der transPhotonensiebe auf ihre Tauglichkeit hin mittierten Intensität aus untersucht (L21.8, 9). Darunter ist eine lichtundurchlässige Folie zu verstehen, die mit vielen tausend nahezu statistisch angebrachten Löchern versehen ist. Betrachten wir der Einfachheit wegen die Abbildung eines Punktes im Abstand a auf der optischen Achse in einen Punkt mit dem Abstand b auf der anderen Seite des Siebes. Sind die Löcher so angeordnet, dass die optische Weglänge von der Röntgenquelle durch das Zentrum eines gegebenen Loches zum Fokus ein ganzzahliges Vielfaches der Wellenlänge O der Strahlung beträgt, so entsteht durch konstruktive Interferenz im Fokus ein heller Lichtfleck. Strahlung, für die diese Bedingung nicht erfüllt ist, wird ausgelöscht. Der Abstand rn der Löcher von der optischen Achse muss also der Bedingung genügen
rn2 a 2 rn2 b 2
a b nO
21 Interferenz und Beugung
677
wobei n eine ganze positive Zahl ist. Durchmesser und Lage eines Loches sind miteinander korreliert. Doch soll auf diese Einzelheiten (L21.8) hier nicht näher eingegangen werden. Es zeigt sich, dass der kleinste auflösbare Abstand kleiner als der kleinste Lochdurchmesser ist.
21.2.3.2 Fresnelsche Beugung an einem Spalt und einem Draht
Die Berechnung der Beugungsfiguren bei Fresnelscher Beobachtungsart ist wegen der quadratischen Terme wesentlich schwieriger als für Fraunhofersche Beobachtungsweise. Im Allgemeinen ist nur eine numerische Integration möglich (L20.1). Als Beispiel betrach1 ten wir den Fall eines unendlich langen Spaltes der Breite b. Liegt dieser längs y in der Fraunhoferxy-Ebene, so wird die Phase in einem Punkt z0 >> b 2 / l Beugung P(xP,0) nach (21.60/61)
) ([ ,0) [ (cos D Q cos D P )
1 [ 2 xP2 ½ ®1 ¾. 2 RP ¯ RP2 ¿
(21.92)
1
Dieser Ausdruck ist in (21.59) einzusetzen. Das Integral hängt über RP stark von der Entfernung z0 der Beobachtungsebene von der FresnelSpaltebene ab. Für einige z0 sind die berechBeugung neten Beugungsbilder in Abb. 21.33a zusammengestellt. Bei Annäherung des Beobach1 tungspunktes an die Spaltebene ändert sich z0 << b 2 / l das Beugungsbild erheblich. Die Intensität zeigt jetzt schwache Helligkeitsfluktuationen im Spaltbereich, dagegen verschwinden jene Abb. 21.33a: Beugung am Spalt: im geometrischen Schattenbereich. Im NahÜbergang von Fraunhoferscher feldbereich fällt die Intensität von ¼ des zu Fresnelscher Beobachtungsart mittleren Wertes monoton auf null ab. Die Spaltkanten können deswegen nicht genau erkannt werden. Abb. 21.33b zeigt im oberen Teil das Beugungsbild eines Spaltes bei Fresnelscher Beobachtungsart und zum Vergleich darunter ein solches für einen Draht. Sein Durchmesser ist gleich dem der Spaltöffnung gewählt.
678
21 Interferenz und Beugung
Abb. 21.33b:Fresnelsche FresnelscheBeugung Beugungam amSpalt Spalt(oben) (oben) Abb.7.33b: Abb. 21.33b: Fresnelsche Beugung am Spalt (oben) bzw. am Draht (darunter). Zur Verdeutlichung bzw. am Draht (darunter). Zur Verdeutlichung wurde im unteren Bild der Kontrast nachträglich erhöht und
21.2.3.3 Fresnelsche Beugung an einer Kante
Das Fresnelsche Beugungsbild einer Kante ist in Abb. 21.34 dargestellt. Der Intensitätsverlauf ist nahezu identisch mit der in der Mitte aufgeschnittenen Beugungsfigur eines breiten Spaltes.
21.2.3.4 Fresnelsche Beugung an einer kreisförmigen Öffnung und einer Scheibe
Fällt senkrecht auf eine Lochblende mit dem Durchmesser 2R ein paralleles Lichtbündel, so entstehen auf einem zur Blendenebene parallelem Schirm ringförmige Strukturen, die vom Abstand z0 des Schirmes von der Blende abhängen (Abb. 21.35). Die Intensität im Punkt P0 in der Mitte des Schirmes wird maximal, wenn z0 R 2 / O gewählt wird. In diesem Fall stimmt
21 Interferenz und Beugung
679
Abb. 21.34: Fresnelsche Beugung an einer Kante (links) Abb. 21.35: Fresnelsche Beugung an einer kreisförmigen Öffnung (oben rechts) bzw. an einer Scheibe (unten rechts)
der Radius der ersten Fresnelzone, r1
z0 O , mit dem Blendenradius überein. Mit abneh-
mendem Abstand z0 entsteht auch die zweite Zone. Sie interferiert destruktiv mit der ersten, so dass die Intensität in P0 stark abnimmt. Bei weiterer Annäherung des Schirmes an die Blendenebene enthält die Lochblende auch die dritte Fresnelzone, womit sich die Schirmmitte wieder aufhellt usw. Die Intensität im Punkt P0 schwankt periodisch und es entstehen immer mehr helle und dunkle Ringe. Der rechte untere Teil zeigt das Beugungsbild einer Scheibe.
680
21 Interferenz und Beugung
21.2.4 Babinetsches Theorem Ersetzen wir bei der Fraunhoferschen Beugungsart den Spalt durch einen geraden Draht, dessen Dicke gleich der Spaltbreite ist, so zeigt sich, dass die Beugungsbilder außerhalb des geometrischen Schattenbereichs identisch sind (Abb. 21.36links).
Abb. 21.36: Fraunhofersche Beugung. Demonstration des Babinetschen Prinzips; links: Drei jeweils nebeneinander angeordnete komplemtäre Strukturen; rechts: Beugung am Draht und Spalt
Analog können wir die kreisförmige Öffnung durch eine gleich große undurchlässige Scheibe austauschen. Auch in diesem Fall sind die beiden Beugungsfiguren gleich. Offenbar ergeben komplementäre Strukturen (Abb. 21.36 rechts) gleiche Intensitätsverteilungen. Dieser Sachverhalt wurde zuerst von J. Babinet (1794-1872) erkannt und heißt Babinetsches Theorem. Es kann wie folgt formuliert werden: Komplementäre Beugungsanordnungen (wie Spalt und Draht gleicher Abmessungen) ergeben bei Fraunhofer-Beugung außerhalb des Bereiches geometrischoptischer Abbildung gleiche Beugungsbilder.
Die Aussage des Theorems können wir uns folgendermaßen klarmachen: Die beugende Öffnung führe im Aufpunkt P zu einer Lichterregung (~ der Feldstärke)
21 Interferenz und Beugung
u01 ( P )
E1 ( P ) ,
681 (21.93)
die komplementäre Beugungsanordnung ergebe dort die Lichterregung
u02 ( P)
E2 ( P ) .
(21.94)
Sie ist der ersteren gerade entgegengesetzt, denn zusammen ergäben die beiden Anordnungen in P Dunkelheit. Würden wir sie beide wegnehmen, so entstünden ebenfalls keine Beugungserscheinungen. Es gilt also
u01 ( P ) u02 ( P )
E1 ( P ) E2 ( P) 0 ;
(21.95a)
E1 ( P ) E2 ( P) ;
(21.95b)
I1 ( P)
(21.95c)
I 2 ( P) .
21.2.5 Holographie 21.2.5.1 Prinzip
Wird ein Gegenstand mit fotografischen Methoden auf einer Fotoplatte aufgenommen, so enthält das zweidimensionale Bild keinerlei Information über die Phase des Lichtes. Die Platte wird lediglich proportional der Lichtintensität geschwärzt. Gabor hatte 1948 als erster die Idee, die ursprüngliche Lichtwelle in eine Objektwelle und eine Referenzwelle aufzuspalten (Abb. 21.37a) und beide auf derselben Fotoplatte zu überlagern. Auf dieser entsteht dabei ein Interferenzmuster. Der Abstand der Interferenzstreifen ist proportional der Phasendifferenz der beiden Wellen. Damit ist die vollständige Information über Intensität und Phase des Lichtwellenfeldes auf der Platte gespeichert. Wird das entstandene Hologramm (nach den griechischen Wörtern holos – vollständig und graphein – schreiben) mit der Referenzwelle beleuchtet, so wird diese an der Struktur des Hologramms gebeugt, und zwar in gleicher Weise in die Richtungen +-I und --I. Dadurch entstehen zwei Beugungsbilder (Abb. 21.37b), ein reelles Bild Breell hinter dem Gegenstand (dem Hologramm), und ein virtuelles Bild Bvirt vor dem Gegenstand. Letzteres entspricht in allen Einzelheiten dem ursprünglichen Gegenstand. Im reellen Bild sind Vertiefungen und Erhöhungen vertauscht. D. Gabor (1900-1979) kannte nur natürliche Lichtquellen, die kein monochromatisches Licht hinreichender Intensität aussandten. Deswegen blieben seine Hologramme unvollständig. Erst die Entdeckung des Lasers verhalf seiner Idee zum Durchbruch. Wir besprechen nun im Einzelnen Entstehung und Wiedergabe eines Hologramms (L21.10).
682
21 Interferenz und Beugung
21.2.5.2 Erzeugung eines Hologramms
Zur Erzeugung eines Hologramms wird die ebene Lichtwelle eines aufgeweiteten Laserstrahls mittels eines Strahlteilers in zwei Teilwellen aufgespalten (Abb. 21.37a). Die Referenzwelle wird direkt auf die Fotoplatte, die in der xy-Ebene liegen möge, gerichtet. Die andere Teilwelle, Objektwelle genannt, fällt auf den abzubildenden Gegenstand, von dem sie ebenfalls die Platte erreicht. Durch den Strahlteiler und die große Kohärenzlänge des Laserlichtes ist sichergestellt, dass die beiden Teilwellen auf der Fotoplatte zueinander kohärent sind. Sie werden beschrieben durch
G ERe f
G G G i (Zt kRe f r ) E0 Re f e und
G EO
G i (Z t MObj ( x , y )) . E0Obj e
(21.96)
Die Intensität in einem Punkt P(x, y) ist folglich
I ( x, y )
G G 2 cH 0 ERe f ( x, y ) EObj ( x, y ) G2 G2 G 2 G 2 i^kGObj rGObj MObj ( rGObj )` cH 0 E0,Re f E0,Obj E 0,Re f E0,Obj e
(21.97)
G G G G i^k r M ( r )` E E 0,2Obj e Obj Obj Obj Obj G2 G2 G G cH 0 E0,Re f E0,Obj 2 E0,Re f E0,Obj cos (M Re f MObj )
2 0,Re f
Die beiden ersten Terme sind die Intensitäten der Referenz- und der Objektwelle. Der dritte Summand beschreibt das Interferenzstreifensystem. Nach Entwicklung besitzt die Fotoplatte eine Amplitudentransmission T(x, y), auf Grund derer sich die vom Hologramm durchgelassene Amplitude zu
G Etrans
G T ( x, y ) Eei n f
(21.98)
Strahlteiler Referenzwelle
Rekonstruktionswelle J J
Laser
Objektwelle Objekt Hologramm Abb. 21.37a: Anordnung zur Aufnahme eines Hologramms
Hologramm Virtuelles Bild
Reelles Bild
Abb. 21.37b: Anordnung zur Rekonstruktion eines Bildes
21 Interferenz und Beugung
683
ergibt. Bezeichnet T0 die Transmission der entwickelten Platte an den unbelichteten Stellen und J den Schwärzungskoeffizienten, so wird T(x, y)
T ( x, y )
T0 J I ( x, y )
(21.99)
21.2.5.3 Rekonstruktion
Zur Rekonstruktion des Bildes wird das Hologramm, wie oben ausgeführt, mit der ReferenzG welle oder einer adäquaten kohärenten Welle, ERe ko , gleicher Frequenz
G ERe ko
G G G E0 Re ko ei (Zt kRe ko r )
(21.100)
Beleuchtet Abb. 21.37b). Setzen wir also
G Etrans
G T ( x, y ) ERe ko ,
(21.101)
so erhalten wir durch Berücksichtigung von I(x, y) in T(x, y) und Einsetzen von T(x, y)
G Etrans
G G G G2 G2 G G G i ( kRe f rRe f MObj ) ERe ko T0 J ( ERe E ) J E E E e f Obj Re ko Obj Re f G G G i ( kGRe f rGRe f MObj ) J ERe ko ERe f EObj e .
^
`
(21.102)
Der erste Term stellt die geschwächte Rekonstruktionswelle dar. Der zweite und dritte Term beschreiben die beiden gebeugten Wellen.
G Etrans1
G G G E0,trans ei (Zt kRe ko rRe ko )
G Etrans2
E
1
G
0,trans
G
2
G
e i (Zt kRe ko rRe ko )
G G G G G G i (Z t ( kRe ko kRe f ) rRe f MObj ) J ERe ko EObj ERe f e ; G G G G G G i (Z t ( kRe ko kRe f ) rRe f MObj ) J ERe ko EObj ERe f e .
(21.103) (21.104)
G G G Der ersten Welle mit dem Wellenvektor k1 kRe ko kRe f entspricht das virtuelle Bild Bvirt und G G G der zweiten mit dem Wellenvektor k2 kRe ko kRe f das reelle Bild Breell . Beide enthalten die
volle Information über Amplitude und Phase der ursprünglichen Objektwelle. Blickt insbesondere ein Beobachter durch das Hologramm hindurch, so sieht er ein dreidimensionales Bild des Objektes. Die andere Welle, auch konjugierte Welle genannt, kann, soweit erforderlich, aus dem Gesichtsfeld ausgeblendet werden. Entsprechend (21.98) haben wir die Holographie bisher an Hand eines Amplituden- oder Transmissionshologramms erläutert. Zur Speicherung der optischen Information können aber auch Veränderungen der Oberflächenstruktur oder des Brechungskoeffizienten dienen. Auf
684
21 Interferenz und Beugung
diese Weise entstehen Phasenhologramme. Die lichtempfindliche Schicht kann nach der Entwicklung gebleicht werden. Das hat den Vorteil, dass bei der Wiedergabe erheblich größere Leuchtdichten erzielt werden können als mit Amplitudenhologrammen. Es soll noch angemerkt werden, dass eine Fotoplatte nur Helligkeitsunterschiede von etwa zwei Größenordnungen speichern kann. Abzubildende Objekte besitzen dagegen meistens erheblich stärkere Kontraste. Da aber die Speicherung jedes einzelnen Punktes des Objektes auf der ganzen Fläche der Fotoplatte erfolgt, können auf das rekonstruierte Bild Helligkeitsunterschiede bis zu ca. sechs Größenordnungen übertragen werden. Was für Konsequenzen hat es, wenn ein Hologramm zur Rekonstruktion mit monochromatischem Licht einer anderen Wellenlänge OReko als der zur Aufnahme verwendeten beleuchtet wird? Das wird klar, wenn wir uns daran erinnern, dass der Beugungswinkel proportional der verwandten Wellenlänge, sin D O , ist. Ist also OReko < O, so wird das Bild kleiner als das ursprüngliche Objekt, im umgekehrten Fall, OReko > O, wird es vergrößert. Soll das Hologramm eines farbigen Objektes erstellt und später rekonstruiert werden, so muss die Aufnahme mit drei verschiedenfarbigen Lasern geschehen, deren Summe weißes Licht ergibt. Die Fotoplatte braucht dazu nicht farbempfindlich zu sein; es genügt eine schwarzweiß-empfindliche Schicht. Wichtig ist nur der unterschiedliche Abstand der Interferenzstreifen. Zur Rekonstruktion müssen wiederum Laser der gleichen Farben eingesetzt werden.
21.2.5.4 Weißlicht-Holographie
Mit einer speziellen Aufnahmetechnik gelingt die Aufnahme von Hologrammen, deren Information auch mit weißem, inkohärentem Licht sichtbar gemacht werden kann. Dazu wird eine wenige µm dicke lichtempfindliche Schicht von der einen Seite mit intensivem monochromatischem Laserlicht und von der anderen Seite mit dem vom Objekt gestreuten Licht beleuchtet (Abb. 21.38). Dabei entsteht eine stehende Lichtwelle, durch die im Abstand d periodisch Strahlteiler Schichten konstanter Absorption bzw. konstanten Brechungsindexes entstehen. Jede der typischerweise 20 geLaser schwärzten Schichten enthält die volle Information über das dreidimensionale Objekt. Bei der späteren Beleuchtung des Hologramms mit wießem Licht wird dieses zum Teil von den einzelnen Schichten reflektiert. Konstruktive Interferenz der einzelFotoschicht nen Teilwellen ist aber nur für solche Objekt Wellenlängen O möglich, für welche die Bragg-Gleichung Abb. 21. 38: Aufnahme eines Weißlicht-Hologramms
2d cos D
mO , m 1, 2,3,. (21.84)
21 Interferenz und Beugung
685
erfüllt ist. Das Bild erscheint daher in der Farbe, die dieser Wellenlänge O zugeordnet ist. Durch Variation des Einfallswinkels D c (90 D ) (D = Braggwinkel) kann die Farbe des Bildes verändert werden.
21.2.5.5 Anwendungen
D) Herstellung eines holographischen Beugungsgitters Die Herstellung eines Beugungsgitters nach dem holographischen Verfahren bietet die Gewähr absoluter Fehlerfreiheit. Bedingt durch den Herstellungsprozess ist allerdings die Spaltfunktion kein Rechteck, sondern sinusförmig. Das wird klar, wenn wir daran denken, dass ein Transmissionsgitter durch Beleuchtung einer auf einer Glasunterlage befindlichen Fotoschicht mit
Kohärente r r TeilwellenE1 , E 2 r E1
Abb. 21.39: Herstellung eines Beugungsgitters mit sinusförmiger Spaltfunktion und
r E2 Fotoschicht
zwei durch einen Strahlteiler aufgespaltenen monochromatischen ebenen Lichtwellen entsteht (Abb. 21.39). Die eine Welle wirkt als Referenzwelle, die andere als Objektwelle. Durch Interferenz entsteht ein sinusförmiges Schwärzungsmuster, ein „Sinusgitter“, das als optisches Transmissionsgitter dienen kann. Auch ein Echelette-ähnliches Reflexionsgitter kann holographisch hergestellt werden. Dazu wird durch zwei einander entgegenlaufende ebene Wellen wiederum ein stehendes Wellenfeld (Abb. 21.40) erzeugt. In diesem befindet sich eine mit einem Fotolack beschichtete, schräg zur Wellennormale stehende ebene Glasplatte. Beim Entwickeln wird der Fotolack entsprechend dem Grad der Belichtung herausgelöst. Die Glasplatte mit ihrer Echelette-ähnlichen Struktur wird anschließend mit einer metallischen Schicht bedampft. Eine andere Möglichkeit besteht darin, ein Sinusgitter durch Ionenätzen auf die gewünschte Form abzuschleifen.
686
21 Interferenz und Beugung
E) Holographische Interferometrie Mit Hilfe der Holographie können Verformungen unterschiedlichen Ursprungs sichtbar gemacht werden. Veränderungen in der Oberflächenbeschaffenheit treten etwa bei der Materialbearbeitung auf oder beim Spielen auf einem Musikinstrument (Abb. 21.41/42). Erstere demonstriert die Verformung eines Werkstückes bei einseitiger Verspannung. Es ist das Resultat einer Doppelbelichtung. Zunächst wird ein Hologramm vor einer Verformung aufgenomen, ein zweites nach erfolgter Verformung. Fotoplatte (und Laser) bleiben dabei ortsfest.
Flächen maximaler Belichtung Fotolack Träger
Entwicklung des Fotolacks
Abb. 21.40: Herstellung eines echeletteähnlichen Reflexionsgitters mit der Methode der Holographie
Bei der Rekonstruktion entstehen gleichzeitig zwei Wellen, die infolge des Phasenunterschiedes ein holographisches Interferogramm erzeugen. Die Interferenzstreifen sind Linien gleichen Abstandes zwischen den aufgenommenen Zuständen.
21 Interferenz und Beugung
Abb. 21.41: Hologramm eines Flansches unter einseitiger Verspannung (Phys. In uns. Zeit 5, 174 (1974)
687
Abb. 21.42: Hologramm einer schwingenden Platte bei Verspannung bei 540 Hz (Phys. In uns. Zeit 5, 176 (1974)
J) Holographische Datenspeicher Zur nichtflüchtigen Speicherung großer Datenmengen lassen sich zwei Typen unterscheiden: Magnetische bzw. optische Speicher und Halbleiterspeicher. Wie der Name besagt, sind auf Ersteren die Informationen mit Hilfe eines mikrofabrizierten Elektromagneten in eine 10-15 nm dicke magnetisierbare Schicht eingeschrieben, von wo sie auch ausgelesen werden können (L21.10). Das analoge Signal wird in eine Folge von Bits umgewandelt. Unter Laborbedingungen wurden Dichten von 20 Gigabit/cm2 erzielt. Ein anderes Speichermedium sind digitale optische Speicher (DOS), bei denen die Informationsbits mit Hilfe eines optischen Modulators durch einen Laser als kleine Vertiefungen (pits) spiralförmig in eine dünne Schicht eingeprägt sind. Die Begrenzung der Speicherdichte ist durch die minimale Ausdehnung des zum Einlesen erforderlichen Lichtflecks gegeben, liegt also bei etwa 1µm. Auf diese Weise entstanden die Videoplattenspeicher und später auch die Digital Versatile (Video) Discs (DVD). Auf ihnen finden bis zu 17 Gigabit Platz. Das ist etwa das 17-fache einer CD. Die pits haben eine Tiefe von O/4, interferieren also mit den von der übrigen Oberfläche reflektierten Lichtstrahlen destruktiv. Diese Maßnahme und die Beugung an den pits ergeben den zum Auslesen erforderlichen Kontrast. Eine weitere Erhöhung der Speicherkapazität wurde mit Hilfe eines blau-violetten Lasers (O = 405 nm) realisiert. Die „Blu-ray Disc (BD) speichert in einer einzelnen Schicht ca. 25 GB. – Bezüglich der Wirkungsweise von Halbleiterspeichern sei auf die Literatur (L21.11) verwiesen. Als weitere optische Methode zur Informationsspeicherung sei zunächst der fotorefraktierte Effekt genannt. Darunter ist eine durch Laserlicht hervorgerufene Änderung des Brechungsindexes zu verstehen. Durch die Bestrahlung werden in einem geeigneten Kristall Ladungs-
688
21 Interferenz und Beugung
träger freigesetzt, die zu einem Raumladungsfeld führen. Diese bewirkt über den Pockelseffekt die genannte Brechungsindexänderung. Durch Anwendung holographischer Methoden kann durch den photorefraktiven Effekt ein Muster im Kristall erzeugt und gespeichert werden. Wir beschränken uns hier auf elektrooptische Materialien, z.B. ein mit Fremdatomen dotierter ferroelektrischer Kristall. Entdeckt wurde der Effekt in LiNbO3 : Fe2+ (L21.12-14). In einen solchen Kristall wird in der üblichen Weise durch Objekt- und Referenzstrahl ein Interferenzmuster erzeugt. Zunächst wird die zu speichernde Information in Form eines Flüssigkristall-Displays in flächige Hell-Dunkel-Muster umgewandelt. Diese Muster werden einem Laserstrahl aufgeprägt, der dadurch zum Objektstrahl wird. Durch Veränderung des Winkels, unter dem der Referenzstrahl die Fotoplatte trifft, können viele Hologramme in einem Kristall gespeichert werden. Das eingeprägte Interferenzmuster setzt an den Fremdatomen der beHell Hell Dunkel leuchteten Stellen die oben genannr r r r ten Ladungsträger frei. Die entstanE E E E denen Elektronen bzw. Löcher diffundieren in unbeleuchtete Bereiche, wodurch zusammen mit den zurückgebliebenen umgekehrt geladenen Atomrümpfen lokale elektrische Felder entstehen (Abb. 21.43). Dadurch Abb. 21.43: Entstehung lokaler Felder durch kommt es zu einer Polarisation und Einprägung eines optischen Interferenzmusters geringen Verzerrung des atomaren Gitters, was makroskopisch zu einer leichten lokalen Änderung des Brechungsindexes führt und damit zu einem optischen Phasengitter. Die Erscheinung wird als fotorefraktiver Effekt bezeichnet. Der Prozess benötigt nur geringe Strahlleistungen; schon solche im mW-Bereich genügen, um Brechungsindexänderungen zu erzeugen. Die Zeit, über welche die Information gespeichert werden kann, hängt stark von dem verwendeten Kristall ab, ferner von den Umgebungsbedingungen. Dotierte LiNbO3-Kristalle verhalten sich in dieser Hinsicht besonders günstig. Ein aufgeprägtes Phasengitter bleibt über Jahrzehnte oder länger stabil. Wird das Hologramm zur Rekonstruktion mit dem Referenzstrahl beleuchtet, so wird er von dem eingeprägten Gitter so abgelenkt, dass wieder das ursprüngliche Objekt entsteht. Eine neue Entwicklung ist die “Holographic Versatile Disc“ (HVD), die mit einem roten und einem blaugrünen Laser arbeitet. Sie besteht im Prinzip aus zwei Schichten. Der blaugrüne Laser dient zur Auslesung der kodierten Interferenzmuster im oberen Bereich, der rote Laser liest in der unteren, CD-adäquaten Schicht, zum Abspielen erforderliche Hilfsinformationen. Die Speicherfähigkeit beträgt etwa das 20-fache einer BD. Die beiden Schichten sind durch eine dichroitische Spiegelschicht optisch voneinander getrennt, so dass Interferenzen von dem an der CD-Schicht reflektierten blaugrünen Laserlicht mit dem Auslesestrahl selbst ausgeschaltet werden.
21 Interferenz und Beugung
689
21.3 Spektralapparate 21.3.1 Optischer Aufbau
Ein Spektralapparat dient zur Analyse des Wellenlängen- bzw. Frequenzspektrums elektromagnetischer Wellen. Wir unterscheiden Prismenspektralapparate, Gitterspektralapparate und Interferenzspektralapparate. Im Allgemeinen geben die Geräte unmittelbar die Wellenlänge des Lichts an, das aus dem Gerät austritt, im einfachsten Fall besitzen sie eine geeichte Skala. Wir sprechen dann von einem Monochromator. Durch Hinzufügung einer geeigneten Strahlungsquelle und eines Detektors wird dieser zu einem Spektrometer. Eine wichtige Kenngröße eines Monochromators bzw. Spektrometers ist sein spektrales Auflösungsvermögen O/GO. Dieses liegt im Allgemeinen unterhalb des berechneten theoretischen Auflösungsvermögens des betreffenden Dispersionselementes bzw. Interferometers. Um das einzusehen, zeigen Abb. 21.44a/b den Strahlengang eines Prismen- und eines Gitterspektrometers. Der Monochromator besteht im Wesentlichen aus dem Dispersionselement und der
A-Spalt a1
g
DQ
Detektor
D
Gitter l
Q
f
Abb. 21.44a: Aufbau eines Prismen-Spektralapparates
E-Spalt Abb. 21.44b: Aufbau eines GitterSpektralapparates
zugehörigen Optik. Diese kann sich aus Linsen oder Hohlspiegeln zusammensetzen. Letztere erlauben eine kompakte Bauweise, besitzen eine wellenlängenunabhängige Brennweite und können auch im infraroten und Submillimeterbereich eingesetzt werden. Das vom Eintrittsspalt ausgehende divergente Lichtbündel fällt auf einen im Abstand der Brennweite stehenden Parabolspiegel, von dem es als paralleles Lichtbündel das Gitter erreicht. Das gebeugte Licht trifft auf einen, im Allgemeinen identischen Parabolspiegel, der es auf die Ebene des Austrittsspaltes fokussiert, hinter dem sich im einfachsten Fall der Detektor befindet. Die Wellenlänge des durch den Spalt tretenden Lichtes wird durch Drehung des Gitters eingestellt. Spalt und Detektor sind häufig durch einen flächenhaften Detektor ersetzt, dessen einzelne Zeilen (parallel zu den Gitterfurchen) angesprochen werden können.
690
21 Interferenz und Beugung
21.3.2 Winkel- und Lineardispersion
Zurück zum Auflösungsvermögen des Spektrometers. Wir definieren zunächst die Winkeldispersion und die Lineardispersion des Monochromators. Hinter dem dispergierenden Element unterscheiden sich die Normalenrichtungen der Wellen der Wellenlänge O und der Wellenlänge O+'O um den Winkel '4 (Abb. 21.45).
'4
d4 'O . dO
(21.105)
Die Größe d 4 / d O wird Winkeldispersion genannt. Der zweite Spiegel bildet den durch Licht der Wellenlänge O beleuchteten Eintrittsspalt in die Ebene des Austrittsspaltes ab. Der Abstand 'x zwischen diesem und dem durch die gebeugte Strahlung der Wellenlänge O+'O entstandenen Spaltbild beträgt
'x
dx 'O dO
f 2 '4
f2
d4 'O . dO
(21.106)
Die Größe dx/dO heißt Lineardispersion des Monochromators. Beide Größen werden wir gleich berechnen. Zuvor betrachten wir aber an Hand von Abb. 21.46 den Einfluss der endlichen Apertur auf die Spaltbilder. f2 Unabhängig von dem im Einzelfall beDQ grenzenden optischen Element können Dx Q wir sie durch eine Blende der Breite D darstellen. Durch Beugung entsteht in der Brennebene der hinteren Linse (bzw. des zweiten Spiegels) selbst bei verschwindender Breite des Eintrittsspaltes eine l + Dl endlich breite Intensitätsverteilung mit der Fußpunktsbreite Abb. 21.45: Zur Winkeldispersion 'xBeug 2 f 2 O / D . (21.107) Mit dem Rayleigh-Kriteriums folgt als kleinster auflösbarer Abstand zweier Spektrallinien
'xmin
f2O / D .
(21.108)
Setzen wir diesen Wert in (21.106) ein, so erhalten wir für das maximale Auflösungsvermögen, wenn wir statt 'O GO schreiben
O GO
D
d4 . dO
(21.109)
21 Interferenz und Beugung
I
a)
D
x
691
I
I
b)
fl/D
x
c)
fl /D+b
x
Abb. 21.46: Intensitätsprofil I(x) in der Beobachtungsebene a) bei endlicher Breite des Eintrittsspaltes und Vernachlässigung der Beugung b) unter Einbeziehung der Beugung c) bei unendlich schmalen Eintrittsspalt In der Praxis muss der Eintrittsspalt natürlich eine endliche Breite b haben, so dass wir statt (21.108) erhalten
'x2
f
O D
b,
(21.110)
wobei wir vorausgesetzt haben, dass die Brennweiten der beiden Linsen bzw. Hohlspiegel gleich sind. Damit wird das Auflösungsvermögen
O GO
d4 . O b ½ dO ® ¾ ¯D f ¿
O
(21.111)
Die Breite des Eintrittsspaltes sollte einen unteren Wert nicht unterschreiten, der dadurch bestimmt ist, dass die Winkelbreite des Beugungsmaximums nullter Ordnung das Öffnungsverhältnis D/f des auf den Kollimatorspiegel treffenden Lichtbündels nicht überschreitet. Es muss also gelten
2'M |
bmin t
2O D d , bmin f
2O f . D
(21.112)
(21.113)
Wird der Eintrittsspalt weiter zugezogen, so geht durch Überstrahlung des Spiegels zunehmend Lichtenergie verloren.
692
21 Interferenz und Beugung
21.3.3 Auflösungsvermögen
Wir wenden uns jetzt der Winkeldispersion eines Prismenmonochromators und eines Gittermonochromators zu. Zunächst zum Prisma. Wir betrachten den Fall des Minimums der Ablenkung, in dem das Lichtbündel (für eine mittlere Wellenlänge) das Prisma parallel zur Basis durchläuft. Für diesen Fall ergibt sich nach Kap. 20.4.3 als Verknüpfung zwischen Eintrittswinkel, Austritts- und brechendem Winkel, Gl. (20.29)
d4 dO
2sin(J / 2)
dn 1 n 2 sin 2 (J / 2) d O
(21.114)
Für die Beugung am optischen Reflexionsgitter gilt die Relation
d (sin D sin E ) mO .
(21.115)
Der Einfallswinkel D ist dabei positiv zu zählen, der Beugungswinkel ß wird als positiv definiert, wenn er auf der gleichen Seite der Gitternormalen liegt wie der Einfallswinkel und als negativ, wenn er auf der anderen Seite liegt. Bei festem Einfallswinkel D (s. Abb. 21.44b) folgt die Winkeldispersion durch Differentiation nach dem Beugungswinkel E zu
dE dO
m d cos ß m
(21.116)
d 2 (mO d sin D ) 2 1 2
2
d cos D 2d O sin D O2 m2 m
.
Bei fixiertem Ein- und Austrittsspalt wird die Wellenlänge, wie oben bereits vermerkt, durch Drehung des Gitters um einen Winkel H gegen die Stellung in nullter Ordnung eingestellt. Bezeichnet U den Winkel zwischen Eintritts- und Ausfallsrichtung, so gelten die Verknüpfungen
D H U / 2,
ß H U /2
(21.117)
und damit
mO
2d cos( U / 2)sin H .
(21.118)
Wir wollen das Auflösungsvermögen eines Prismenmonochromators mit dem eines Gittermonochromators vergleichen. Dazu genügt es, die Winkeldispersionen auszurechnen.
21 Interferenz und Beugung
693
Als Beispiel wollen wir wählen: O = 500 nm, J = 60°, n = 1,55, dn/dO = 8,9710-3 bzw. m = 1,
d = 1 µm 1200 Furchen/mm, U | 0°. Daraus folgt
< für das Prisma
d T /dO = 1,79 10-2 µm-1,
(21.119)
< für das Gitter
dß /dO = 1,01 µm-1.
(21.120)
Das Gitter hat also eine ca. 60-mal größere Winkeldispersion als das Prisma und ist Letzterem daher bez. des Auflösungsvermögens überlegen. Dagegen besitzt das Prisma den Vorteil, dass jeder Spektrallinie in der Beobachtungsebene eine eindeutige Wellenlänge zugeordnet ist, während beim Gittermonochromator eine Vorfilterung für Wellenlängen d O/2 erforderlich ist. Das Auflösungsvermögen wird mit D = 120 mm, f = 1 m, 's = 0,01 mm
< für das Prisma
O/dO = 895;
< für das Gitter
O/dO = 500 102.
Das maximale Auflösungsvermögen ergibt sich mit b | 0 aus (21.111) zu
ªO º « GO » ¬ ¼ max
D
d4 dO
2 D sin(J / 2)
dn . 1 n sin (J / 2) d O 2
2
(21.121)
Der Ausdruck lässt sich noch vereinfachen. Nach Abb. 44a ist
D
l cos D1 . 2sin(J / 2)
(21.122)
Beim Minimum der Ablenkung gilt ferner
n sin(J 2) sin ^(4 J ) / 2` sin D1 ,
(21.123)
so dass wir für das maximale Auflösungsvermögen erhalten
ªO º « GO » ¬ ¼ max
l
dn . dO
(21.124)
Das Auflösungsvermögen bei unendlich schmalen Spalten ist allein durch die Basislänge und die Dispersion des Prismas bestimmt.
694
21 Interferenz und Beugung
In unserem Beispiel ergibt sich mit l = D/cos 30°
ªO º « GO » ¬ ¼ max,Pr isma
2480 .
(21.125)
Im Fall des Gitters gilt mit D = N d cos(U/2 - D)
ªO º « GO » ¬ ¼ max,Gitter
D
dD dO
Nm 1, 2 105 .
(21.126)
Diese Werte sind etwa dreimal so groß wie die oben angegebenen bei endlich breiten Spalten. Abschließend noch eine ergänzende Bemerkung zum Prisma. Die Ableitung des Auflösungsvermögens verschleiert etwas die Rolle der Wellennatur des Lichtes und der mit ihr einhergehenden Beugungserscheinungen. Deswegen sei hier noch eine andere Ableitung gegeben. Jede Spektrallinie ist ein Beugungsbild der das Strahlenbündel begrenzenden Blende. Selbst bei unendlich schmalem Spalt existiert eine endliche Breite, wie wir beim Gitter gerade gefunden haben. Als Begrenzung wirkt beim Prisma dessen Breite, D h cos D1 ; die daraus resultierende Halbwerts-Winkelbreite beträgt gemäß (21.66a/b) O/D. Damit zwei Spektrallinien der Wellenlängen O und O + dO noch getrennt werden können, müssen sie folglich um diesen Winkel divergieren. Bei symmetrischem Durchgang (s. Fig. 20.10) ändert sich dabei der Ablenkungswinkel G = 2D - 2ß, also bei einer Änderung des Brechungsindexes von
um
dn
dn dO dO
dG
2 dD
2
O
O
D
a cos D
dG
sin(J / 2) dn dO . cos D d O 2
sin(J / 2) dn dO . cos D d O
(21.127a)
(21.127b)
Eliminieren wir hierin sin (J/2) und cos D, so ergibt sich das gleiche Ergebnis wie in (21.124):
O dO
2a sin(J / 2)
dn dO
l
dn . dO
Jetzt ist auch das Auftreten der Basisbreite im Auflösungsvermögen verständlich.
(21.128)
21 Interferenz und Beugung
695
21.3.4 Gegenüberstellung von Interferometer- und Gitterspektrometer
Wir wollen das maximale Auflösungsvermögen von Gitterspektralapparaten mit dem von Interferometern vergleichen. Dazu stellen wir hier die abgeleiteten Ausdrücke zusammen.
< Zweistrahlinterferometer
's
'smax
ªO º « GO » ¬ ¼ max
2
ªO º « GO » ¬ ¼ max
2
N eff 's 2 O
ªO º « GO » ¬ ¼ max
2
N 's 2 O
O
2
O
;
(21.30)
(Fourierspektrometer)
< Vielstrahlinterferometer
2
'smax
O
;
(21.48)
(Fabry-Perot-Interferometer
< Gitterspektrometer
2
'smax
O
.
(21.63)
Hierin ist N/2 bzw. Neff/2 die Anzahl der paarweise miteinander interferierenden Teilwellen. 's ist der Wegunterschied benachbarter Wellen, 'smax der maximale Wegunterschied zwischen einer herausgegriffenen Teilwelle p und der Teilwelle p + N/2. In allen drei Fällen ist das Auflösungsvermögen durch den auf die jeweilige Wellenlänge bezogenen maximalen Wegunterschied zugehöriger (miteinander interferierender) Teilwellen bestimmt. Dass in das Ergebnis nicht die Eigenheiten des speziellen Spektralapparates eingehen, ist nicht verwunderlich. Es handelt sich immer um Interferenz und die Trennbarkeit zweier Spektrallinien hängt allein vom maximalen Wegunterschied ab. Sei dieser gleich einem ganzzahligen Vielfachen Z1 einer Wellenlänge O1/2,
'smax
Z1
O1
(21.129)
2
bzw. gleich einem ganzzahligem Vielfachen Z2 einer Wellenlänge O2/2,
'smax
Z2
O2 . 2
(21.130)
Zwei Wellenlängen lassen sich noch voneinander trennen, wenn Z2 = Z1 + 1 ist. Mit O2 O1 GO O GO und GO O folgt
'smax
O
GO
O 2
.
(21.131)
Bei gegebener Wellenlänge O ist das auflösbare Wellenlängenintervall umso kleiner, je größer der (auf die Wellenlänge bezogene) maximale Wegunterschied ist. Dieses Ergebnis ist in
696
21 Interferenz und Beugung
vollständiger Übereinstimmung mit (21.30), was einleuchtend ist, da sie auf den gleichen Voraussetzungen beruht. Ein großer maximaler Wegunterschied lässt sich entsprechend (21.48) und (21.73) durch einen großen Gangunterschied benachbarter Teilwellen oder/und eine große Anzahl N miteinander interferierender Wellen erreichen. Die Wirkungsweise von Interferometern basiert auf einem großen Gangunterschied m benachbarter Wellen. Der Extremfall ist beim Zweistrahl-Interferometer realisiert, bei dem N/2 = 1 ist. Dagegen arbeiten Gitterspektralapparate mit großen N und kleinen m. Dementsprechend ist der nutzbare Spektralbereich 'O O / m , wie bereits abgeleitet, bei den beiden Gerätetypen ganz unterschiedlich.
21.3.5 Lichtstärke von Monochromatoren
Neben dem spektralen Auflösungsvermögen ist die Lichtstärke eines Spektralapparates von Wichtigkeit. Darunter verstehen wir das Produkt U aus der Fläche des Eintrittsspaltes ASp und dem vom Monochromator erfassten Raumwinkel :. In der Folge wollen wir die Lichtstärke eines Michelsoninterferometers (MI) mit dem eines Gitterspektralapparates bei gleichem spektralen Auflösungsvermögen vergleichen. Dabei sollen Eintritts- und Austrittsspalt sowie die beiden Parabolspiegel gleiche Durchmesser D bzw. Brennweiten f haben. Der Raumwinkel ergibt sich in beiden Fällen zu
: S
D2 ; 4f2
(21.132)
die Fläche der Lochblende ist durch die Fläche des zentralen Maximums gegeben, wobei der Radius mit dem in Abb. 21.11 bereits eingeführten Neigungswinkel D verknüpft ist.
r
2 fD .
(21.133)
Folglich erhalten wir für das Produkt aus Blendenfläche und Raumwinkel
U
S f 2D 2 S
D2 4f 2
S2
D2 2 D 4
(21.134)
Der Winkel D bestimmt sich aus (21.17):
's cos D
O o D 2 # 2(1 O / 's ) .
(21.135)
Drücken wir hierin den Bruch durch das Auflösungsvermögen aus, so folgt
§ ©
2
· ¹
. D 2 # 2 ¨1 O / dO ¸
(21.136)
21 Interferenz und Beugung
697
Damit folgt schließlich
U MI
S2
D2 § 2 · ¨1 ¸. 2 © O / dO ¹
(21.137)
Für den Gitterspektralapparat ergibt sich
UG
bh
D2 , f2
(21.138)
wobei b die Spaltbreite und h dessen Länge ist. Das Auflösungsvermögen beträgt nach (21.111)
O GO
1
O b ½ d4 ¾ . ¯ D f ¿ dO
(21.111)
O®
Bildung der Winkeldispersion ( 4 o H ) mittels (21.118) führt mit D
O GO
Nd cos H zu
O dN cos H m O Nbd cos H / f 2 d cos( U / 2)cos H ^ ` Nm
O 2^O Nbd (cos H ) / f `
(21.139)
.
Dieser Ausdruck lässt sich nach b auflösen und in (21.138) einsetzen. Es ergibt sich
UG
hNd O Rmax ( 1) . f cos H 2 R
(21.140)
R bedeutet hierin das spektrale Auflösungsvermögen. Das Verhältnis der Lichtstärken der beiden Spektralapparate folgt mit (21.124) und (21.140) zu
U MI UG
(S 2 D / 2)(1 2 / R) . (hO / f ) ^( Nm / 2 R ) 1`
(21.141)
Legen wir ein Auflösungsvermögen von R = 105 fest, D = 100 mm, d = 10-2 mm, O = 5*10-3 mm, h = 0,5 cm und f = 103 mm, so erhalten wir
U MI | 102 S 2 . UG
(21.142)
698
21 Interferenz und Beugung
Ergänzung 1: Ableitung der Kirchhoffschen Integralformel Ausgangspunkt zur Lösung einer Beugungsaufgabe ist die Wellengleichung
G G 1 w2 E 'E 2 2 c wt
0.
(21A1.1)
Die Lösung hat bestimmte, durch das betreffende Hindernis und die Lichtquelle festgelegte Randbedingungen zu erfüllen. Beschränken wir uns auf zeitlich periodische Lösungen
G E ( x, y , z , t )
G E ( x, y, z )e iZt
(21A2.2)
so ist die zeitfreie Wellengleichung
G G 'E ( x, y, z ) k 2 E ( x, y, z ) 0
(21A1.3)
zu lösen. Das ist im Allgemeinen eine sehr schwierige Aufgabe. Das Problem wurde daher von Kirchhoff vereinfacht. Ausgehend vom Huygens-Fresnelschen Prinzip soll sich die Feldstärke an einem entfernten Aufpunkt aus Kugelwellen (Elementarwellen) zusammensetzen, die von den einzelnen Punkten einer beleuchteten Öffnung ausgehen. Dementsprechend versuchen wir, das Verhalten einer Lösung der stationären Wellengleichung im Punkt P darzustellen durch ein Oberflächenintegral auf einer den Punkt P umschließenden Fläche, dessen Integrand Kugelwellen um die Punkte der Fläche enthält. Diese Fläche werden wir später mit der Ebene identifizieren, welche die beugende Öffnung enthält. Wir können sie uns im Unendlichen geschlossen denken. Wegen der großen Schwierigkeiten wird nicht die Lösung der vektoriellen Wellengleichung (21A6.1) gesucht, sondern nur die der skalaren Gleichung
'u k 2 u
0.
Ausgangspunkt zur Lösung ist die Greensche Integralformel
³ v'u u'v)dV v³ v grad u u grad v)dA .
V
(21A1.4)
A
In ihr setzen wir
u u0 , v
e ikr . r
(21A1.5)
u0 bedeutet die Lichterregung (~ Feldstärke ). Der Nullpunkt unseres Koordinatensystems liege im Punkt P (Abb. 21A1.1). Um die Formel anwenden zu können, schließen wir P durch eine kleine Kugel mit Radius rK von der
21 Interferenz und Beugung
699
Integration aus. Da u0 Lösung der Wellengleichung ist, verschwindet das Volumenintegral. Aus der rechten Seite wird
§ · G e ikr e ikr u grad grad u0 ¸ dA v³AG ¨© 0 r r ¹
§ · G e ikr e ikr u grad grad u0 ¸ dA (21A1.6) ¨ 0 v ³ G r r ¹ AKugel ©
Lassen wir den Radius der Kugel um P gegen null gehen, so wird das zweite Integral auf der rechten Seite null, da dA r2 ist. Es verbleibt das Integral
³
grad
AKugel
eikr G dA r
(21A1.7)
Die Gradientenbildung ergibt
grad x
eikr r
x § ik 1 · ¨ 2 ¸ e ikr i (21A1.8) r ©r r ¹
und analoge Ausdrücke für die beiden anderen Komponenten. Es wird also
grad
eikr r
Da dAˆ Kugel 4S
³u 0
0
§ ik 1 ¨ 2 ©r r
· ikr ¸ e rˆ . (21A1.9) ¹
rˆ , ergibt die Integration
§ ik 1 · 2 2 ¸ e ikr rKugel d: ¨¨ ¸ r r Kugel ¹ © Kugel 4S u0 (ikrKugel 1)
Abb. 21A.1: Zur Ableitung der Kirchhoffschen Integralformel
(21A1.10) Mit r o 0 folgt aus der Greenschen Formel die Kirchhoffsche Formel
u0 ( P )
1 4S
§ e ikr e ikr · G grad u u grad ¨ ¸ dA . 0 0 v³AG © r r ¹
(21A1.11)
Mit ihr ließe sich die Lichterregung u0 in einem Punkt P berechnen, wenn auf der ganzen, den Aufpunkt P umgebenden Fläche A diese Größe bekannt wäre! Dazu müsste das Problem aber bereits gelöst sein. Um das Dilemma zu umgehen, gehen wir folgendermaßen vor. Die Fläche A sei der Schirm, der die beugende Öffnung enthält. Er werde gegebenenfalls über das Unendliche geschlossen. Wir nehmen nun an, dass in der Öffnung u0 die gleichen Werte
700
21 Interferenz und Beugung
annimmt wie ohne Schirm. In der Schirmebene außerhalb der Öffnung sollen u0 = 0 und grad u0 = 0 sein. Mit diesen Festlegungen lautet die Kirchhoffsche Formel
u0 ( P )
1 4S
§ e ikr e ikr · G grad u u grad ¨ ¸ dA . 0 0 ³ r r ¹ Öff ©
(21A1.12)
Für die Lichterregung in der Öffnung setzen wir eine von der Quelle ausgehende Kugelwelle an:
u0 { E
E0
e
ikrQ
rQ
.
(21A1.13)
Da der Abstand rQ immer groß gegenüber der Wellenlänge ist, wird nach (21A1.9)
grad
eikr r
ik ikr e rˆ . r
(21A1.14)
Einsetzen in die Kirchhoffsche Formel führt zu der Beziehung
ikE E ( P) 0 4S
° e ik ( rQ rP ) G G G G cos( r , dA ) cos( r ® Q P , dA) ³ ° rQ rP Öff ¯
½
°¾ d[ dK .
(21A1.15)
¿°
Aus dem gleichen Grund ( (rQ rP ) !! O ) reagiert der Zähler viel empfindlicher auf eine Änderung von rQ , rP als der Nenner und die Differenz der Kosinusterme. Wir können (21A1.15) daher schreiben als
E ( P)
G G G G ikE0 cos( rQ , dA) cos(rP , dA)
4S rQ rP
³e
ik ( rQ rP )
d [ dK .
(21A1.16)
Öff
Da Beugungsmuster im Wesentlichen nur in der Nähe der geometrischen Schattengrenze auftreten, gilt für nicht zu unterschiedliche rQ, rP
G G G G cos(rQ , dA) | cos(rP , dA) , und damit
(21A1.17)
21 Interferenz und Beugung
E ( P)
701
G G E0 ik cos(rQ , dA)
2S rQ r
³³ e
ik ( rQ r )
d [ dK .
(21A1.18)
Öff
Ergänzung 2: Entwicklung der Feldamplitude in der Kirchhoffschen Integralformel, Gl. (21.58) bzw. (21A1.18) : Wir legen Abb. 21A1.1 zu Grunde. Aus ihr folgt
rP
( xP [ ) 2 ( yP K ) 2 z P2
rQ
( xQ [ ) 2 ( yQ K ) 2 zQ2
RP
xP2 yP2 z P2
RQ
xQ2 yQ2 zQ2
(21A2.1)
Für eine Taylor-Entwicklung werden benötigt
wr wx w2r wx 2
x ; r
wr wy
y r
1 x2 ; r r3
w2r wy 2
1 y2 ; r r3
w2r wx wy
(21A2.2)
xy 3 r
Die Taylor-Entwicklung ist
§ wr · r ( x [ , y K , z ) r ( x, y , z ) [ ¨ ¸ © wx ¹[ ,K
1 ° 2 § w 2 r · ®[ ¨ ¸ 2! ¯° © wx 2 ¹[ ,K
0
0
§ wr · K ¨ ¸ © wy ¹[ ,K
§ w2r · K 2 ¨ 2 ¸ © wy ¹[ ,K
0
§ w2r · 2[K ¨ ¸ © wx wy ¹[ ,K 0
½° ¾ ... ° 0¿ (21A2.3)
Setzen wir die Ableitungen ein, so erhalten wir
rP
RP
[ xP K y P RP
1 [ 2 K 2 ([ xP K P y ) 2 ½ ® ¾ .. 2! ¯ RP RP3 ¿
(21A2.4a)
702
21 Interferenz und Beugung
rQ
RQ
[ xQ K yQ RQ
2 1 ° [ 2 K 2 ([ xQ K yQ ) ½° ® ¾ ... 2! ¯° RQ RQ3 ¿°
(21A2.4b)
x und y können wir durch die Richtungskosinus ausdrücken
cos D Q cos E Q
xQ RQ yQ RQ
; cos D P
xP ; RP
; cos E P
yP . RP
(21A2.5)
Das ergibt
) ([ ,K ) [ (cos D Q cos D P ) K (cos EQ cos E P ) 1 °§ 1 1 · 2 2 ®¨ ¸ ([ K ) 2 °¯¨© RQ RP ¸¹
([ cos D Q K cos E P ) 2 RQ
(21A2.6)
½° ([ cos D P K cos E P ) 2 ...¾ RP ¿°
21 Interferenz und Beugung
703
Zusammenfassung x Interferenzerscheinungen entstehen durch Überlagerung kohärenter Lichtbündel mit festen räumlichen und zeitlichen Phasenbeziehungen. x Interferenzfähige Lichtbündel lassen sich durch Aufspaltung eines inkohärenten Lichtbündels in zwei Teilbündel erzeugen. Bei der Überlagerung der Teilwellen wird die Intensität maximal, wenn der herbeigeführte Gangunterschied ein ganzzahliges Vielfaches der Wellenlänge ist. x Die Zweistrahlinterferenz wird beim Michelson-Interferometer ausgenutzt, das auch als Fourierspektrometer Verwendung findet. x Die Intensitätsverhältnisse bei der Vielstrahlinterferenz werden durch die Airy-Formeln beschrieben. Auf der Vielstrahlinterferenz beruht das FabryPerot-Interferometer, die Realisierung von Antireflexschichten und hochreflektierender dielektrischer Spiegel. x Die Beugung von Wellen kann auf der Grundlage des Huyghensschen Prinzips mit Hilfe der Kirchhoffschen Beugungsformel (7.58) beschrieben werden. Jeder Punkt der Phasenfläche einer Welle ist Ausgangspunkt einer neuen „Elementarwelle“. Die resultierende Welle ergibt sich durch Überlagerung der einzelnen Elementarwellen. x Beugungserscheinungen lassen sich in Fraunhofersche und Fresnelsche Beobachtungsart einteilen, je nachdem die Beugung durch parallele oder konvergente Lichtbündel erfolgt. x Bei Fraunhoferscher Beugung ist die Intensitätsverteilung an einem Punkt P hinter einem Spalt der Breite b
S b ½ sin 2 ® sin - ¾ ¯O ¿, I ( P) v b 2 2 S b ½ ® sin - ¾ ¯O ¿ wobei - der Beugungswinkel ist. Im Fall einer Kreisblende ist 2
I (- )
§ 2 I ( x) · I0 ¨ 1 ¸ ; © x ¹
x
2S R
O
I1(x) ist die Besselfunktion erster Ordnung.
sin - .
704
21 Interferenz und Beugung
x Die Intensitätsverteilung hinter einem linearen Gitter der Gitterkonstanten d ist in Fraunhoferscher Beobachtungsart (N = Anzahl der gebeugten Teilwellen, b = Spaltbreite) 2
2
sin( N ) / 2) ½ sin(M / 2) ½ I ( P) ® ¾ ® ¾ ; I ¯ sin() / 2) ¿ ¯ (M / 2) ¿
2S
d
O
sin - ;
M
2S
b
O
sin -
x Bei einem Raumgitter kann die Interferenzbedingung durch die Laue-Gleichungen oder die Bragg-Gleichung beschrieben werden. Ist D der Winkel zwischen einfallendem Strahl und der Gitterebene und d der Abstand benachbarter Gitterebenen, so lautet Letztere 2d cos D mO ; m 1, 2,3,... x Eine Fresnelsche Zonenplatte wirkt als Linse; ihre Brennweite ergibt sich als der Abstand, in dem sich die von allen Zonen herrührenden Teilwellen entsprechend ihren Phasen konstruktiv überlagern. x Das Babinetsche Theorem besagt, dass komplementäre Strukturen, wie z.B. Spalt und Draht, außerhalb ihres Schattenbereiches die gleichen Beugungsbilder ergeben. x Ein Hologramm entsteht durch Überlagerung der vom Objekt gestreuten Lichtwelle mit einer zu dieser kohärenten Referenzwelle auf einer Fotoplatte. Es enthält daher die vollständige Information über Amplituden und Phasen der von den einzelnen Objektpunkten gestreuten Lichtwellen. Durch Beleuchtung des entwickelten Hologramms mit einer kohärenten Lichtwelle gleicher Frequenz entsteht ein räumliches Bild des Gegenstandes. x Durch Kombination der Interferometrie und der Holografie können Verformungen unterschiedlichen Ursprungs sichtbar gemacht werden. x Das maximale (theoretische) Auflösungsvermögen verschiedener auf der Interferenz beruhender Spektralapparate ist im Vergleich
's
'smax
a) Zweistrahlinterferometer (FTS)
ªO º « GO » ¬ ¼ max
2
b) Vielstrahlinterferometer (FPI)
ªO º « GO » ¬ ¼ max
2
N eff 's 2 O
c) Gitterspektrometer
ªO º « GO » ¬ ¼ max
2
N 's 2 O
O
2
O 2 2
;
'smax
O
'smax
O
;
.
Hierin ist N/2 bzw. Neff/2 die Anzahl der paarweise miteinander interferierenden Teilwellen. 's der Wegunterschied benachbarter Wellen (beim Gitter wird 's / O : m als Beugungordnung bezeichnet) 'smax der maximale Wegunterschied zwischen einer herausgegriffenen Teilwelle p und der Teilwelle p + N/2.
21 Interferenz und Beugung
705
x Bei einem Prismenspektrometer ist das maximale Auflösungsvermögen im Minimum der Ablenkung
ªO º « GO » ¬ ¼ max
l
dn , wobei l die Basislänge bedeutet. dO
x Ein Maß für die Lichtstärke einer Linse oder eines Hohlspiegels des Durchmessers D und der Brennweite f ist der erfassbare Raumwinkel :.
:
S D2 4 f2
.
Die Lichtstärke eines Spektralapparates ist durch das Produkt aus der Fläche des Eintrittsspaltes ASp und dem vom Monochromator erfassten Raumwinkel : gegeben.
Übungsaufgaben 1a. Berechnen Sie die Interferenzfigur in weiter Entfernung von einem Doppelspalt der Spaltbreite s und dem Spaltabstand d, wobei s < d. b. Wie ändert sich die Intensitätsverteilung, wenn die Spaltbreiten sich wie 2:3 verhalten? 2. In der Empfängerebene eines Michelson-Interferometers treten bei der Verschiebung des beweglichen Spiegels um 0,706 mm 1560 Helligkeitsmaxima auf. a) Wie groß ist die Wellenlänge des Lichtes? b) Wie groß ist das spektrale Auflösungsvermögen eines als Fourierspektrometer arbeitenden Spektralapparates, wenn die maximale Verschiebung des Spiegels 10 mm beträgt? c) Welche Bedeutung haben Eintritts- und Austrittsspalt bei einem Fourierspektrometer? Wo würden Sie die Spalte anordnen? d) Nur bestimmte Wellenlängen erfüllen die Interferenzbedingung. Welche Konsequenzen ergeben sich daraus (qualitativ)? 3. Das Licht von Cs-Dampf enthält zwei schwache Spektrallinien mit den Wellenlängen 684,9 nm und 689,5 nm. Berechnen Sie die Anzahl der beobachtbaren Interferenzmaxima und die Kohärenzlänge für dieses Licht unter der Voraussetzung, dass die Halbwertsbreite gleich dem halben Linienabstand ist. 4. Eine Glasplatte (n = 1,65) werde zur Entspiegelung mit einer Schicht MgF2 (n = 1,38) bedampft. Berechnen Sie für senkrechte Inzidenz die Schichtdicke für eine Wellenlänge von O = 600 nm. Wie groß ist das verbleibende Reflexionsvermögen (die Reflektivität)? Welche Werte ergeben sich bei O = 380 nm und bei 720 nm? Wie lässt sich eine bessere Entspiegelung erreichen?
706
21 Interferenz und Beugung
5. Ein Freund erbittet von Ihnen eine möglichst verlustfreie Fresnel-Linse mit einer Brennweite von f = 12 mm und einem Durchmesser von D = 25 mm. Der Brechungsindex des Linsenmaterials betrage n = 1,5. Wie groß müssen Sie die Radien der Furchen (Tiefe 1 µm) wählen und wie viele Ringe können Sie unterbringen? Ist der Wert des Brechungsindexes von Wichtigkeit? 6. Auf eine Blende mit einem rechteckigen Spalt von 0,8 mm Breite und 5 mm Länge fällt ein monochromatisches Parallelstrahlbündel der Wellenlänge O = 600 nm. Welche Fußpunktbreite hat das Maximum 0. und r 1. Ordnung auf einem 5 m entfernten Schirm? Wie ändert sich die Intensitätsverteilung bei einer quadratischen Öffnung von 4 mm Breite? 7. Es soll ein echelettegitterähnliches Gitter mit 105 Furchen und einer Gitterkonstanten von 0,8 µm mittels holographischer Techniken hergestellt werden. Welche Anordnung ist dazu zu wählen? Wie sind deren Abmessungen (Winkel)? 8. Wie groß sind spektrales Auflösungsvermögen und freier Spektralbereich eines Fabry-PerotInterferometers, das einen Plattenabstand von d = 8 mm hat und ein Reflexionsvermögen von 0,70 (0,90) aufweist? Wie lässt sich erreichen, dass auch ein breiteres Spektrum eindeutig analysiert werden kann? Machen Sie einen quantitativen Vorschlag. 9. Auf ein Beugungsgitter mit 1200 Furchen/mm fällt ein Parallelstrahlbündel mit O = 500 nm. Der Einfallswinkel betrage -0 34q . Unter welchem Austrittswinkel wird die 1. Beugungsordnung beobachtet, unter welchem Licht dieser Wellenlänge 2. Ordnung? Das Gitter habe eine Breite von 100 mm. Wie groß ist das maximale spektrale Auflösungsvermögen und der freie Spektralbereich? Das Dispersionselement bestehe aus einem Echelettegitter, das in der Blaze-Stellung benutzt werden soll. Welchen Furchenwinkel müssen Sie wählen? Was ist der Vorteil dieser Nutzungsart? Welche Breite müsste ein solches Gitter haben, damit es im fernen ultraroten Spektralbereich (O | 50 µm) das gleiche Auflösungsvermögen hätte? Gibt es eine Alternative? 10. Bei der Beugung an Kristallgittern fallen mitunter gewisse Beugungsordnungen aus, was Schlüsse auf deren Struktur erlaubt. Hier werde das vereinfachte Modell eines linearen Gitters betrachtet. Wie muss ein solches beschaffen sein, damit die geradzahligen Ordnungen ausfallen?
22
Optische Instrumente
22.1 Das menschliche Auge Das Abbildungssystem des menschlichen Auges (Abb. 22.1) ist der Augapfel. Er ist nahezu kugelförmig und wird von der undurchsichtigen weißen Sehnenhaut umschlossen. Diese geht an der Vorderseite in die etwas gewölbte, durchsichtige Hornhaut über. Hinter ihr liegt die farbige Regenbogenhaut (Iris), die in der Hornhaut Fovea Mitte eine kreisförmige Öffnung, die Pupille, besitzt. Vom Gehirn gelber Glaskörper gesteuert, reguliert sie den einfalFleck vordere lenden Lichtstrom. Hinter der Iris Augenkammer liegt die aus vielen Schichten zuSehnerv Augenmuskeln hintere sammengesetzte bikonvexe Linse Netzhaut Augenkammer von etwa 11 mm Durchmesser Aderhaut Ziliarmuskel Lederhaut und einer Dicke von ca. 4 mm. Sie besitzt einen mittleren BreAbb. 22.1: Schnitt durch das menschliche Auge chungsindex von n = 1,336; ihre Krümmung und damit ihre Brechkraft kann durch den Augenmuskel variiert werden. Die Abbildungsqualitäten der Linse sind nicht besonders hoch; sie besitzt mehrere Linsenfehler. Zwischen Hornhaut und Linse erstreckt sich die vordere Augenkammer. Diese ist mit einer wässerigen Flüssigkeit gefüllt, deren Brechungsindex mit dem der Linse übereinstimmt. Im Raum hinter der Linse befindet sich der aus einer gallertartigen Flüssigkeit bestehende sog. Glaskörper. Er reicht bis zur lichtempfindlichen Netzhaut N, auf der ein stark verkleinertes reelles Bild des Gegenstandes entsteht. Die Brechkraft des optischen Systems beträgt bei entspanntem Auge ca. 60 Dptr, wobei der Hauptbeitrag mit 43 Dptr von der Grenzfläche Luft-Hornhaut herrührt. Durch Anspannung der Augenmuskel kann ein Jugendlicher Gegenstände bis zu ca. 0,08 m Entfernung scharf sehen. Mit zunehmendem Alter verschiebt sich die Nahgrenze wegen Erschlaffung der Muskulatur zu größeren Abständen. Die geschichtete lichtempfindliche Schicht besteht aus zweierlei Detektoren, aus den ca. 1,3 108 sog. Stäbchen und den ca. 7 106 sog. Zäpfchen. Erstere reagieren nur auf Helligkeit. Ihre Dichte ist mit ca. 14000/mm2 in der Nähe der Stelle, an der die optische Achse die Netzhaut trifft, besonders groß. Die Zäpfchen reagieren auch auf farbliche Reize; sie besitzen Rezeptoren für Rot, Grün und Blau. Da sie weniger empfindlich als die Stäbchen sind, können wir in der Dämmerung Farben nur schwer unterscheiden. Die von den Sehnerven wegführenden Nervenfasern treten im lichtunempfindlichen, dem sog. blinden Fleck S gebündelt aus der Augenhöhle aus. Entsteht das Bild nicht auf der Netzhaut, sondern etwas davor oder dahinter, so bedeutet das eine Kurzsichtigkeit bzw. Weitsichtigkeit (Abb. 22.2). Zur Korrektur dienen Brillen mit Zerstreuungs- bzw. Sammellinsen oder entsprechende Kontaktlinsen. Zur Minimalisierung des Astigmatismus bei solchen Augapfelstellungen, bei denen das Licht durch die Randzonen der Gläser einfällt, werden sog. Meniskusgläser verwendet, deren Grenzflächen also beiderseits (unterschiedlich) gekrümmt sind.
708
22 Optische Instrumente
Abb. 22.2: Kurzsichtigkeit (links) kann durch eine Zerstreuungslinse korrigiert werden, Weitsichtigkeit (rechts) durch eine Sammellinse Das (geometrische) Auflösungsvermögen des Auges ist durch den Abstand der Rezeptoren und durch die Beugung an der Pupille begrenzt. Beide errechneten Werte stimmen miteinander überein. Ein leuchtender Punkt wird auf der Netzhaut als ein Beugungsscheibchen abgebildet. Der Durchmesser des zentralen Maximums ist
d
2, 44O f / D
(22.1)
Bei einer Brennweite von 22 mm, einem Pupillendurchmesser D = 3 mm und einer Wellenlänge O 550 nm ergibt sich
d
2, 44 5,5 107 22 103 m 7, 4 ȝm . 2 103
(22.2)
Dieser Wert entspricht ungefähr dem Abstand zweier Zäpfchen im empfindlichsten Bereich. Zwei Lichtpunkte im Abstand der deutlichen Sehweite werden vom Auge noch getrennt wahrgenommen, wenn die zugehörigen Beugungsmaxima mindestens einen Abstand von d/2 haben.
xmin
d a d a | 2b 2 f
7, 4 250 ȝm 2 22
42ȝm 0,042 mm
(22.3)
Diesem Wert entspricht ein Winkelabstand von
u
xmin s0
1,68 104 rad 0,58c
(22.4)
Die Empfindlichkeit des Auges variiert mit der Wellenlänge. Sie ist im grünen Spektralbereich am größten. Hier können noch Intensitäten bis zu ca. 3 1013 W wahrgenommen werden.
22 Optische Instrumente
709
22.2 Die Lupe Zur Vergrößerung des Sehwinkels gibt es verschiedene Möglichkeiten. Das einfachste Instrument ist die Lupe. Sie besteht aus einer Sammellinse kleiner Brennweite (f << s0) und erzeugt von einem Objekt G ein vergrößertes, aufrechtes virtuelles Bild (Abb. 22.3). Der Gegenstand muss sich dazu innerhalb der Brennweite der Linse befinden, am besten in deren Brennebene, denn dann erscheint dem Auge das Bild im Unendlichen, so dass der Beobachter es mit entspanntem Auge beobachten kann. Die Winkelvergrößerung haben wir in Kap. 20.4 definiert als
V
H , H0
wobei H 0 der Sehwinkel ohne Instrument bei deutlicher Sehweite ist. Der Sehwinkel, unter dem das Bild des Gegenstandes erscheint, H G / f ist. Die Winkelvergrößerung beträgt demnach
V
Virtuelles Bild im Unendlichen
(22.5)
G s0 f G
s0 . f
(22.6)
F
G F
f Abb. 22.3: Strahlengang bei einer Lupe, wenn sich der Gegenstand im Abstand der Brennweite f befindet auf
Die Vergrößerung ist also gleich dem Verhältnis von deutlicher Sehweite und Brennweite der Linse. Sie entsteht dadurch, dass die Linse einen Gegenstand unter der kleineren Entfernung f scharf abzubilden vermag als unser Auge in der Entfernung s0. Die Vergrößerung lässt sich steigern, indem der Gegenstand noch näher an die Linse herangerückt wird. Das Bild entsteht dann in endlicher Entfernung s von der Linse (Abb. 22.4). Wir erhalten für V
V
B G / s s0
s0 b . sa
(22.7)
Die Abbildungsgleichung für die Lupe ist mit s = - b
1 1 a s V
1 . f
B G / s s0
s0 b sa
(22.8)
710
22 Optische Instrumente
Einsetzen von 1/a in die obere Gleichung führt zu
s0 s0 f s
V
Wird hierin 1/s mittels 22.8 ersetzt, so folgt als Endresultat
B
F
G F
s0 § f a· ¨1 ¸. f © a ¹
V a f
b
Abb. 22.4: Bildentstehung bei einer Lupe, wenn sich der Gegenstand innerhalb der Brennweite befindet und
22.3
(22.9)
(22.10)
Da a < f ist, ergibt sich eine zusätzliche Vergrößerung des Sehwinkels. Das Auge muss sich dazu allerdings etwas anstrengen! Die erreichbaren Vergrößerungen sind bescheiden. Wählen wir f = 20 mm, a = f / 2, so wird V = 2s0 / f = 25.
Das Mikroskop
22.3.1 Strahlengang, Vergrößerung und Auflösungsvermögen Stärkere Vergrößerungen lassen sich mit dem Mikroskop erzielen. Im Prinzip besteht es aus zwei Sammellinsen (Abb. 22.5). Bereits die erste Linse L1, Objektiv genannt, bildet den Gegenstand vergrößert ab. Dieses Zwischenbild wirkt für die als Lupe fungierende zweite Linse L2, dem Okular, als Gegenstand. Der Sehwinkel ist durch die Größe des Zwischenbildes BZw und die Brennweite von L2 gegeben.
H Zw-B
a1
b1 F1
(22.11)
Für BZw folgt mit Hilfe des Strahlensatzes
F2 G F1
BZw . f2
F2
virtuelles Bild im Unendlichen Abb. 22.5: Strahlengang bei einem einfachen Mikroskop
BZw G
b1 . a1
(22.12)
Der Quotient auf der rechten Seite ergibt sich aus der Linsengleichung zu
22 Optische Instrumente
b1 a1
711
a1 f1 . a1 f1
(22.13)
Setzen wir diese Gleichung in die darüber Stehende ein und lösen nach BZw auf, so erhalten wir durch Einsetzen in (22.11)
H
G b1 . a1 f2
(22.14)
Damit ergibt sich für die Winkelvergrößerung
V
H H0
Gb1 s 0 a1 f 2 G
b1 s 0 . a1 f2
(22.15)
Zur Erzeugung eines möglichst großen Zwischenbildes muss sich der Gegenstand nahe der Brennebene des Objektivs befinden. Es gilt dann a | f1 . Da das Zwischenbild in der Brennebene des Okulars entstehen soll, können wir b1 mittels des Abstandes d der beiden Linsen durch b1 d f 2 ausdrücken. Wir erhalten damit für die Vergrößerung
V |
(d f 2 ) s 0 . f1 f 2
(22.16)
Vergleichen wir diesen Ausdruck mit dem für eine Lupe, so erkennen wir, dass die Mikroskop-Vergrößerung um den Faktor (d f 2 ) / f1 | d / f1 über jener der Lupe liegt. Das Auflösungsvermögen ist wie beim Auge durch die Beugung begrenzt. Zwei vom Objektiv in der Bildebene abgebildete leuchtende Punkte können noch aufgelöst werden, wenn ihr Abstand dmin mindestens der Bedingung genügt
xmin
d a1 2 b1
1, 22O
b1 a1 f | 1, 22 O 1 . D1 b1 D1
(22.17)
Hierin haben wir die Gegenstandsweite durch die Brennweite angenähert. Durch Einführung des Öffnungswinkels u des gegenstandseitigen Lichtkegels erhalten wir
xmin | 1, 22
O 2sin(u / 2)
.
(22.18)
Das Auflösungsvermögen lässt sich steigern, indem zwischen Gegenstand und Objektiv eine sog. Immersionsflüssigkeit mit einem hohen Brechungsindex gebracht wird (Immersionsobjektiv). Dabei verkleinert sich die Wellenlänge des eingestrahlten Lichtes, so dass
712
22 Optische Instrumente
xmin | 1, 22
OVak
(22.19)
2n sin(u / 2)
wird. Die Größe NA n sin(u / 2) heißt numerische Apertur. Mit n = 1,5 (Zedernholzöl) und u = 85° wird die numerische Apertur NA = 1,49. Bei einer Vakuumwellenlänge von OVak 550 nm ergibt sich für xmin = 225 nm. Als Faustregel können wir uns merken, dass gerade noch Abstände von der Größe der halben Wellenlänge aufgelöst werden können. Ausgehend vom Auflösungsvermögen des Auges, hat es daher keinen Sinn, Mikroskope mit stärkerer Vergrößerung als V | 103 zu bauen. Dieser Wert wird deswegen als förderliche Vergrößerung bezeichnet. Eine wesentlich stärkere Vergrößerung lässt sich mit dem optischen Nahfeldverfahren erzielen (Kap. 22.3.3.4). Eine weitere Möglichkeit bietet ein Elektronenmikroskop. Die Wellenlänge der Elektronen ist, abhängig von der Beschleunigungsspannung, um ca. 3 Größenordnungen kleiner als die der Lichtwellen. Zur Abbildung werden elektrostatische und magnetische Linsen benutzt (vgl. Kap. 3).
22.3.2 Abbesche Theorie der Bildentstehung Die Begrenzung des Auflösungsvermögens infolge Beugung zeigt deutlich, dass die Strahlenoptik nur eine Näherung ist. Manchem von Ihnen mag es auch unbefriedigend erscheinen, zwei unterschiedliche Konzepte zur Beschreibung der Abbildungseigenschaften eines optischen Systems kombinieren zu sollen. Bereits E. Abbe (1840-1905) hat erkannt, wie die Wellennatur des Lichtes die Bildentstehung bestimmt. Zur Demonstration benutzte er die Entstehung eines Bildes im Mikroskop. Seine Überlegungen sollen anhand von Abb. 22.6 erläutert werZB den. Das zu vergrößernde Objekt bestehe aus einem Strichgitter oder einfach aus zwei Spalten. Eine von unten einfallende ebene Welle wird an den Spalten gebeugt. Die in eine Richtung - gebeugten Teilwellen erzeugen in der Brennebene des Objektivs ein Beugungsbild der unendlich entfernten Lichtquelle 1. Ordn. -1. Ordn. 0. und anschließend das Zwischenbild B1Z. Es sind drei Teilwellen gezeigt, sie entsprechen der nullten sowie F-Ebene der ersten und minus-ersten Beugungsordnung. ErsteObjektiv re enthält keinerlei Information über den Abstand d der Spalte; wird das gebeugte Licht durch eine Blende zurückgehalten, so erscheint auf dem Schirm ein G verwaschener heller Fleck. Erst die erste und höhere Beugungsordnungen geben Auskunft über den Spaltabstand, da die zugehörigen Beugungswinkel mit d verknüpft sind über Abb. 22.6: Zur Abbeschen Theorie der Bildentstehung
d sin -m
mO; (m 1, 2,3,...) .
(22.20)
22 Optische Instrumente
713
Zur Ausbildung einer Struktur ist also mindestens die erste Beugungsordnung erforderlich. Der minimale halbe Öffnungswinkel folgt daher für ein Immersionsobjektiv aus
sin -min
O
OVak
d
nd
.
(22.21)
Das ist bis auf einen Faktor 0,61 mit (22.19) identisch. Die Demonstration der Abbeschen Theorie lässt sich am besten mit einem Kreuzgitter als Gegenstand zeigen. Wird eine direkt hinter dem Objektiv angeordnete rechteckige Blende in Richtung einer der beiden linearen Teilgitter langsam zugezogen, so verschwindet schließlich die Struktur des Kreuzgitters. Übrig bleibt das Bild eines Strichgitters, dessen Striche senkrecht zur Spaltrichtung liegen.
22.3.3 Spezielle Techniken der Mikroskopie 22.3.3.1 Phasenkontrastverfahren Bisher haben wir vorausgesetzt, dass die zu untersuchenden Objekte einen Teil des Lichtes absorbieren, aber nicht die Phase der Welle ändern. Wir bezeichnen sie als Amplitudenobjekte. Daneben gibt es, vor allem im Bereich der Biologie, Objekte, die eine lokale Variation des Brechungskoeffizienten aufweisen und dadurch die Phase der hindurchtretenden Welle verändern, aber keine Absorption verursachen. Unser Auge kann Phasenobjekte nicht erkennen. Daher müssen sie erst in Amplitudenobjekte umgewandelt werden. Dies leistet das Phasenkontrastverfahren. Denken wir uns an die Stelle des Amplitudengitters in Abb. 22.6 ein PhasenObjektiv F-Ebene ZB gitter (Abb. 22.7) gesetzt, so entstehen in Phasenobjekt 0. Ordnung der Brennebene des Objektivs wiederum die verschiedenen Ordnungen der Gitterbeugung. Bringen wir nun ein durchsichtiges Plättchen an den Ort der nullten Ordnung, das gegenüber den anderen Ordnungen eine Phasenverschiebung etwa Phasenplättchen um O/4 bewirkt, so entsteht in der Zwischenbildebene durch Überlagerung aller Teilwellen aus der Phasenstruktur eine Abb. 22.7: Prinzip des PhasenkontrastverAmplitudenstruktur. fahrens nach Zernike In der praktischen Ausführung kann die Phasenplatte z.B. aus einer Glasplatte bestehen, auf die im Bereich der hindurch tretenden ungebeugten Teilwelle eine ringförmige Schicht der Dicke (n 1)O / 4 aufgedampft ist (Abb. 22.7). Die Lichtquelle muss deswegen ebenfalls ringförmig sein. Dies wird durch eine vor dem Kondensor angeordnete Ringblende erreicht. Als erster realisierte F. Zernike (18881966) eine solche Anordnung.
714
22 Optische Instrumente
22.3.3.2 Dunkelfeldverfahren Schwach absorbierende Amplitudenobjekte ergeben bei der Abbildung durch das Mikroskop nur einen geringen Kontrast. In diesem Fall ist es nützlich, das Objekt so auszuleuchten, dass es vom direkten Licht überhaupt nicht getroffen wird. Das kann z.B. durch eine Ringblende vor dem Kondensor erreicht werden (Abb. 22.8). Das Gesichtsfeld ist folglich dunkel. Nur vom Objekt gebeugtes Licht kann in die Frontlinse eintreten, so dass ein kontrastreiches Bild entsteht. Sehr kleine Objekte, die vom Mikroskop nicht mehr aufgelöst werden, erscheinen als Beugungsscheibchen auf dunklem Hintergrund. Mit dieser Methode können noch O/100 große Objekte nachgewiesen werden, allerdings ohne deren Struktur aufzulösen. – Mit dem Verfahren können auch schwache Phasenobjekte sichtbar gemacht werden, da diese Licht in das Objektiv hinein streuen, das eine strukturierte Abb. 22.8: Prinzip der DunkelAufhellung des Gesichtsfeldes bewirkt. Die Phasenfeldbeleuchtung beim Mikroskop struktur geht dabei allerdings verloren (L.22.12).
22.3.3.3 Konfokale Mikroskopie Mit der Methode der konfokalen Mikroskopie ist eine erheblich stärkere Streulichtunterdrückung möglich als mit einem Durchsicht-Mikroskop, so dass auch schwach ausgeprägte Amplitudenobjekte dargestellt werden können (L22.1). Die prinzipielle Anordnung der optischen Elemente ist aus Abb. 22.9 zu ersehen. Das aufgeweitete Lichtbündel eines Lasers fällt nach Passieren einer engen Kreisblende B1 auf einen Strahlteiler, von dem es über eine kurzbrennweitige Linse (Objektiv) auf einen sehr kleinen Fleck in der Ebene z = z0 des zu vergrößernden Objektes reflektiert wird. Dadurch wird Streulicht, das von anderen Bereichen dieser Ebene ausgehen könnte, vermieden. Das von dem beleuchteten Fleck zurückgestreute Licht wird vom Objektiv durch den Strahlteiler hindurch auf eine weitere Lochblende B2 ( ) |1 µm) abgebildet, hinter welcher der Detektor steht. Diese Blende reduziert übrig gebliebenes Streulicht weiter, vor allem solches, das tiefer und höher liegenden Schichten herrührt. Durch diese beiden Maßnahmen steigt der Kontrast und damit auch das zur Objektebene senkrechte Auflösungsvermögen erheblich an. Die Vorteile des Mikroskops werden durch zwei Nachteile erkauft: Die geringe Schärfentiefe und die Begrenzung auf einen sehr kleinen Bereich der Probe. Beide Punkte lassen sich weitgehend beheben, einmal durch die Möglichkeit, die Probe in z-Richtung präzise zu verschieben und zum anderen durch eine Rasterung der betreffenden Ebene bzw. Oberfläche (Abb. 22.10). Ist die gleichzeitige Aufnahme eines größeren Bereiches einer Probe erwünscht, so wird die Blende B1 in Abb. 22.9 durch eine feine Lochmaske ersetzt und der Detektor gegen eine CCDKamera ausgetauscht, (Abb. 22.11).
22 Optische Instrumente
715
Detektor B2
Strahlteiler
Laser
Strahlteiler
Laser
B1
B1 B2 Detektor
Präparat Abb. 22.9: Anordnung zur konfokalen Mikroskopie
Präparat Abb. 22.10: Konfokales Mikroskop mit Laserstrahlrasterung der Oberfläche
CCD-Kamera Strahlteiler
Lochmaske
Abb. 22.11: Gleichzeitige Mikroskopie mehrerer Teilbereiche eines Objektes mittels Lochmaske und CCD-Kamera und
Die Anordnung der lichtempfindlichen Pixel entspricht der Lage der Öffnungen der Lochmaske. Die Methode wird bei der Fluoreszenzmikroskopie biologischer Objekte eingesetzt sowie zur Untersuchung von Oberflächenstrukturen.
716
22 Optische Instrumente
22.3.3.4 Optische Nahfeldmikroskopie Auf Grund der Beugung lassen sich mit einem Lichtmikroskop keine Strukturen auflösen, die unterhalb der halben Wellenlänge des zur Beleuchtung verwendeten Lichtes liegen. Diese Begrenzung bezieht sich aber nur auf die Untersuchung im Fernfeld, z0 >> O Wie wir gesehen haben, ändert sich das Beugungsbild bei starker Annäherung von P an das beugende Objekt drastisch. Betrachten wir den Fall der Spaltbeugung. Wird der Spalt immer stärker zugezogen, so dehnt sich das zentrale Maximum bei Fraunhoferscher Beobachtungsart immer mehr aus, so dass es vom Objektiv nur noch teilweise erfasst werden kann. Dagegen ist das Nahfeld in unmittelbarer Nähe des Spaltes, nämlich im Abstand z0 << b2/O fast ganz auf den Schattenbereich des Spaltes begrenzt, in dem die Intensität um einen mittleren Wert nur noch leicht oszilliert und an beiden Seiten steil abfällt (L22.2). Mittlere Intensität und Struktur hängen sehr empfindlich vom Abstand z0 des Schirmes ab. Befindet sich ein solcher Sondenspalt also in hinreichender Nähe des Objektes, so können auch feinere Strukturen aufgelöst werden. Abb. 22.12 zeigt einige mögliche Anordnungen zur optischen Nahfeldmikroskopie (L22.3,4) (SNOM = Scanning Near-field Optical Microscope). Das Laserlicht wird im Allgemeinen durch eine am unteren Ende sich verjüngende Glasfaser, die mit einem Metallfilm ausgekleidet ist, bis auf einen Abstand von wenigen Nanometern an die zu untersuchende Oberfläche geleitet. In anderen Ausführungen (Abb. 22.12a) wird das Licht durch eine feine metallische Spitze () = 50 nm) am Ende der Faser (d <
Q
Lichtleiter
Abb. 22.12a: Zwei Anordnungen zur optischen Nahfeldmikroskopie; von links nach rechts: Nahfeldtaschenlampe (Emission mode SNOM). Rechts: Nahfeldlupe (Collection mode SNOM) a
Q
22 Optische Instrumente
717
Eine Abart des ersten Typs ist das forbidden light SNOM (Abb. 22.12b). Der Name weist darauf hin, dass es in dem durch Totalreflexion charakterisierten Winkelbereich arbeitet. Eine Abart des collection mode Typs, bei dem die auf einem Prisma befindliche Probe durch Totalreflexion des Beleuchtungslichtes ein evaneszentes Wellenfeld erzeugt, sind das photon scanning tunneling microscope (PSTM) (Abb. 22.12c) und das aperturlose SNOM
Q
E
FM
Nomarski Interferometer
Lichtleiter
evaneszentes Feld
Er
Er+Egestr
Spiegel
FM Q
FM
Egestr
Etrans
AFM-Spitze
Abb. 22.12b-d; von links nach rechts: Forbidden-Light-Snom; Scanning tunneling microscope; Aperturloses Nahfeldmikroskop (Abb. 22.12d). Letzteres benutzt statt einer räumlichen Begrenzung des Beleuchtungslichtes durch eine sehr kleine Apertur eine sehr feine beleuchtete Spitze ( R | 2 0 nm ) als Sonde. Der Vorteil dieses Gerätes ist eine um mehrere Größenordnungen höhere Lichtintensität am Ort der Spitze. Deren Krümmungsradius kann dadurch erheblich kleiner gewählt werden als die Sondenöffnung in den aperturbegrenzten Anordnungen, was ein besseres Auflösungsvermögen (d 30 nm) erlaubt. Ein Nachteil ist die viel höhere Untergrundstrahlung, denn es wird nicht nur die Spitze, sondern auch die unmittelbare Umgebung, z. B. der Schaft der Spitze und der Ausleger, der sie hält, bestrahlt. Durch ein spezielles Modulationsverfahren konnte dieses Problem inzwischen gelöst werden. Das Signal wird einem Interferometer zugeführt, wo es nach Amplitude und Phase analysiert wird (L22.5,6). Ein tieferes Verständnis der Nahfeldmikroskopie ist mit Hilfe der Fourierdarstellung möglich (L22.7,8) (Abschn. 22.6.7).
22.4
Das Fernrohr
Die beiden bisher behandelten Instrumente dienten zur Vergrößerung des Sehwinkels nahe liegender Gegenstände. Wie der Name besagt, vergrößert ein Fernrohr den Sehwinkel, unter dem ein entferntes Objekt dem Auge erscheint. Es gibt zwei Typen, das Keplersche Fernrohr, das im Prinzip aus zwei Sammellinsen besteht, und das Galileische Fernrohr, bei dem das Okular als Zerstreuungslinse ausgebildet ist.
718
22 Optische Instrumente
Wir besprechen zunächst das Keplersche Fernrohr (Abb. 22.13). Die Aufgabe des Objektivs ist es, den Gegenstand möglichst groß in der Brennebene des Okulars abzubilden. Natürlich bleibt die Lateralvergrösserung immer unter dem Wert 1. Aber je größer die Brennweite gewählt wird, umso größer ist das Zwischenbild, das mit dem Okular als Lupe angeschaut wird. Der Sehwinkel H0 ohne Instrument ist gegeben durch
H0
BZw , f1
(22.22) und für den Sehwinkel mit Fernrohr gilt
Vom weit entfernten Objekt ZB b1= f1 F1=F2
H F2
virtuelles Bild im Unendlichen Abb. 22.13: Keplersches Fernrohr aus zwei Sammellinsen
BZw . f2
(22.23)
Die Vergrößerung ergibt sich somit als das Verhältnis der Brennweite f1 des Objektivs zu der des Okulars
V
f1 . f2
(22.24)
Die Brennweite des Okulars kann ohne größeren Aufwand nicht viel kleiner als 2 cm gemacht werden. Viel leichter ist es, ein langbrennweitiges Objektiv zu realisieren. Allerdings wird mit zunehmendem f1 das Fernrohr immer länger und das Gesichtsfeld bei gleichem Linsendurchmesser immer kleiner. Mit einem handlichen Fernrohr von f1 = 200 mm ergibt sich eine 10-fache Vergrößerung; für V 100 wird schon eine Brennweite f1 = 0,1 m benötigt. Wir berechnen abschließend das Auflösungsvermögen. Zwei Lichtpunkte erscheinen in der Zwischenbildebene wieder als zwei Beugungsscheibchen mit dem Durchmesser 2r. Sie können noch aufgelöst werden, wenn ihre zentralen Maxima den Abstand r voneinander haben. Der zugehörige Winkelabstand umin ist nach (21.67)
umin
r f1
1, 22
O D1
.
(22.25)
Der kleinste Abstand zweier noch trennbarer Gegenstandspunkte kann natürlich im Allgemeinen nicht angegeben werden, da ihre Entfernung meistens unbekannt ist. Für astronomische Zwecke werden meistens anstelle von Linsenfernrohren Spiegelteleskope eingesetzt (Abb. 22.14). Hohlspiegel lassen sich mit größerem Durchmesser herstellen als Linsen. Je größer der Durchmesser, desto größer die Lichtstärke des Instrumentes und das Auflösungsvermögen. Allerdings wird Letzteres häufig durch Dichtefluktuationen in der Erdatmosphäre begrenzt. Sie können mit speziellen Techniken reduziert werden, die im nächsten Abschnitt besprochen werden. Auf der anderen Seite erlaubt ein großflächiger Spiegel auch den Empfang elektromagnetischer Wellen größerer Wellenlänge mit hinreichend
22 Optische Instrumente
719
hoher Auflösung. Z.B. ist das Radioteleskop in Effelsberg (Eifel) für den Wellenlängenbereich > 3 mm mit einem Parabolspiegel von 100 m Durchmesser ausgerüstet. Untersuchungen können natürlich nur in solchen Spektralbereichen vorgenommen werden, in denen die Atmosphäre durchlässig ist. Das Galilei-Fernrohr besteht aus einer Sammellinse als Objektiv und einer Zerstreuungslinse als Okular (Abb. 22.15). Es bietet den Vorteil, dass es aufrecht stehende Bilder des Objektes liefert. Um ein solches mit dem Kepler-Fernrohr zu erzeugen, müssen in den Strahlengang Umkehrprismen eingefügt werden (s. Abschn. 19.2.4.7).
e0
e
f2
f1
Abb. 22.14: Prinzipieller Aufbau eines Spiegelteleskops
d
f1 f2
e0
Abb. 22.15: Galileisches Fernrohr mit einer Zerstreuungslinse als Okular auch
von weit entferntem Objekt
e
ZB
Bild im Unendlichen
22.5 Aktive und adaptive Optik Die Lichtstärke eines Spiegelteleskops wächst proportional zum Quadrat des Durchmessers D, das Auflösungsvermögen entsprechend (22.30) proportional zu D. Für astronomische Untersuchungen sehr lichtschwacher Objekte im sichtbaren Spektralbereich und angrenzenden Gebieten entstanden in den letzten 10-15 Jahren Observatorien mit Spiegeln von D = 4-10 m. Je größer der Durchmesser, umso schwieriger ist die nötige optische Qualität zu erreichen. Außerdem treten bei der Nachführung auf ein bestimmtes Objekt Gewichtsverlagerungen auf. Zusammen mit thermischen und Windeinflüssen kommt es zu einer leichten Deformation des Spiegels, welche die Qualität des gewonnenen Bildes beeinträchtigen. Eine weitere, ganz wesentliche Begrenzung ergibt sich durch die bereits erwähnten Turbulenzen in der Lufthülle der Erde, die zu räumlich und zeitlich variierenden Fluktuationen des Brechungsindexes führen. Das bedeutet, dass die den Spiegel erreichende Wellenfront zu einem herausgegriffenen Zeitpunkt nicht mehr eben ist. Ihre Form ändert sich auf einer Zeitskala weniger
720
22 Optische Instrumente
Millisekunden. Da die effektive Ausdehnung der Luftschicht ca. 20 km beträgt, können Gangunterschiede bis zu einigen Mikrometern resultieren. Dadurch verschlechtert sich das praktische Auflösungsvermögen schon bei einem 4 m Teleskop um mehr als eine Größenordnung gegenüber dem theoretisch Erreichbaren und auch die Lichtstärke sinkt um den Faktor 100 oder mehr.
Justierelemente
Abb. 22.16: Prinzipieller Aufbau eines der 8 m Spiegelteskope der Europäischen Südsternwarte in Chile mit aktiver Optik
zum Detektor Wellenfrontsensor Regelelektronik Piezoelektrische Stellelemente
Eine aktive Optik kann die quasistatischen Fehlerquellen weitgehend korrigieren, während es mit der adaptiven Optik (L22.9,10) gelingt, die Verzerrung der Wellenfront des einfallenden Lichtes stark zu reduzieren. Aktive Optik verwendet computergesteuerte elektromechanische Stellelemente (Abb. 22.16), die auf der Rückseite des Primärspiegels angebracht sind und mit Hilfe einer Regelelektronik die Oberfläche lokal so korrigieren, dass die auftretenden Abweichungen von der Soll-Oberfläche minimalisiert werden. Diese Justierungen erfolgen mit einer Frequenz von typischerweise 0,05 Hz. Der Spiegel muss dazu hinreichend dünn sein ( d 200 mm). Das Erste mit dieser Technik ausgestattete Teleskop war das 3,5 m-Teleskop neuer Technologie (NTT) der Europäischen Südsternwarte (ESO) auf dem Berg La Silla in Chile, das 1989 den Betrieb aufnahm. Auch die vier 8 m-Spiegel des „ESOVery-Large-Telescope“ (VLT) (L22.12) in Chile sind mit einem derartigen System aus je 150 Stellelementen ausgestattet. Die einzelnen identischen Primärspiegel lassen sich interferometrisch verbinden. Die Ausgangssignale werden über kleinere Spiegel an einem zentralen Ort kohärent überlagert. Dazu müssen die Differenzen zwischen den Lichtwegen auf mindestens O /5 konstant gehalten werden. Die Lichtstärke des Teleskops entspräche der eines 16 m-Teleskops. Die Spiegel haben einen Abstand von 200 m. Das theoretische Auflösungsvermögen würde sich dadurch um einen Faktor 25 vergrößern. Die adaptive Optik besteht aus einem zusätzlichen Spiegel und der zugehörigen Korrekturelektronik. Das System arbeitet im Nahen Infrarot bei ca. 2µm. Durch den Wellenfrontsensor wird das empfangene Bild 350 mal in der Sekunde abgetastet. Die Steuerbefehle werden den 60 Stellelementen des Korrekturspiegels zugeführt.
22 Optische Instrumente
721
Jeder der Primärspiegel des VLT besteht „aus einem Guss“. Dagegen sind die zwei 10 m-Spiegel des KeckTeleskops auf Mauna Kea (Hawaii, 1992) aus Kostengründen aus 36 hexagonalen Einzelspiegeln (Abb. 22.17) zusammengesetzt (L22.13), deren Justierung mittels aktiver Stellelemente vorgenommen wird.
Abb. 22.17: Wabenstruktur des 10 m Keck-Teleskopps (Hawaii)
Kommen wir nun zur Entzerrung der Wellenfront des einfallenden Lichtes. Die Eigenschaften der Atmosphäre, welche die Güte des Bildes beeinflussen, können durch drei Parameter beschrieben werden. die atmosphärische Korrelationslänge r0 der isoplanatische Winkel 4 die Korrelationslänge W
x x x
Die Größe r0 ist ein Maß für den Abstand senkrecht zur Ausbreitungsrichtung des Lichtes, für den die Wellenfront im Mittel um die Strecke O /2S gestört ist (vgl. Abb. 22.18). Pro Zone wird also mindestens ein Stellelement benötigt. Der isoplanatische Winkel ist ein Maß für den Winkel, unter dem man r0 von dem Beobachtungsstandort im Abstand R aus sieht. O/n m r0/mm 4 /‘‘ W/ms N
r0
R Q
Abb. 22.18: Zusammenhang von atmosphärischer Kohärenzlänge r0 und isoplanatischem Winkel
500 100 1,8 6 6400
2200 600 10 35 180
Tabelle 22.1: Typische Werte für atmosphärische Korrelationslänge r0, Isoplanatischer Winkel 4 , Korrelationslänge W
Die Größe W gibt an, wie schnell sich eine Störung der Wellenfront ändert. Typische Werte im sichtbaren ( = 500 nm) und im infraroten Bereich (O = 2,2 µm) sind aus Tab. 22.1 zu entnehmen. Es zeigt sich, dass für ein 8 m - Teleskop im ersten Fall 6400 Stellelemente benötigt würden, im zweiten Fall entsprechend der größeren Wellenlänge nur 180. Die Korrektur wird daher meistens mittels eines kleineren deformierbaren Spiegels (D = 0,20 m) vorgenommen (Abb. 22.19). Jedes Stellelement muss separat angesteuert werden. Die dazu notwendigen Steuersignale werden von einem Wellenfront-Sensor erzeugt (Abb. 22.20). Diesem wird über
722
22 Optische Instrumente
einen Strahlteiler ein Teil des zu korrigierenden Lichtes zugeleitet. Das Lichtbündel wird durch eine geeignete Optik in die notwendige Anzahl von Teilbündeln aufgespaltet und zusammen mit dem Licht einer separat erzeugten ebenen Welle einer CCD-Kamera zugeführt. Eine geeignete Regelelektronik bestimmt die Abweichungen von der ebenen Wellenfront und verarbeitet sie zu den nötigen Steuersignalen für die Stellelemente. Beim Keck-Observatorium wird die Wellenfront 67 mal pro Sekunde korrigiert. Das Auflösungsvermögen konnte auf diese Weise um eine Zehnerpotenz gesteigert werden. Verzerrte Wellenfront
Gestörte Strahlteiler Wellenfront
Linsenmatrix
CCDKamera
Ebene Referenzwelle
korrigierte Wellenfront
Abb. 22.20: Aufbau eines Wellenfrontsensors
ST
Kamera
Piezoelektrische RegelWellenfrontelektronik sensor Stellelemente
Abb. 22.19: Adaptive Optik zur Korrektur verzerrter Wellenfronten bei einem Spiegelteskop (Cassegrain-Anordnung, aus dem Internet nachgezeichnet)auch
Im Allgemeinen sind die den Primärspiegel erreichenden Strahlungsflussdichten so gering, dass mit ihnen keine Wellenfront-Entzerrung möglich ist. Daher wird ein hinreichend heller Leitstern im Bereich des isoplanatischen Winkels benötigt, mit dessen Hilfe diese Aufgabe bewerkstelligt werden kann. Ein solcher Stern ist schwierig zu finden; daher wird in den modernen Teleskopen ein künstlicher Leitstern erzeugt. In einer Höhe von ca. 100 km liegt eine mit Natrium-Atomen angereicherte Luftschicht. Ein auf die gelbe Na-D-Linie abgestimmter gepulster Laser regt solche Atome zu einer intensiven Fluoreszenzstrahlung an, welche zur Entzerrung herangezogen wird.
22 Optische Instrumente
22.6
723
Fourieroptik
22.6.1 Fourierdarstellung der Fraunhoferschen Beugung In Kap. 21 haben wir die Beugung elektromagnetischer Wellen an unterschiedlich gearteten Öffnungen bzw. Hindernissen diskutiert. Dabei sind wir vom Huygens-Fresnelschen Prinzip in der Kirchhoffschen Formulierung ausgegangen. Wir wollen jetzt zeigen, dass sich in der Fraunhoferschen Näherung die Verteilung der elektrischen Feldstärke hinter einem beugenden Objekt als Fouriertransformierte des elektrischen Feldes in der Ebene des Objektes darstellen lässt (L22.14,15). Diese Darstellung lehnt sich an das Buch von Lauterborn et. al. (L22,15). Wir können dazu direkt von der Kirchhoffschen Formel ausgehen oder von einem bereits behandelten speziellen Fall. Wir wählen den zweiten Weg und benutzen als Ausgangspunkt die Fraunhofersche Beugung an einem Spalt der Breite b (Abb. 22.21). Die Feldstärke in einem Punkt P(x´) ergibt sich aus b/2
E ( xc)
³
e ikx sin - dx
(22.26)
b / 2
Die Beziehung wollen wir so umschreiben, dass sie auf beliebig geformte Öffnungen anwendbar ist. Zunächst drücken wir im Exponenten den Beugungswinkel - durch die Koordinaten des Beobachtungspunktes aus, sin - xc / z0 . Gleichzeitig erweitern wir das eindimensionale Problem auf zwei Dimensionen. Um die speziellen Integrationsgrenzen zu eliminieren, führen wir die folgende Transmissionsfunktion W ( x, y ) ein:
P (x ¢,y¢,z 0 )
x J
x b
1 für 0 d x d b, 0 d y d l ¯0 sonst.
x sinJ
x´ z0 z
W ( x, y ) ®
Abb. 22.21: Fraunhofersche Beugung an einem Spalt der Breite b
(22.27) Damit wird (22.26) zu
E ( xc, y c, z0 ) e
i 2S
z0 f f
O
³ ³ E ( x, y ) W ( x, y ) e e
i
2S ( x cx y cy ) O z0
dx d y .
(22.28)
f f
Rechts steht bis auf einen Phasenfaktor die Fouriertransformierte F ( x, y ) von E(x, y).
E ( xc, yc, z0 ) e
i 2S
z0
O
F ( x, y ) .
(22.29)
724
22 Optische Instrumente Bei Fraunhoferscher Beugung ist die Feldstärkeverteilung in der Ebene z = z0 proportional zur Fouriertransformierten F ( x, y ) der Transmissionsfunktion W ( x, y ) Ee ( x, y ) .
Die Beugung der einfallenden ebenen Welle an einem Objekt ist gleichbedeutend mit einer Zerlegung dieser Welle in unendlich viele ebene Wellen mit unterschiedlichen Ausbreitungsrichtungen. Das macht deutlich, dass es sich um eine räumliche Fourieranalyse handelt. Die Größen
Qx
xc , O z0
yc O z0
Qy
(22.30)
in (22.30) werden als Raumfrequenzen bezeichnet (Zweckmäßiger wäre es, den Faktor 2S mit einzubeziehen, wie es in der angelsächsischen Literatur häufig geschieht, so dass 2S/O = k benutzt werden kann). Mit der Umbenennung E ( xc, y c, z0 ) E (Q x ,Q y , z0 ) erhalten wir
E (Q x ,Q y , z0 ) e
i 2S
z0 f f
O
³ ³ E ( x , y ) W ( x , y )e
i 2S ( xQ x yQ y )
e
dx d y
(22.31)
f f
22.6.2 Beugung an einer rechteckigen Blende Es ist klar, dass die Anwendung von (22.29) auf einen Spalt wieder die bereits berechnete Feldstärkeverteilung (21.65) liefert, denn die Ausgangsgleichungen sind identisch. Trotzdem werde dies hier gezeigt, wobei wir eine rechteckige Blende der Breite b und der Höhe a behandeln wollen (Abb. 22.22). Die Transmissionsfunktion wird damit
b b a a °1 für d x d , d y d , 2 2 2 2 (22.32) °¯0 sonst.
W ( x, y ) ®
Die Blende werde von einer ebenen Lichtwelle beleuchtet, so dass
Ee ( x, y )
E0
const.
Die Blendenöffnung denken wir uns in Streifen der Breite dx aufgeteilt.
22 Optische Instrumente
725
Der Teil der Feldstärke, der durch einen Streifen erzeugt wird, ergibt sich mit (22.32) zu
dE (Q x ,Q y , z0 )
E0 e i 2S xQ x
a 2
³e
i 2S yQ y
dy .
a 2
Die vollständige Feldverteilung in der Beobachtungsebene erhalten wir durch Integration über alle Streifen b 2
E (Q x ,Q y , z0 )
E (Q x ,Q y , z0 )
a 2
E0 ³ e i 2S xQ x dx ³ e
E0
b 2
1 2
S Q xQ y
y
(22.33)
i 2S yQ y
a
x
d y . (22.34)
a 2
dx
sin(SQ x b) sin(SQ y a) (22.35)
b
Abb. 22.22: Zur Berechnung der Intensitätsverteilung bei der Beugung an einer Rechteckblende
Die Intensität ergibt sich damit zu
I (Q x ,Q y , z0 )
I0
2 sin 2 (SQ x b) sin (SQ y a) . (SQ x b) 2 (SQ y a) 2
(22.36)
Lassen wir hierin a gegen null streben, so erhalten wir die bereits berechnete Intensitätsverteilung eines Spaltes. Die Beugungsfigur einer Rechteckblende ergibt sich also als Überlagerung der Intensitätsverteilungen y´ zweier zueinander senkrecht liegender Spalte der Breite a und b. Ihre IntensitätsverteiIy’/I0 lungen sind in Abb. 22.23 dargestellt. Wir hatten bereits bei der Diskussion der Spaltbeugung festgestellt, dass die Strukturen im Beugungsbild umso breiter werden, je enger der Spalt gemacht wird, d.h.
Ix’/I0
Kleine Raumfrequenzen entsprechen großen räumlichen Strukturen und große Raumfrequenzen feinen räumlichen Strukturen.
x´ Abb. 22.23: Intensitätsverteilung bei der Beugung am Rechteckspalt
726
22 Optische Instrumente
22.6.3 Die Linse als Fouriertransformator Das Beugungsbild eines Objektes lässt sich in der Brennebene einer Linse beobachten. Die Linse holt das Bild quasi aus dem Unendlichen in ihre hintere Brennebene, sie wirkt als Fouriertransformator. Eine schräg auf eine Sammellinse zulaufende ebene Welle ergibt in der hinteren Brennebene (der Fourierebene) einen Lichtpunkt (Abb. 22.24). Umgekehrt führt ein Lichtpunkt ( x0 , y0 ) in der vorderen Brennebene durch die räumliche Fouriertransformation zu einer ebenen Welle und damit zu einer gleichmäßigen FeldverteiF lung in der hinteren Brennebene. Die räumliche Feldverteilung eines Lichtpunktes lässt sich darstellen durch
E ( x, y )
Abb. 22.24: Die Linse transformiert die ebene Welle E(x,y) in einen Punkt in der Brennebene, E(x´,y´) = E(Qx, Qy)
Setzen wir dies in (22.31) ein, so ergibt sich als Feldstärke in der Beobachtungsebene ( xc, y c)
f f
E (Q x ,Q y , z0 ) A ³
³E
0
E0 G ( x x0 ) G ( y y0 ) . (22.37)
G ( x x0 ) G ( y y0 )e
2S i ( xQ x yQ y )
dx d y
(22.38a)
f f
A E0 e Da
Qx
2S i ( x0Q x y0Q y )
xc O z0
sin D
O
|
.
D , O
(22.38b)
Qy
yc O z0
sin ß
O
|
ß
O
,
(22.30a)
beschreibt (22.38b) eine ebene Welle, die sich in Richtung D gegen die x´-Richtung bzw. in Richtung ß gegen die y´-Richtung ausbreitet. Die Überlegungen lassen sich leicht auf zwei Punktlichtquellen erweitern (Abb. 22.25a).
22 Optische Instrumente
y
727
b)
a)
I(x ¢,y¢)
y0 x
-y0
ny 1/2 y 0 Abb. 22.25: Das Frequenzspektrum zweier Punktlichtqellen (a) im Fourierraum ist ein Kosinusgitter (b)
E ( x, y )
E0G ( x) ^ G ( y y0 ) G ( y y0 )`
(22.39)
Die Fouriertransformierte E(x, y) und die Intensität werden damit
E ( xc, y c)
A (e
2S iy0Q y
e
2S iy0Q y
) 2 A cos(2S y0Q y ).
(22.40)
I ( xc, y c) 4 A2 cos 2 (2S y0Q y ) 2 A2 ^1 cos(4S y0Q y )`. Dieses Kosinusgitter ist in Abb. (22.25b) dargestellt. Die Raumfrequenz der zur x-Richtung parallelen Streifen ist
'Q y
1/ 2 y0 .
Als letztes Beispiel berechnen wir die Beugungsfigur eines linearen Amplitudengitters mit N Spalten der Breite b und der Gitterkonstanten d. Die Wellennormale der einfallenden Lichtwelle stehe senkrecht auf der Gitterebene (Abb. 22.26).
(22.41)
d E
b
x
Abb. 22.26: Lineares Amplitudengitter der Stegbreite b und der Gitterkonstanten d und
728
22 Optische Instrumente
Die Feldstärke ist N
E ( x, y )
E0 ¦ G ( x nd )
Der letzte Faktor rect
rect
x b
x b
(22.42)
x beschreibt die Stufenfunktion b
1 für 0 d x / b d 1 ® ¯0 sonst
(22.43)
Das Zeichen ( < ) bedeutet die Faltung der Deltafunktion mit der Stufenfunktion. Einsetzen der Feldstärke in (22.28) und Integration ergibt als Feldverteilung in der Beugungsebene
E ( x, y )
E0 G (Q y ) b
sin(S bQ x ) N 2S ind Q x ¦e S bQ x n 1
(22.44)
und als Intensität den bereits in Kap. 22.2.2.2 berechneten Ausdruck
I ( x, y ) E02 G (Q y ) b 2
sin 2 (S bQ x ) sin 2 (S NdQ x ) (S bQ x ) 2 sin 2 (S dQ x )
(22.45)
Dieses Beispiel illustriert erneut, dass die Grobstruktur im Beugungsbild mit einer kleinen Raumfrequenz, hier Q x , korreliert ist und die Feinstruktur mit einer großen Raumfrequenz, hier NQ x (Abb. 22.27).
I(nx)
Abb. 22.27: Raumfrequenzspektrum des Amplitudengitters von Abb. 22.22
nx
22 Optische Instrumente
729
22.6.4 Optische Filterung Optische Filterung kann unerwünschte feine Strukturen in der Objektebene beseitigen oder große Strukturen stärker hervortreten lassen. In Analogie zu elektrischen Filtern werden dazu Tiefpass- und Hochpassfilter verwendet. Die prinzipielle Anordnung zur optischen Filterung zeigt Abb. 22.28. Sie besteht aus zwei gleichen Linsen L1 und L2, die im Abstand der doppelten Brennweite hintereinander angeordnet sind. Durch die erste Linse entsteht in deren hinterer Brennebene wie oben die Fouriertransformierte der Feldstärkeverteilung der L1 L2 Fouriertransformierten der Objektebene In der Bildebene von L2 ergibt sich also wieder die ursprüngliche Feldstärke-Struktur der Objektebene, aber mit umgekehrten Vorzeichen. Durch Einsetzen von Blenden f f f f oder das Licht blockierenden Scheiben in die erste Fourierebene lassen sich bestimmte Gegenstands- Fourierebene Bildebene Raumfrequenzen herausfiltern und dadurch ebene (x,y) (-x,-y) die Struktur in der hinteren Brennebene der Abb. 22.28: Prinzipielle Anordnung zur zweiten Linse entsprechend verändern. Es optischen Filterung sollen hier die oben angesprochenen beiden Fälle diskutiert werden.
22.6.4.1 Tiefpassfilter Ein Tiefpassfilter entsteht durch Blockierung der L1 FE hohen Raumfrequenzen, also der stark abgebeugten Wellen, durch eine enge Blende in der Fourierebene von L1 (Abb 22.29). Im Extremfall wird nur Licht der nullten Ordnung durchgelassen, also nur die kleinsten Raumfrequenzen. Dadurch verschwinden bei der zweiten Abbildung Abb. 22.29. Tiefpassfilter also feine Strukturen. Solche können etwa durch feine Kratzer und Staubkörner auf der (ersten) Linse entstehen. Wird die Brennweite der zweiten Linse größer als die der ersten gewählt, so stellt das Linsensystem einen Strahlaufweiter dar, der eine homogene Ausleuchtung der gewählten Fläche gewährleistet.
730
22 Optische Instrumente
22.6.4.2 Hochpassfilter Ein Hochpassfilter entsteht durch Blockierung der niedrigen Raumfrequenzen, d.h. der wenig abgebeugten Wellen, durch eine kreisförmige undurchlässige Scheibe im Zentrum der Fourierebene der ersten Linse (Abb. 22.30). Die direkte Welle, die der nullten Ordnung entspricht, trägt also zum Bildaufbau nichts bei. Wir d/2 berechnen die Auswirkungen des 1/d Filters auf das von L2 erzeugte Bild d am Beispiel eines Kosinusgitters der Gitterkonstante d als Objekt. f f f f E(x,y) Die Feldverteilung in der Objektebene ist gegeben durch Abb. 22.30: Hochpassfilter
§Sx· E0 cos 2 ¨ ¸ © d ¹
E ( x, y )
E0 § 2S x · ½ ®1 cos ¨ ¸¾ , 2 ¯ © d ¹¿
(22.46)
in komplexer Schreibweise
1 1 1 ½ E0 ® e2S ix / d e 2S ix / d ¾ . 4 ¯2 4 ¿
E ( x, y )
(22.47)
Einsetzen in (22.34) ergibt als Feldstärkeverteilung in der Beugungsebene
E (Q x ,Q y )
E0 1 1 1 1 ½ G (Q y ) ®G (Q x ) G (Q x ) G (Q x ) ¾ . 2 2 2 d d ¿ ¯
(22.48)
Das Beugungsbild besteht also aus drei Punkten mit den Raumfrequenzen Qx und r1/ d , die der nullten und der r 1-ten Beugungsordnung entsprechen. Die nullte Ordnung werde nun ausgeblendet, G(Qx) = 0. Die erneute Fouriertransformation durch L2 liefert auf Grund unserer am Beispiel zweier Lichtpunkte gewonnenen Erkenntnisse wieder ein Kosinusgitter, das aber wegen des doppelten Abstandes der Lichtpunkte die halbe Periode hat. Unter Benutzung von Q x xc /(O f ), Q y y c /(O f ) wird
E ( xB )
1 § 2S x · 2cos ¨ ¸ 4 © d ¹
1 § Sx · cos ¨ ¸. 2 © d /2¹
(22.49)
Das Hochpassfilter kann auch dazu dienen, Phasenobjekte sichtbar zu machen, die nur lokale Änderungen des Brechungsindexes aufweisen, während der Betrag der elektrischen Feldstärke
22 Optische Instrumente
731
bei der Durchstrahlung konstant bleibt. Die Transmission eines Phasenobjektes kann dargestellt werden durch
W ( x, y ) c eiM ( x , y ) .
c = const.
(22.50)
Die Feldstärke in der Objektebene wird, wenn die konstante Feldstärke der einfallenden ebenen Welle mit E0 bezeichnet wird,
E ( x, y )
E0 W ( x, y ) cE0 eiM ( x , y ) .
(22.51)
Die Intensität ist in diesem Fall überall konstant.
I ([ ,K ) c 2 E02 .
(22.52)
Für schwach ausgeprägte Phasenstrukturen, M ( x, y) 2S , kann die Exponentialfunktion entwickelt werden. Die Feldstärke wird damit
E ( x, y ) cE0 ^1 iM ( x, y )` .
(22.53)
Die Fouriertransformierte in der hinteren Brennebene von L1 ergibt sich zu
E (Q x ,Q y ) F > E ( x, y ) @ cE0 ^G (Q x )G (Q y ) iF >M ( x, y )@` .
(22.54)
Blenden wir die nullte Ordnung durch Nullsetzen des ersten Terms aus, so ergibt die Abbildung des Beugungsbildes in die Bildebene (hintere Brennebene von L2)
E ( xB , yB ) iE0 cF ^F >M ( x, y ) @` icE0M ( x, y ) .
(22.55)
Die Intensität wird
I ( xB , yB ) c 2 E02M 2 ( x, y ) .
(22.56)
Sie hängt quadratisch von der Phase ab, wird also auf diese Weise sichtbar. Eine andere Art, ein Phasenobjekt in ein Amplitudenobjekt umzuwandeln, ist das Zernikesche Phasenkontrastverfahren, das bereits in Kap. 22.3.3.1 eingeführt wurde. Da bei diesem Verfahren die Intensität linear von der Phase abhängt, führt es zu einer höheren Empfindlichkeit.
732
22 Optische Instrumente
22.6.4.3 Zernikesches Phasenkontrastverfahren in der Fourierdarstellung Sind wie in Kap. 22.6.1 x, y die Koordinaten einer gegebenen Blendenöffnung und F(x, y) die betreffende Blendenfunktion, so ist das elektrische Feld E ( x , y ) in einem Punkt P( x , y ) in der hinteren Brennebene des Objektivs gegeben durch
E ( x , y ) ei (Zt kr ) ³³ F ( x, y )e
k yy ) i ( xx f
dx dy .
(22.57)
Die Blendenfunktion ist bei einem Amplitudenobjekt, wie wir gesehen haben, reell, d.h. die Phase ist in der Objektebene konstant. Wir berücksichtigen die örtliche Abhängigkeit des Phasenobjektes, indem wir F ansetzen als
F ( x, y ) e i\ ( x , y ) .
(22.58)
Im Weiteren setzen wir voraus, dass die Phasenunterschiede so klein sind, dass wir F ( x, y ) annähern können durch
F ( x, y ) 1 i\ ( x, y ) .
(22.59)
Setzen wir dies in unsere Ausgangsgleichung ein, so erhalten wir unter Berücksichtigung von
i
e
i
S 2
E ( x , y ) e
i ( Z t kr )
³³ e
k yyK ) i ( xx f
k
yy ) i ( xx ª i S º dx dy « e 2 » ei (Z t kr ) ³³\ ( x, y )e f dx dy . ¬ ¼
(22.60) Analog ergibt sich für ein schwaches Amplitudengitter mit
F ( x, y )
e k ( x, y )
1 k ( x, y ) 1 e iS
(22.61)
Die Feldstärke setzt sich in beiden Fällen aus zwei Summanden zusammen. Der erste Summand stellt eine ungebeugte Welle mit konstanter Amplitude dar. Der zweite Summand beschreibt das durch Beugung entstandene Wellenfeld. Im Fall eines Amplitudenobjektes beträgt der durch eckige Klammern hervorgehobene Phasenunterschied zwischen ungebeugtem (direktem) und gebeugtem Lichtfeld 180°, beim Phasenobjekt -90°. Gelingt es also, durch einen optischen Eingriff die Phasendifferenz des direkten Lichtes um weitere 90° zu vergrößern, so entsprechen die Verhältnisse denen beim Amplitudenobjekt. Der Phasenkontrast wird in einen Amplitudenkontrast umgewandelt.
22 Optische Instrumente
733
22.6.5 Optische Mustererkennung Die Herstellung technischer Artikel muss ständig durch eine Qualitätskontrolle überprüft werden. Zur Überwachung der vorgegebenen Toleranzen wird ein Werkstück mit einem präzise gearbeiteten Muster verglichen. Für einen solchen Vergleich eignet sich wiederum die optische Filterung. Zunächst wird ein Hologramm der Beugungsstruktur des Musters, ein sog. Fourierhologramm, angefertigt. Zur Aufnahme wird eine Fotoplatte in die Beugungsebene einer Linse gebracht und gleichzeitig die Platte durch eine ebene Welle beleuchtet. Das fertige Fourierhologramm wirkt in die Beugungsebene der Linse als Filter für die Fouriertransformierte des Objektes. Dieses befindet sich anstelle des Musters in der vorderen Brennebene der Linse. In der Bildebene überlagern sich die Bilder des Testobjektes und des Filters. Bei vollständiger Übereinstimmung von Testobjekt und Filter erscheint das Gesamtbild gleichmäßig hell. Abweichungen machen sich als Helligkeitsschwankungen bemerkbar. (In Wirklichkeit entstehen wie immer bei der Wiedergabe von Hologrammen vier Teilbilder mit unterschiedlichem Informationsgehalt, die aber an jeweils anderen Stellen des Beobachtungsschirmes auftreten).
22.6.6 Wirkungsweise des Nahfeld-Mikroskops In Kap. 22.3.1 haben wir das geometrische Auflösungsvermögen des Lichtmikroskops abgeleitet. Dabei ergab sich auf Grund der Beugung für den kleinsten auflösbaren Abstand zweier Punkte 'x
'x
OVak 2 NA
|
OVak 2
.
(22.18)
Diese Grenze beruht auf der Fernfeldnäherung, d.h. der Gegenstand befindet sich in einer Entfernung vom Objektiv, die groß gegenüber der Wellenlänge des verwendeten Lichtes ist. Wird dagegen das Objektiv dem Gegenstand bis auf wenige Nanometer genähert, so lässt sich diese Grenze umgehen. Betrachten wir als einfaches Beispiel einen durch eine ebene Welle beleuchteten schmalen Spalt Sp1 (Abb. 22.31). Das elektrische Feld in nächster Nähe hinter dem Spalt, das sog. Nahfeld, beschränkt sich im Wesentlichen auf den Sp1 Spaltbereich. Es ist umso weniger strukturiert, b e je mehr die das Feld abtastende Sonde dem Spalt genähert wird. Das Auflösungsvermögen d Sp2 hängt im Prinzip nur vom Durchmesser der Sonde und deren Entfernung von dem zu unFM tersuchenden Objekt ab. Die Unterschiede liegen darin begründet, dass das Nahfeld propagieAbb. 22.31: Zur Fourier-optischen Berende und mit dem Abstand abklingende (evahandlung der Nahfeld-Mikroskopie neszente) Anteile enthält, während das Fernfeld
734
22 Optische Instrumente
nur aus homogen propagierenden Wellen besteht. Eine ähnliche Situation haben wir bereits beim Hertzschen Dipol kennen gelernt. Wir wollen nun das Problem in der Sprache der Fourieroptik darstellen und diskutieren. Als Sonde denken wir uns einen zweiten engeren Spalt Sp2 der Breite d << b im Abstand H hinter dem Spalt Sp1 der Breite b angeordnet (L22.16). Eine monochromatische ebene Welle E(x,z), die senkrecht auf Sp1 trifft, erzeugt unmittelbar dahinter die Feldstärke
E (b )
E0 ( x, z ) W ( x) .
(22.62)
Hierin ist W ( x) die Transmissionsfunktion von Sp1. Das – ohne den zweiten Spalt Sp2 – auf einem Schirm im Abstand z = z0 entstehende Feld ist f
E ( x, z0 ) 2S
³
E1b (Q x , z
0)e i 2SQ x x e
i 2S (Q 2 Q x2 ) z0
dQ x
(22.63)
f
Die Berechnung des Integrals führt bei einer Rechteck-Transmissionsfunktion,
b b °1 für d x d , 2 2 °¯0 sonst.
W ( x) ®
(22.64)
auf den uns bereits von (22.37) bekannten Ausdruck; Qx durchläuft dabei alle möglichen reellen Werte. In (22.63) kann der Wurzelterm imaginär sein, je nachdem ob
Q 2 Q x2 entweder positiv reell oder negativ
Q 2 Q x2 > 0 oder
Q 2 Q x2 < 0 ist. Entsprechend den Inte-
grationsgrenzen enthält das Feld nach der Beugung beide Anteile, propagierende Wellen und evaneszente Wellen. Im Fernfeld sind aber nur noch die propagierenden Anteile präsent. Betrachten wir etwa das Feld bei einer bestimmten Raumfrequenz Q0,
E1b (Q x ,0)
E1bG (Q x Q 0 ) .
(22.65)
Setzen wir dieses Feld in (22.63) ein, so ergibt sich für das Fernfeld
E ( x, z0 )
E1b e i 2SQ 0 x e 0
i 2S Q 2 Q 02 z0
, Q 0 Q x
, Q 0 !Q x .
(22.66)
Nun denken wir uns den zweiten Spalt, Sp2, in einem so kleinen Abstand H hinter Sp1 angeordnet, dass ihn auch dessen Nahfeld erreicht. Gleichzeitig wirkt Sp2 aber auch als Sendeantenne, die jetzt auch homogene propagierende Wellen aussendet. Die Quintessenz ist, dass evaneszente Wellen in homogen propagierende Wellen transformiert worden sind.
22 Optische Instrumente
735
Das Fernfeld im Abstand (z0 - H) wird Z/c
E ( x, z0 ) 2S
³ Z
e i 2SQ xc x e
i 2S Q 2 Q xc2 ( z0 H )
dQ xc
/c f
u
³
(22.67)
E1b (Q x , z
0)e
i 2S Q 2 Q xc2 H
u E1d (Q xc , z H ).
f
Berechnen wir wieder das Feld bei einer bestimmten Raumfrequenz K, so erhalten wir
E ( x, z0 )
i 2S E1b e
Q 2 Q 02 H
Z /c
u 2S
³ Z
e i 2SQ xc x e
i 2S Q 2 Q xc2 ( z0 H )
dQ xc u E1d (Q xc Q 0 , z H ). (22.68)
/c
Da H eine sehr kleine Größe ist, wird das Feld nun auch für Q0 > Q = Z/2S c nicht null, das Fernfeld enthält auch Komponenten des Nahfeldes. Je kleiner der Abstand H der Sonde zum Objekt ist, umso größer ist der Anteil von Raumfrequenzen mit Q> Z / 2S c , umso feinere Strukturen können aufgelöst werden, vorausgesetzt, die Sondenspitze besitzt einen hinreichend kleinen Durchmesser d.
Zusammenfassung x Die Winkelauflösung des menschlichen Auges ist durch den Abstand der Rezeptoren und durch die Beugung an der Pupille begrenzt auf
umin | 1,7 10-4 rad = 0,6´. x Das geometrische Auflösungsvermögen optischer Instrumente ist durch die Beugung bestimmt. Die Winkelauflösung beträgt bei einem Durchmesser D der abbildenden Linse (bzw. des Spiegels)
u min
1, 22
O D
.
x Mit einem Mikroskop können gerade noch Abstände von der Größe der halben Wellenlänge aufgelöst werden. Beim Dunkelfeldverfahren kann noch zwischen Objekten von O/100 unterschieden werden; Strukturen lassen sich jedoch nicht mehr auflösen. Ein Elektronenmikroskop hat wegen der kleineren Wellenlänge der Elektronen ein ca. 103 mal größeres Auflösungsvermögen als ein Lichtmikroskop.
736
22 Optische Instrumente
x Transparente Phasenobjekte können durch Erzeugung eines künstlichen Phasenunterschiedes zwischen den Teilwellen der nullten und der höheren Beugungsordnungen von O / 4 in ein Amplitudenobjekt umgewandelt und damit sichtbar gemacht werden (Phasenkontrastverfahren). x Durch die konfokale Mikroskopie wird in Verbindung mit einer starken Streulichtunterdrückung ein hohes Auflösungsvermögen auch in der zur Objektebene senkrechten Richtung erreicht. x Eine Abbildung durch optische Elemente setzt voraus, dass mindestens Licht der ersten Beugungsordnung vom optischen System erfasst wird. x Die Beugungsbegrenzung des Auflösungsvermögens lässt sich mit einem Nahfeldmikroskop umgehen. Es lassen sich noch Abstände im 10 nm-Bereich auflösen. x Die Vergrößerung eines zweilinsigen Fernrohres ist
V
f1 / f 2 ,
wobei f1 und f2 die Brennweiten von Okular und Objektiv sind. x Die aktive Optik korrigiert quasistatische Verformungen der Oberfläche eines Spiegelteleskops für astronomische Zwecke mittels elektronisch geregelter Stellelemente. x Die auf ein Spiegelteleskop einfallende, durch Fluktuationen des Brechungsindexes der Atmosphäre verzerrte Wellenfront kann mit Hilfe der adaptiven Optik korrigiert werden. x Grundlage der Fourieroptik ist die Tatsache, dass in der Fraunhoferschen Näherung die Verteilung der elektrischen Feldstärke hinter einem beugenden Objekt als Fouriertransformierte des elektrischen Feldes in der Ebene des Objektes dargestellt werden kann. Die erneute Abbildung liefert das reelle Bild des Gegenstandes. x Durch Einsetzen von Blenden oder das Licht blockierenden Scheiben in die erste Fourierebene lassen sich bestimmte Raumfrequenzen herausfiltern und dadurch die Struktur in der hinteren Brennebene einer zweiten Linse entsprechend verändern. Werden hohe Raumfrequenzen durch ein Tiefpassfilter blockiert, verschwinden feine Strukturen im Bild. Ein Hochpassfilter betont feine Bilddetails. x Durch ein Hochpassfilter können Phasenobjekte sichtbar gemacht werden.
22 Optische Instrumente
737
Übungsaufgaben 1. Wozu lässt sich eine Linse der Brennweite f = 10 mm verwenden? Ein Gegenstand befinde sich im Abstand a = f/2. Wo entsteht das Bild und wie ist es geartet? Kann es auf einem Schirm beobachtet werden? Welche Vergrößerung wird erzielt? Welche Möglichkeiten gibt es, um diese zu erhöhen? 2. In Mitteleuropa erreicht die Erdoberfläche in der Mittagszeit von der Sonne eine Strahlungsenergie von ca. 1 kWh/m2. Diese gelange durch eine Blende auf eine Bikonvexlinse, welche das Licht auf einen Fleck mit 0,1 mm Durchmesser fokussiert. Das Auge vermag sich der einfallenden Lichtleistung mittels der Irisblende in gewissen Grenzen anzupassen. Zu kleinen Pupillen hin ist das Öffnungsverhältnis auf ca. 1:8,5 begrenzt. Wieweit muss die Intensität abgeschwächt werden, damit das Auge keinen Schaden erleidet? Die maximale Leistung darf 10 6 W nicht überschreiten. Die bildseitige Brennweite des Auges beträgt 22 mm. 3. Die Brennweiten des Objektiv-Satzes eines Mikroskops seien 60, 30 und 16 mm, die des Okularsatzes 12, 6 und 3 mm. Die Tubuslänge ist 0,25 m. Wie können die Linsen sinnvoll miteinander kombiniert werden? Welcher Vergrößerungsbereich lässt sich realisieren? In welchem Abstand von der Objektivebene müssen sich die Objekte befinden? Wie groß ist das jeweilige geometrische Auflösungsvermögen? 4. Sie wollen ein Objekt, dessen Struktur mit dem Auge nicht mehr zu erkennen ist und das sich zudem in einer Umgebung mit starkem Streulichtanteil befindet, sichtbar machen. Welche Möglichkeiten gibt es? Wieso limitiert die Beugung das erreichbare Auflösungsvermögen? Lässt sich diese Begrenzung umgehen? 5. Konstruieren Sie den Strahlengang eines Diaprojektors. Wie ist der Kondensor aufzubauen? Wie können Sie vermeiden, dass das Dia zu heiß wird? – Beim Betrachten eines Dias wird manchmal ein verzerrtes farbiges Ringsystem beobachtet. Wie entsteht es? 6. Ein Stern mit der Zenitdistanz von 65° werde mit Hilfe eines 10 m-Spiegelteleskops der Brennweite 12 m beobachtet. Welchen Wert hat die Winkelverschmierung des Sterns und wie groß erscheint sein Durchmesser? Rechnen Sie mit einer mittleren Schwankung des Brechungsindexes von Gn = 3,2 10-2 n und n = 1,00030 über den Beobachtungszeitraum.
A1
Mathematischer Formel-Anhang
A1.1 Vektorrechnung A1.1.1 Definition von Vektoren In der Physik begegnen uns sowohl Größen, die durch eine Zahl (und eine Einheit) charakterisiert sind, als auch solche, die durch eine Länge und eine Richtung festgelegt sind. Erstere Größen nennen wir Skalare, gerichtete Größen heißen Vektoren. Beispiele für Skalare sind Potential, Arbeit oder Temperatur; z solche für vektorielle Größen sind Kraft, Drehmoment oder elektrisches Feld. Vektoren lassen sich in einem kartesischen Koordinatensystem in ihre Komponenten längs r der drei Achsen zerlegen. Durch diese Kompor nenten ist ein Vektor eindeutig bestimmt. Seine g Länge ist nach dem Satz des Pythagoras gegeben durch (Abb. A1.1) b a y G r
x2 y 2 z 2 .
x
(A1.1)
Abb. A1.1: Zur Definition eines Vektors
Seine Richtung ergibt sich aus den Winkeln gegen die Koordinatenachsen
cos D
x 2
2
x y z
2
; cos E
y 2
2
x y z
2
; cos J
z 2
x y2 z2
. (A1.2)
Der Vektor der Länge „eins“ heißt Einheitsvektor. Wir schreiben ihn als
eˆ
G r G , r
wobei eˆ
x2 y 2 z 2 x2 y 2 z 2
1.
(A1.3)
Er hat die Komponenten
eˆ1 {1,0,0}; eˆ2
{0,1,0}; eˆ3 {0,0,1} .
(A1.4)
Damit können wir jeden Vektor darstellen als
G r
xeˆ1 yeˆ2 zeˆ3 .
(A1.5)
740
23 Mathematischer Anhang
A1.1.2 Polare und axiale Vektoren Zu Beginn des Kapitels haben wir Kraft und Drehmoment als zwei Beispiele vektorieller Größen angeführt. Die Kraft gehört zu einer Klasse von Vektoren, die bei einer Spiegelung der G Koordinatenachsen am Ursprung das Vorzeichen wechselt. Das Gleiche gilt für den Vektor r . Das Drehmoment steht für eine Sorte von Vektoren, die einen Drehsinn besitzen. Das wird im übernächsten Abschnitt klar werden. Bei einer Spiegelung am Nullpunkt des Koordinatensystems bleibt der Drehsinn erhalten. Solche Vektoren werden daher als axiale Vektoren bezeichnet.
A1.1.3 Addition und Subtraktion von Vektoren Vektoren werden addiert, indem die zugehörigen Komponenten addiert werden. Sind z.B. zwei G G Vektoren a {a x , a y , a z } und b {b1 , b2 , b3 } gegeben, so ist deren Summe (Abb. A1.2)
z
G c
r c
r b
G G a b ,
G c {a1 b1 , a2 b2 , a3 b3 } .
r a
y x Abb. A1.2: Addition zweier Vektoren
(A1.6a) (A1.6b)
Entsprechendes gilt für die Differenz. Die Subtraktion eines Vektors bedeutet ja die Addition des Vektors mit umgekehrter Richtung.
G G a b
G G a ( b ) .
(A1.7)
A1.1.4 Multiplikation eines Vektors mit einem Skalar oder mit einem Vektor Wir haben drei Fälle zu unterscheiden: Die Multiplikation eines Vektors mit einem Skalar und die mit einem Vektor. Der zweite Fall untergliedert sich in das skalare Produkt und das vektorielle Produkt. Die Namen weisen darauf hin, dass im ersten Fall ein Skalar entsteht und im zweiten Fall ein Vektor. Wir beschränken uns bei der Erläuterung zunächst auf einfache Produkte.
23 Mathematischer Anhang
741
A1.1.4.1 Multiplikation eines Vektors mit einem Skalar Ein Vektor wird mit einem Skalar c multipliziert, indem jede Komponente mit dem Skalar multipliziert wird. Der Vektor wird dadurch c-mal länger, behält aber seine Richtung, sofern der Skalar einen positiven Wert besitzt. Es gilt
G c a {ca1 , ca2 , ca3 } c{a1 , a2 , a3 } .
(A1.8)
A1.1.4.2 Skalare Multiplikation eines Vektors mit einem Vektor G G Das Skalarprodukt zweier Vektoren a und b
ist definiert als
c
G G a b
a b cos D ,
(A1.9)
G G G wobei D der Winkel zwischen a und b ist. Das Skalarprodukt ist also das Produkt von a G G und der Projektion von b auf a (Abb. A1.3).
.Es nimmt demnach seinen größten Wert an, wenn D 0 ist, d.h. wenn die beiden Vektoren parallel zueinander liegen. Es ist null, wenn D 90q ist, also wenn die beiden Vektoren aufeinander senkrecht stehen. Für die drei Einheitsvektoren längs der drei Achsen gilt folglich
eˆi eˆ j
G ij , i, j 1, 2,3
^
1 für i j 0 für i z j
.
a cosa
(A1.10)
wobei G ij das Kroneckersymbol ist. Es bedeutet
G ij
r b
(A1.11)
b cosa
r a
Abb. A1.3: Zur Definition des skalaren Produktes
Drücken wir das Skalarprodukt entsprechend der gerade gegebenen Definition durch seine Komponenten aus, so erhalten wir unter Beachtung des Kroneckersymbols
G G a b
(a1eˆ1 a2 eˆ2 a3eˆ3 ) (b1eˆ1 b2 eˆ2 b3eˆ3 ) (a1b1 a2b2 a3b3 ).
(A1.12)
742
23 Mathematischer Anhang
A1.1.4.3 Vektorielle Multiplikation eines Vektors mit einem Vektor Das Vektorprodukt
G G (a u b )
G c
G G ªa, b º ¬ ¼
(A1.13)
G G zweier Vektoren a , b ist ein Vektor, der senkrecht auf den beiden Vektoren steht (Abb. A1.4). G Er bildet eine Rechtsschraube, wenn der links stehende Vektor a auf dem kürzest möglichen G Weg in die Richtung von b gedreht wird. Führen wir eine Spiegelung am Nullpunkt durch, G G G G ersetzen also a durch a , b durch b , so bleibt G c und damit sein Drehsinn erhalten. Letzterer ist r G c ein axialer Vektor. Die Länge des Vektors c bzw. der Wert des Vektorproduktes folgt aus
r b
G c
G G a b sin D .
(A1.14)
r a
G d.h. heißt, der Betrag von c ist gleich dem FlächenG G inhalt des von den beiden Vektoren a und b Abb. A1.4: Zur Definition des aufgespannten Parallelogramms. Er ist also am Vektorproduktes größten, wenn D 90q ist und am kleinsten, G G G nämlich null, für D 0q . Da a , b und c ein Rechtssystem bilden, gilt für die Einheitsvektoren
eˆ1 u eˆ2
eˆ3 , eˆ2 u eˆ3
eˆ1 ,
eˆ3 u eˆ1
eˆ2 .
(A1.15)
Damit finden wir die Komponenten-Darstellung des Vektorproduktes zu
G c
G G (a u b ) (a2 b3 a3b2 ; a3b1 a1b3 ; a1b2 a2b1 ).
(A1.16a)
Dies lässt sich als Determinante schreiben.
G G (a u b )
eˆ1 eˆ2 eˆ3 a1 a2 a3 . b1 b2 b3
(A1.16b)
23 Mathematischer Anhang
743
A1.1.5 Multiplikation von mehr als zwei Vektoren Wir gehen wieder wie bisher vor, besprechen also zunächst Skalarprodukte und anschließend vektorielle Produkte. A1.1.5.1 Skalare Multiplikation eines polaren und eines axialen Vektors
Als Ergebnis der skalaren Multiplikation dieser Art verstehen wir die „pseudoskalare“ Größe d
d
G G G c (a u b ) .
(A1.17)
G Bei der Spiegelung des polaren Vektors c am Ursprung des Koordinatensystems wechselt G G dieser sein Vorzeichen ( c o c ), bei der Spiegelung des axialen Vektors bleibt dieses erhalten. d geht über in -d. Daher trägt d den Namen Pseudoskalar. Der Betrag d bedeutet an-
schaulich das Volumen des von den G G G drei Vektoren a , b , c aufgespannten Parallelepipeds (Abb. A1.5). In Komponentenschreibweise ergibt das Produkt (A.1.17) (auch Spatprodukt genannt) die Determinante c cos b
G G G c (a u b )
a1 a2 a3 b1 b2 b3 . (A1.18) c1 c2 c3
b
r c r b r a
Abb. A1.5: Veranschaulichung des Spatproduktes
A1.1.5.2 Vektorielle Multiplikation eines polaren und eines axialen Vektors
Nach der Definition des Vektorproduktes ist das Resultat einer derartigen Multiplikation wiederum ein Vektor.
G d
G G G c u (a u b ) .
(A1.19)
G G Dieser Vektor steht senkrecht auf der Normale des durch a und b aufgespannten ParalleloG G gramms und senkrecht auf c . Er ( d ) liegt also in der Ebene des Parallelogramms und muss sich schreiben lassen als
G d
G G xa yb
(x, y = Zahlen)
(A1.20)
744
23 Mathematischer Anhang
Um x und y zu finden, schreiben wir zur Abkürzung
G G G (a u b ) n .
(A1.21)
Wir legen nun zur Vereinfachung ein Koordinatensystem so, dass dessen x-Achse in die G G G Richtung von b weist und die y-Achse in die Ebene von a und b fällt. Die drei Vektoren G G G a , b , c schreiben sich dann
G a
a1eˆ1 a2 eˆ2 ,
G b b1eˆ1 , G c
(A.1.22)
c1eˆ1 c2 eˆ2 c3eˆ3 ,
G G und das Vektorprodukt (a u b ) erhält die einfache Form
G G (a u b ) a2 b1 eˆ3 .
(A1.23)
G G Für das aus den Vektoren c und n gebildete Vektorprodukt ergibt sich
G d
c2 a2 b1 eˆ1 c1 a2 b1 eˆ2 .
(A1.24a)
Addieren und subtrahieren wir dazu den Vektor c1 a1 b1 eˆ1 , so erhalten wir
G d
c1 b1 (a1 eˆ1 a2 eˆ2 ) (c1 a1 c2 a2 ) b1 eˆ1 .
(A1.24b)
Das können wir schreiben als
G d
G G G G G GG G (c u (a u b )) (cb) a (c a ) b
G GG G G a (cb) b (c a ) .
(A1.24c)
Vergleichen wir diesen Ausdruck mit (A.4.1.20), so erkennen wir, dass x und y durch die GG GG Skalarprodukte ( cb ) und (c a ) gegeben sind. (4.24c) wird als Entwicklungssatz bezeichnet; mit seiner Hilfe lassen sich auch kompliziertere Produkte umformen. Als Beispiel betrachten wir das Skalarprodukt zweier Vektorprodukte:
G G G G ( a u b ) (c u d ) . G G G G G G G G G G G G G g (c u d ) c ( g u d ) c (( a u b ) u d ) c ( d u ( a u b ))
(A1.25) (A1.26a)
23 Mathematischer Anhang G G Wobei wir (a u b )
745
G g gesetzt haben. Benutzung des Entwicklungssatzes führt zu
G G G G G G G G G G G c (d u (a u b )) c {a (d u b ) b (a u d )} .
(A1.26b)
G Nach Multiplikation mit c folgt als Endresultat
G G G G GG G G GG G G (a u b ) (c u d ) ac b d b c ad .
(A1.26c)
Als Sonderfall ergibt sich
G G (a u b )2
GG a 2b 2 ( ab ) 2 .
(A1.27)
Aus dem Entwicklungssatz folgt weiter, dass
G G G G G G G G G (a u (b u c )) (b u (c u a )) (c u (a u b )) 0 .
(A1.28)
A1.1.6 Differentiation eines Vektors nach einem Skalar Ein Vektor sei eine stetige Funktion einer Variablen, z.B. der Zeit t.
G G u u (t ) ;
G u
( x, y , z ) .
(A1.29)
G Bei Zunahme von t um 't ändert sich der Vektor u um
G 'u
G G G (u (t ) 'u ) u (t ) .
(A1.30)
In Analogie zur Differentiation einer skalaren Größe bezeichnen wir als Differentialquotienten den Grenzwert
G u'
G du dt
G G G (u (t ) 'u ) u (t ) 0 't
lim 't
(A1.31)
Der Ausdruck ergibt sich unmittelbar, wenn wir die Komponenten-Schreibweise benutzen. Analog sind die höheren Ableitungen definiert. Für die Differentiation von Produkten gelten ebenfalls die bekannten Regeln der Analysis.
746
23 Mathematischer Anhang
Wir erhalten
GG d (u v) dt
G G du G G dv , vu dt dt
G G d (u u v) dt
(
G G du G G dv u v) (u u ) . dt dt
G Es sei ein Vektor mit konstantem Betrag gegeben. Es gilt also a 2 Differentiation folgt
G G da 2a dt
0.
(A1.32)
(A1.33) const . Durch
(A1.34)
Das bedeutet, dass die beiden Vektoren senkrecht aufeinander stehen. Anwendung findet dieser Fall z.B. bei der gleichförmigen Kreisbewegung.
A1.2 Elemente der Vektoranalysis A1.2.1 Der Gradient einer skalaren Funktion Eine skalare Größe, z.B. die Temperatur, als Funktion des Ortes definiert ein skalares Feld. Die G Änderung dieser Größe beim Fortschreiten um eine Strecke d r hängt von der Richtung ab, in der wir fortschreiten. Bezeichnen wir die interessierende Funktion mit V(x,y,z), so gilt bis auf Größen höherer Ordnung
dV
wV wV wV dx dy dz . wx wy wz
(A1.35a)
Die rechte Seite können wir auch schreiben
dV
wV wV wV eˆ1 eˆ1dx eˆ2 eˆ2 dy eˆ3 eˆ3 dz wx wy wz
(A1.35b)
oder als das skalare Produkt
dV
(
wV wV wV eˆ1 eˆ2 eˆ3 ) ( dxeˆ1 dyeˆ2 dzeˆ3 ) wx wy wz
(A1.35c)
23 Mathematischer Anhang
747
Der erste der beiden Vektoren hängt nur von den Änderungen von V in Richtung der Koordinatenachsen ab. Der zweite wird bestimmt durch die Richtung, in der wir nach der Änderung von V(x,y,z) fragen. Den ersten bezeichnen wir mit grad V (Gradient von V) und G den zweiten mit dr .
gradV
§ wV wV wV · eˆ1 eˆ2 eˆ3 ¸ . ¨ wy wz ¹ © wx
(A1.36)
Damit lässt sich (A1.35c) schreiben
dV
G dr gradV .
(A1.37)
Wir wollen uns die Bedeutung des Gradienten klarmachen. Dazu gehen wir von dem Skalar V aus; wir verbinden alle Punkte mit gleichem Wert von V zu Flächen, die wir Niveauflächen G nennen. Beim Fortschreiten auf ihnen bleibt also V konstant. Legen wir demnach dr in eine solche Niveaufläche, so ist (Abb. A1.6)
G dr gradV
0.
(A1.38)
Das bedeutet, dass der Vektor gradV senkrecht auf der Niveaufläche steht. Weiter sehen wir, G dass die Änderung von V, bezogen auf den gleichen Betrag von dr , maximal wird, wenn das Skalarprodukt der beiden Vektoren den größten Wert annimmt, wenn also die Richtung von G dr mit der von grad V übereinstimmt. Der Gradient einer skalaren Größe ist demnach ein Vektor, dessen Richtung zusammenfällt mit der Richtung der größten Änderung von V im Punkt (x,y,z). Sein Betrag gibt diese größte Änderung an.
Wir geben ein einfaches Beispiel. Auf einer Wanderkarte sind die Linien gleicher Höhe angegeben. Sie begrenzen die Flächen gleicher Höhe. Senkrecht zu ihnen verlaufen die Falllinien. Das sind die Richtungen, in denen sich die Höhe am schnellsten ändert. Der Vektor grad z , wobei z die Höhe im Punkt (x, y) angibt, ist also Tangentenvektor an die Falllinien.
A1.2.2 Die Divergenz eines Vektorfeldes Zum besseren Verständnis betrachten wir ein konkretes Beispiel. Gegeben sei ein Vektorfeld G G G G v(r ) , das eine Flüssigkeitsströmung darstellen möge. v(r ) bedeutet die Flüssigkeitsmenge, die pro Sekunde durch ein senkrecht zur Strömung liegendes Flächenelement von 1 cm2 Inhalt G fließt. Die durch ein Flächenelement dA pro Zeiteinheit strömende Flüssigkeitsmenge ist
748
23 Mathematischer Anhang
grad j
Falllinien Niveaulinien j = const
P dr
Abb. A1.6: Zur Definition des Gradienten einer skalaren Funktion
somit gegeben durch das Skalarprodukt G G v dA , das Fluss des Vektorfeldes heißt. Wir greifen uns nun im Vektorfeld G G v (r ) ein beliebig gestaltetes Volumenelement W heraus. Die Oberflächenelemente mögen nach außen weisen. Durch Summierung aller Beiträge über die gesamte Oberfläche erhalten wir den G G G resultierenden Fluss v³ v (r ) dA durch die
Oberfläche. Er kann positiv oder negativ sein. Im ersten Fall sprechen wir von einer Quelle, im zweiten Fall von einer Senke. Ist das Integral gleich null, so heißt das Feld quellenfrei. Die Größe des resultierenden Flusses hängt auch ab von der Größe des Volumens. Um ein Maß für die Ergiebigkeit einer Quelle zu gewinnen, ist es zweckmäßig, den auf das Volumen bezogenen Fluss zu benutzen. Diese Größe trägt den Namen Divergenz des G Vektorfeldes und wird als di v v geschrieben (Divergenz = Ergiebigkeit).
G div v
1 0 'W
lim
'W
G G v v³ dA .
(A1.39)
Wir betrachten jetzt ein endliches Volumen. Wir unterteilen es in beliebig viele Volumenelemente. Für jedes gilt
G div v dW
G G
v³ v dA .
Wir summieren nun auf beiden Seiten über alle Volumenelemente. Auf der linken Seite entG steht das Volumenintegral ³ div v dW , auf der rechten Seite heben sich im Inneren alle Beiträge
auf, da die Oberflächen benachbarter Volumenelemente verschiedenes Vorzeichen aufweisen G und r ( x, y, z ) eine stetige Funktion ist. Es bleiben nur die Beiträge der Elemente an der Oberfläche. Das Resultat ist der Gaußsche Satz (C.F. Gauß, 1777-1855)
G G
G
v³ vdA = ³ div v dW
.
Gaußscher Satz
(A1.40)
Das Oberflächenintegral, berechnet über eine geschlossene Oberfläche, ist gleich G dem Volumenintegral der Divergenz von v , berechnet über das eingeschlossene Volumen.
Zur Berechnung der Divergenz eines Vektorfeldes ist die Darstellung in kartesischen Koordinaten nützlich. Dazu wählen wir als Volumenelement einen Kubus (Abb. A1.7) mit den Seiten dx, dy und dz. An der Stelle x0 strömt durch die Fläche dydz die Flüssigkeitsmenge
23 Mathematischer Anhang
749
dydz (v x ) x0 ein. An der Stelle x dx strömt durch die
gegenüberliegende Seite die Menge dydz (v x ) x 0 +dx aus.
z
Entwickeln wir (v x ) x0 dx in eine Taylorreihe, so ergibt sich als Differenz der zwei Beiträge
(v x
wvx dx v x ) dydz . dx
dz
(A1.41)
x0, y0, z0
Entsprechende Überlegungen für die beiden anderen Seiten-Paare führen zu analogen Beiträgen, so dass wir für das Flächenintegral insgesamt erhalten
G G § wv x wv y wv z · v v³ dA ¨© wx wy wz ¸¹ dxdydz
(A1.42)
dx
dy
y
x Abb. A1.7: Zur Berechnung der Divergenz eines Vektors
Dividieren wir noch durch (dxdydz ) , so ergibt der Vergleich mit (A1.39)
G div v
wv x wv y wv z . wx wy wz
(A1.43)
A1.2.3 Die Rotation eines Vektorfeldes Durch die Bildung der Divergenz eines Vektorfeldes entsteht ein skalares Feld. Bilden wir dagegen die Rotation eines Vektorfeldes, so ergibt sich ein anderes Vektorfeld. Zur näheren Erläuterung betrachten wir ein Vektorfeld, das im ganzen Raum die gleiche Richtung habe (Abb. A1.8); die Länge (ihr Betrag) senkrecht zur Ausbreitungsrichtung nehme unterschiedliche Werte an. Wir denken uns nun eine G Fläche senkrecht zur Richtung von v gelegt, so dass G seine Normale in die Richtung von v zeigt, und bilden das über die geschlossene Berandungskurve C erstreckte Linienintegral
G G
v³ v dr . C
(A1.44)
Abb. A1.8: Zur Abhängigkeit des Linienintegrals von der Lage der umlaufenden Fläche
750
23 Mathematischer Anhang
G G Da die Linienelemente dr stets senkrecht zu v weisen, ist das Integral gleich null. Steht die G G Normale dagegen senkrecht zu v , so verschwinden zwar weiterhin die Beiträge der zu v G senkrechten Stücke, dagegen nicht die Beiträge der parallel v liegenden Wegstücke. Wir sehen das am einfachsten, wenn wir als Flächenelement ein Rechteck wählen. Der Grenzwert
sn
lim
'A 0
1 G G v dr 'A v³
(A1.45)
hängt also von der Normalenrichtung des umlaufenen Flächenelementes ab. Wir können ihn berechnen, wenn wir ihn für drei nichtkomplanare Richtungen kennen. Als solche wählen wir zweckmäßigerweise die Achsen eines kartesischen Koordinatensystems. Als zu umlaufendes Flächenelement diene ein Dreieck dA = ABC (Abb. A1.9), dessen Ecken von den Koordinatenachsen geschnitten werden. Anstatt das Linienintegral über die Berandungskurve A,B,C zu führen, können wir es ersetzen durch die Linienintegrale über die mit dem Ursprung und den drei Ecken A,B,C gebildeten Dreiecke. Z.B. ergibt sich für die sx t Komponente C
sx
0
B A Abb. A1.9: Zur Bildung der Rotation eines Vektors
lim
'Ax 0
1 'Ax
v³
G G v dr ,
(A1.46)
OBC
Bei der Summierung der Umläufe wird jede Achse zweimal in entgegengesetztem Sinn durchlaufen, so dass nur der Beitrag der Seiten AB, BC und CA verbleibt. Die Gleichwertigkeit der Berechnung ist damit gewährleistet. Andererseits gilt für ein Flächenelement
G G G G ˆ dA ndA ex dAx e y dAy ez dAz , (A1.47)
G wobei nˆ der Normalen-Einheitsvektor von dA ist. Werden die Richtungskosinusse der Normalen mit cos D , cos E , cos J bezeichnet, so lassen sich die Flächenelemente in (A1.47) schreiben
dAx
dA cos D , dAy
dA cos E , dAz
dA cos J .
Setzen wir dies in (A1.46) ein, so erhalten wir
sn
sx cos D s y cos E sz cos J .
(A1.48)
23 Mathematischer Anhang
751
Diesen Ausdruck können wir deuten als das skalare Produkt des Normalen-Einheitsvektors mit einem Vektor, der die Komponenten sx , s y , sz hat. Der Vektor G G wird Rotation von v genannt und als rot v geschrieben.
rotv eˆx sx eˆy s y eˆz sz Damit ergibt sich Skalarprodukt sn dA
G G v³ vdr
sdA
für
(A1.49) das
oben
eingeführte
G G G nˆ rot v dA rot v dA .
(A1.50)
Abb. A1.10: Zum Stokesschen Satz
Wir erweitern nun unsere Ergebnisse auf ein Flächenstück mit beliebiger (nicht notwendig ebener) Randkurve. Die Fläche unterteilen wir in unendlich kleine Flächenelemente (Abb. A1.10). Diese werden in der gleichen Richtung durchlaufen, in der die Randkurve durchlaufen wird. Für jedes Element gilt (A1.50). Bei der Summation über alle Flächenelemente heben sich alle Beiträge der inneren Elemente heraus, da jedes Wegstück zweimal in entgegen gerichteter Richtung durchlaufen wird. Auf der linken Seite der Gleichung bleibt das Integral über die Randkurve und wir erhalten die Beziehung
G G
G G
v³ v dr ³ rot vdA . C
(A1.51)
A
G Das Linienintegral des Vektors v , erstreckt über eine geschlossene Kurve C, ist G gleich dem Oberflächenintegral von rot v , erstreckt über eine beliebige von C berandete Fläche (Satz von Stokes). G G Wir wollen jetzt noch die Darstellung von rot v in Komponenten des Vektors v berechnen. Wir führen die Berechnung für die x-Komponente durch. Die y- und z-Komponenten folgen dann analog. Die x-Komponente ergibt sich durch Umfahren eines Flächenelementes in der yz-Ebene. Das folgt aus (A1.49) und (A1.46). Das Flächenelement möge die Form eines Quadrats mit der Seitenlänge 2h haben (Abb. A1.11); seine Seiten liegen parallel zu den G Koordinatenachsen. Längs der y-Richtung liefert nur die y-Komponente von rot v einen Beitrag, längs der z-Komponente nur die z-Komponente. Wir bezeichnen die Koordinaten im Mittelpunkt mit dem Index „0“. vy hat längs AB den Wert
752
23 Mathematischer Anhang
§ wv y · § wv y · (v y )0 ¨ ¸ h¨ ¸ y, © wz ¹0 © wy ¹0
(A.1.52a)
und längs CD
§ wvy · § wvy · (v y )0 ¨ ¸ h¨ ¸ y. © wz ¹0 © wy ¹0 Abb. A1.11: Zur Komponentendarstellung von rot v B
G G ³ v dr A
h
³v
y
dy
h
(A1.52b)
Damit ergibt sich der Beitrag des Wegabschnittes AB zu
§ wvy · 2h (v y )0 2h 2 ¨ ¸ © wz ¹0
(A1.53a)
Analog erhalten wir für den Beitrag von CD D
G G ³ v dr
C
h
³v
y
dy
h
§ wvy · 2h (v y )0 2h 2 ¨ ¸ . © wz ¹0
(A1.53b)
Addition der beiden Beiträge resultiert in B
D
A
C
G G G G ³ v dr ³ v dr
§ wvy · 4h 2 ¨ ¸ . © wz ¹0
(A1.54)
Entsprechend erhalten wir als Beitrag der Abschnitte BC und DA C
A
B
D
G G G G ³ vdr ³ vdr
§ wv · 4h 2 ¨ x ¸ . © wy ¹0
(A1.55)
Die Fläche des Quadrats ist 4h2. Division durch diesen Wert liefert, wenn wir noch die Indizes weglassen
23 Mathematischer Anhang
wvz wv y wy wz wvx wvz . wz wx wv y wvx wx wy
(rot v) x (rot v) y (rot v) z
753
(A1.56a)
Dieses Ergebnis lässt sich auch in Determinantenform schreiben
ex
ey
ez
w w w , wx wy dz vx v y vz
G rot v
(A1.56b)
G wobei wir unter dem formalen Produkt von w / w x und einer Komponente von v den Differentialquotienten, z.B. w v x / w x , verstehen wollen. G G G Wir können v auch als Kraftfeld deuten; wir ersetzen deshalb v durch F . Das skalare G G G Produkt F d r ist dann die Arbeit, welche auf dem Weg dr gegen die Kraft verrichtet wird. G G Die Größe v³ Fd r ist die bei einem vollständigen Umlauf längs C verrichtete Arbeit. Die Kraft C
ist konservativ, d.h. wegunabhängig, wenn das Integral verschwindet. Benutzung des Stokesschen Satzes, (A1.51), zeigt, dass das gleichbedeutend ist, wenn gilt
G rot F
0.
Solche Felder heißen wirbelfreie Felder.
A1.2.4 Der Nabla-Operator, mehrfache Ableitungen Es ist zweckmäßig, den Gradienten einer skalaren Größe mit Hilfe eines symbolischen Vektors , gesprochen „Nabla“, einzuführen:
V
(
wV wV wV eˆ1 eˆ2 eˆ3 ) . wx wy wz
Der Name rührt von der Form eines phönizischen Saiteninstruments her.
(A1.57)
754
23 Mathematischer Anhang
Der symbolische Vektor ist also definiert als
(
w w w eˆ1 eˆ2 eˆ3 ) . wx wy wz
(A1.58)
Die Einheitsvektoren eˆ1 , eˆ2 , eˆ3 sind identisch mit eˆx , eˆy , eˆz . Wir haben nun verschiedene Möglichkeiten, den „Operator“ auf eine Größe anzuwenden. Dabei wollen wir unter der Anwendung des Operators die Vorschrift verstehen, diesen mit einer Größe zu multiplizieren. Wie wir gesehen haben, ergibt die Anwendung auf eine skalare Größe den Gradienten. Haben wir einen Vektor vor uns, so gibt es zwei Möglichkeiten: Skalare und vektorielle Multiplikation. Multiplizieren wir den Nablaoperator skalar mit einem Vektor, so erhalten wir nach der Definition des skalaren Produktes
G v
wvx wv y wvz wx wy wz
G div v .
(A1.59)
G Vektorielle Multiplikation ergibt (A1.58b), also die Rotation von v ,
G uv
G rot v .
Mit Hilfe des Nabla-Operators lassen sich mehrfache Ableitungen übersichtlich schreiben. Vier Beispiele seien hier genannt:
G G ( u u ) div rotu 0; u (f ) rot grad f 0 u ( u f ) grad div f div grad f (f ) div grad f : ' f .
(A1.60)
In kartesischen Koordinaten wird letztere Operation
(f )
div grad f w § wf · w § wf · w § wf · ¨ ¸ ¨ ¸ ¨ ¸ wx © wx ¹ wy © wy ¹ wz © wz ¹ w2 f w2 f w2 f wx 2 wy 2 wz 2
'f.
Das Symbol ' heißt Delta-Operator oder Laplace-Operator.
(A1.61)
23 Mathematischer Anhang
755
A1.2.5 Der Greensche Satz Der Greensche Satz folgt aus der Anwendung des Gaußschen Satzes. Gegeben seien zwei stetig differenzierbare skalare Ortsfunktionen f und g. Für sie gilt die Identität (A1.62) ( f g ) f g ( f ) ( g ), ( g f ) g f ( g ) ( f ).
(A1.62)
Subtraktion der zweiten Beziehung von der ersten, Integration über ein Volumen V und Anwendung des Gaußschen Satzes ergibt
³ f g g f dV ³ f g gf dA
V
A1.3
(A1.63)
A
Koordinatensysteme
A1.3.1 Kartesische Koordinaten 1. Das Kartesische Koordinatensystem besteht aus drei zueinander rechtwinkligen Achsen. G (Abb. A1.12). Der Ortsvektor r hat also die Komponenten
G r
( x, y , z ) .
(A1.64)
Die Einheitsvektoren längs der drei Achsen sind
eˆx
(1,0,0); eˆy
(0,1,0); eˆz
(0,0,1)
.(A1.65)
z
P(x, y, z)
Der Ortsvektor ist daher in Komponentenschreibweise
G r
xeˆx yeˆy zeˆz .
(A1.66)
Ein infinitesimal kleines Volumenelement dV wird
dV
dxdydz .
y x
(A1.67)
Abb. A1.12: Kartesisches Koordinatensystem
G G Die Geschwindigkeit v und Beschleunigung a eines Raumpunktes sind definiert als
G v
G 'r lim 't o0 't
G dr < {t, dt
bzw.
G a
G 'v lim 't o 0 't
G dv dt
G d 2 r << {t . dt 2
(A1.68)
756
23 Mathematischer Anhang
A1.3.2 Zylinderkoordinaten Ein Raumpunkt ist in Zylinderkoordinaten in der xy-Ebene durch ebene Polarkoordinaten und in der z-Richtung durch den Wert auf der z-Achse bestimmt (Abb. A1.13). Die Polarkoordinaten in der xy-Ebene sind charakterisiert durch den Winkel M zwischen x-Achse und Projektion des Raumpunktes auf die xy-Ebene sowie durch dessen Abstand U vom Nullpunkt. Kartesische und Polarkoordinaten sind verknüpft durch
x
U cos M , y U sin M .
Für die Umrechnung von Zylinderkoordinaten eines Raumpunktes auf kartesische Koordinaten ergibt sich damit
U x2 y 2 U cos M y U sin M M arctan( y / x)
x z
z
z
(A1.69)
z Die drei Einheitsvektoren bilden für jeden Punkt P ( U , M , z ) ein orthogonales Dreibein.
z
eˆU
(cos M ,sin M ,0)
eˆM
( sin M ,cos M ,0)
eˆz
(0,0,1).
(A1.70)
Ein infinitesimal kleines Flächenelement auf der Mantelfläche des Zylinders ist
dA U dM dz und ein Volumenelement
dj j x
r dr
(A1.71)
y r dj
dV
d U dA U d U dM dz .
(A1.72)
Die Verwendung von Zylinderkoordinaten bietet sich bei der Berechnung rotationssymmetrischer Abb. A1.13: Zylinderkoordinaten Probleme wie z.B. der Ermittlung entsprechender Trägheitsmomente oder der Behandlung zylindrischer elektrischer Felder (Zylinderkondensator) etc. an.
23 Mathematischer Anhang
757
A1.3.3 Sphärische Koordinaten (Kugelkoordinaten) Haben wir ein kugelsymmetrisches Problem vor uns, wie es etwa bei der Bewegung eines Teilchens im Zentralkraftfeld vorkommt. (Es kann sich etwa um ein Gravitationsfeld oder elektrisches Coulombfeld (Wasserstoff-Problem) handeln, so ist es zweckmäßig, sphärische G Koordinaten zu verwenden. Der Ortsvektor r ist gegeben durch seinen Betrag sowie den Azimut-Winkel M und den Polar-Winkel - (Abb. A1.14)). Für den Übergang von sphärischen Koordinaten in kartesische und umgekehrt gelten folgende Beziehungen:
r
x r sin M cos M y r sin - sin M z r cos -
x2 y 2 z 2
- arccos
z
(A1.73)
2
x y2 z2
M arctan( y / x)
z
r
r sinJ P(r,J ,j )
J r j
y
eˆ r
Breitenkreis r r
x a) Kugelkoordinaten;
r sinJ dj
eˆ j eˆ J
Längenkreis
b) Dreibein der Einheitsvektor;
rdJ j
J J + dJ j + dj
dA = r sinJ dJ dj c) Flächenelement der Kugeloberfläche
Abb. A1.14: Verschiedene Koordinatensysteme Die Einheitsvektoren im Punkt P (r ,- , M ) sind (Abb. A1.14 )
eˆr eˆ-
(sin - cos M , sin - sin M , cos - )
eˆM
( sin M , cos M , 0).
(cos- cos M , cos- sin M , sin - )
(A1.74)
758
23 Mathematischer Anhang
Der Einheitsvektor eˆr zeigt radial nach außen, die Vektoren eˆ- und eˆM sind Tangente an den Längen- bzw. Breitenkreis im Punkte P. Ein Flächenelement dA auf der Kugeloberfläche (Abb. A1.14c) wird begrenzt durch zwei Längenkreise und zwei Breitenkreise. Seine Größe ist
dA r 2 sin - drd- dM .
A1.4
Komplexe Zahlen
Mit den reellen Zahlen können die vier Grundrechenarten ausgeführt werden. Auch das Potenzieren einer solchen Zahl mit einer reellen Zahl ist möglich. Dagegen stoßen wir auf Schwierigkeiten beim Radizieren. Das einfachste Beispiel ist die Bildung der Quadratwurzel aus einer negativen Zahl, die uns bei der Lösung der Gleichung
x2 1 0 .
(A1.75)
begegnet. Formal erhalten wir als Lösung
x
1 .
Das ist keine reelle Zahl. Um mit solchen Ausdrücken umgehen zu können, ist es erforderlich, den Zahlenbereich zu erweitern. Die Wurzel einer negativen Zahl wird als imaginäre Zahl bezeichnet und 1 als imaginäre Einheit definiert und mit dem Buchstaben „i“ gekennzeichnet. Ein Zahlenpaar, das aus einer reellen und einer imaginären Zahl besteht, heißt komplexe Zahl.
z
x iy .
(A1.77)
Es heißt „x“ der Realteil und „y“ der Imaginärteil von z.
x
Re{z},
y
Im{z} .
(A1.78)
Neben der Zahl z ist die sog. konjugiert komplexe Zahl z wichtig. Sie ist definiert als
z
x iy .
(A1.79)
Zur Veranschaulichung einer komplexen Zahl dient die Gaußsche Zahlenebene. Der Imaginärteil wird auf der y-Achse aufgetragen, der Realteil auf der x-Achse (Abb. A1.15). z wird vom Nullpunkt an bis zum Punkt mit den Koordinaten x, y aufgetragen. Der Winkel zwischen
23 Mathematischer Anhang
759
x-Achse und z heißt Phase M . Der Winkel wird entgegen dem Uhrzeigersinn gezählt. Bezeichnet z die Länge des Pfeils den Betrag der komplexen Zahl, so können wir diese entweder durch die Werte von M und
z = x + iy = r (cosj +i sinj )
iy
= r ei j
z beschreiben oder durch die von x und y.
x
z cos M ,
y
x2 y 2
z
z sin M
tan M
y . x
Setzen wir x, y in (A.1.77) bzw. (A1.79) ein, so erhalten wir die sog. Polardarstellung
z
x r iy
r
(A1.80)
z (cos M r i sin M ) . (A1.81)
j
x
Abb. A1.15: Darstellung einer komplexen Zahl z in der Gaußschen Zahlenebene hund
Die Reihenentwicklung der Exponentialfunktion lautet
ez
z z2 z3 z 4 z5 iM M 2 iM 3 M 4 iM 5 ... 1 1! 2! 3! 4! 5! 1! 2! 3! 4! 5! § M2 M4 · § · M3 M5 ... ¸ i ¨ M ... ¸ . ¨1 2! 4! 3! 5! © ¹ © ¹
1
(A1.82)
Die beiden Klammerausdrücke stellen die Reihenentwicklungen für cos M und sin M dar. Wir können also schreiben
e r iM
cos M r i sin M .
(A1.83)
Diese Beziehung heißt Eulersche Formel (L. Euler, 1707-1783). Es ist zu beachten, dass die Polardarstellung und damit die Eulersche Formel nicht eindeutig sind, denn für jeden Winkel Mn n 2S ; n 0,1, 2,3,.. ergibt sich für z die gleiche Zahl. Der Wert für n = 0 wird Hauptwert genannt. Aus (A.1.83) folgen die Moivreschen Formeln
cos M sin M
eiM e iM , 2 eiM e iM . 2i
(A1.84)
760
23 Mathematischer Anhang
Für komplexe Zahlen gelten die folgenden Rechenregeln: 1. Addition und Subtraktion
( x1 iy1 ) ( x2 iy2 ) ... ( x1 x2 ...) i( y1 y2 ...) .
(A1.85a)
Komplexe Zahlen werden addiert bzw. subtrahiert, indem ihre Realteile und Imaginärteile getrennt addiert (subtrahiert) werden. 2. Multiplikation
Die Multiplikation zweier komplexer Zahlen wird definiert durch
( x1 iy1 )( x2 iy2 ) ( x1 x2 y1 y2 ) i ( x1 y2 y1 x2 ) .
(A1.85b)
3. Division
Die Division einer Zahl z1 durch eine Zahl z2 bedeutet
z1 z2
x1 iy1 . x2 iy2
Erweitern wir den Bruch mit dem konjugiert komplexen Nenner, so wird der Nenner reell und wir erhalten nach Ausführung der Multiplikation als Ergebnis
z1 z2
x1 x2 y1 y2 x y x y i 2 21 12 2 2 2 x2 y2 x2 y2
(A1.85c)
a ib, wobei Real- und Imaginärteil der entstandenen komplexen Zahl gegeben sind durch
a
x1 x2 y1 y2 ; b x22 y22
x2 y1 x1 y2 . x22 y22
Multiplikation und Division werden einfacher, wenn wir die Polardarstellung benutzen. Es gilt
z1 z2
z1 eiM1 z2 eiM2
z1 z2 ei (M1 M2 )
zz
z z eiM e iM
z
z1 z2
z1 z2
ei (M1 M2 ) .
2
(A1.86)
23 Mathematischer Anhang
761
A1.5 Elemente der Tensorrechnung Zur Beschreibung physikalischer Eigenschaften ungeordneter Materie genügen skalare und vektorielle Größen. Das gilt auch noch bei kubischer Symmetrie, ändert sich aber, wenn wir anisotrop aufgebaute Materie ins Auge fassen. Gerade dieser Fall kommt am häufigsten vor. Auch unter dem Einfluss äußerer Felder kann Materie anisotrop werden. Im Rahmen dieses Manuskriptes kommen hauptsächlich zwei derartige Eigenschaften zur Sprache, nämlich das Trägheitsmoment starrer Körper und das dielektrische Verhalten von Festkörpern, das sich z. B. in der Doppelbrechung zeigt. Zur Formulierung solcher Eigenschaften benötigen wir Tensoren 2. Stufe, die wir jetzt einführen wollen. Dabei beschränken wir uns auf die Darlegung einiger grundlegender Zusammenhänge. Zum leichteren Verständnis knüpfen wir an ein konkretes Beispiel an, nämlich an das Trägheitsmoment starrer Körper von anisotroper Gestalt. Dieser möge mit der WinkelG geschwindigkeit Z um eine beliebige Achse durch seinen Schwerpunkt rotieren. Im AllgeG G meinen stimmt die Richtung des zugehörigen Drehimpulses L nicht mit der Richtung von Z G überein, sondern seine Komponenten sind lineare Vektorfunktionen der Komponenten von Z . In einem kartesischen Koordinatensystem gilt
Lx
I xxZ x I xyZ y I xzZ z
Ly
I yxZ x I yyZ y I yzZ z
Lz
I zxZ x I zyZ y I zzZ z .
(A1.87)
Hierin sind die Koeffizienten I i j die Komponenten eines Tensors 2. Stufe, den wir als Trägheitstensor I bezeichnen. In Matrixschreibweise hat er die Form
I
§ I xx ¨ ¨ I yx ¨I © zx
I xy I yy I zx
I xz · ¸ I yz ¸ . I zz ¸¹
(A1.88)
G G Drücken wir ferner Z durch einen Spaltenvektor aus, so erhalten wir für L
§I G ¨ xx L ¨ I yx ¨I © zx
I xy I yy I zx
I xz · § Z x · G ¸¨ ¸ I yz ¸ ¨ Z y ¸ o L I zz ¸¹ ¨© Z z ¸¹
G IZ
(A1.89a, b)
Damit eine Größe wie I einen Tensor 2. Stufe darstellt, müssen seine Komponenten so beschaffen sein, dass er unabhängig vom gewählten Koordinatensystem dem Vektor auf der G G rechten Seite von (A4.89), hier Z , immer den gleichen Vektor, hier L , zuordnet. Gehen wir
762
23 Mathematischer Anhang
von einem Koordinatensystem (eˆx , eˆy , eˆz ) zu einem gegen dieses gedrehte System (eˆxc , eˆy c , eˆz c ) über, so müssen die Komponenten also bestimmten Transformationsbeziehungen genügen. Um sie zu finden, multiplizieren wir die erste der Gleichungen (A1.87) mit cos(eˆx , eˆx c ) , die zweite mit cos(eˆy , eˆxc ) und die dritte mit cos(eˆz , eˆx c ) und addieren die Teilergebnisse. Die drei cosTerme werden als Richtungskosinusse der neuen gegen die bisherigen Achsen bezeichnet. Das Resultat ist
Lxc
I I I
xx
(cos eˆx , eˆxc ) I yx (cos eˆy , eˆxc ) I zx (cos eˆz , eˆxc ) Z x
yx
(cos eˆx , eˆxc ) I yy (cos eˆy , eˆxc ) I zy (cos eˆz , eˆxc ) Z y
zx
(cos eˆx , eˆxc ) I yz (cos eˆy , eˆxc ) I zz (cos eˆz , eˆxc ) Z z .
(A1.90a)
Drücken wir auch die Z-Komponenten als Funktion der gestrichenen Größen aus, so ergibt sich für Lxc
I
Lxc
xx
(cos eˆx , eˆxc ) I yx (cos eˆy , eˆxc ) I zx (cos eˆz , eˆxc )
Z xc (cos eˆxc , eˆx ) Z y c (cos eˆyc , eˆx ) Z z c (cos eˆzc , eˆx ) I xy (cos eˆx , eˆxc ) I yy (cos eˆy , eˆxc ) I zy (cos eˆz , eˆxc ) Z xc (cos eˆxc , eˆy ) Z y c (cos eˆyc , eˆy ) Z zc (cos eˆz c , eˆy )
(A1.90b)
I xz (cos eˆx , eˆxc ) I yz (cos eˆy , eˆxc ) I zz (cos eˆz , eˆxc ) Z xc (cos eˆxc , eˆz ) Z yc (cos eˆy c , eˆz ) Z z c (cos eˆz c , eˆz ) . Die Form der Gleichungen (A1.89) gilt für ein beliebiges Koordinatensystem. Folglich ist Lxc im Koordinatensystem xc, y c, z c
Lxc
I xcxcZ xc I xcycZ yc I xcz cZ z c ,
(A1.91)
Durch Vergleich der jeweiligen Komponenten in den beiden letzten Gleichungen können die Komponenten des Trägheitstensors im gestrichenen Koordinatensystem gefunden werden. Beispielsweise finden wir aus den obigen Beziehungen
I xcxc
I
xx
(cos eˆx , eˆxc ) I yx (cos eˆy , eˆxc ) I zx (cos eˆz , eˆxc ) (cos eˆxc , eˆx )
I xy (cos eˆx , eˆxc ) I yy (cos eˆy , eˆxc ) I zy (cos eˆz , eˆxc ) (cos eˆxc , eˆy ) I xz (cos eˆx , eˆxc ) I yz (cos eˆy , eˆxc ) I zz (cos eˆz , eˆxc ) (cos eˆxc , eˆz )
A1.92a)
23 Mathematischer Anhang
I xcyc
I
xx
763
(cos eˆx , eˆxc ) I yx (cos eˆy , eˆxc ) I zx (cos eˆz , eˆxc ) (cos eˆ yc , eˆx )
I xy (cos eˆx , eˆxc ) I yy (cos eˆy , eˆxc ) I zy (cos eˆz , eˆxc ) (cos eˆyc , eˆy )
(A1.92b)
I xz (cos eˆx , eˆxc ) I yz (cos eˆy , eˆxc ) I zz (cos eˆz , eˆxc ) (cos eˆy c , eˆz )
I
I xcxc
xx
(cos eˆx , eˆxc ) I yx (cos eˆy , eˆxc ) I zx (cos eˆz , eˆxc ) (cos eˆxc , eˆx )
I xy (cos eˆx , eˆxc ) I yy (cos eˆy , eˆxc ) I zy (cos eˆz , eˆxc ) (cos eˆxc , eˆy )
(A1.92c)
I xz (cos eˆx , eˆxc ) I yz (cos eˆy , eˆxc ) I zz (cos eˆz , eˆxc ) (cos eˆxc , eˆz ) In derselben Weise lassen sich die Transformationsgleichungen für die anderen sechs Tensorkomponenten ermitteln. Diesen Beziehungen müssen also die Matrixkomponenten genügen, um – allgemein gesprochen – Komponenten eines Tensors 2. Stufe zu sein. Auf zwei Sonderfälle sei hingewiesen. Wir nennen den Tensor symmetrisch, wenn zwischen den Komponenten die Beziehungen gelten
I xy
I yx ; I yz
I zy
I zx
I xz .
(A1.93)
Der Tensor heißt schief- oder antisymmetrisch, wenn die Diagonalelemente null sind
I xx
I yy
I zz
0, und zusätzlich gilt
I xy
I yx ; I yz
I zy
I zx
I xz
Wir benötigen hier nur symmetrische Tensoren. Ein solcher kann durch eine Fläche 2. Grades veranschaulicht werden, denn beide besitzen sechs unabhängige Komponenten. Zu ihrer G G Konstruktion denken wir uns die Vektoren Z als Radiusvektoren r vom Nullpunkt eines kartesischen Koordinatensystems aus aufgetragen, wobei die Länge noch festzulegen ist. G G G Durch den Tensor I ist jedem Vektor r ein Vektor r c I r zugeordnet. Skalare Multipli-
G
G
kation von r und rc ergibt
G G r(I r )
G G G rx ( I r ) x ry ( I r ) y rz ( I r ) z
rx ( I xx rx I xy ry I xz rz )
ry ( I yx rx I yy ry I yz rz ) rz ( I zx rx I zy ry I zz rz ).
(A1.94)
Durch Berücksichtigung von (4.93) folgt die einfachere Beziehung
G G p { r (I r )
I xx x 2 I yy y 2 I zz z 2
2 I xy x y 2 I yz y z 2 I zx z x .
(A1.95)
764
23 Mathematischer Anhang
wobei wir p als Abkürzung eingeführt haben. Legen wir p zu p = 1 fest, so ist damit der Betrag G von r festgelegt. Die Spitzen aller Vektoren liegen auf der durch (A1.95) gegebenen Fläche 2. Grades, welche (bei positiven Komponenten) ein Ellipsoid darstellt (Abb. A1.16) und deswegen Tensorellipsoid heißt.
G G p { r (I r )
h y
x,x
I xx x 2 I yy y 2 I zz z 2
2 I xy x y 2 I yz y z 2 I zx z x 1. ( A1.96)
z
z Abb. A1.16: Tensorellipsoid
Eine Fläche 2. Grades lässt sich immer so transformieren, dass die Nichtdiagonalelemente verschwinden. In diesem Hauptachsensystem, in dem die Koordinaten eines Punktes durch das Tripel ([ ,K , 9 ) bezeichnet seien, ist also das Ellipsoid durch die Gleichung gegeben
I[[ [ 2 IKKK 2 I99 9 2 1.
(A1.97)
Die Koeffizienten werden als Hauptträgheitsmomente bezeichnet. Der (Trägheits-) Tensor ist rr r r¢ = 1
grad p r r
I
r 1/ r ¢
[2 Abb. A1.17: Zur graphischen G Konstruktion von r c
1 I ll
0 IKK 0
0 · ¸ 0 ¸. I99 ¸¹
(A1.98)
Wir können (A1.97) auch die Form geben
0
al
§ I[[ ¨ ¨ 0 ¨ 0 ©
;
(l [ ,K , [ ) .
a[2
K2 aK2
92 a92
1.
(A1.99)
Darin sind die Hauptwerte (A1.100)
Abschließend bilden wir den Gradienten von p, wobei wir nach (A1.36) mit (A1.96) erhalten
G rc
1 grad p . 2
(A1.101)
23 Mathematischer Anhang
765
G G Die Beziehung besagt, dass der Vektor r c und damit L die Richtung der Normalen der Fläche G G p = const. im Endpunkt P von r hat. Entsprechend (A1.96) ist der Betrag von rc gleich dem G reziproken Wert der Projektion von r auf die Richtung der Normalen im Punkt P (Abb. G A1.17). Dieser Zusammenhang lässt sich zur grafischen Konstruktion von r c ausnutzen. Zum Rechnen mit Tensoren 2. Stufe sind die folgenden Rechenregeln von Nutzen: Addition und Subtraktion werden als die entsprechenden Operationen der zugehörigen Matrizen definiert, wobei wir jetzt die Tensorkomponenten mit aij und bij bezeichnen. Es gilt demnach für die Summation
A B C
l aij bij
cij ;
(A1.102a)
Ausgeschrieben
§ a11 ¨ ¨ a21 ¨a © 31
a12 a22 a32
a13 · § b11 b12 ¸ ¨ a23 ¸ ¨ b21 b22 a33 ¸¹ ¨© b31 b32
b13 · ¸ b23 ¸ b33 ¸¹
§ a11 b11 ¨ ¨ a21 b21 ¨a b © 31 31
a12 b12 a22 b22 a32 b32
a13 b13 · ¸ a23 b23 ¸ a33 b33 ¸¹
(A1.102b)
Die Addition ist folglich kommutativ und assoziativ. Als Produkt eines Tensors mit einer reellen Zahl definieren wir
C
O A l cij
O aij .
(A1.103)
Als Skalarprodukt zweier Tensoren A , B definieren wir als die Summe der Produkte ihrer gleichstelligen Matrixelemente.
A DB C
3
¦a
ij
bij .
(A1.104)
i, j 1
Das entstandene Skalarprodukt ist kommutativ und distributiv. Das Produkt zweier Tensoren definieren wir durch Multiplikation der Zeilen der ersten Matrix mit den Spalten der zweiten Matrix. Das entspricht der normalen Matrixmultiplikation.
C
JJJJJJJJJJJJJJJJJG § a11 a12 a13 · § b11 b12 ¨ ¸ ¨ A B ¨ a21 a22 a23 ¸ p ¨ b21 b22 ¨a ¸ ¨ © 31 a32 a33 ¹ © b31 b32
C
A B
3
¦a
ij
i, j 1
b ji .
b13 · ¸ b23 ¸ b33 ¸¹
§ a11b11 ¨ ¨ a21b12 ¨a b © 31 13
a12 b21 a22b22 a32b23
a13b31 · ¸ a23b32 ¸ ; a33b33 ¸¹ (A1.105)
766
23 Mathematischer Anhang
Es gibt weitere Multiplikationsmöglichkeiten, die hier aber nicht angeführt werden sollen. Für kompliziertere Rechenoperationen ist die Einführung des adjungierten Tensors nützlich. Er ist definiert als
C
3
¦c
ij
, wobei cij
c ji .
(A1.106)
i, j 1
Es sei noch eine Bemerkung zur Bedeutung voll antisymmetrischer Tensoren angefügt. Wie oben bereits angeführt, wird ein solcher Tensor durch eine antisymmetrische Matrix beschrieben und besitzt deswegen nur drei von null verschiedene Komponenten, da die Hauptdiagonalelemente null und die Außerdiagonalelemente paarweise entgegengesetzt gleich sind. Das bedeutet, dass ein antisymmetrischer Tensor als ein axialer Vektor angesehen werden G G G kann. Betrachten wir zur Demonstration den axialen Vektor c a u b mit den Komponenten
G c
c1 , c2 , c3
(a2b3 a3b2 , a3b1 a1b3 , a1b2 a2b1 ) ,
während die eines antisymmetrischen Tensors lauten
C
§ a1b1 GG GG ¨ ab b a ¨ a2 b1 ¨a b © 3 1
a1b2 a2b2 a3b2
a1b3 · § b1a1 b1a2 ¸ ¨ a2b3 ¸ ¨ b2 a1 b2 a2 a3b3 ¸¹ ¨© b3 a1 b3 a2
b1a3 · ¸ b2 a3 ¸ b3 a3 ¸¹
§ 0 a1b2 a2b1 a3b1 a1b3 · ¨ ¸ 0 a2b3 a3b2 ¸ ¨ a1b2 a2 b1 ¨ ¸ 0 © a3b1 a1b3 a2 b3 a3b2 ¹
§ 0 ¨ ¨ c3 ¨ © c2
c3 0 c1
c2 · ¸ c1 ¸ 0 ¹¸
Er besitzt also die gleichen Komponenten wie obiger axialer Vektor, bedeutet mithin eine G Drehung um die Achse der Richtung von c . Diagonalisierung symmetrischer Tensoren
Wie weiter oben vermerkt, lassen sich symmetrische Tensoren stets durch eine geeignete Transformation (Drehung) diagonalisieren, d.h. alle Elemente des Tensors bis auf die auf der Hauptdiagonalen verschwinden. Mathematisch entsprechen die Hauptachsen den EigenG vektoren der zugehörigen Matrix. Wir fragen also nach diesen Eigenvektoren xi ( xi1 , xi 2 , xi 3 ) , für welche die Eigenwertgleichungen
G Axi
G
Oi xi
(A1.107a)
23 Mathematischer Anhang
767
erfüllt sind. Die Oi heißen die Eigenwerte der Matrix. Es ist zweckmäßig, diese Beziehung als Matrixgleichung zu formulieren. Dazu führen wir die Einheitsmatrix E ein, die definiert ist als
§1 0 0· ¨ ¸ E : ¨0 1 0¸ . ¨0 0 1¸ © ¹
(A1.107b)
Damit schreibt sich (A1.107a)
G ( A O E) x
0.
(A1.108a)
Ausgeschrieben hat sie die Gestalt
§ a11 O ¨ ¨ a21 ¨ © a31
a13 · § x1 · ¸ ¨ ¸ a23 ¸ ¨ x2 ¸ 0 . a33 O ¹¸ ©¨ x3 ¹¸
a12 a22 O a32
(A1.108b)
Nach Ausführung der Multiplikation stellt dies ein lineares, homogenes Gleichungssystem dar, aus dem die xi berechnet werden können.
(a11 O ) x1
a12 x2
a13 x3
0
a21 x1 ( a22 O ) x2
a23 x3
0 .
a31 x1
a32 x2 (a33 O ) x3
(A1.109)
0
Das Gleichungssystem besitzt nur dann eine von null verschiedene Lösung, wenn die Determinante der Koeffizienten verschwindet.
a11 O a12
a13
a21
a22 O a23
a31
a32
0
(A1.110)
a33 O
Dies ist eine Gleichung 3. Grades zur Bestimmung der Oi . Setzen wir ihre Werte in (A1.108b) ein, so erhalten wir die drei gesuchten Eigenvektoren, in unserem obigen Beispiel die Richtungen der Hauptträgheitsachsen. Die Eigenwerte liefern die Hauptträgheitsmomente in (A1.98).
768
23 Mathematischer Anhang
A1.6
Grundzüge der Variationsrechnung
Aus der Mathematik kennen Sie sicher das Problem, den Wert einer unabhängigen Variable x zu suchen, für den der Wert der zugehörigen Funktion y(x) einen Extremwert besitzt. Denken wir etwa an eine Parabel der Form y r x 2 . Durch Anwendung der Differentialrechnung ergibt sich, dass je nach Vorzeichen die Funktion ein Maximum bzw. ein Minimum bei x = 0 hat. Eine andere Art von Extremwertaufgaben besteht darin, dass nach einer Funktion y = y(x) gefragt wird, für die ein von ihr und der ersten Ableitung y c { dy / dx abhängiges Integral ein Maximum oder Minimum annimmt. Die einfachste Aufgabe dieser Art ist wohl die Frage nach der kürzesten Verbindungslinie zwischen zwei Punkten P1(x1,y1) und P2(x2,y2), die auf ein und derselben Ebene liegen. Die Länge s einer beliebigen Kurve zwischen diesen Punkten ist x2
2
s
³ ds
³
x2
dx 2 dy 2
x1
1
³
1 y c2 dx .
(A1.111)
x1
Aus der Gesamtheit aller Kurven y(x) ist nun diejenige zu finden, für die s minimal wird. y y2
x2
s
y1
³
1 y c2 dx
Min.
(A1.112)
x1
Die Lösung lässt sich mit Hilfe der Variationsrechnung finden. Dabei wollen wir die Problemstellung in zwei Typen gliedern, je nachdem, ob x1 x2 x zusätzlich Nebenbedingungen zu berücksichtigen sind oder nicht. Ein Beispiel der ersten Art ist die Abb. A1.18: An zwei Punkten eingeFrage nach der Form eines Seils, dass im spanntes Seil Schwerefeld der Erde an zwei Punkten locker aufgehängt ist (Abb. A1.18). Das Seil stellt sich so ein, dass seine potentielle Energie Epot minimal wird. Beschreiben wir die Seilform durch eine Funktion y(x), so gilt im Gleichgewichtszustand
J
E pot
³ gydm
x2
U g ³ y 1 yc2 dx minimal.
(A1.113)
x1
Darin haben wir benutzt, dass die Dichte U gleich dem Quotienten aus Massenelement und Wegelement, U = dm/ds, ist. g bedeutet die Erdbeschleunigung. Dieses Variationsproblem ist unter der Einschränkung zu lösen, dass die Länge l des Seiles fest vorgegeben ist.
23 Mathematischer Anhang
769
Die gesuchte Funktion y(x) muss also der Nebenbedingung genügen x2
l
³
1 y c2 dx const.
(A1.114)
x1
Wir stellen diese Aufgabe für einen Moment zurück und wenden uns zunächst dem oben an zweiter Stelle genannten Typ zu.
A1.6.1 Variation ohne Nebenbedingungen Symbolisch wird ein Variationsproblem durch den Buchstaben G ausgedrückt, der vor das betreffende Integral gesetzt wird. Aus (A1.112) wird damit x2
G s G ³ 1 yc2 dx 0 .
(A1.115)
x1
Es wird also nach der Funktion y(x) gesucht, mit der das Integral einen Extremwert annimmt. Ersetzen wir zur Verallgemeinerung die Funktion 1 y c2 durch eine Funktion
f ( y ( x), y c( x); x ,
(A1.116)
und entsprechend s durch den allgemein üblichen Buchstaben J
J y ( x ) , so schreibt sich J
x2
J y ( x)
³ f ( y( x), yc( x); x dx
(A1.117)
x1
y
und unser Variationsproblem wird
y2
x2
G J y ( x) G ³ f ( y ( x), y c( x); x dx 0 . x1
y1
(A1.118) J ist eine Funktion anderer Funktionen. Eine solche Größe wird als Funktional bezeichnet. Um zu einer Lösung zu gelangen, betrachten wir eine Menge von benachbarten („variierten“) Funktionen, die alle den Wertepaaren ( x1 , y1 )
x1
x2 x
Abb. A1.19: Zur Lösung der Extremalaufgabe der Variationsrechnung
770
23 Mathematischer Anhang
bzw. ( x2 , y2 ) genügen, also als Kurven alle durch die Punkte P1 und P2 laufen (Abb. A1.19). Sie seien durch den Parameter D charakterisiert, der so gewählt werde, dass sich für D = 0 die gesuchte Funktion ergibt.
y ( x, D )
y ( x,0) DK ( x) .
(A1.119)
Die Funktion K (x) sei eine beliebige differenzierbare Funktion, die an den beiden Randpunkten wegen der obigen Forderung bez. der Punkte P1, P2 den Bedingungen
K ( x1 ) K ( x2 )
(A1.120)
genügen muss. Setzen wir (A1.119) in (A1.117) ein, so wird J eine Funktion von D: x2
³ f ( y( x,D ), yc( x,D ); x dx .
J (D )
(A1.121)
x1
Damit J(D) für D = 0 einen Extremwert annehmen soll, muss die erste Ableitung für diesen Wert verschwinden,
wJ wD
0.
(A1.122)
D 0
Die Durchführung der Differentiation ergibt, da x1,x2 unabhängig von D sind
wJ wa
x2
wf wy
wf wy c ½
³ ®¯ wy wD wyc wD ¾¿dx
x1 x2
wf wy wf w 2 y ½ ³ ® wy wD wyc wD wx ¾¿dx . x1 ¯
(A1.123)
Der zweite Term kann durch partielle Differentiation umgeformt werden in x2
x2
x
2 § wf wy · § d wf · wf w 2 y dx ³x wyc wD wx ¨© wyc wD ¸¹ x³ ¨© dx wyc ¸¹ dx . x1 1 1
(A1.124)
Nach (A1.119) ist
wy K ( x) . wa
(A1.125)
23 Mathematischer Anhang
771
An den Grenzen x1,x2 verschwindet nach (A1.120) diese Ableitung , so dass der erste Term auf der rechten Seite von (A1.124) null wird. Damit nimmt (A1.113) die Form an x2
wJ wa
° wf wy
§ d wf wy · ½°
³ ®¯° wy wD ¨© dx wyc wD ¸¹ ¿¾°dx
x1
(A1.126)
x2
wf d wf ½ ³x ®¯ wy dx wyc ¾¿K ( x) dx . 1
Setzen wir hierin D = 0, so beschreiben y und y´ die gesuchten Funktionen . Gemäß (A1.122) gilt dann x2
0
wf
d wf ½
³ ®¯ wy dx wyc ¾¿K ( x) dx .
(A1.127)
x1
Da diese Gleichung für alle K(x) gelten muss, folgt
wf d wf ½ ® ¾ 0. ¯ wy dx wy c ¿
(A1.128)
Diese Beziehung heißt Eulersche Gleichung. Da nach (A1.116) f eine gegebene Funktion von y, y´, x ist, lassen sich aus ihr y und seine Ableitung berechnen, womit das Variationsproblem gelöst ist. In unserem obigen Beispiel ist f
w 2 y c( x ) wx 1 y c( x ) 2
0.
1 y c2 und die Eulersche Gleichung wird
(A1.129)
Integration liefert
y c const. o
y
ax b .
(A1.130)
Die Funktion stellt also eine gerade Linie dar, was mit unserer Erfahrung übereinstimmt! Für umfangreichere Aufgabenstellungen ist es zweckmäßig, das Variationsproblem dahingehend zu verallgemeinern, dass f von n Funktionen y1(x), y2(x), …, yn(x) und deren Ableitungen abhängt:
f
f ( y1 , y2 ,..., yn , y1c, y2c ,..., ync , x) .
(A1.131)
772
23 Mathematischer Anhang
Analog zu (A1.116) fragen wir nach den n Funktionen yi, die das Funktional x2
J
³ f ( y ( x), yc( x); x dx i
(A1.132)
i
x1
extremal machen. Die n Funktionen werden unabhängig voneinander variiert,
yi ( x,D )
yi ( x,0) DK i ( x) .
Anstelle von (A1.127) tritt dann die Beziehung
0
x2 n
wf
³ ¦ ¯® wy
x1 i 1
i
d wf ½ ¾Ki ( x) dx . dx wyic ¿
(A1.133)
Diese Gleichung ist wiederum für beliebige unabhängige Ki (x) nur zu erfüllen, wenn der Klammerausdruck gleich null wird. Aus den n Gleichungen können die n Funktionen yi (x) bestimmt werden.
A1.6.2 Variation mit Nebenbedingungen Es gibt verschiedene Typen von Nebenbedingungen. Wir bezeichnen ein System als holonom („ganzgesetzlich“), wenn die Nebenbedingungen durch Gleichungen der Form
G G G f k (r1 , r2 ,..., rn ) 0; oder G G G f k (r1 , r2 ,..., rn , t ) 0; k 1, 2,..., s
(A1.134)
dargestellt werden können, also nicht von der Geschwindigkeit abhängen. Alle Nebenbedingungen, die nicht in dieser Form formuliert werden können, heißen nichtholonom. Eine weitere Unterteilung wird nach ihrer Zeitabhängigkeit vorgenommen. Hängen die Nebenbedingungen nicht von der Zeit ab, heißen sie skleronom („starr“). Ist eine explizite Zeitabhängigkeit vorhanden, nennen wir sie rheonom („fließend“). Eine rheonome Nebenbedingung ist zu erfüllen, wenn wir nach der kürzest möglichen Verbindung zweier Punkte auf einer vorgegebenen Fläche im dreidimensionalen Raum, z.B. einer Kugelfläche, fragen. Sie werden als geodätische Linien bezeichnet. Die Punkte seien gegeben durch
P1
x1 , y ( x1 ), z ( x1 )
und P2
x2 , y ( x2 ), z ( x2 ) .
(A1.135)
Die zu suchenden Kurven sollen auf der vorgegebenen Fläche
g ( x, y , z ) 0
(A1.136)
23 Mathematischer Anhang
773
liegen. Die Minimalisierungsaufgabe lautet demnach x2
J ( y, z )
³
1 y c2 z c2
minimal .
(A1.137)
x1
Die Variation ist unter der Nebenbedingung (A1.136) auszuführen. Zur Lösung eines solchen Falles modifizieren wir die Eulersche Gleichung (A1.136). Wir beschränken uns dabei zunächst auf Fälle wie den der geodätischen Linie mit zwei zu bestimmenden Funktionen und nur einer Nebenbedingung. Gegeben sei also eine Funktion
f
f y ( x), z ( x), y c( x), z c( x), x
(A1.138)
und die Nebenbedingung
g ( x, y , z ) 0 .
(A1.139)
Die für die Aufgabenstellung angepasste (A1.133) lautet x2
0
°§ wf
d wf · wy
§ wf
d wf · wz ½°
³ ®¯°¨© wy dx wyc ¸¹ wD ¨© wz dx wzc ¸¹ wD ¾¿° dx .
(A1.140)
x1
Beim weiteren Vorgehen müssen wir beachten, dass die beiden Faktoren
K1
wy wD
und K2
wz wD
(A1.141)
wegen der Nebenbedingung, (A1.139), nicht mehr unabhängig voneinander sind. Es folgt vielmehr
§ wg wy wg wz · ¨ ¸ dD © wy wD wz wD ¹ wg wg bzw. K1 K2 wy wz dg
0 (A1.142)
0
Lösen wir die letzte Gleichung nach K2 auf und setzen es in (A1.140) ein, so erhalten wir x2
0
°§ wf
d wf · § wf
d wf · wg / wy ½°
³ ®¯°¨© wy dx wyc ¸¹ ¨© wz dx wzc ¸¹ wg / wz ¾¿°K dx . 1
x1
(A1.143)
774
23 Mathematischer Anhang
Damit die rechte Seite für alle K1(x) null wird, muss der Ausdruck in der geschweiften Klammer gleich null werden. Schreiben wir diese in der Form, dass links nur Ableitungen nach y, y´ stehen und rechts nur solche nach z, z´, so folgt
§ wf d wf · 1 ¨ ¸ © wy dx wy c ¹ wg / wy
§ wf d wf · 1 . ¨ ¸ © wz dx wz c ¹ wg / wz
(A1.144)
Zur Erfüllung der Gleichung können die beiden Seiten höchstens gleich einer gemeinsamen Funktion O(x) sein. Sie wird (oder werden) als Lagrange-Multiplikator(en) bezeichnet.
wf d wf wg O wy dx wy c wy wf d wf wg O wz dx wz c wz
(A1.145)
Diese zwei Gleichungen zusammen mit der Nebenbedingung (A1.139) sind drei Gleichungen für die gesuchten Funktionen y ( x), z ( x) und O ( x) . Das Verfahren kann auf n Funktionen yi ( x) und m < n Nebenbedingungen erweitert werden:
wf d wf wyi dx wyic
Oj
g j ( yi , x) 0
wg j wyi
;
i 1,..., n
(A1.146)
j 1,..., m
(A1.145) bzw. (A1.146) werden als Euler-Lagrange-Gleichungen (J. J. de Lagrange, 17361813) bezeichnet.
Lösungen der Übungsaufgaben Kapitel 1 1) Die Flugzeiten thin bzw. trück für den Hin- bzw. den Rückflug sind (s = Wegsrecke, v = Reisegeschwindigkeit, u = Windgeschwindigkeit) s , trück vu
thin t gesamt
s vu s s thin trück vu vu 1 2s t0 ; t0 . 2 v §u· 1 ¨ ¸
2s v2 v (v u )(v u )
2v (v u )(v u )
©v¹
Folglich:
G 2a) v1 r1
1. t gesamt o f für u o v 2. t gesamt z t0 für u z 0
G (104 , 2,1), v 2
4 § 0 · §10 · ¸ ¨ ¸ ¨ ¨ 0 ¸ ¨ 2 ¸ t ; r2 ¨0¸ ¨ 1 ¸ © ¹ © ¹
Abstand A
2b) A
(104 , 2,1); 4 § 0 · §10 · ¸ ¨ ¸ ¨ ¨ 1 ¸ ¨ 1 ¸ t ; r1 r2 ¨0¸ ¨ 2 ¸ © ¹ © ¹
02 (t 1) 2 (t ) 2
r1 r2
§ 0 · ¨ ¸ ¨ t 1¸ ; ¨ t ¸ © ¹
t 2 2t 1 t 2
2t 2 2t 1 min imal :
! d ( 2t 2 2t 1) 0 o t dt
3) v(t )
§0· §0· ¨ ¸ ¨ ¸ ¨ 1¸ ¨ 1 ¸ t ¨ 0 ¸ ¨ 1 ¸ © ¹ © ¹
aB t v 0 ; sB
0,5s;
! d2 ( 2t 2 2t 1) ! 0 für t 2 dt
aB 2 t v 0 t ; sB 2
108, 4 m; sB ,min
0.5; Amin
0, 707 m
108, 66 m.
4a) Der vom Habicht in der Höhe h überstrichene Öffnungswinkel M berechnet sich aus lMaus M lMaus tan oh 343, 7m ; 2 2h 2 tan(M / 2) 4b) h
5) sn
1 2 gt o t 2
8.37 s
1 g (n't ) 2 ; sn 1 2
1 2 g ^(n 1)'t` o sn sn 1 2
1 ('t ) 2 g (n ) 2
776
Lösungen der Übungsaufgaben
6) (v A )0
v 0 sin - ; (v& )0
v 0 cos - ; y
(A) y
0ot
y
g 2 t ; 2 2(v A )0 T g
(v A )0 t
(B) v y
Aa) y
h
(vP )0
x
s = 10 km
(v A )0
xS g xS2 ; Bb) 0 (v& )0 2 (v& )02 gxS2 o (v A )0 2h
(v A )0
2 xS g 4 xS2 o (v A )0 (v& )0 2 (v& )02
gxS . (v& )0
2 gh
s ; T
(v& )0
(v A )0 (v& )0
a) tan c) d ) -
³ dz ³
4h os
45q o s45
Fz G
7) tan M
dn
J
(v A ) 0 gt
In Aa) eingesetzt: (v& )02
z( x
H=1000m
( v^ ) 0
Z
0)
21,8q o v0
mZ2 x mg
1 g (n't ) 2 ; d n 1 2
o d n d n 1
2h g
28,55 s;
Z2 x g
xdx C 0 o z ( x)
2
14,50 m.
2
g
377, 2 m / s; b) T
Z2 g
z w Fz
j
x2
1 2 g ^(n 1)'t` 2 1 't 2 g (n ); 2
Rinne
G
j
x
Lösungen der Übungsaufgaben
777
Kapitel 2 G 1a) u1
G (u0 , 0, 0); 1b) u2
(0, u0 , 0), wobei u0
a) u x'
ux v ; u 'y 1 (v / c 2 )u x
u z'
' x
ux v ; u 'y 2 1 (v / c )u x
b) u
u y'
10
90 ^1 (1/ 9)107 ` km / s.
0 o u x'
1 (v / c 2 )u x' u y
, u z'
1 (v / c) 2
1 (1/ 9)108 1 (1/ 9)106
10 km / s, v 100 km / s.
102 ½ ; 100 ®1 10 ¾ ¯ 3 10 ¿
0 o u x'
.
x ' vt '
2) Lorentztransformation : x
1 (v / c) 2
;t
t ' (v / c 2 ) x ' 1 (v / c) 2
;
S -System:System des Studenten, S ' -System: System des Prüfers; vt '0
Nach der Zeit t'0 gilt: x
1 (v / c) 2
t '0 (v / c 2 ) x '
;t
1 (v / c) 2
.
Im System des Studenten benötigt das Licht die Zeit x0 / c . Die Gesamtzeit ist für den Studenten ist t1
3) l c 1m; lxc
lc
l yc
2
1 (v / c)
l yc ; l 2
1 ½ (l c) 2 ®1 (v / c ) 2 ¾ o l 2 ¯ ¿
G 4) vk
x t
b) vce , x
0, 75c o ve, x
c) ve, y
y t
ve
xc vt c t c (v / c 2 ) xc
v 2k v e2, y
lx2 l y2
(lxc ) 2 ^1 (v / c) 2 1` 0,935l c; sin D
ly / l
0, 756 o D
vce , x v k
0,86 c;
1 (v k / c 2 )vce, x
0,58 c;
/ c ) xc` 2
k
3,51 h .
0, 75 c
y c 1 (v 2k / c 2 )
^t c (v
1 (v / c) ' t0 1 (v / c)
t0'
l c 1 (1/ 8)
G G (0,3 c, 0, 0); ve, k { vec
a) ve, x
2
;
lxc 1 (v / c) 2 ; l y
lx
1 (v / c)
t0 x0 / c
0, 775 c
y c 1 (v 2k / c 2 ) t c ^1 (v k / c )vec, x ` 2
vce , y 1 (v k / c) 2
0, 715 c;
49,1q
778
Lösungen der Übungsaufgaben
Kapitel 3 v2 g cos D r r h v2 r h o r rFG r
1) FN
FZ o
cos D o rh mgh oD
v2 FG
v2 ; FG
1 2 mv o v 2 48, 2q.
2 gh o h
FZ
h
r-h
r 3
vx vy
FN
r
v FG
H = 2r - h
x1 !
2) ZErde ZSattelit ; o Z 2 R
J mE
x2
J mE Z2
42300 km. R Der Satellit überstreicht ca 160 Längengrade, denn tan D R / RErde 6, 6 . Es werden also drei Satelliten benötigt. Die Bereiche der Polkappen oberhalb ca 80° geografischer Breite können dabei allerdings nicht eingesehen werden. 2
oR
3
3) Damit ein Pkw nicht rutscht, muss der Zentrifugalkraft durch die Reibungskraft zwischen Reifen und Straße das Gleichgewicht gehalten werden. Die Zentrifugalbeschleunigung aZ Z 2 R ist dann für beide Pkw gleich groß, die Winkelgeschwindigkeit folglich auf der inneren Bahn größer als auf der Außenbahn. 4) Die Überhöhung einer Kurve (Radius R) erzeugt die Zentripetalkraft, die zum Durchfahren der Kurve erforderlich ist. Ohne Überhöhung muss die Zentripetalkraft FN durch die Reibung zwischen Reifen und Straßenbelag aufgebracht werden, was zu einer stärkeren Abnutzung führt. Bei gegebener Geschwindigkeit v ist FN mv 2 / R . Die Resultierende aus Schwerkraft und Zentripetalkraft und Schwerkraft muss senkrecht auf der Straße stehen. Der Überhöhungswinkel ergibt sich folglich aus tan D v 2 / r g , wobei g die Erdbeschleunigung ist.
Lösungen der Übungsaufgaben 2( xeˆx yeˆy )
5a) gradV
779
2 x 2 y 2 er
G 2r ;
grad (1/ r 2 ) : d § 1 · wr 2 x 2 §1· 3 i o grad ¨ 2 ¸ 3 eˆr ¨ 2¸ dr © r ¹ wxi r r r ©r ¹ 5b) Der Gradient einer skalaren Funktion gibt die Richtung der größten Änderung der Funktion in dem betreffenden Punkt (x,y). G G 5c) rotV ist ein Maß für die Rotation von Wirbeln. Ist rotV 0 , so ist das Vektorfeld G G wirbelfrei; divu ist ein Maß für die Quellenstärke des Vektorfeldes; ist div u 0 , so ist das Feld quellenfrei.
6) Die Fluchtgeschwindigkeit v 0
2 gr0
11.1km / s ist die (senkrecht zur Erdoberfläche)
gerichtete Anfangsgeschwindigkeit eines Geschosses, die zum Verlassen der Erde mindestens erforderlich ist. Bei Annahme einer Kugelgestalt der Erde ist sie unabhängig vom Ort. 7) sin4 ergibt sich mit Hilfe des cos-Satzes : s
(r 2 R 2 - 2 Rr cos 4)1/ 2
R sin Q
ds 1 1/ 2 o ^s` 2 Rr sin 4 d4 2 o sds Rr sin 4 d 4, sds oV Rr
sin 4 d 4
J m0 M r
R
R
³
m0
Q
s (S )
ds
s (0)
J m0 M ^s(S ) s(0)` r
a) m0 außerhalb der Kugelschale: s (S )
r R, s (0)
r R oV
b) m0 innerhalb der Kugelschale: s (S )
R a; s (0)
R a oV
8) W
r J m0 R R
mg ( s sin D mg )h 1245,87 N . s
9) W
³ ^F
& Ebene
FR Fhoriz cos D mg cos(90 D )`ds
3573, 77 J ;
0
W& Ebene
200 J; Whoriz
1504 J; WR
200 J; WG
269, 77 J .
J m0 M
. const.
780
Lösungen der Übungsaufgaben
Kapitel 4 1) Der Ball trifft die schiefe Ebene unter einem Winkel von D = 30° gegen die Normale und verlässt sie folglich unter dem gleichen Winkel. Der Winkel gegen die Horizontale beträgt ebenfalls 30°. Der Ball trifft im Abstand d erneut die Ebene. Für den schiefen Wurf gilt 1 sx v0 x t ; s y v 0 y t gt 2 ; 2 v 0 x v 0 cos D ; v0 y v0 sin D : s2 1 sx tan D g 2 x 2 2 v 0 cos D
o sy
y o s y sx tan D . x Der erneute Auftreffpunkt ergibt sich durch Gleichsetzen der beiden Gleichungen zu 4 v02 sin D cos D 4, 41m ; sx g tan D
Der Ball trifft die schiefe Ebene in einer Entfernung von d G 2) Der Impulsübertrag ist 'p
tnachh
³
sx cos D
5, 09 m
G Fdt
tvorh
G Folglich ist die Kraft F (t )
§ 57 103 220 103 · N ¨ 3 3 ¸ © 3, 6 10 4 10 ¹
3) Aus Impuls- und Energiesatz folgt 2 mn uMod vMod uMod v 2Mod o v n un mMod v n un v n2 un2
870 N
uMod v Mod 2
2
§ u · § m mMod · a) Die Moderatorkerne seien in Ruhe. Dann folgt ¨ n ¸ ¨ n ¸ ; © v n ¹ © mn mMod ¹ Die Abbremsung ist am größten, wenn un/vn am kleinsten ist, d.h. wenn mn = mMod . b) A = 12 Q
§ un · ¨ ¸ © vn ¹
Q
§ 121 · ¨ ¸ © 169 ¹
106 o Q
41, 4 Stöße
Lösungen der Übungsaufgaben 4) RS
G ³ U ( r ) rdA ³ U ( r ) dA ³ xdA
xS
³ dA
781
! ; U ( r ) const . o
; dA
R 2 2 ³ R x xdx 0 R 2 2 ³ R x dx 0
y ( x ) dx o xS
4 3S
R
yS ;
wobei dA y ( x) dx und y ( x) R 2 x 2 ; (R = Kreisradius) benutzt wurden. Der Abstand r des Schwerpunktes vom Mittelpunkt folgt aus 4R 2 0, 60 R . r xS2 yS2 3S nach vor Ekin 5) Q : Ekin
nach Ekin
Ekin ; p1 p2
Ekin,1
m2 Q m1 m2
Ekin,2
m1 Q 115, 6 MeV; v 2 m1 m2
74,3 MeV; v1
0; Ekin
p12 p2 2 ; o p1 2m1 2m1
2P Q ;
1, 01 107 m/s; 1,57 107 m/s.
150q relativ zur Richtung des Elektrons ;
6) a) D b) pres
1, 07 1020 mkg / s; v
2.73 104 m / s; Ekin
14,53 1017 J
907 eV .
G G 7) Die Größen vor dem Stoß seien mit m1 , v1 bzw. m2 , v 2 . Der Stoß ist inelastisch. Daher gilt G G nach dem Einfang m m1 m2 , v v E und es wird
G G m1v1 m2 v 2 G vE a) Q
G (m1 m2 )v E
G G m1 v1 m2 v 2 . m1 m2
1 1 1 (m1 m2 )v 2E m1 v12 m2 v 22 2 2 2 m1m2 1 G G 2 1 G2 P (v1 v 2 ) P v12 ; P . m1 m2 2 2
G Die Schwerpunktgeschwindigkeit vor dem Stoß ist v S G im Schwerpunktsystem seien mit vic bezeichnet:
G G m1 v1 m2 v 2 . Die Geschwindigkeiten m1 m2
782
Lösungen der Übungsaufgaben
G v1c
P G
G G v1 v S
m1
G v12 ; vc2
m2
v12 ;
1 P2 G 2 1 P2 G 2 c m2 2 v12 c m1 2 v12 2 m1 2 m2
1 G2 1 G2 m1 v1c m2 vc2 2 2
Ekin, S
P G
G G v2 vS
1 2G 2 § 1 1 · c ¨ P v12 ¸ 2 © m1 m2 ¹
1 G2 P v12 . 2
b) G v nach
G G m1 v1 m2 v 2 ; v1 m1 m2
v2
v 15 km/h : Q1
20,8 kJ;
v
83,3 kJ
30 km/h : Q2
m1
m2 : Q
11 m1 4v 2 22
v; o Q
1 m1m2 4v 2 2 m1 m2
2
m1m2 2 v m1 m2
4 Q1 ; m1 v 2 .
Kapitel 5 1a) U 0,9 g / cm3 ; R 5cm, r 0,5 cm; D 2 cm, d 0,1cm; l 1cm; Zahl der Wicklungen : n l /(2S r ), n x d o Fadendicke x 2S rd / l 31, 4ȝm. b) Bewegungsgleichung des Jojos: 1 2 1 E mv 4Z 2 mg 0; Z v / r (dx / dt ) / r 2 2 4 1 § · (dx / dt ) 2 ¨ m 2 mgx ¸ 0; 2r ©2 ¹ Integration durch Trennung der Variablen: x
³
dx
t
2mgr 2 dt o x(t ) mr 2 4 ³0
x c) Für den Weg nach oben gilt: 0
mgr 2 t2; 2(mr 2 4)
m= U V=U (2S R 2 D +S r 2 d ) = 0,283 kg; 1 1 4 = 2 US R 2 D R 2 US r 2 d r 2 2 2
3,54 104 kgm 2 ;
Nach unten braucht das Jojo die Zeit Tu
2 (mr 2 4) l mgr 2
Es ist nach der Zeit T = 2Tu = 6,46s wieder oben angelangt.
3, 235s
Lösungen der Übungsaufgaben
783
d) Die Kraft FA auf den Aufhängepunkt ergibt sich aus § · 1 FA m ( g a) mg ¨ 1 2, 72 N . 2 ¸ © 1 (4 / mr ) ¹ e) v(Tu )
aTu
mgr 2 0, 62 m/s; 'p mr 2 4
m 'v
m 2v
0,35 kgm/s; 'L
1 1 m1 R 2 ; 4 Sta m 2 l2 7, 225 103 kgm 2 ; 4 12 1 4 Sch m1 s 2 m1 R 2 m1 s 2 0, 0682 kgm 2 o 4 Sch 4 2SQ 62,83/s; L 4Z 9 kgm 2 /s;
0.
2a) 4 Sch 4cSch
b) Z
0,143 kgm 2 ;
at o a 12,57 / s 2 ; dZ d) M 4 4a 1,8 kgm 2 /s 2 . dt
c) Z
3) m1 v1x m2 v 2 x m3 v3 x
0;
m1 v1 y m2 v 2 y m3 v3 y
0;
v3
4,88 m / s, M3
197,89q
3 2 mr 11 106 kgm 2 ; 5 b) Abstand dS des Schwerpunktes von der Spitze: dS = (3/4) h; c) L 3, 47 103 kgm 2 / s ; G G G d) Auf den Schwerpunkt wirkt das Drehmoment D rs u mg rS mg sin M ; M )(eˆy , Zˆ ) G G G G G G G G D dL / dt o dL & Ddt A rS & L o dL A L o L bewegt sich auf einem Kegelmantel ;
4a) 4
dL
Z
L sin M dD dD dt
5) Ekin
Ddt ; rS mg sin M , unabhängig von M. 4Z sin M
D L sin M Erot Etrans
1 I Z 2 mv2S 2
mv 2S
15, 7 kJ
1 2 1 2 I Z mv S mv 2S ; vS o v0 x . 2 2 1 g Waagerechter Wurf: y y0 ( x x0 ) 2 . 2 v0 2x
6) 'E pot
mg 'h
( x x0 )
v0 x 2'h / g
'Ekin
'h 2
7, 05 m
784
Lösungen der Übungsaufgaben
Kapitel 6 1a) Als Nullpunkt des Koordinatensystems werde der Erdmittelpunkt gewählt. mE 0 mM rEM rS 4, 678 103 m, innerhalb der Erde; mE mM
B A
b) aMC
J
aMB
J
aMA
J
C
D G G Fg ! FZ
mM
rME RE mM rME 2
2
34, 6 106 m / s 2 ;
33,5 106 m / s 2 ; mM
rME RE
2
32, 4 106 m / s 2
G c) Bezeichnet FZ die Zentrifugalkraft, so gilt bei A:
G G und bei C : Fg FZ . Bei B ist die zum Erdmittelpunkt weisende Kraft klein.
Zwischen B (und D) einerseits und A und C andererseits findet ein stetiger Übergang statt, so dass in den Zwischenpunkten auch eine Tangentialkomponente, die für die Bewegung des Wassers sorgt, auftritt. Infolgedessen strömt das Wasser von allen Seiten zu den Punkten A und C. Dort entstehen unterschiedlich hohe Flutberge. Wegen des Zusammenwirkens der Mondbewegung und der Rotation der Erde um die Nord-Südachse verlagert sich dieser Zustand dauernd, so dass innerhalb von 24,75 Std. an einem Ort zweimal Ebbe und Flut auftreten. Eine Springflut entsteht, wenn Erde, Mond und Sonne in dieser Reihenfolge hintereinander stehen. 2) FGS
219, 2 102 N; FGM
0,13 102 N; FGV
Fluchtgeschwindigkeit: v 0
2 gr
7, 03 102 N; FGJ
20,81 102 N .
2Gm . r
3) 2GmS .L. 2GmS .L. 2 6, 67 1011 2 1031 or 2,94 104 m r c2 9 1016 GmS .L. 6, 67 1011 2 1031 2GmS .L. a 5,3 107 m/s 2 , o da dr 2 12 r 25 10 r3 F ma 21,34 400'l o 'l 5,3cm . v M r r0 m v^ Mm 4) F G G 3 r, r2 r0 c
da M r r0
M
Vr r0 V
§r· M¨ ¸ © r0 ¹
21,34m/s 2 .
d
3
FG FC
Dh
Lösungen der Übungsaufgaben
785
r0 = Radius des Himmelskörpers. Die Anziehungskraft durch die außerhalb r liegende Kugelschale ist null, da sich die Kräfte der einander gegenüber liegenden Massenelemente kompensieren. G 5) FC
G G 2m ZE u vWass ; M
vA o FC 2m ZE vWass sin M ; v FC o D 1,3 103 q; FG
sin M tan D 'h
d tan D o 'h 1,1cm.
6) aC h
50q
2Z v
2 gt o vC
§ 2h · 1 Zg ¨ ¸ 3 © g ¹
1 2 gt o sC 2
1 Z gT 3 ; 3
Z gt 2 o sC 3/ 2
2 cm o s
2 sC
§ 2h · 2 Zg ¨ ¸ 3 © g ¹
Westablenkung. Bei einer geographischen Breite von M ist
vM
3/ 2
1/ 2
4 § 2h · Zh ¨ ¸ 3 © g ¹
v sin M zu setzen.
Kapitel 7 9, 47 1014 J, 'Ekin, p
1a ) 'Ekin ,e b) 'Ekin, e
9,3 1014 J,
c) 'Ekin,e
7, 45 1014 J,
d ) 'Ekin,e
31, 73 1014 J.
2) v max / c 3) v e vp 4a ) p
G 4b) v S
m0, p m0,e
'Ekin, e ,
0,116 .
2,36 108 m/s, Ee 6
9,56 10 m/s, E p
1,388 10 13 J 35,15 10
13
0,868 MeV;
J.
8,89 GeV / c, Ekin 8,94 GeV, G G m1 v1 m2 v 2 ; Ekin ,1, S (cp1, S ) 2 (m0 c 2 ) 2 ; p1, L m1 m2
Impulssatz im Schwerpunktsystem:m1 v1,S + m 2 v 2,S = 0;
o Ekin,1, S
1, 27GeV;
;
m0 v1 1 (v1 ) 2
;
786
Lösungen der Übungsaufgaben
5a) 'E
c 2 ^(mU mn ) (mCer mZr 2mn )` c 2 ^235, 043924 u 1, 008665 u ) 139,905433 u 93,906314 u 2 1, 008665 u` c 2 0, 223512 u 931, 4943 MeV / uc 2
5b) 'E
2
c (2mD mHe )
208, 2 MeV.
2
c (2 2, 0014102 u 4, 002603 u )
23,85 MeV
Kapitel 8 1) Sind R der senkrechte Abstand des Körpers der Masse m von der Drehachse, l die Fadenlänge und M der gesuchte Winkel zwischen Drehachse und Faden, so gilt sin M FR Z 2 l sin M g o cos M . FR mZ 2 R mZ 2 l sin M ; tan M cos M mg g Z 2l 2) Es sind Zentrifugal- und Corioliskraft zu berücksichtigen. Wird die Raumstation als Toroid ausgebildet, so kann die Zentrifugalkraft bei richtiger Bemessung die Schwerkraft ersetzen. Bei einer Bewegung längs des Ringes treten vor allem bei kleineren Torusradien erhebliche radiale Corioliskräfte auf, die der betreffenden Person Mühe bereiten. 3) Auf der Nordhalbkugel wird die spiralige Natur der Wolkenformationen in einem Tiefdruckbereich durch die Linksablenkung der Corioliskräfte bewirkt. Für einen Beobachter in einem Inertialsystem existiert diese Trägheitskraft nicht. Er sieht eine gleichmäßige Wolkenstruktur. G 4) aC
G G 2Z u v 1,17 m / s
Kapitel 9 'l1 'l2 F 'l 0; E; l l A l Die Kräfte auf die beiden Drähte sind
1)
F x l § x· FG ¨1 ¸ und F2 FG o 1 l F2 x 1 © l¹ Fl F2 l F l a ) 'l1 'l2 o 1 o 1 1 o x A1 E1 A2 E2 F2 x F1
b)
F1 A1
F2 ox A2
l 1 A1 / A2
0, 667 m
0,571m;
Lösungen der Übungsaufgaben 2) Bei gegebenem Umfang u
787 2(a b) wird die Tragfähigkeit maximal, wenn das Produkt
2
a b maximal wird. Dabei ist a die Länge der senkrechten Seite. Ausdrücken von b durch a und u und Differentiation ergibt f ´(b) 3b 2 2ub u 2 / 4; f ´´(b) 6b 2u. Nullsetzen der ersten Ableitung ergibt für b unter Berücksichtigung von f ´´(b) 0 den Wert
b u / 6 und damit a u / 3 . Obiges Produkt wird also a 2 b u 3 / 54 . Bei quadratischer Form folgt dagegen a 3 u 3 / 6 4 . Bei der berechneten rechteckigen Form ist die Tragfähigkeit also um den Faktor 64 / 54 1,185 größer als bei quadratischem Querschnitt. – Ein beiderseits aufliegender Balken kann eine Last tragen, die doppelt so groß ist wie die eines einseitig eingespannten, halb so langen Balkens.
3) Infolge der leichten Schrägstellung biegt sich das Rohr unter Einwirkung einer senkrecht gerichteten Kraft F, so dass am oberen Ende des Rohres die Achse einen Gesamtwinkel J | (l a) / 2 R gegen die Senkrechte bildet. In guter Näherung können wir annehmen, dass die axiale Kraftkomponente am oberen Ende gleich F ist. Senkrecht dazu, also in Richtung des Krümmungsradius ist die Komponente gegeben durch FA | F (l a ) / 2 R . Die weitere Argumentation folgt den Ausführungen in Kap. 9.2.2. Das entstandene Drehmoment DF FA l / 2 erzeugt ein Rückstellmoment der Größe DRü CEr 4 / R | S Er 4 / 4 R . Der Faktor C berücksichtigt die geometrische Form der Säule, denn die Ableitung wurde unter vereinfachenden Annahmen für einen rechteckigen Querschnitt vorgenommen. Das Rohr knickt, wenn das durch die Belastung entstandene Drehmoment größer als das Rückstellmoment wird.
Kapitel 10 1a ) FG
FA o V U H
V cUW o h
d2 4
UW x
d2 S ox 4
1b) Harmonische Schwingung mx F FG FA V UG g A( x 'x) UW g mx AUW gx
0 oT
2S
m AUW g
1c) Lage minimaler potentiellen Energie;
2) h
4V 2r U g
1,5m.
hUH g UW
h
UH UW
A'x UW g ; 0, 775s.
3,5cm;
788
Lösungen der Übungsaufgaben
3) Aus der Bernoulli-Gleichung folgt für die Ausflussgeschwindigkeiten v12 2 gh1 ; v22 2 gh2 ; t12 2( H h1 ) / g ; t22 2( H h2 ) / g ; x1 x2 o h2
H h1
1, 6 m; x1
x2
v1t1
1, 6 m.
4) Aus der Bernoulli- und der Kontinuitätsgleichung folgt v1 7,3m / s; v 2 29, 2 m / s; v3 25, 6 m / s; A3 0,57 cm 2 . H
5)
A 1 dh a ³0 2 g ( H h)
T
³ dt; o T 0
2 A a 2g
H h
H 0
4515, 24 s
75,3 min .
Kapitel 11 l o l 0,994 m; g b) Der Winkel zwischen dem ausgelenkten Faden und der Projektion (Länge l - h) auf die Richtung des ruhenden Pendels betrage M .
1a ) T
2S
oh
l (1 cosM );
1 2 t mv max o v max 0,815 m / s o v(t ) v max cos(2S ); 2 T § 1 'l · 3 c) T2 T1 ¨ 1 ¸ 1, 00604 10 s o 't 43, 2s; © 2 l ¹ d ) 't 265, 4s; l 0,988 m. mgh
2) T s
2S 1 2 at 2
l ; g a 1 v2 oa 2 a
4,17 m / s; T
2, 031s.
v 2 t2
Lösungen der Übungsaufgaben
3a )
789
d 2M ß dM g M 0; dt 2 2m dt l 3 2m 4 M (nT ) M0 o ß ln ; nT 3 4 M (nT ) ß 1 4 T ln ln ; n 3 M ((n 1)T ) 2m ß
3b) E
t
E0 e m o
3c) 'E
E (nT ) E0
e
2
3 (ln )2 4
E (nT ) E ((n 1)T )
§3· ¨ ¸ ; ©4¹
E0 e
ß nT m
ß T · ! § ¨ 1 e m ¸ mg 'R; © ¹
2 2 2 ½ E0 °§ 3 · § 3 · n ° ®¨ ¸ ¨ ¸ ¾ . mg °© 4 ¹ © 4 ¹ ° ¿ ¯
'R
4) Die Massen seien M und m und die Gitterkonstante a; die Bindungskräfte seien durch eine Federkraft mit der Federkonstante D beschrieben. Die Bewegungsgleichungen in Normalkoordinaten u bzw. v sind (q = Wellenzahl) d 2u M 2 D(v s v s 1 2v s ); dt d 2v m D(us us 1 2us ); dt 2 Wir machen den Lösungsansatz ebener Wellen us ueisqa e iZt ; v s veisqa e iZt . Einsetzen führt zu dem linearen, homogenen Gleichungssystem 2D M Z 2 D(1 e iqa ) 0 D(1 e iqa ) 2 D M Z 2 Auflösung nach Z liefert die Dispersionsrelation 2
M m 4 a §M m· rD ¨ sin 2 q . ¸ Mm 2 © Mm ¹ Mm
o Z 2 (q)
D
5) Z
1 (v / c) 2 1 v / c
Z0
!
2Z0 o v
c
3 5
6) Die Frequenzen seien zur besseren Unterscheidung mit f bezeichnet. v 1 1 c v1 c f0 274,8 / s; 1. Fall: f f 0 v c v2 1 2 c
790
Lösungen der Übungsaufgaben
2. Fall: f
f0
c v1 c v2
231, 7 / s ;
3. Fall: f
f0
c v2 c v1
227, 4 / s
A 1 ; A 1
7a) E
2
§ 'O · A ¨ 1¸ ; E © O ¹
0, 2 ;
7b)
'O
2.
O
Kapitel 12 1) x1 x2
l1 sin M1 ;
y1
l1 sin M1 l2 sin M 2 ;
y1
l1 cos M1 l1 cos M1 l2 cos M 2 ;
o x2 x1 l2 sin M2 ; y2 y1 l2 cos M 2 . Beschränkung auf kleine Winkel: sin M | M , cos M | 1 § dx1 · ¨ dt ¸ © ¹
2
M2 2
, o x1
2
§ dM · l12 ¨ 1 ¸ ; © dt ¹
2
§ dy1 · ¨ dt ¸ © ¹ 2
dM 2 · § dx2 · § dM1 ¨ dt ¸ ¨ l1 dt l2 dt ¸ ; © ¹ © ¹ Damit ergibt sich
Ekin
m1 2 m2 2 v1 v1 2 2
l1M1 ,
§ M2 · l1 ¨1 1 ¸ 2 ¹ ©
x2 2
§ dy2 · ¨ dt ¸ © ¹
dM1 · § ¨ l1M1 dt ¸ © ¹
2
0;
2
0
2 2 m2 2 § § dM 2 · dM dM 2 1 2 § dM1 · m2 l1l2 1 l1 ¨ m m l 1 2 2 ¨ dt dt 2 © dt ¸¹ 2 ¨© ¨© dt ¸¹ 2
m1 m2 § dM · m § dM · gl1 ¨ 1 ¸ 2 gl2 ¨ 2 ¸ 2 2 © dt ¹ © dt ¹ Die Lagrange-Gleichungen werden E pot
2
m1 gy1 m2 gy2 2
2
§ d 2M · § d 2M · (m1 m2 )l12 ¨ 2 1 ¸ m2 l1l2 ¨ 2 2 ¸ gl1 (m1 m2 )M1 © dt ¹ © dt ¹
0;
§ d 2M l22 ¨ 2 2 © dt
0;
· § d 2M1 · ¸ l1l2 ¨ 2 ¸ gl2M 2 ¹ © dt ¹
Lösungsansatz M1 A1eiZt ; M2 A2 eiZt ; Einsetzen liefert für die Frequenz die quadratische Gleichung (m1 m2 )(l1 l2 ) g g (m1 m2 ) Z2 r m1 (l1 l2 ) 2 m2 (l1 l2 ) 2 . 2m1l1l2 2m1l1l2
· ¸ ¸ ¹
Lösungen der Übungsaufgaben
791
Werden statt verallgemeinerter Koordinaten kartesische Koordinaten benutzt, so wird die Rechnung sehr umständlich, da ein gekoppeltes Gleichungssystem mit sechs Unbekannten gelöst werden muss. d 2 z1 O1 0, dt 2 d2z m2 g m2 22 O1 2O2 0, dt d 2 z3 m3 g m3 2 O2 0, dt d2z m4 m4 24 O2 0; dt Nebenbedingungen: z1 + z 2 + r1S - l1 = 0; z 4 + z3 - 2z 2 + r2S - l2 = 0.
2) m1 g m1
Für den Fall m 2 = m3 = m, m 4 = 2 m, m1 = 4 m werden d 2 z1 dt 2
d 2 z2 dt 2
d2z 1 g ; 23 23 dt
d2z 9 g ; 24 23 dt
7 g. 23
3) Gesucht wird die Funktion y(x), deren Werte bei x1 und x2 vorgegeben sind. Zur Vereinfachung ordnen wir der negativen y-Achse positive Werte zu. Außerdem setzen wir y1 = 0. Der Energiesatz lautet dann m 2 v mgy 0 o v y ; ( y 0) bzw. v y ( y ! 0) 2 Die Zeit dt, in der das Kurvenstück ds durchlaufen wird, ergibt sich daraus zu 2
1
1
§ dy · 1 ¨ ¸ © dx ¹ dx C y
2
§ dx · 1 ¨ ¸ © dy ¹ dy ; C C y
1
. 2g y 2g Die Ableitungen werden im Folgenden mit gestrichenen Größen bezeichnet. Wir suchen nun die Funktion x(y), für die das Integral dt
x2
³
x1
1 y c2 dx y
y2
³ 0
1 xc2 dy y
ein Minimum wird. Am einfachsten ist x(y) zu finden. Die Eulersche Differentialgleichung lautet § 1 dx · dx d xc 0 bzw. d ¨ y, ¸¸ 0. Sie wird erfüllt durch ¨ 2 dy y (1 xc ) ds © y ds ¹ wobei wir den Proportionalitätsfaktor aus Zweckmäßigkeitsgründen zu
2/l wählen. Es folgt
792
Lösungen der Übungsaufgaben
l y 2 . l 2 Diese Gleichung stellt eine Zykloide dar, die durch Abrollen eines Kreises mit R = l/4 von unten an der Geraden y = 0 entsteht. Zu Beginn des Falles ist y = 0, folglich bildet der Anfangspunkt die Spitze der Zykloide. dy dx
§ dx · 1 ¨ ¸ © ds ¹
2
Kapitel 13 1) k 5 W /(m 2 K) o dq / dt Mit Styroporisolierung: 1
§x x · ¨ 1 2 ¸ 'T © O1 O2 ¹
dq dt dQNutz dt
2)
ra2S vU c'T
Vkrit
Q RT
3a ) V
p
d ) p1cVges
4) c p 'T
7,1W / m 2 o k
0, 283 W /(m 2 K);
500MW o Die Verluste betragen 0, 7%.
3 Tkrit R oa 8 pkrit
Q
5) p
125 W / m 2 ;
1 Vkrit 3
0,5855 Pa×m 6 / mol2 ; b
0,5 m3 ; b) p 1, 64 105 Pa; c) Q
p1V1 ;
p2cVges
p2V2 ;
§ 2a · b ¸ 'p; 'p ¨ © RT ¹
pges
9 atm
0,3215 104 m3 / mol.
cLuftQ 'T
16,56 kJ
1,38 105 Pa
p1c p2c
0,912 106 Pa; c p
7 / 2 R o 'T
2,33K.
4,32 105 Pa .
6) (Te Ta )(C Va UW cW ) (Te T0 )V0 cW UW a) c Al
0,845J / K; cmol , Al
7) 'S
'S1 'S2
0oC
22,8 J / kgK b) cCu
'Q 'Q T1 T2
0,179 kJ / K .
0,55 kJ / K ;
0,36 J / K; cmol , Cu
22,9 kJ / kgK.
Lösungen der Übungsaufgaben
793
8) Die einzelnen Beiträge sind T2
Eis :
273,15
dQ ³T T 1
'S
mcV
dT T 257,15
³
2, 27 J; Schmelzen :
'S
373,15
Wasser : 'S
9) 'S Misch
dT T 273,15
³
'S
G 11) B
2, 7 J;
Verdampfung : 'S
'QVerdampf TSieden
22, 0 J; 143, 0 J.
106, 06 J / K
T1 W T1 T2
10) Q
dF
mcV
'QSchmelz TGefrier
'Q2 T2
276,15 1, 2 14, 41J; 23 14, 41 276,15
G G B0 0 M ; M
5, 22 102 J / K; 'S ges
Vm
Cc B T TC
0.
C H ; (V T TC
Volumen
const ) (1)
SdT B0 dm;
§ wB · § wS · § wH · ¨ 0 ¸ P0 ¨ ¨ ¸ ¸ ; (2) © wm ¹T © wT ¹m © wT ¹m Wärmekapazität bei V = const: w § wS · ½ § wCm · ¨ wm ¸ T ® wm ¨ wT ¸ ¾ ¹ m ¿T © ¹T ¯ © Innere Energie: dU TdS 0VHdM ;
§ wU · ¨ ¸ © wT ¹ M § wU · ¨ ¸ © wM ¹T
w § wS · ½ ® ¨ ¸ ¾ ¯ wT © wm ¹T ¿m
§ w2 H · P 0T ¨ 2 ¸ © wT ¹m
o Cm (T , M ) z f ( M ) 0
§ wS · T¨ C M Cm ; ¸ © wT ¹ M (2) § wS · § wS · § wH · T¨ ¸ 0VH TV ¨ ¸ 0VH 0TV ¨ ¸ 0VH © wM ¹T © wm ¹T © wT ¹m M (1) M M 0TV 0V T TC 0V TC , C C C 2 M o U (T , M ) 0VTC G (T ). 2C T M2 § wU · § wU · dU ¨ ¸ dT ¨ ¸ dM o U U 0 ³ Cm dT 0VTC 2C © wT ¹ M © wM ¹T 0
794
Lösungen der Übungsaufgaben
Entropie: T
Cm dT T 0
S (T , M ) § wS · ¨ ¸ © wm ¹T
f ( M );
³
1 § wS · ¨ ¸ V © wM ¹T
§ wH · 0 ¨ ¸ © wT ¹m
0 M , o f c( M ) C
0V M, C
T
o S (T , M )
Cm V dT 0 M 2 . T 2C 0
S0 ³
Freie Energie: T
PV § T · F0 ³ Cm (T ) ¨ 1 ¸ dT c 0 M 2 (T TC ). 2C © Tc¹ 0 Freie Enthalpie: V G (T , B0 ) F mB0 F 0VMH F 0 (T TC ) M 2 ; C T VC 2 1 § T · G F0 ³ Cm (T c) ¨1 ¸ dT c B0 . c T 0 T TC 2 © ¹ 0 F
12) Vollständige Dissoziation vorausgesetzt, ergibt sich 2 30 'TGefrierp 1,85Q 1,85 1,91K. 58 13) Die Milch habe Zimmertemperatur. Der Wärmeverlust der gefüllten Tasse, der proportional zu ihrer Oberfläche sei, ist überproportional zur Temperaturdifferenz. Beim Hinzufügen von Milch steigt das Volumen. Die Temperaturabnahme ist proportional zu dieser Vergrößerung. Die Oberfläche nimmt jedoch im Vergleich zum Volumen schwächer zu, so dass die Mischung weniger Wärme verliert als der Kaffee alleine. 14) Eine Wärmepumpe arbeitet als Kältemaschine, ist also im Prinzip eine Carnot-Maschine mit umgekehrtem Drehsinn. Sie pumpt Wärmeenergie aus einem Reservoir 1 in ein Reservoir 2, in diesem Fall das Haus. Aufgestellt werden sollte die elektrisch betriebene Pumpe möglichst nahe zum Reservoir 1, um Verluste zu minimieren. Als Wärmequelle kann z.B. das Erdreich dienen. Im Winterhalbjahr lässt sich auch die Außenluft ausnutzen. 15) Q Zu
mZu / M Zu
12 / 260
0, 0462 mol; posm
Q RT / V
1,107 105 Pa .
Lösungen der Übungsaufgaben
795
Kapitel 14 1) v
3kT / m ; 2, 49 1010 m / s; a2 ) v 17, 62 1010 m/s
a1 ) He : v b) N 2 : v
6, 66 1010 m/s;
c) Hg : v
4,31 1010 m/s.
2) Die innere Energie dieser Gase besteht bei nicht zu hohen Temperaturen aus kinetischer Energie. f Ekin Ekin ,trans Ekin , rot ; Ekin , f kT ; 2 3 a) N 5 / 3 o f 3, einatomiges Gas; Ekin ,trans kT 6, 21 1021 J 2 b) N 7 / 5 o f 5, zweiatomiges Gas; Ekin Ekin,trans Ekin , rot 3) Die schwarze Seite erwärmt sich stärker als die blanke Seite; folglich ist der durch Reflexion der Moleküle übertragene Impuls auf Erstere größer. Bei kleinen Drucken steigt die Kraft proportional mit dem Druck. Die mittlere freie Weglänge ist groß gegenüber den Abmessungen des Rädchens, die Moleküle erleiden keine Zusammenstöße untereinander. Erreicht die mittlere freie Weglänge der Moleküle Werte von der Größenordnung der Rädchenabmessungen, so beginnt das Rädchen sich langsamer zu drehen, da die übertragene Kraft abnimmt. 4)
3kT mH 2
v2
1
5) l
2V n
6) p0
RT0 V0
1,57 1012 m;
p
nkT
266 m / s;
v2
71 m / s
4,14 1020 bar .
4,986 105 N / m 2 ; N 1
T
3 1,38 1023 3.7 2 1, 67 1027
§V · T0 ¨ 0 ¸ ©V ¹
§ 5 · 300 ¨ ¸ © 0,8 ¹
2/3
N
1, 024 103 K;
p
§V · p0 ¨ 0 ¸ ©V ¹
106, 47 bar.
Kapitel 15
1) Die beiden Ladungen an den freien Enden der Pendel seien mit qA und qB bezeichnet. Wir betrachten z.B. die Ladung in B. Wir könnten nun so vorgehen, dass wir die von den beiden anderen Ladungen ausgeübte resultierende Kraft berechneten. Die feste Ladung im Aufhängepunkt interessiert aber in diesem Zusammenhang nicht (warum?). Die in der
796
Lösungen der Übungsaufgaben
Verbindungslinie zu qB wirkende Kraft sei Fq A und die senkrechte dazu FG. Daher gilt q2 . Mittels beider Beziehungen folgt 4SH 0 (2l sin (D / 2) 2
tan (a / 2) . Ferner gilt FqA
FqA / FG
q2 , woraus q berechnet werden kann. 4SH 0 (2l sin (D / 2) 2 mg
tan(D / 2)
2) Die vier einander äquivalenten Eckladungen seien mit qA, qB, qC, qD bezeichnet, die zu ermittelnde mit qx. Wir berechnen z.B. die auf qA wirkende resultierende Kraft. Es ergibt sich Fqx 2 F 'cos 45q FqC ; da F '/ 2 FqA FqB und mittels des Coulombschen Gesetzes qx q a2 / 2
2
q2 q2 , woraus sich qx berechnen lässt. a 2 2a 2
3) Es seien U , V die räumliche Dichte bzw. die Flächendichte der elektrischen Ladungen sowie A die Plattenfläche. Dann ergibt der Gausssche Satz G G 1 ³ EdA ³ EdA ³ U dV 2V / 2H 0 ³ dA , A
H0 V
A
A
da es sich um geladene Platten mit zwei Oberflächen handelt. Für den Betrag der elektrischen Feldstärke folgt § V V · E ¨ , ,0¸ . © 2H 0 2H 0 ¹ Aufgrund des Superpositionsprinzips verlaufen die Feldlinien unter r45q zur Plattenoberfläche.
4) M
G 3 x ; E
G grad M E
2
§ 6x · ¨ ¸ ¨ 0 ¸. ¨0¸ © ¹
G Das Volumintegral von di v E ergibt sich zu G G G 2 2 ³ di v E dV ³ EdA E (a) 6a 8a 6a VWürfel
A
48a 3
Q
H0
.
Für einen Würfel mit der Kantenlänge a = 1m wird die Ladung Q 48 8,8 1012 As | 4, 2 1010 As . lim Q ( x) 0 , keine Ladung auf der yz-Fläche. x o0 G G rot E 0 bzw. v³ Eds 0 ; zur Herumführung eines Elektrons wird keine Energie benötigt. Quadrat
Lösungen der Übungsaufgaben
797
½° q 1 ° q ® 2 ¾ 4SH 0 ° x y 2 ( z d / 2) 2 x 2 y 2 ( z d / 2) 2 ¿° ¯ Für sehr große Entfernungen r vom Dipol (r >> d) lässt sich schreiben
5) M ( x, y, z )
° 2 § zd d 2 ®r ¨1 B 2 2 r 4r ¯° ©
1 2
2
x y ( z r d / 2)
2
grad M
G p
G qd .
1/ 2
zd 1§ | ¨1 r 2 r © 2r
· ¸. ¹
1 qd z . 4SH 0 r 3
Damit folgt M ( x, y, z ) G E
· ½° ¸¾ ¹ ¿°
Ey |
wM wy
p 3 zy wM ; Ez | 4SH 0 r 5 wz
p 3 zy § 1 3z 2 · p 3cos 2 4 ; 5 ¸| 5 ¨ 3 4SH 0 r © r r ¹ 4SH 0 r3
Feldlinien und Äquipotentialflächen s. Kap. 1.
G
6a) Die sehr einfache Rechnung ergibt, wenn rn die Ortsvektoren der beiden Ladungen sind und rn = a gesetzt wird, Q11 / q r12 r22 2a 2 Q33 / q b) Q11 / q
Q21 / q
2(3a 2 a 2 )
4a 2 .
2(3a 2 a 2 ) 2(a 2 )
6a 2
^2(3a 2 a 2 ) 2(a 2 )`
6a 2 .
7) Der Abstand der Platten sei mit a bezeichnet. Das elektrische Feld im Kondensator ist Q gegeben durch E . Zur Vergrößerung des Plattenabstandes um 'd müssen wir die H0 A Arbeit verrichten H0 2 H0 2 1 1Q F 'd E A 'd o F E A QE U. 2 2 2 2d A 1 A oF H 0H r 2 U 2 . d 2 d Kondensator ohne Dielektrikum: Q U C 1,95 1012 e o F 8) Q UC U H 0H r
Kondensator mit Dielektrikum: FDiel
2,15 10 7 N ;
FVak H r
9) Es sei Wpot die potentielle Energie, um ein Ion aus dem Unendlichen in die bereits existierende lineare Kette einzubauen. Der Abstand benachbarter Ionen sei mit a bezeichnet, dann ist der zwischen übernächsten Nachbarn 2a usw. Die Beiträge zum Potential sind dann
798
Lösungen der Übungsaufgaben a
U1
³ Edr f
a
q 1 dr 2 SH 4 0 r f
³
2a
q 1 ; 4SH 0 a
1 , usw. 4SH 0 2a f Aufgrund des Superpositionsprinzips ergibt sich für das resultierende Potential folglich f 1 ° f 1 1 ½° Ug ¦ ¾. ®¦ 4SH 0 a °¯ k 0 2k 1 k 0 2k °¿ U2
³ Edr
q
Mit der Näherung ln(1 x) | x
x 2 x3 x 4 ... folgt 2 3 4
q ln 2 . 4SH 0 a Hinzu kommt der Beitrag der links vom herausgegriffenen Ion lokalisierten Ionen. Damit wird die potentielle Energie pro Ion q ln 2 . W pot 2qU | 2SH 0 a Ug |
10) Die nicht miteinander verbundenen Kugeln besitzen im Abstand r das Potential 4 Q Q S R3 U o E Q rˆ o M 2 r t R 3 4SH 0 r 4SH 0 r Qr rˆ o M 4SH 0 R 3
E
3 r2 ½ ® ¾; 4SH 0 R ¯ 2 2 R 2 ¿ Q
Da die Potentiale der Kugeloberfläche unterschiedlich sind, fließt nach der Verbindung der Kugeln bis zum Ausgleich der Potentiale ein Strom. Die Gleichgewichtsbedingung lautet Q1 / Q2 R1 / R2 . Drücken wir etwa Q1 durch Q2 aus, so ergeben sich die Potentiale zu
M1
Q2 R1 1 ; 4SH 0 R2 r
M2
Q2 1 . 4SH 0 r
11) Die Diagonalelemente (Hauptkomponenten) erfüllen die Bedingung N xx N yy N zz
1
a) Kugel: Aus Symmetriegründen müssen die Hauptkomponenten des Tensors den gleichen Wert aufweisen: N xx N yy N zz ; b) Langer Stab: Der Stab sei unendlich lang; dann tritt in Längsrichtung keine Entelektrisierung auf, N zz 0 . Die beiden Komponenten senkrecht dazu haben wegen der angenommenen Zylindersymmetrie den Wert N xx N yy 1/ 2 .
Lösungen der Übungsaufgaben
799
c) Dünne Scheibe: Entsprechend b) existiert in der unendlich angenommenen xy-Ebene keine Entelektrisierung. Die verbleibende Hauptkomponente hat daher den Wert N zz 1 .
12) CKoax
l ln R2 / R1
2SH 0H r
13) C
12C1C2 4C2 2 3C12 10C2 3C1
14) E
grad M
1 p ; F 2SH 0 r 3
99,92 nF o Cges
3
33,3 nF
11 ȝF . 14
Eq
1 pq 2SH 0 r 3
1, 036 1011 N .
15) Das Dipol-Potential ist
M
1 pz 4SH 0 r 3
G oE
gradM
U § 3xz 3 yz 1 3 z 2 · , 5 , 3 5 ¸ ¨ 4SH 0 © r 5 r r r ¹x
y
U § 1 3z 2 · ¨ 3 5 ¸ 0 4SH z ¹ 0 © z
p 1 2SH 0 z 3
Das induzierte Dipolmoment p ist p DH 0 E . Einsetzen von p führt zu E
1 D e2 2SH 0 z 3 4S z 2 1
De 1 8S 2H 0 z 5
4, 7 102 V / m .
Kapitel 16
1) Es gilt U I R . Folglich ist der Spannungsbereich am empfindlichsten, wenn kein Vorwiderstand verwendet wird, 0,5 kȍ 10A 5 mV . Zur Ausdehnung des Spannungsbereiches auf 5 V muss der Widerstand 0,5 M: betragen. Der Spannungsabfall an jedem der 20 Widerstände ist 7 V, die Widerstandskette wird von einem Strom von 70 A durchflossen. Bei der Messung verursacht die Parallelschaltung einen erheblichen Fehler, da der Innenwiderstand des Voltmeters nicht sehr groß gegenüber dem Parallelwiderstand ist: Der Gesamtwiderstand beträgt 84, 4 k: . Daraus folgt U 5,91V , was eine Abweichung von 15,6 % bedeutet. 2) Die Stromstärke vor und hinter der Verzweigung sei auf I = 1 normiert. Dann gilt
800
Lösungen der Übungsaufgaben
1· §1 ¨ I 2 I3 ¸ R 3¹ ©3 1 1 1 U 7 7 7 3 3 6
0;
I2
35 oR 6
I3 U I
1 1 o I3 , I 2 3 6 35 5 5 :. 6 6
1 ; 6
3) Die Molmassen des Salzes sind 23 bzw. 35,5. Die Menge von 9g entsprechen 0,15 mol/l, so dass die Teilchendichten 0,9 1020 T/cm3 betragen. Die Leitfähigkeit V lässt sich aus den bekannten Beweglichkeiten berechnen: V en( ) 1,8 102 : 1cm -1 4) Eine physiologische Kochsalzlösung besteht aus 9 g Salz/l. Die Molmassen sind 23 bzw. 35,5, was 0,15 mol/l entspricht. Das bedeutet Teilchenzahldichten von 0,9 1020 / cm3 . Die Leitfähigkeit lässt sich aus den bekannten Beweglichkeiten ermitteln: 2 V en( ) 1,8 10 / : cm . Die Knochen brauchen wegen der wesentlich kleineren Leitfähigkeit nicht berücksichtigt werden. Zur Abschätzung des Widerstandes werden die Armlängen mit 150 cm und die engsten Bereiche (Handgelenke) mit einem mittleren Durchmesser von 6 cm und einer Dicke von 2 cm angenommen. Damit wird R
l
VA
|
l
V S d 'R
150 | 0,5 k: oU max | 50 V . 1,8 102 : S 5 2 cm 2
Dieser als grober Richtwert anzusehender Wert kann sich bei feuchten Händen noch verringern. 5) In einem Halbleiter wächst die Leitfähigkeit mit der Temperatur nach einem Exponentialgesetz. Hierin wird 'E als thermische Aktivierungsenergie bezeichnet.
V
V 0e
'E 2 kT
Im vorliegenden Fall ergibt sie sich wie folgt R1 R2
V2 V1
'E ½ ® 1/ T1 1/ T2 ¾ ¿
e¯ 2k
o 'E
2k ln R1 / R2 1/ T1 1/ T2
1, 43J
0,89 eV
6) Nach dem 1. Faradayschen Gesetz gilt mmol Q mmol I t ma ; ZF ZF Hierin bedeuten F die Faraday-Konstante und NL die Avogadrosche Zahl, F 9, 6485 104 As / mol; ma
26,98 40 103 90 3 9, 65 104
33,5 kg
Lösungen der Übungsaufgaben
801
7) Der Ladungszustand eines Bleiakkus lässt sich durch Messung der Säure-Dichte mittels eines Aräometers überprüfen, denn beim Entladungsvorgang werden laufend SO 4- -Ionen an der positiv geladenen Platte abgeschieden, so dass die Dichte der Säure abnimmt. Kapitel 17
1) Die Schwingungsfrequenz eines Pendels ist gegeben durch den Ausdruck G 1 G G pBED 1 pBE D ; D p u BE o D # oZ # . Z I 0 0 0 I
Die Form des Pendelkörpers kann so gewählt werden, dass sein Trägheitsmoment I berechnet werden kann. Die Polstärke = p1 kann experimentell mit Hilfe einer zweiten frei aufgehängten Nadel 2 bestimmt werden. Dazu werden zunächst beide Nadeln im Erdfeld orientiert. Nadel 1 wird in dieser Stellung fixiert und die parallel zu dieser angeordnete Nadel 2 langsam ersterer genähert, bis sie umschlägt. Das Magnetfeld von Nadel 1 übersteigt jetzt gerade das Erdfeld BE. Folglich gilt F2 E F1,2 , wobei F2 E
p2 BE ; F1,2
0 2 p1 p2 o p1 4S r1,2 2
2S r1,2
BE . 0
2) Innerhalb einer langen Spule ist das Magnetfeld im Mittelbereich in der Nähe der Achse annähernd homogen, aber schwierig zu erreichen. Sehr gut homogene und besser erreichbare Felder lassen sich im Inneren eines Helmholtz-Spulenpaars erzeugen. G G 3) Biot-Savartsches Gesetz: B (r1 )
Bz
0 I 3S / 4 2 4 sin M dM 4S S³/ 4 a
G
P0 ds2 u eˆ12 I 4S ³ r122
2 0 I 3S / 4 > cos M @S / 4 S a
a
135° a/2
2 2 0 I . S a
45°
4) Das Amperesche Gesetz wird zweckmäßiger Weise in die Form gebracht A B 2S r 0 jA 0 I ; S Darin ist S die Fläche des stromführenden Leiters und A die Integrationsfläche. In einem kompakten Leiter sind diese Größen identisch.
0°
R3 R1 R2
802
Lösungen der Übungsaufgaben
a) r R1 :
B 2S r
b) R1 r R2 :
B
c) R2 r R3 : B d ) r ! R3 :
B
1 2S r
0 I
4S r 2 oB 4S R12
0 I r; 2S R12
0 I
4S R12 o B 4S R12
0 I 1 ; 2S r
§ 4S R12 4S (r R2 ) 2 · 0 ¨ I ( I ) ¸oB 2S r © 4S R12 4S ( R3 R2 ) 2 ¹ § 4S R12 4S ( R3 R2 ) 2 · 1 I ) 0 ¨ I ( ¸o B 2S r © 4S R12 4S ( R3 R2 ) 2 ¹ 1
G 5) F
G G I ³ B u dl
0 I § (r R2 ) 2 · 1 ¨1 ¸ ; 2S © ( R3 R2 ) 2 ¹ r 0 (I I ) 2S r
0
S
IBR ³ eˆr dM 0
S
IBR ³ (cos M eˆx sin M eˆy ) dM
R A
0
B
G 2 IBR eˆy o F
IB ª¬ sin M ex cos M ey º¼
S 0
G G I (l u B)
6) Auf ein Ion wirken die Lorentzkraft und die ihr entgegengerichtete Zentrifugalkraft, so dass bei der vorliegenden Geometrie die Gleichung gilt: mv 2 mv . evB or r eB Die Geschwindigkeit lässt sich aus der Beschleunigungsspannung berechnen: 1 2 2eU m 2eU 2mU . mv eU o v or 2 m eB m e Für den Abstand des Auftreffpunktes ergibt sich damit 2 2 mN U d 2r N ; m N = Nukleonenmasse = 1,67×1027 kg , N = Massenzahl; B e d (14 C ) 11, 4 cm; d (12 C ) 10, 6 cm . 7a) B 190,5 0 I ; b) 'B / Bz 0 2, 2 106 ; c) I zur Richtung des Erdfeldes liegen.
0.21A , die Spulenachse muss antiparallel
8) In Analogie zum horizontalen Wurf ist die Bahnkurve eine Parabel. Der Ablenkungswinkel ist gegeben durch die Beziehung QEz lE tan D . m vx2 Eine Geschwindigkeitsfokussierung gelingt (Aston) durch eine zusätzliche, entgegengesetzte Ablenkung um den Winkel ß in einem homogenen Magnetfeld.
Lösungen der Übungsaufgaben
803
QBlB . mv Wir machen die Voraussetzung, dass die Ablenkungswinkel so klein sind, dass die Winkelfunktionen durch die Winkel selbst ersetzt werden können. Geschwindigkeitsunabhängige Ablenkung bedeutet, dass keine Änderung der Ablenkung bez. der Geschwindigkeit auftritt: dE,B 0, wobei d E , B | d B ß (d E d B ) D ; dv dabei wurde mit den Winkelbeträgen gerechnet, womit sich die resultierende Ablenkung von der x-Achse als Differenz der Ablenkungen bez. des B-Feldes und des E-Feldes ergibt. dD 2QEz lE 2D dß QBlB ß ; folgt Mit dv mv3 v dv mv 2 v dß dD ß 2D (d E d B ) d B (d E d B ) dB 0 o ' (d E d B ) D . dv dv v v Die Ebene der Fotoplatte muss also um den Winkel D gegenüber der x-Achse geneigt sein. Ihre rückwärtige Verlängerung schneidet die x-Achse in der Mitte des E-Feldes. tan ß
9) Die Feldstärke im Luftspalt ergibt sich wie folgt: Die Energie des Magnetfeldes im Luftspalt berechnet sich aus 2 0 mg BL 2 BL 2 B2 dW W ³ Fdx ³ dV Ax o F A mg o BL 0, 22 T; 20 dx 20 A V 2 Um den Zusammenhang zwischen Magnetfeld im Luftspalt und Strom zu finden, gehen wir vom Ampereschen Gesetz aus: G G B 0 v³ Hds 0 (lH Fe 2dH SP ) l dBSP 0 HI ; C Daraus folgt für die Stromstärke 2d l / 2d 4 102 0, 22 I B| B 27,9A . 0 N 0 N 1, 26 106 2,50 102 Kapitel 18
1) Der Weidezaun liegt auf einer Wechselspannung von einigen hundert Volt, die für die Tiere (und Menschen) ungefährlich ist, sie aber davor bewahrt, vom Weg (Wiesengrund) der Tugend abzuweichen. Die Wechselspannung wird bei dem vorliegenden Exemplar durch einen Unterbrecher aus der Gleichspannung erzeugt. Dieser erzeugt das Ticken. Die nötige Erhöhung der Spannung erfolgt mittels eines Transformators. Für die Elektroniker unter Ihnen: Können Sie sich auch geräuschlose Geräte vorstellen, die den gleichen Zweck erfüllen? 2) Der reziproke komplexe Gesamtwiderstand berechnet sich mit R0 iZ L 1 1 1 1 = ; R R0 iZ L; RC o ;Z 1 iZ R0 C Z 2 LC Z R RC iZC
804
Lösungen der Übungsaufgaben R0 2 Z 2 L2 1 2Z 2 LC Z 4 L2 C 2 Z 2 R0 2 C 2
Z2
a) Z f : Z 2
Z 2 L2 Z 4 L2 C 2
b) Z 0 : Z 2
R2
1
c) Z tan M
LC
1 o Z Z C2 o Z
R0 2 L / C R0 2 C / L
: Z2
1 ; ZC R;
2
L § L/C · ¨1 2 ¸ ; C© R0 ¹
o Z
I mag Z
Z ^L C ( R0 2 Z 2 L2 `
Real Z
R0
;
Zur Wirkleistung trägt nur der Realteil des komplexen Widerstandes bei. PRe al Z Re al I 0 2 ; R ; (1 Z R C ) Z 2 R 2 C 2 R a) Z f : P I 0 2 4 20 2 ; Z LC b) Z 0 : P I 0 2 R0 ; Z Re al
c) Z
3a)
U2 U1
2
1 LC
2
0 2 2
I02
P
1
Z 2 R0 C 2
R2 R1 R2 (1/ iZC )
. 1 . 1 ( R1 / R2 ) (i / Z CR2 )
Aus diesem Ausdruck können die Spannungsverhältnisse in den drei Fällen abgeleitet werden. Es ergibt sich mit Z1 1/( R2 C ) a1 ) Z Z2 , Z 0 :
U2 U1
1 R2 C
:
a2 ) Z
Z2
a3 ) Z !! Z2 , Z f :
Für R2
0oZ
Z1 ;
Z R2 C U2 U1
U2 U1
U1 U2
Z ; Z2 1
0, 673;
2
R §R · Z 1 2 1 ¨ 1 ¸ 2 R2 © R2 ¹ Z 1 R 1 1 R2 1 1 Z / Z1
0,91. 1 U1 2 U2
1 1 i
1 (1 i ) o M 2
45q
Lösungen der Übungsaufgaben b)
U2 U1
R1 (1/ iZC ) ; R1 R2 (1/ iZC )
b1 ) Z 0 : b2 ) Z
Z2
b3 ) Z o 0 : Für R2
805
U2 U1
1;
U 1 : 2 iZ C U1 U2 U1
0oZ
R1 R1 R2
Z1 ;
U1 U2
( R1 / R2 ) 1/ i 1 ( R1 / R2 ) 1/ i
0, 676;
0, 09; 1 1 Z / Z1
1 U1 2 U2
i 1 i
1 (1 i ) o M 2
45q
4) Die Differentialgleichung des frei schwingenden physikalischen Pendels lautet d 2M dM d 2M dM d 2M dM I 2 DM R oI 2 R DM 0 o 2 2J Z0 2M 0 ; ; dt dt dt dt dt dt dM I = Trägheitsmoment; R = Reibungsmoment; DM = Rücktreibendes Moment; dt R D 2J = ; Z0 Eigenfrequenz des ungedämpften Oszillators; I I Die Schwingungsgleichung des elektrischen Reihenschwingkreises ist d 2Q 1 dQ d 2Q dQ 1 d 2Q dQ L 2 Q R: o L 2 R: Q 0 o 2 2J Z0 2 Q C dt dt C dt dt dt dt L = Selbstinduktion; R: = Ohmscher Widerstand; C = Kapazität;
0
R: 1 ; Z0 Eigenfrequenz des ungedämpften Oszillators; L LC Je größer die Masse eines Körpers ist, umso größer muss die Kraft sein, um ihn zu beschleunigen. Analoges gilt für das Trägheitsmoment. Auch der Selbstinduktion L kommt diese Eigenschaft zu: Je größer L ist, umso größer ist die Selbstinduktionsspannung, umso größer muss die angelegte Spannung sein, um eine vorgegebene Stromstärke aufrecht zu erhalten. Der Reibungsterm ist für die Verluste verantwortlich. Das gilt ebenfalls für den entsprechenden Term, der proportional zum Ohmschen Widerstand ist. Die reziproke Kapazität übernimmt die Rolle des rücktreibenden Momentes -DM. Je größer Letztere ist, umso größer ist die Schwingungsfrequenz . Analoges ergibt sich für 1/C, denn je kleiner C ist, umso schneller kann sich der Kondensator entladen. 2J =
5) Zwei Möglichkeiten der Kopplung zweier Schwingungskreise sind unten gezeigt. Im ersten Fall erfolgt die Kopplung induktiv, im zweiten Fall kapazitiv. Anstelle des Koppelkondensators kann auch ein Ohmscher Widerstand geschaltet werden (Galvanische Kopplung).
806
Lösungen der Übungsaufgaben
Ck L1
C1
L2
L
C2
C
C L
R2
R1
Bei induktiver Kopplung ist der Kopplungsgrad definiert als die Größe k L12 / L , die den Grad der Kopplung beschreibt. Die Größe L12 bedeutet die Gegeninduktivität. Analoges gilt für die beiden anderen Fälle. Die Stromstärke im angekoppelten Kreis besitzt als Funktion der Frequenz zwei Maxima. Die Eigenfrequenzen sind Z1 6,19 MHz , Z2 5,83 MHz . 6a) Offenes Ende: Das elektrische Feld ist am Ende maximal, daher findet sich dort ein Spannungsbauch. Wegen der Phasenverschiebung zwischen Spannung und Strom von S / 2 resultiert für Letzteren ein Knoten. Zwischen benachbarten Knoten bzw. Bäuchen liegt ein Abstand von O / 2 c / 2Q 24 cm . b) Kurzgeschlossenes Ende: Die Spannung hat einen Knoten, der Strom einen Bauch. Bei Einbettung der Leitung in ein Medium der DK H ändert sich die Wellenlänge um den Faktor 1/
H
. c 2l
7) Die Resonanzfrequenz der Antenne ist Q
6 MHz . Die Intensität der Welle ist
gegeben durch den Ausdruck P0 2Z 4 I 0 2 l 2Z 2 I ( 4) mit P Ql und I Q folgt I ; # ( 4 ) sin 2 4 ; Z 0 0 32S 2 c 3H 0 r 2 32S 2 c3H 0 r 2 Die Gesamtleistung ergibt sich durch Integration: S I 0 2 l 2Z 2 S 3 I 0 2 l 2Z 2 4 Z S c / l I 0 2S sin 4 d 4 202,5 kW P 2³ I (4)r 2 sin 4 d 4 dM 3 ³ 16S c H 0 0 16S c3H 0 3 12cH 0 0 I (90q)
I 0 2 l 2Z 2 sin 2 90q 32S 2 c3H 0 r 2
o E
2 I (90q) H 0c
I0 4cH 0 r
2, 43 W / m 2 ;
42,3mW / m; B
8) Die Grenzfrequenz beträgt ZG
1 E c
105,3GHz OG
Für eine Welle mit der Wellenzahl k (n, m) (1,1);(2,1);(3,1) .
-1
0 I 0 4r
1,35 1010 T .
1, 79 cm .
2, 42 cm O
2, 60 cm sind die möglichen Moden
Lösungen der Übungsaufgaben
807
Kapitel 19
1) Der statische Strukturfaktor ist ein Maß für die räumliche Anordnung der Teilchen (Atome, GG G Moleküle, Ionen). Der Formfaktor P (qr ) ( r = Ortsvektor, gemessen vom Kugelmittelpunkt) berücksichtigt die bei größeren Teilchen auftretenden Interferenzen zwischen einfallender und gestreuter Welle. Der Gangunterschied zwischen den beiden Wellen steigt mit zunehmendem Streuwinkel. Dadurch nimmt der Formfaktor zunächst ab. Im weiteren Verlauf kommt es zu Oszillationen. Für sphärische Teilchen lässt sich der Formfaktor entspr. Kap. 5.1.3.6 berechnen zu 2
ª¬3 /(qr )3 (sin(qr ) qr cos(qr )) º¼ .
P(q) 2) O
2S c
Z
2S 102 m
6, 28 102 m o 2d
1, 608m
Wegen der Reflexion am dichteren Ende resultiert 'M mit E01
E02 o E0
2 01
E
2
E02 2 E01 E02
O
52 ; 2 S o cos 'M
1;
0
3) Der Realteil des Brechungsindexes hat bei einer Linie die Form Z02 Z 2 Ne 2 Re{n} nc 1 ; 2H 0 m Z 2 Z 2 2 (2GZ ) 2 0
Der Brechungsindex verläuft in Abhängigkeit der Frequenz bzw. Wellenlänge wie eine typische Dispersionskurve (vgl. Kap. 5.2). Bei sehr großen Frequenzen Z >> Z0 wird der frequenzabhängige Teil in obigem Ausdruck null, so dass n = 1. Bei sehr kleinen Frequenzen Z << Z0 nimmt er wieder einen konstanten Wert an, da der rechts stehende Bruch gegen den Betrag 1/Z02 strebt. Existieren weitere Eigenfrequenzen, so nimmt der Brechungsindex zu kleineren Frequenzen hin jeweils nach Durchlaufen der nächsten Resonanzstelle entsprechend zu. Bei Normalbedingungen ist die Anzahldichte der Moleküle etwa N 2,5 1025 m -3 . Der Wellenlänge 656,3 nm entspricht der Frequenz Z0 28, 71 1014 Hz , der Wellenlänge 500 nm entspricht Z nc 1
37, 68 1014 Hz . Im klassischen Modell folgt damit für den Brechungsindex
2,5 1025 1, 62 1038 2 8,85 1012 9,1 1031 5,96 1030
1 6, 67 103
4) Der Brechungsindex von Glas im sichtbaren Bereich ist mit nGl # 1.5 größer als der von Luft mit nL= 1. Aus dem Brechungsgesetz folgt, dass in einem solchen Fall keine Totalreflexion eintritt, sondern nur im Fall n1 > n2 . Gläser werden entspiegelt, indem sie mit einer dielektrischen Schicht bedampft werden, die dafür sorgt, dass die an der Vorderseite und die an der Rückseite reflektierten Wellen miteinander destruktiv interferieren. Der Phasenunterschied der Wellen muss dazu ein ungeradzahliges Vielfache von O/2 betragen. Um destruktive Interferenz nicht nur für eine vorgegebene Wellenlänge, sondern für einen größeren Wellenlängenbereich zu erreichen, werden mehrere Schichten aufgebracht. Wichtig ist das z.B. bei Brillengläsern und Objektiven.
808
Lösungen der Übungsaufgaben
5) Die absorbierte Leistung ist
'P P0
(1 e D x ) .
Im ersten Fall folgt durch Reihenentwicklung 'P 1, 6 102 P0 Im zweiten Fall ergibt sich 'P
0,33P0
0,8 mW 1, 6%
0,17 W 33%
6) Die Frequenz der 3 cm-Welle liegt weit unterhalb der Plasmafrequenz. Die Eindringtiefe der Welle ist daher näherungsweise
H 0c2 2VZ
Ge
Schichtdicke:
1 8,85 1012 3 108 3 102 2 6, 7 107 S
1 H 0 cO 2 VS
E0 e D x ! 3 10 o x E0
ln103
D
3, 08 107 m
0,308m
G e 6, 22 1,91 106 m
Kapitel 20
1) Das Brechungsgesetz ergibt ß = 28,13°. Beim Austritt des Lichtstrahls aus dem gleichseitigen Prisma beträgt der Winkel ß2 =52,37°. 2) Ein Parabolspiegel leistet dies, wie das Fermatsche Prinzip zeigt: Die Phasenflächen der einfallenden Welle sind Ebenen senkrecht zur optischen Achse. Sehen wir die Welle als ein Parallelstrahlbündel an, so müssen alle Strahlen, unabhängig von ihrem Abstand von der optischen Achse, in einem Punkt vereinigt werden. Ihr Weg ist s s1 s2 ( f x) ( f x) 2 y 2 . Unabhängigkeit des Weges von y fordert, dass die Ortsfunktion g ( x, y ) eine Parabel sein
muss, denn nur wenn wir y 2 3) a) f
b) f
R§ y2 · ¨1 2 ¸ 2 © 2R ¹ § ¨ 1 1 R ¨1 ¨ 2 y2 ¨ 1 2 R ©
4 f x const wählen, wird s unabhängig von y.
0, 4 (1 · ¸ ¸ ¸ ¸ ¹
16 ) 12800
39,950 m ;
§ ¨ 1 0,8 ¨1 0,5 ¨ 0, 09 1 ¨ 0, 64 ©
· ¸ ¸ ¸ ¸ ¹
0,369 m .
4) Die Linsenformel ergibt für die Brennweite f = 3 m. 5)
1 f
hScheitel
§ 1 1 (n 1)d · 0, 25 3,5 o f 138,86 cm ; (n 1) ¨ ¸ R R nR1 R2 ¹ 1,5 81 © 1 2 (n 1) f d 0,5 3,5 138,86 o h 17,8cm 1, 75cm 19,55cm . nR2 1,5 9
Lösungen der Übungsaufgaben
809
6) Wir legen den Scheitelpunkt der Frontlinse zu xS = 0 fest. Die x-Koordinaten aller Punkte vor dieser Linse werden damit negativ. a) Gegenstandsweite a f o b f o hB 120 135 15 mm , b) Gegenstandsweite a 10mm o O b
145,8mm; xB
( xG ) 103 mm
hB f 25,8 mm 145,8 mm .
7) Ein Teleobjektiv besitzt eine große Brennweite. Die Brennweite folgt aus der Linsenformel 1 1 1 d . f f1 f 2 f1 f 2 Drücken wir den Abstand d der Linsen aus durch d f1 f 2 G , wobei G f1 f 2 , so sehen wir, dass die reziproke Brennweite mit abnehmendem G abnimmt. Allerdings wird das Objektiv auch immer voluminöser, was für die Brennweite eine obere Grenze darstellt. 8) Brennweite und Brechungsindex sind verknüpft durch die Beziehung R1 R2 1 . f n1 1 R2 R1 Für die Brechungsindizes ergibt sich n1 = 1,485 und n2 = 1,50. 9) Die Brechkraft des Linsensystems ist mit der Brechkraft P PSyst
PSyst (d
P P´
1/ P)
PP´ d nb
P´
n 1 der Einzellinsen R
n 1 § n 1 · ¨2 ¸. R © R ¹
P; PSyst (d
3 /(4 P))
(5 / 4) P
Die beiden Hauptebenen müssen aus Symmetriegründen symmetrisch zu den beiden Einzellinsen liegen. Ihr Abstand zur Mittelebene der jeweiligen Linse ist nPd n 3n dH ; d H (d 1/ P) ; d H (d 3 / 4 P) . 5P Psyst P 10) Die Linse und damit deren Fassung, die als die eine Blende wirkt, sei vorgegeben. Im Bereich y1 d y d y2 wird der Lichtstrom durch beide Blenden bestimmt. Der Öffnungswinkel im Bereich y1 d y ist für alle Strahlenbündel nahezu gleich. Dieses Licht bewirkt eine gleichmäßige Helligkeit in der Mitte des Bildes. Außerhalb dieser Zone tragen mit zunehmendem Abstand von der optischen Achse immer weniger Strahlen zum Bild bei, so dass dessen Helligkeit nach außen hin abnimmt. Strahlen, die aus Bereichen außerhalb y2 y herrühren, tragen überhaupt nicht mehr zur Abbildung bei. Je kleiner die 1. Blende wird bzw. je näher sie an die abzubildende Fläche rückt, umso stärker werden die beschriebenen Effekte.
810
Lösungen der Übungsaufgaben
Kapitel 21
1) Wir sehen zunächst von der Beugung am Einzelspalt ab. Der Wegunterschied 'l ist näherungsweise 2S 2S d sin - . 'l d sin - o Phasendifferenz der Wellen M 'l
O
O
Die Intensität auf dem Schirm ist I
cH 0 A0 2 1 eiM
2
cH 0 A0 2 2 e iM eiM
cH 0 A0 2 2 cos M .
Wenn sich die Spaltbreiten wie 2:3 verhalten, ergibt sich I zu I
cH 0 A0 2
2 3 eiM
2
cH 0 A0 2 5 3e iM 3eiM
cH 0 A0 2 5 3 cos M ;
Bei Berücksichtigung der Beugung folgt die Intensitätsverteilung aus der allgemeinen Gitterbeugungsformel mit N = 2, wobei N die Anzahl der miteinander interferierenden Wellen bedeutet. 2) Konstruktive Interferenz liegt vor, wenn die vom beweglichen Spiegel zurückgelegte Strecke gleich einem ganzzahligen Vielfachen der halben Wellenlänge ist. Daraus folgt O = 0,905 m. O 2smax 2, 21 105 . Das Auflösungsvermögen ist
GO
O
Die Größe des Eintrittsspaltes bestimmt den Lichtfluss. Der Austrittsspalt ist erforderlich, um die durch Interferenz entstehenden höheren Ordnungen auszublenden. Die Spalte bzw. Blenden werden in der Brennebene der jeweiligen Monochromatorspiegel angeordnet. Die Interferenzbedingung kann nur für diskrete Wellenlängen erfüllt werden. Licht anderer Wellenlängen gibt Anlass zu „falscher Strahlung“. Abhilfe schafft die Apodisation. 3) Zwei Linien können noch aufgelöst werden, wenn N Wellenlänge ein, so folgt N Die Kohärenzlänge ist lkoh 4) A
A1 A2
A0
O . Setzen wir für O die mittlere 'O
687, 2 149 . 4, 6 N O 687, 2 149 10266, 7 nm 10, 27m .
R1 (1 R1 ) R2 ;
2
§ n1 n2 · 2 ¨ ¸ o R1 0,1597 © n1 n2 ¹ 2m 1 O A 0, 2464 A0 ; d ; 4 n1
R
d (600 nm )
0, 0255;
108, 70 2m 1 nm; d (380 nm )
R2
0, 0891.
68,84 2m 1 nm; d (720 nm )
130, 43 2m 1 nm
Lösungen der Übungsaufgaben
811
5) Bei einer einfachen Zonenplatte geht infolge Abdeckung jeder zweiten Zone die Hälfte der Strahlungsenergie verloren. Sie kann ebenfalls nutzbar gemacht werden, wenn diese Zonen so angeätzt werden, dass zwischen einem Punkt in einer Rinne und dem entsprechenden Punkt eines benachbarten Steges neben dem bereits vorhandenen Gangunterschied von O/2 ein zusätzlicher Wegunterschied von O/2 entsteht. In diesem Fall können wir uns die kammförmige Zonenplatte als aus zwei Zonenplatten zusammengesetzt denken, deren Teilwellen konstruktiv miteinander interferieren. Furchentiefe und Brechungsindex sind dann miteinander verknüpft: H
O/2o H
O 1m ; Rm 2
D 2
mmax f O o mmax
D 1 4 fO
mf O o R1 2
12 103
109,5m
3
25 10 4 12
1,3 104.
6) Die Fußpunktbreiten (Nullstellen) sind: 0. Ordnung: x0 r 3, 25 mm ; r 1. Ordnung: x1 r 6,5 mm . Tritt anstelle eines Spaltes eine Rechteckblende mit vergleichbarer Breite und Höhe, so ergibt sich als Beugungsfigur die Überlagerung der Intensitätsverteilungen zweier zueinander senkrecht liegender Spalte der Breite a und b. Im vorgegebenen Fall betragen die Fußpunktbreiten der Einzel-Beugungsfiguren annährend 1/5 der Fußpunktbreiten der Beugungsfigur des 0,8 mm breiten Spaltes. 7) Die Furchen des herzustellenden Gitters mögen senkrecht zur x-Achse liegen. Damit es die richtige Gitterkonstanten erhält, müssen Interferenzmaxima der beiden monochromatischen Wellen im Abstand von 0,8 mm erzeugt werden. Der Winkel zwischen den Wellenvektoren der beiden symmetrisch einfallenden Wellen sei r D. Interferenzmaxima treten auf, wenn der Wegunterschied der Wellen ' s m O beträgt. Entlang der x-Achse folgen für die Wellen Maxima im Abstand 's1 'x sin D bzw. 's2 'x sin D . Der gesamte Gangunterschied ist 's s1 s2 . Folglich treten längs der x-Achse Interferenzmaxima im Abstand g { 'x
sich D
O / 2sin D auf. g ist die gewünschte Gitterkonstante. Im vorliegenden Fall ergibt 22, 02q .
8) Es werde eine mittlere Wellenlänge von 500 nm angenommen. Das Auflösungsvermögen ist O / GO 2,8 (9,5) 105 . Der freie Spektralbereich ergibt sich zu mit m 2d / O 'O 1,56 102 nm . Zur Vorzerlegung eignet sich ein Prisma. Bei gegebenem brechenden Winkel J und Dispersion kann die Winkeldispersion berechnet werden. Damit folgt die Brennweite f2 der Linse aus der d4 'O . Beziehung 's f 2 dO
9) Aus der Beugungsformel d (sin -0 sin - )
O GO
Nm 1, 2 105 ( 2, 4 105 ); GO
O m
mO folgt
500 nm ( 250 nm) .
812
Lösungen der Übungsaufgaben
Licht in 1. Ordnung mit O = 500 nm erscheint unter dem Winkel - = -2,35°, in 2. Ordnung unter - = -39,87°. Der Furchenwinkel ergibt sich zu G D -0 U / 2 18,18q . Ein Gitter mit dem gleichen Auflösungsvermögen für O = 50 m müsste ein Breite von ca. 100 cm besitzen! Einen Ausweg bietet das Fourierspektrometer, das statt der Beugung die Interferenz zweier Lichtbündel ausnutzt. 10) Die Intensität in Fraunhoferscher Beobachtungsart ist 2
2
sin( N ) / 2) ½ sin(M / 2) ½ I ( P) ® ¾ ® ¾ ¯ sin() / 2) ¿ ¯ (M / 2) ¿ (d = Gitterkonstante, b = Spaltbreite).
mit )
2S
d
O
sin - ;
2S
M
b
O
sin - .
Aus der Beugungsformel folgt, dass gewisse Maxima der Interferenzfunktion sin -h´ / 2 ausfallen, wenn sie mit Minima der Spaltfunktion sin -h / 2 Bedingung für den Ausfall gewisser Ordnungen ist also h´ ligen Ordnungen fallen aus, wenn d
2b o
h´ h
O d
h
h
O b
O b
o
h´
O d
zusammenfallen. Die d b
h´ . Die geradzahh
2.
Kapitel 22
1) Eine kurzbrennweitige Sammellinse lässt sich als Lupe verwenden, entweder als Vergrößerungsglas oder als Okular in optischen Instrumenten. Liegt der Gegenstand in der Brennebene, so entsteht ein virtuelles, aufrechtes Bild auf der Gegenstandsseite in unendlicher Entfernung. Bei a = f/2 entsteht ebenfalls ein virtuelles, aufrechtes Bild, und zwar auf der Seite des Gegenstandes in der Brennebene der Linse; es kann also nicht auf einem Schirm aufgefangen werden. Die Vergrößerung ist s0 § f a · 25 0,5 V (1 ) 50 . ¨1 ¸ f © a ¹ 1 0,5 Eine stärkere Vergrößerung wird mit einem Mikroskop erreicht, wobei es zweckmäßig ist, Licht kleinerer Wellenlänge zu benutzen (z.B. Elektronenmikroskop). 2) Das Öffnungsverhältnis ist definiert als (1: k ) , wobei k die Blendenzahl f Linse / 2rLinse bedeutet. Für den Durchmesser der Pupille folgt 2r = 2,59 mm. Durch die Fokussierung wird die Intensität um den Faktor ABlende/ANetzhaut erhöht, beträgt also 603,7 kW/m2. Die auf die Netzhaut entfallende Leistung ist P 900 S 1,3 106 W 4,8 mW. Die Leistung muss als um einen Faktor 107 abgeschwächt werden. Also Vorsicht!
Lösungen der Übungsaufgaben
813
3) Die Vergrößerung eines Mikroskops berechnet sich aus dem Ausdruck b1 s0 d f 2 s0 234 250 19 250 1218; Vmin Vmax |7. 16 3 12 60 a1 f 2 f1 f 2 Die Objekte müssen sich zwischen der einfachen und der doppelten Brennweite des Objektivs befinden. Die stärkste Vergrößerung wird erzielt, wenn sich das Objekt so nah wie möglich an der Brennebene des Objektivs befindet. Der kleinste Abstand ist durch die Tubuslänge d bedingt, b1 d f 2 . 4) Unter solchen Bedingungen ist die konfokale Mikroskopie die geeignete Methode. Das geometrische Auflösungsvermögen jeglicher Fernfeldmethode ist durch die Beugung an der Objektivfassung begrenzt, da durch Diese jeder Objektpunkt als ein Scheibchen abgebildet wird. Damit zwei Scheibchen noch getrennt werden können, muss das Rayleigh-Kriterium erfüllt sein. Das Auflösungsvermögen ist umgekehrt proportional der Wellenlänge, es kann erhöht werden, indem Licht kürzerer Wellenlänge benutzt wird wie im Elektronenmikroskop. Beugungseffekte können quasi ausgeschaltet werden durch das Nahfeldmikroskop. (Ferner sind die verschiedenen Ausführungsformen des Tunnelmikroskops zu nennen, die Sie später kennen lernen können). 5) Ein Diaprojektor besteht im Prinzip aus dem Kondensor und dem Objektiv. Der Kondensor sorgt für eine gleichmäßige Ausleuchtung des Dias. Dazu steht er meistens unmittelbar vor der Objektebene. Der Hohlspiegel (als Kaltspiegel ausgebildet) trägt dazu bei, ein möglichst helles Bild zu erzeugen. Aus demselben Grund wird die Lichtquelle nahe dem Linsensystem positioniert. Dieses besteht aus zwei plankonvexen Linsen mit dazwischen liegendem Wärmeschutzfilter. Die unten gezeigte Anordnung (nicht maßstäblich) minimiert den Öffnungsfehler. Der Kondensor bildet die Lichtquelle als Eintrittspupille in die Ebene des Objektivs ab, wirkt also als Feldlinse.
Dia Beleuchtungsspiegel
K1 WSF K2
Aperturblende
814
Lösungen der Übungsaufgaben
6) Die astronomische Refraktion beträgt näherungsweise r 0,95 tan 65q 1, 04 . Die durch die Fluktuationen Gn bedingte Verschmierung GU wird damit Gn 3, 2 102 GU 0,95 tan 65q 2, 04´ 0, 0653´| 3,9´´ n 1, 0003 Der Durchmesser 2r des Beugungsscheibchens (zentrales Maximum) ergibt sich wie folgt: Die erste Nullstelle entspricht dem Beugungswinkel -, gegeben durch die Beziehung 2S R sin - 1, 22S .
O
Andererseits ist sin r
f 2
C 1
, wobei C
r 2
r f2 1 R 0, 66 O
. Damit folgt für r 1,51 107
o r | 0, 066 f m .
Literaturverzeichnis Einige Lehrbücher der Experimentalphysik Alonso, M., E. Finn: Physik, 2. Aufl., Inter European Editions Amsterdam (1992) Demtröder, W.: Experimentalphysik 1-4, Springer-Verlag (1999) Dorfmüller, Th., Hering, W. T., Stierstadt, K. unter Mitwirkung v. Fischer, G. BergmannSchäfer: Lehrbuch der Experimentalphysik, Bd. I-IV, 1965ff, Walter de Gruyter-Verlag, Berlin (1965ff) Dransfeld, K., P. Kienle, M. Kalvius: Physik I, Mechanik und Wärme 9. Aufl., R. OldenbourgVerlag München (2001) Dransfeld, K., P. Kienle: Physik II, Elektrodynamik und spezielle Relativitätstheorie 6. Aufl., R. Oldenbourg-Verlag München (2002) Feynman, R. B., R. B. Leighton, M. Sands: Feynmann-Vorlesungen über Physik, Bd. I-III, R. Oldenbourg-Verlag München (1988) Gerthsen, Ch., D. Meschede: Physik, 21. Aufl., Springer-Verlag Berlin (2001) Halliday, D., R. Resnick, J. Walker: Physik, 1. Auflage, Wiley-VCH (2003) Hänsel, H., W. Neumann: Physik I-IV, Spektrum Akademischer Verlag Heidelberg (1993) Kittel, Ch., Knight, W. D., Rudermann, M. A.: Berkeley Physik Kurs 1-5, Verlag F. Vieweg u. Sohn, Braunschweig (1975) Lüders, K, R. O. Pohl (Hrsg.): Pohls Einführung in die Physik, Springer, Berlin (2004) Orear, J.: Physik, Hanser-Verlag München (1985) Pitka, R., Bohrmann, S., Stöcker, H., Terlecki, O.: Physik. Der Grundkurs, 2. Aufl., Verlag H. Deutsch, Frankfurt/M. Tipler, P. A.: Physik, Spektrum Akademischer Verlag Heidelberg (1994) Wegener, H.: Physik für Hochschulanfänger, 3. Aufl., Verlag B. G. Teubner Wiesbaden (1991)
816
Literaturverzeichnis
Einige Lehrbücher der Theoretischen Physik Fließbach, T.: Mechanik, 2. Aufl., Spektrum Akademischer Verlag Heidelberg, Berlin 1996 Joos, G. Lehrbuch der Theoretischen Physik, bearbeitet V. B. Fricke u. K. Schäfer, 15. Aufl. Wiesbaden, Aula-Verlag (1989) Kittel, Ch., Krömer, H.: Physik der Wärme, R. Oldenbourg-Verlag München, Wien (1989) Klein, R. Theoretische Mechanik, Uni. Bibl. Konstanz, phy 5:ks/k52c Klein, R. Thermodynamik, Uni. Bibl. Konstanz, 2001, phy 5:ks/k52e Nolting, W.:Grundkurs Theoretische Physik, Band 1,2, Klassische/ Analytische Mechanik, 6. Aufl.; Spezielle Relativitätstheorie, Thermodynamik, 5. Aufl., Springer-Verlag (2002) Scherz, U., Quantenmechanik, Verlag B. G. Teubner Wiesbaden (1995) Schmutzer, E.: Grundlagen der Theoretischen Physik, BI-Wiss. Verlag Mannheim (1989) Schnakenberg, J.:Thermodynamik und Statistische Physik, Carl Grossmann,Tübingen (2000) Schwabl, F., Quantenmechanik, 5. Aufl., Springer-Verlag (1998)
Zum mathematischen Anhang Arfken, G. B., Weber, H. J.: Mathematical Methods for Physicists, 5. Ed., Academic Press San Diego (2001) Bronstein, i. N., Semendjajew, K. A., Musiol, G., Mühlig, G.: Taschenbuch der Mathematik, 5. Aufl., Verlag H. Deutsch, Frankfurt a. M. (2001) Joos, G.: Lehrbuch der Theoretischen Physik, bearbeitet v. B. Fricke u. K. Schäfer, 15. Aufl. Wiesbaden, Aula-Verlag (1989), u. a.
Literaturverzeichnis
817
Spezialliteratur Kapitel 3 3.1
B. Povh: Elementarteilchen und Kosmologie, Sterne und Weltraum 3, (2004)
Kapitel 9 9.1
U. Frantz, A. Lotter: Blitze zum Anfassen, Physik i. u. Zeit 33, 16 (2002)
9.2
A. Lambrecht, G.-L. Ingold: Physik i. u. Zeit 27, 200 (1996)
Kapitel 10 10.1
B. S. Massey, Mechanics of fluids, 5. Ed., Wokingham: Van Nostrand Reinhold (1984)
Kapitel 12 12. 1 Lehrbücher der Theoretischen Physik, s. unten
Kapitel 13 13.1 M. Kühne: Kalt, kälter, ultrakalt, Phys. Blätter 57, 6, 59 (2001)
Kapitel 16 16.1. G. Fuchs, G. Krabbes, Dauermagnete aus Hochtemperatur-Supraleitern, Phys. Blätter 57, 5, 61 (2001) 16.2. H. Eschrig, J. Fink, L. Schultz, 15 Jahre Hochtemperatur-Supraleiter, Phys. Blätter 1, 1, 45 (2002) 16.3. C. Nölscher, Brennstoffzellen - Energiequelle des 21. Jahrhunderts, Phys. i. u. Zeit 27, 52 (1996) 16.4. G. Hoogers, Brennstoffzellen - Motoren der Zukunft, Phys. Blätter 56, 5, 53 (2000)
818
Literaturverzeichnis
16.5. H. Landes, M. Waidhas, Gebändigtes Knallgas, Phys. i. u. Zeit 32, 4, 172 (2001) 16.6. P. Würfel, T. Trupke, Solarzellen der dritten Generation, Physik Journal 2, 45 (2003) 16.7. M. C. Lux-Steiner, G. Willeke, Strom von der Sonne, Phys. Blätter 57, 11, 47 (2001) 16.8. F. Gassmann, R. Kötz, A. Wokaun, Europhysics News 34, 176 (2003) 16.9. G. Hahn, Physik i. u. Zeit 35, 20 (2004)
Kapitel 17 17.1. J. Untiedt, Das Magnetfeld der Erde, Physik i. u. Zeit 4, 147 (1973) 17.2. H. Lühr, V. Haak, Das Magnetfeld der Erde, Phys. Blätter 56,10,33 (2000) 17.3. J. A. von Allen, Magnetosphären und das interplanetare Medium, in: Die Sonne und ihre Planeten (Physik-Verlag Weinheim 1985)
Kapitel 18 18.1. K. Wille, Physik der Teilchenbeschleuniger und Synchrotronstrahlungsquellen (Teubner, Stuttgart 1992) 18.2. Deutsches Elektronen-Synchrotron: http://www.desy.de/html/home/index.html
Kapitel 20 20.1. M. V. Klein, Th. E. Furtak, Optik, Springer Berlin, Heidelberg 1988 20.2. M. Born, E. Wolf, Principles in Optics, 6th edn, Pergamon Press, Oxford 1980
Kapitel 21 21.1. H. Müller, A. Peters: Einsteins Theorie auf dem Prüfstand, Phys. i. u. Zeit 35, 70 (2004) 21.2. Lee Smolin: Quanten der Raumzeit, Spektum d. Wissenschaft, S. 54, März 2004
Literaturverzeichnis 21.3. Spectrometric Techniques, G. A. Vanasse, Ed., Academic Press New York 1977 21.4. J. M. Vaughan: The Fabry-Perot-Interferometer, Hilger, Bristol 1989 21.5 W. Demtröder: Laserspektroskopie, 4. Auflage, Springer-Verlag Berlin 2002 21.6. Beugung an Kreisblenden, s. 6.1; 6.2 21.7. G. Schmal, D. Rudolph, B. Lengeler, C. Schroer: Röntgenlinsen, Phys. Blätter 57, 1, 43 (2001) 21.8. L. Kipp, M. Skibowski, R. L. Johnson, R. Berndt, R. Adelung, S. Harm, R. Seemann: Sharper images by focusing soft X-rays with photon sieves, Nature 414, 184 (2001), 21.9. L. Kipp, Gesiebte Röntgenstrahlung: Phys. i. u. Zeit 33, 9 (2002) 21.10. M. Albrecht, J.U. Thiele, A. Moser, Terabit-Speicher – bald Realität oder nur Fiktion?, Physik-Journal 2,.25 (2003) 21.11. J. Dreßen, A. Hoffknecht, Nichtflüchtige Datenspeicher, Physik Journal 3, 39 (2004) 21.12. M. Miller, Optische Holografie-Theoretische und experimentelle Grundlagen und Anwendungen, Thiemig, München 1978 21.13. D. Psaltis, F. Mok, Holografische Datenspeicher, Spektrum d. Wiss. S. 50, (Januar 1996) 21.14. F.T.S. Yu, S. J. Jutamulia, S. Yin, Introduction to Information Optics, Academic Press (2001)
Kapitel 22 22.1. J. W. Lichtman, Konfokale Mikroskopie, Spektrum d. Wissenschaft S.78, (1994) 22.2. s. z.B. 20.1 22.3. H. Brückl, Die Überwindung der Beugungsbegrenzung, Phys. i. u. Zeit 28, 67 (1997) 22.4. M. Labardi, P. G. Gucciardi, M. Allegrini, Near-field optical microscopy Rivista del Nuova Cimento 23, 2000 (1999)
819
820
Literaturverzeichnis
22.5. A. Naber, D. Molenda, U. C. Fischer, H.-J. Maas, C. Höppener, N. Lu, and H. Fuchs, Enhanced Light Confinement in a Near-Field Optical Probe with a Triangular Aperture, Phys. Rev. Lett. 89, 210801 (2002) 22.6. H. G. Frey, F. Keilmann, A. Kriele, and R. Guckenberger, Enhancing the resolution of scanning near field optical microscopy by a metal tip grown on an aperture probe, Appl. Phys. Lett. 81, 5030 (2002) 22.7. J.M. Vigoureux, C. Girard, D. Courjon, Optics Lett. 14, 1039 (1989) 22.8. F. T. S. Yu, S. J. Jutamulia, S. Yin, Introduction to Information Optics, Academic Press (2001) 22.9. F. Merkle, Aktive und adaptive Optik in der Astronomie, Phys. Blätter 44, 439 (1988) 22.10. J. W. Hardy, Adaptive Optik, Spektrum d. Wissenschaft August 1994, S. 48 22.11. An introduction to Active and Adaptive Optics, http://eso/projects/aot/introduction.html 22.12. The very Large Telescope Project, http://www.eso.org/projects/vlt/ 22.13. http://www2.keck.hawaii.edu:3636/realpublic/gen_info/kiosk/ 22.14. S. Stößel, Fourieroptik, Springer Berlin, Heidelberg 1993 22.15. W. Lauterborn, T. Kurz, M. Wiesenfeldt, Coherent Optics, 2. Auflage, Springer 1999 22.16 J.M. Vigoureux, F. Depasse, C. Girard: Superresolution of near-field optical microscopy defined from properties of confined electromagnetic waves, Applied Optics, 31, 3036 (1992)
Kapitel 25 25.1
Demtröder, W.: Experimentalphysik 2, 4. Aufl., Springer-Verlag (2006)
Namen- und Sachverzeichnis Abbe, E. 712 Abbesche Sinusbedingung 619, 635 Abbesche Theorie der Bildentstehung 712 Abbildung, aplanatische 619 Abbildungsfehler 611 – Astigmatismus 616 – Bildfeldwölbung 617 – Chromatischer 612 – Koma 615 – Sphärische Aberration 613 – Verzeichnung 618 Abbildungsgleichung 596, 600, 606, 609, 610 Abbildungsmaßstab 594 Abendrot, Morgenrot 533 Absorption – lineare 522 – nichtlineare 587 Absorptionskoeffizient 523 Achromat 616 Adaptive Optik 719 Adhäsion 128 Adiabatenkoeffizient 255, 314 adiabatische Entmagnetisierung 280 Aggregatzustand 123 Airy, G. B. 658 Airy-Formeln 658 Akkumulatoren 390 Aktive Optik 719 Aktivierungsenergie, thermische 378 Akzeptoren 380 Ampere, Definition 425 Amperemeter 373 Antiferromagnetismus 434 Antireflexschicht 662 Aperiodischer Grenzfall 177 Apertur, numerische 712 Aplanatische Abbildung 619 Äquipartitionsprinzip 310 Äquipotentialflächen 333 Arbeit 40 Archimedisches Prinzip 141 astronomische Refraktion 622 Atomaufbau 37 Atwoodsche Fallmaschine 236
Auflösungsvermögen, geometrisches – des Auges 708 – des Fernrohres 719 – des Mikroskops 711 Auflösungsvermögen, spektrales – des Gitters 670, 693 – des Interferometers 660 – des Prismas 692 Auftrieb – aerodynamischer 157 – Gasen 142 – in Flüssigkeiten 140 Auge 707 Ausdehnungskoeffizient, – thermischer 240 außerordentlicher Strahl 567 Austrittspupille 624 Babinetsches Theorem 680 Balkenbiegung 126 Bandgenerator 341 Bardeen, J. 380 Barkhausensprünge 433 barometrische Höhenformel 148 Bednorz, J. G. 381 Beersches Absorptionsgesetz 523 Bernoulli, J. 155 Bernoulli-Gleichung 154 Beschleunigung 6, 9 Beugung, Fraunhofersche 665, 719 – am linearen Gitter 667 – am Raumgitter 671 – am Rechteckspalt 666, 723 – Fourierdarstellung 724 – Laue-Gleichungen 672 Beugung, Fresnelsche 673 – am Spalt 677, 681 – an einem Draht 677 – an einer Kante 678 – an einer Kreisblende 678 Beugungsgitter, holographisches 685
822 Beweglichkeit 375 Bezugssystem 17, 115 Biegung 126 Bildentstehung 595, 603 Bildfeldwölbung 621 Bio, J.-B. 409 Biot-Savartsches Gesetz 408 Blazewinkel 671 Blendenzahl 621 Blindleistung 463 Bogenentladung 384 Boltzmann, L. 313 Boltzmannfaktor 313 Boltzmannkonstante 309 Boltzmann-Verteilung 313 Bosonen 38 Boyle, R. 254 Boyle-Mariottesches Gesetz 254 Bragg-Gleichung 673 Brechkraft 610 Brechung – Stetigkeitsbedingungen 544 Brechungsgesetz, Snelliussches 548, 594 – index 519, 540, 559, 575, 663 Brennstoffzellen 391 Brewster, D. 554 Brewsterwinkel 554 Brown, R. 139 Carnot, S. 257 Carnotscher Kreisprozes 257 Cassegrain-Anordnung 723 Cavendish, H. 95 chemisches Potential 271 chromatische Aberration 612 Clapeyron, B. P. E. 283 Clausius, R. J. E. 283 Clausius-Clapeyron-Gleichung 283 Clausius-Mosotti-Formel 348, 540 Cooper, L. R. 380 Cooperpaar 381 Coriolis, G. G. D. 116 Corioliskraft 116, 119 Coronaentladung 384 Cotton, R. A. 582 Cotton-Mouton-Effekt 582 Coulomb, Einheit 327
Namen- und Sachverzeichnis Coulomb-Eichung 407 Coulomb-Gesetz 326 Coulombkraft 326 Curie, P. 432 Curie-Konstante 432 Curie-Temperatur 432 Dampfdruck 284 – kurve 283 – erniedrigung 299 Debye-Temperatur 371, 379 Defektelektronen 378 Deformationstensor 130, 135 Deklination, Inklination 436 deutliche Sehweite 594 Diamagnetismus 430 Dichroismus 578 Dielektrikum 347 Dielektrizitätskonstante, relative 327, 345 Dielektrizitätszahl 345 Diff. Koeffizient von Gasen 149 Dioptrie 596 Dipol – elektrischer 335 – Hertzscher 491, 511 – magnetischer 431 – -moment, elektrisches 337 Dispersion 196, 522 – anomale 525 – normale 525 Dispersionsrelation 505, 522 Dissoziation, elektrolytische 383 Divergenz 752 Donatoren 379 Doppelbrechung – elektrische 580 – magnetische 582 – optische 572 – Spannungs- 583 Doppelspaltversuch, Youngscher 645 Doppler, Chr. 197 Dopplereffekt bei – elektromagnetischen Wellen – mechanischen Wellen 197
Namen- und Sachverzeichnis Drehachse, momentane 83 Drehimpuls 65 – Erhaltungssatz 67, 69, 77, 234 Drehimpulssatz 66 Drehmoment 66 Drehschwingungen 178 Drehspul-Messgeräte 416 Drehstrommaschinen 457 Drehwaage 96, 326 Dreieckschaltung 458 Driftgeschwindigkeit 377 Druck 140 Duhem, P. M. 274 Dulong, P. L. 243 Dunkelfeldverfahren 714 Durchflutungsgesetz, Amperesches 404 Dynamoprinzip 439 Echelettegitter 670 Effektivwerte ( Spannung, Strom) 456 Eichbedingung 438, 511 Einfallsebene 547 Einstein. A. 18 Eintrittspupille 621 elektrische Feldstärke 328 elektrische Leistung 370 elektrische Leitfähigkeit 369 elektrischer Dipol 335 elektrischer Kraftfluss 330 – Quadrupol 338 – Schweißapparat 470 – Strom, Einheit 425 – Widerstand 368, 375, 378 elektrochemisches Äquivalent 383 Elektrolyse 381 Elektromagnetische Wellen 519 Elektron 37 Elektronengas 375 Elektronenstoßionisation 383 Elektronenvolt 333 Elektroskop 326 Elektrostatische Feldgleichungen 350 Elementarladung 38, 325 elektrostatisches Potential 332
823 Emission – induzierte 647 – spontane 642 – stimulierte 643 Energie 40 – einer elektromagn. Welle 492 – freie 272 – kinetische 41 – magnetische 451 – mittlere 312 – potentielle 41 – relativistische 109 Energiedichte, elektrische 347 Energieerhaltungssatz 40, 43 Energiespeicher 397 Energiestromdichte 492, 513 Entelektrisierungsfeld 364 Enthalpie 253 – freie 274 Entladung – freie 272 – selbständige 383 – unselbständige 383 Entropie 262 – statistische Deutung 319 Erdbeschleunigung 118 Erdmagnetfeld 436 Erhaltungsgröße 40 Erzeugende Funktion 221 erzwungene Schwingungen 178 Euler-Lagrange Gleichungen 206, 774 Eulersche Gleichung 151 – der Variationsrechnung 771 – Kreiselgleichungen 80 – Winkel 85 Fabry-Perot-Interferometer 659 Fadenstrahlrohr 416 Fahrenheit, G. D. 238 Fallgesetze 10 Faraday– Effekt 580 – konstante 383 – Käfig 341
824 Faraday, M. 382 Faradaysches Induktionsgesetz 443 Fata Morgana 624 Feder – konstante 41 – pendel 44, 173 Feld – elektromagnetisches 428, 473, 537 – Entelektrisierungs- 361 – Gravitations- 95 – Homogenes elektrisches 337 – inhomogenes 337 – lokales elektrisches 362 – magnetisches 401 Fermat, P. 593 Fermat´sches Prinzip 594 Fermionnen 38 Fernrohr – Auflösungsvermögen 719 – Galileisches 719 – Keplersches 718 – Spiegelteleskop 719 – Vergrößerung 718 Ferrimagnetismus 434 Ferromagnetismus 401, 431 Festkörper 123 – deformierbare..124 – Dehnung 124, 132 – Scherung 127 Finesse 660 Flächensatz 96 Fluchtgeschwindigkeit 36, 45 Flüssigkeiten 139 – benetzende 143, 146 – ideale 151 – nicht benetzende 145 – zähe 151 Flüssigkeitsströmung 150 Flüssigkeitsthermometer 238 Formfaktor 526 fotorefraktiver Effekt 688 Fourieroptik 723 Fourierspektroskopie 652 – Apodisation 654 – Multiplexvorteil 654 Fraunhofersche Beugung, 665, 719
Namen- und Sachverzeichnis freie Achsen 78, 79 freie Energie 272 Freiheitsgrad 297, 309, 310, 312 Freqenzverdopplung, optische 584 Fresnel, A. J. 549 Fresnelsche Beugung 673 Fresnelsche Formeln 549 Fresnelsche Zonen 673 – Zonenplatte 673 Fresnelscher Spiegelversuch 643 Fresnelsches Biprisma 645 Fundamentalgleichung 271, Funktion – Erzeugende 221 – Hamiltonsche 216 Galilei, G. 17 Galilei-Transformation 17 Galvani, L. 389 Gasdruck 147, 314 – molekularkinetische Beziehung 147 Gasentladung – selbständige 383 – unselbständige 383 Gaskonstante, allgemeine 247 Gasthermometer 241 Gasverflüssigung 249, 268 Gauß, C. F. 330 Gaußsche Zahlenebene 758 Gaußscher Satz der Elektrostatik 331 Gay-Lussac, J. 241 Gay-Lussacscher Überströmungsversuch 253 gedämpfter Schwingkreis 479 Gefrierpunkterniedrigung 302 Gegeninduktionskoeffizient 449 Gehrke, R. 665 Generator – Drehstrom 457 – Gleichstrom 453 – Van-de-Graaf 342 – Wechselstrom 454, 459 Genzel, L 654 Geometrische Optik 597
Namen- und Sachverzeichnis Geschwindigkeit der Gaspartikel – mittlere 315, 318 – mittlere quadratische 316 – wahrscheinlichste 315, 316 Geschwindigkeit 5 – relativistisches Additionstheorem 25 Geschwindigkeitskoordinaten, – verallgemeinerte 208 Geschwindigkeitsverteilung, – Maxwellsche 314 Geschwindigkeitsfilter 423 Gesichtsfeldblende 621 Gewitterentstehung 355 Gibbs, J. W. 271 Gibbs-Duhem-Relation 275 Gibbssche Fundamentalgleichung 271 Gibbssche Phasenregel 296 Gibbssches Potential 273 Glan-Thomson-Polarisator 575 gleichförmige Geschwindigkeit 5 gleichm. beschleun. Bewegung 6 Gleichrichtung 471 – Stromglättung 472 Gleichstrommaschine 453 Gleichverteilungssatz 310 Gleitreibungskoeffizient 129 Glimmentladung 384 Glimmlicht, negatives 386 Grätz-Brückenschaltung 471 Gravitation 95 Gravitations– feldstärke 95 – konstante 95 – kraft 95 – waage 96 Greenscher Satz 755 Grenzflächenspannung 143 Grundgesetz der Mechanik 32 Gruppengeschwindigkeit 196, 505 Haftreibungskoeffizient 129 Halbleiter 379 – intrinsischer 379 – dotierte 379 Halbwertsbreite 466, 494, 658, 659, 653
825 Hall, E. H. 376 Halleffekt 376, 424 Hamilton, W. R. 205 – Bewegungsgleichungen 217 – Funktion 216, 228 Hamilton-Prinzip 205 Hamiltonsche-Theorie 215 Hamilton-Jacobi-Gleichung 223 Hamiltonoperator 219 Hamiltonsche BewegungsHamiltonsche charakteristische Funktion 228 Hamiltonsches Prinzip 205 harmonischer Oszillator 225 Hauptachsensystem 561 Hauptachsentransformation 79, 771 Hauptbrechungsindex 559, 571 Hauptdielektrizitätskonstanten 561 Hauptebene 607 Hauptsatz – erster 250 – dritter 276 – nullter 237, 238 – zweiter 262 Hauptschlussmaschine 453 Hauptschnitt 567 Hauptträgheitsmomente 79, 769 Helmholtz, H. 412 Helmholtz-Spulenpaar 412 Henry, J. 445 Hertz, H. 485 Hertzscher Dipol 489, 509 Himmelsblau 534 Himmelslicht, Polarisation des 537 Hochpass, elektrischer 464 Hochpassfilter, optisches 730 Hochtemperatur-Supraleiter 383 Hohlleiter 500 – Rechteck- 503 Hohlraumresonator 507 Hohlspiegel 595 Hologramm, 681 – Phasen- 683 – Weißlicht- 684
826 Holographischer Speicher 687 Hooke, R. 125, 139 Hooksches Gesetz 125, 136 Huygens, Chr. 663 Huygenssches Prinzip 574, 663 hydrodynamisches Paradoxon 156 hydrostatisches Paradoxon 140 Hysteresekurve 432 Ideales Gas 247, 267, 289 imaginäre Zahl 763 Imaginärteil einer komplexen Zahl 764 Immersionsflüssigkeit 712 Impedanz 462 Impuls 49 – relativistischer 105 Impulserhaltungssatz 49 Impulskoordinate, – verallgemeinerte 215 Indexellipsoid 565 Induktivität 445 – gegenseitige 449 Induktionsgesetz, Faradaysches 445 Induktionsspannung 445 induktiver Widerstand 464 Inertialssystem 17 Influenz 339 Innenpolmaschine 456 innere Energie 250 innere Kräfte 49 innere Reibung 157 Interferenz – Vielstrahl 655 – Zweistrahl 643 Interferometrie – holographische 686 Ionenleitung 381 Ionenoptik 417 Irreversibler Prozess 265 Isotherme 254 Jones-Vektoren 635 Joos, J. Chr. G. 652 Joule, J. P. 40
Namen- und Sachverzeichnis Joule-Maßeinheit 40 Joulesche Wärme 370 Joule-Thomson-Effekt 268 Kalorimeter 243 Kältemaschine 259 Kamerlingh Onnes, H. 380 kanonisch konjugierte Größen 209 Kanonische Transformation 219 Kapazität 341 – eines Koaxialkabels 342 – eines Kugelkondensators 342 – eines Plattenkondensators 342 kapazitiver Widerstand 462 Kapillarität 146 Kathodenfall 389 Kelvin, Lord (Thomson, W.) 242 Kepler, J. 96, 722 Kepplersche Sätze 96 Kerr, J. 580 Kerr-Effekt 580 Kerr-Konstante 582 Kerrzelle 582 Kirchhoff, G. R. 373, 668 Kirchhoffsche – Beugungsformel 698, 701 – Regeln 371 Klystron 484 Koaxialkabel 500 Koerzitivfeld 432 kohärente Streuung 531 Kohärenz – räumliche 641 – zeitliche 641 Kohärenzbedingung, – räumliche 642 – zeitliche 641 Kohärenzfläche 646 Kohärenzlänge 646 Kohäsion 128 Komplexe Zahlen 758 – Widerstände 463 Kompressionsmodul 124 Kondensatoren 341 – Schaltung von 344 Konfokale Mikroskopie 719
Namen- und Sachverzeichnis Konkavlinse 602, 613 Konkavspiegel 597 konservative Kraft 41 Kontaktspannung 354 Kontinuitätsgleichung – einer Flüssigkeitsströmung 152 – strömender Ladungen 368 Konvexlinse 604, Koordinatensysteme 755 – kartesische 755 – sphärische 757 – Zylinder- 756 Kräfte 33, 34 – im elektrischen Feld 327, 328, 332, 326 – konservative 41 – ortsabhängige 35 – relativistische 107 – zeitabhängige 36 – zwischen Strömen 425 Kraftfeld 39 Kraftfluss – elektrischer 330 – magnetischer 404 Kreisel 82, 89 – kräftefreier 82 – Kreiselgleichung, Eulersche 82 – symmetrischer 82 Kreiselkompass 89 Kreisprozess 251 Kriechbereich 177 kritische Temperatur 248 Kugelkondensator 342 Kugelwelle 195 Kundt, A. 194 Kundtsche Staubfiguren 194 Kurzschlussanker 458 Kurzsichtigkeit 707 Ladung – Einheit 328 – elektrische 35, 327 – freie 347 – gebundene 347 Lagrange, J. L. 205 Lagrange-Funktion 205 Lagrangesche Gleichungen 205
827 Lagrangesche Gleichungen 2. Art 215 Lagrangesche Multiplikatoren 212, 775 laminare Strömung 151 Längenkontraktion 22 Laplace, P. S. 195 Laplace-Operator 195 Laser 643 Lateralvergrößerung 594 Laue-Gleichungen 529 Laufzeitmethode 317 Lecher, E. E. 501 Lecherleitung 501 Leclanche, G. 390 Leclanche-Element 390 Legendre-Transformation 272 Leistung – elektrische 370 – mechanische 40 Leistungsanpassung 472 O/2-Plättchen 577 O/4-Plättchen 577 Leitfähigkeit, elektrische – bei Halbleitern 379 – bei Metallen 376 – Temperaturabhängigkeit 377 Lenz, H. F. E. 444 Lenzsche Regel 444 Leptonen 38 Lichtablenkg. in d. Atmosphäre 626 Lichtgeschwindigkeit 17, 18, – Messung der 498 Lichtimpulsuhr 24 Lichtstärke 696 Linke-Hand-Regel 415 Linse – als Fouriertransformator 726 – dicke 607 – dünne 602, 604 – magnetische 419 – sphärische 602 Linsenfehler 611 Linsensystem 610 – achromatisches 612 logarithmisches Dekrement 177
828 Lorentz, H. A. 415 Lorentz– feld 359 – kontraktion 23 – kraft 415 – transformation 18, 26 Lummer, O. 661 Lummer-Gehrke-Platte 661 Lupe 709, Magnetfeld, statisches 401 – Grundgleichungen 403 magnetische Feldenergie 453 magnetische Feldstärke – einer Helmholtzanordnung 412 – einer Spule 406, 414 – eines geraden Leiters 410 – eines homogenen Zylinders 406 – eines Kreisstromes 410 magnetische Linsen 417 magnetische Suszeptibilität 429 magnetischer Kraftfluss 404 magnetisches Dipolfeld 401 magnetisches Längsfeld 417 Magnetisches Vektorpotential 407 Magnetisierung 429 Mariotte, E. 148, 254 Maschenregel 371 Masse 7, 100 – schwere 32 – träge 32 Masse-Energie-Äquivalenz 109 Massenschwerpunkt 51 Massenwirkungsgesetz 293 Massenpunkt 7, 33, 52 Massenzunahme, relativistische 105 Maßsysteme 327 Matrix, – Abbildungs- 633 – Brechungs- 627 – Translations- 628 Maxwell, J. C. 477 Maxwell-Gerade 248, 268
Namen- und Sachverzeichnis Maxwell-Boltzmannsche Geschwindigkeitsverteilung 314 Maxwell-Gleichungen 473, 476, 537 – Differentialform 476 – Integralform 476 Maxwell-Relationen 271 Mechanik, analytische 205 Mehrschichtenbedampfung 663 Meißnersche Rückkopplungsschaltung 484 Meridionalebene 616 Metalle – spezifischer Widerstand 369 – Wärmeleitzahl 244 Metazentrum 142 Michelson, A. A. 18 Michelson-Interferometer 648 Michelson-Morley-Experiment 650 Mikroskop 417, 710 – Abbesche Theorie 712 – Auflösungsvermögen 712 – Konfokales 714 – Nahfeld- 716, 734 – numerische Apertur 712 – Phasenkontrastverfahren 713 Mikrozustände 320 Millikan-Versuch 352 Mischungsentropie 292 mittlere freie Weglänge 317 Mode 508 Modendichte 510 Moivresche Formeln 759 Momentanbeschleunigung 6, 9 Momentangeschwindigkeit 5, 8 Monochromatoren 688 – Gitter- 689 – Lichtstärke 695 – Lineardispersion 689 – Prismen- 689 Mouton, H. 585 Müller, K. A. 381 Multipolentwicklung 338, 357 Mustererkennung, optische 733
Namen- und Sachverzeichnis Nabla-Operator 753 Nahfeldmikroskopie 716 – Fourieroptische Darstellung 733 Nahordnung 123 natürliche Variabeln 272 Navier-Stokes-Gleichung 162 Nebenbedingungen 207, 777 – holonom 777 – rheonom 777 – skleronom 777 Nebenschluss-Maschine 455 Nernst, W. 276 Nernstscher Satz (3. Hauptsatz) 276 Netzwerke 464 Neutralitätsbedingung, Halbleiter 380 Neutron 37 Newton, I. 31 Newtonsche Abbildungsgleichung 606 Newtonsche Axiome 31 nichtlineare Optik 586 Nickel-Cadmium-Batterie 391 Nicolsches Prisma 577 n-Leitung 380 Normalen– Ellipsoid 565 – geschwindigkeit 567 Normalkoordinaten 186 Normalschwingungen 186 numerische Apertur 712 Nutationsbewegung 84, 88 Nutationskegel 84 Oberflächenenergie, spezifische 143 Oberflächenspannung 143 Oeffnungsblende 620 Objektiv 710 Ohm, G. S. 376 Ohm, Maßeinheit 369 Ohmsches Gesetz 369 Okular 710 Optik – adaptive 720 – aktive 720 – geometrische 593
829 Optik – nichtlineare 586 optisch einachsig 566 optisch negativer (positiver) Kristall 567 optisch zweiachsig 571 optische Aktivität 578 optische Filterung 729 optische Frequenzmischung 585 optische Frequenzverdopplung 584 optische Mustererkennung 733 optische Speicher 687 optische Weglänge 594 optisches Hochpassfilter 730 optisches Tiefpassfilter 730 ordentlicher Strahl 567 Ortsvektor 7 osmotischer Druck 298 Oszillator – gekoppelte 185 – harmonischer 173, 174, 225 Otto-Motor 260 Parabolspiegel 597 Paradoxon – hydrodynamisches 156 – hydrostatisches 140 Pascal, B. 149 Pascal, Maßeinheit 149 Parallelschaltung – von Kondensatoren 344 – von Widerständen 372 Parallelschwingkreis 478 Paramagnetismus 431 paraxialer Strahlengang 595 Peltier, J. Ch. 396 Peltiereffekt 396 Permeabilität 402, 429 Permeabilitätskonstante 402 perpetuum mobile – 1. Art 251 – 2. Art 256 Petit, A. T. 243 Phase, thermodynamische 123 Phasenanpassung 585
830 Phasendiagramm 288 Phasengeschwindigkeit 189 Phasengitter 672 Phasenkontrastverfahren 713 – Fourierdarstellung 732 Phasenübergang 1. Art 281 Phasendiagramm 288 Phonon 379 Planck, M. 38 Planetenbahnen 96 planparallele Platte 598 Plasmafrequenz 542 Plattenkondensator 342 Poisson, D. 255 Poisson-Fleck 671 Poisson – Gleichung 255, 311, 332, 333 – Klammer 228 – Poisson-Zahl 125 Polarimeter 581 Polarisation – bei Brechung, Reflexion 551 – des Sonennlichtes 535 Polarkoordinaten 761 Polarisation – dielektrische 346 – elliptische 573 – lineare 573 – Orientierungs- 346, 349 – Verschiebungs- 346 – zirkulare 573 Polarisator – Brewsterwinkel 574 – dichroitischer 576 – Glan-Thompson 575 – O/4-Plättchen 576 – Nicolsches Prisma 575 Polarisationsdreher 577 Polarisierung 347 positive Säule 387 Potential 42, – chemisches 271 – elektrostatisches, 332 – thermodynamisches 289 Potentialstreuung 101 Potentialströmung 166
Namen- und Sachverzeichnis Poynting, J. H. 492 Poynting-Vektor 492, 513 Präzession 86 Prisma 599 – Auflösungsvermögen 692 – brechender Winkel 599 – minimale Strahlablenkung 601 Prismenspektralapparat 693 Proton 37 Punktladung 328, 334 Quadrupol – elektrischer 338, 357 Quarks 38 quasistatische Näherung 443 Querkontraktionszahl 125 Quincke, G. H. 194 Quinckesches Resonanzrohr 194 Raketengleichung 60 Raoultsche Gesetze 301, 302 Rastpolkegel 85 Raumfrequenz 724 räumliche Kohärenz 641 Rayleigh, Lord, J. W. 659 Rayleigh-Kriterium 659 razemisches Gemisch 579 reduzierte Masse 57 reduzierte Wärmemenge 264 Reflexions– Echelettegitter 670 – gesetz 546, 596 – gitter 668, 691 – holographisches 689 – Laminargitter 654 – Sinusgitter 685 – Vermögen 551 Reflexionskoeffizient 550 reflexmindernde Schichten 662, Refraktometer 558 Regel von Dulong-Petit 243 Regenbogen 624 Reibungselektrizität 339 Reibungskraft 128, 150, 157, 160 – Gleitreibung 129
Namen- und Sachverzeichnis Reibungskraft, Forts. – Haftreibung 128 – Rollreibung 129 Rekombinationsrate 385 Rekonstruktionswelle 687 Relativgeschwindigkeit 8 relativistische Massenzunahme 105 Relativitätsprinzip – Einsteinsches 18 – Newtonsches 17 Relegation von Eis 287 Resonanzstreuung 526 Restwiderstand 380 Retardierung 491 reversibler Prozess 256 Reynolds, O. 151 Reynoldszahl 151 Römer, O. 498 Röntgen – Bremsstrahlung 496 – Röhre 496 Röntgen, W. C. 496 Rollreibungskoeffizient 129 Rotation und Translation – Gegenüberstellung 90 Rotationsenergie 89 rote Sonne 535 rotierendes Bezugssystem 116 Rotor 454 Rubens, H. 194 Rubenssches Flammenrohr 194 Ruheenergie 110 Ruhemasse 107 Rutherfordstreuung 101 Sagittalebene 616 Savart, F. 409 Schallgeschwindigkeit, Best. der 194 Schärfentiefe 620 Scheinwiderstand 464 Schermodul 127 Schmelzdruckkurve 287 Schmelzofen, elektrischer 470 Schmelzpunkterniedrigung 288 Schmelzwärme, spezifische 286
831 Schriefer, J. R. 380 Schubmodul 127 Schubspannung 127 Schwebung 187 Schweißapparat, elektrischer 469 Schweredruck 140 – der Gase 140 – der Lufthülle 147 – einer Flüssigkeit 140 Schwerkraft 32, 152 Schwerpunkt 51, 142 Schwerpunktsystem 58 Schwimmen 141 Schwingkreis – elektromagnetischer 478, 480 – Energiebilanz 181 – Entdämpfung 483 – gekoppelter 481 – Parallel- 478 – Serien- 480 Schwingungen – elektromagnetische 477 – erzwungene mechanische 178 – freie gedämpfte 174 – harmonische 173 – mechanische 173 – Überlagerung von 188 Seebeck, Th, J. 396 Seebeck-Effekt 396 Sehwinkel 594 Selbstfokussierung v. Licht 587 Selbstinduktion 445 Selbstinduktionskoeffizient 445 Siedepunkterhöhung 302 Siedeverzug 249 Solarzelle 393 Spaltfunktion 666 Spannung – elastische 125 – elektrische 332 – Normal- 135 – Tangential- 135 – Zug- 126 Spannungs-Dehnungs-Diagramm 125 Spannungsmessung 373 Spannungstensor 135
832 Spannungsüberhöhung 448 Spektralapparat 689 Spektralbereich, freier 660, 670 Spiegel – dielektrischer 663 – ebener 598 – elliptischer 597 – isometrie 581 – konkaver 595 – konvexer 595, 613 – Parabol- 597 – sphärischer 595, Spiegelteleskop 719, 720 Stabmagnet 403 Stator 452 Staubabscheider 356 Staudruck 154 Steinerscher Satz 74 Sternschaltung 458 Stetigkeitsbedingungen 544 Stokes, G. G. 159 Stokesscher Satz 756 Stokessches Reibungsgesetz 159 Störstellenleitung 379 Stoß 54 – elastischer 55 – im Schwerpunktsystem 59 – inelastischer 56 – parameter 57 – schiefer 57 – zentraler 55 Strahlenellipsoid 564, 569 Strahlenfläche 574 Strahlenoptik 593 Strahlgeschwindigkeit 568 Strahlteiler 652 Strahlungsdämpfung 493 Streuung 525 – an Polysterolkügelchen 526 – elastische 525 – inelastische 525 – inkohärente 526, 531 – kohärente 526, 529 – Mie- 526 – Rayleigh- 526 – Röntgen- 525
Namen- und Sachverzeichnis Strömung 151 – ideale 151 – laminare (schlichte) 160 – stationäre 151 – turbulente 151 Stromdichte, elektrische 367 Stromlinien 150 Strommessgeräte 373 Stromquellen 388 Stromrichtung, technische 367 Stromschleife, Magnetfeld einer 410 Stromstärke, Definition 367 Strukturfaktor, statischer 526 Sublimationsdruckkurve 287 Supraleitung 380 Suszeptibilität – dielektrische 345 – magnetische 429 – nichtlineare 584 Swing-by-Methode 101 Synchrotronstrahlung 496 Temperatur 237, – absolute 242 – kritische 248 Temperatureinheit 238, 242 Temperaturmessung 238 Temperaturskalen 238, 267 TE, TM-Welle 507 Tensor 761 – Addition von 760 – adjungierter 767 – antisymmetrischer 763 – Diagonalisierung 766 – Multiplikation von 767 – symmetrischer- 763 Tensorellipsoid 764 Tesla, Maßeinheit 402 Tesla, N. 402 thermodynamische Phase 123 thermodynamische Potentiale 270, 275 289 thermoelektrische Spannungsreihe 398
Namen- und Sachverzeichnis Thermoelement 395 Thermometer 238 – Bimetall- 240 – Flüssigkeits- 238 – Gas- 239 – Strahlungs- 238 – Suszeptibilitäts- 239 – Widerstands- 238, Thermospannung 396 Tesla, N. 402 Tiefpass, elektrischer 465 Tiefpassfilter, optisches 729 TM-Welle 509 Torsionsmodul 127 Totalreflexion 555 – freie 272 – Grenzwinkel der 556 – verhinderte (frustierte) 557 Tragflügel, Auftrieb des 157 Trägheits– ellipsoid 79 – kraft 115, 119 – moment 72, 76 – tensor 78 Transformator 467 – idealer 467 Transmissionsvermögen 551 Trommelanker 452 Überschallgeschwindigkeit 198 Überschallknall 199 unselbständige Entladung 385 Van-de-Graaff-Generator 342 Van der Waals, J. D. 248 – Binnendruck 248 – Eigenvolumen 248 – Zustandsgleichung 248 van´t Hoff 298 van´t Hoffsches Gesetz 298 Varationsrechnung, Grundzüge 768 – mit Nebenbedingungen 772 – ohne Nebenbedingungen 769
833 Vektor 739 – Addition 740 – axialer 740 – Betrag 739 – polarer 740 – Differentiation 745 – skalare Multiplikation 741 – vektorielle Multiplikation 742 Vektoranalysis, Elemente der 751 Vektorfeld – Divergenz 747 – Gradient 746 – Rotation 749 Vektorpotential, magnetisches 409 verallgemeinerte Koordinaten 207 – Impulse 215 – Kräfte 213 Verbundmaschine 456 Verdampfungswärme 285 Verflüssigung von Gasen 269 Verformung eines Festk. 124, 130 Verschiebungsdichte 351 Verschiebungsstrom 475 Verzeichnung 618 Vielstrahlinterferenz 655 Virialkoeffizient 250 Viskosimeter 159 – Kugelfall- 159 – Kapillar- 161 Viskosität 158 – dynamische 158 Virialkoeffizient 250 Volt, Maßeinheit 333 Volta, A. 333 Voltmeter 373 Wärme – äquivalent, mechanisches 244 – kapazität 242 – Schmelz- 302, 305 – spezifische 242 – Verdampfungs- 284 Wärmekraftmaschine 257, 286 Wärmeleitzahl 244, 246 Wärmepumpe 259
834 Waltenhofensches Pendel 444 Wasserstrahlpumpe 156 Watt, J. 370 Watt, Maßeinheit 370 Wechselspannung und -strom – Effektivwerte 457 – komplexe Darstellung 461 Wechselstromkreise 460 Wechselstrommaschinen 456 Wechselwirkung – elektromagnetische 38 – Gravitations- 38 – schwache 38 – starke 38 Weglänge, mittlere freie 318 Weisssche Bezirke 433 Weitsichtigkeit 707 Welle – ebene 490, 562 – elektromagnet. 485, 494, 541, 544, 562 – harmonische 173, 190, 490 – Longitudinalwelle 173 – mechanische 188 – Reflexion 192, 193 , 544 – stehende 191 – Transversalwelle 173, 487 Wellengleichung 188, 486, 540 Wellengruppe 196, 197 Wellennormale 572 Wellenwiderstand 502 Wellenzahl 190 Wheatstonesche Brücke 376 Widerstand – induktiver 462 – kapazitiver 462 – spezifischer 369 – Widerstände, Schaltung von 372 Wienfilter 423 Winkeldispersion 690 Winkelgeschwindigkeit 71 Wirbelstärke 16 Wirbelstrombremse 444 Wirbelvektor 164 Wirkung 205
Namen- und Sachverzeichnis Wirkungsfunktion 223 – verkürzte 228 Wirkungsgrad 259 Wirkungsquerschnitt 318 Wirkwiderstand 464 Wölbspiegel 601 Wurf, schräger 10 Xerografie 357 Young, T. 645 Youngscher Doppelspaltversuch 645 Zahnradmethode 501 Zeigerdiagramm 463 Zeitdilatation 23 zentraler Stoß 55 Zentrifugalkraft 116, 118, 119 Zentripetalbeschleunigung 12 Zernike, F. 714 Zerreißgrenze 125 Zerstäuber 156 Zerstreuungs (Konkav)linse 610, 613 zirkulare Polarisation 573 Zirkulation 165 Zugspannung 126, 135 Zustandsänderung 252 – adiabatische 254, 653 – irreversible 256 – isobare 252 – isochore 252 – isotherme 258 – reversible 256 Zustandsdichte 505, 511 Zustandsgleichung für – ideales Gas 247 – reales Gas 248 Zustandsgröße 247, 265 Zweistrahlinterferenz 647 zyklische Variabeln 209