Atom- und Molekülphysik Gerd Fußmann Vorlesung an der Humboldt-Universität zu Berlin, Sommersemester 2002
1
GRUNDLAGE...
68 downloads
1217 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Atom- und Molekülphysik Gerd Fußmann Vorlesung an der Humboldt-Universität zu Berlin, Sommersemester 2002
1
GRUNDLAGEN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1 BEZIEHUNG DER ATOMPHYSIK ZU ANDEREN BEREICHEN ................................................................5 1.2 HISTORISCHE ÜBERSICHT .........................................................................................................5 1.3 DER ATOMARE AUFBAU DER MATERIE........................................................................................7 1.3.1 Einfache Beobachtungen zur Teilbarkeit der Materie ..............................................................7 1.3.2 Atomtheorie und die Bausteine der Materie ..........................................................................7 1.3.3 Elementarteilchen...........................................................................................................9 1.3.4 Zur Beobachtung der Atome ........................................................................................... 12 1.3.5 Größenbestimmung der Atome........................................................................................ 13 1.3.6 Quantelungen .............................................................................................................. 14
2
MASSENANALYSE DER TEILCHEN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 7 2.1 THOMSONS ENTDECKUNG DES ELEKTRONS................................................................................ 17 2.2 ERSTE MASSENSPEKTROMETER................................................................................................ 18 2.2.1 Thomsons Parabelspektrometer....................................................................................... 18 2.2.2 Massenspektrometer nach Dempster................................................................................. 19 2.3 MODERNE MASSENSPEKTROMETER .......................................................................................... 21 2.3.1 Doppelfokussierende Massenspektrometer ......................................................................... 21 2.3.2 Quadrupol-Massenfilter.................................................................................................. 21 2.3.3 Paul-Falle und Ionen-Zyklotron-Resonanz-Spektrometer ...................................................... 23 2.3.4 Flugzeitspektrometer..................................................................................................... 24 2.4 EINSTEINS MASSEN-ENERGIE-ÄQUIVALENT .............................................................................. 24
3
ATOMARE STOßPROZESSE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 6 3.1 DAS KONZEPT DES WIRKUNGSQUERSCHNITTS ............................................................................ 26 3.2 DIE RUTHERFORDSCHE STREUFORMEL...................................................................................... 28 3.2.1 Zusammenhänge zwischen Relativ-, Schwerpunkt- und Laborsystem...................................... 32 3.2.2 Diskussion der Rutherford-Streuformel ............................................................................. 35 3.2.3 Rutherford Rückstreung................................................................................................. 37 3.3 EINIGE WICHTIGE STOßPROZESSE ............................................................................................ 37 3.3.1 Elastische Streuung von Elektronen................................................................................. 38 3.3.2 Anregung von Atomen durch Elektronenstoß..................................................................... 39 3.3.3 Ionisation durch Elektronenstoß ...................................................................................... 41 3.3.4 Photoionisation ........................................................................................................... 41 3.3.5 Ladungsaustauschprozesse.............................................................................................. 42 3.3.6 Zusammenfassung........................................................................................................ 42 3.4 FREIE WEGLÄNGEN UND MITTLERE REAKTIONSRATEN................................................................ 43
4
ATOMSPEKTREN UND DIE GRENZEN DER KLASSISCHEN MECHANIK . . . . . . . . . . . . . . 4 7 4.1 GRUNDLAGEN DER SPEKTROSKOPISCHEN ANALYSE ..................................................................... 47 4.1.1 Emission- und Absorptionslinien .................................................................................... 47 4.1.2 Moderne Spektroskopie ................................................................................................. 47 4.1.3 Fluoreszenz................................................................................................................. 49 4.1.4 Dopplerprofile ............................................................................................................. 50 4.1.5 Laserinduzierte Fluoreszenz ............................................................................................ 51 4.1.6 Bedingungen für die resonante Fluoreszenz ........................................................................ 51 4.1.7 Der Mößbauer-Effekt..................................................................................................... 52 4.2 DIE SPEKTREN DES WASSERSTOFFS........................................................................................... 53 4.2.1 Bohrs Postulate und sein Atommodell.............................................................................. 55 4.3 SPEKTREN DER ALKALI-ATOME .............................................................................................. 59 4.4 DER VERSUCH VON FRANCK UND HERTZ................................................................................... 61
5
TEILCHEN UND WELLEN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3
G. Fussmann , Atomphysik SS 2002
2
5.1 INTERFERENZEN VON LICHT UND TEILCHEN .............................................................................. 63 5.2 HARMONISCHE WELLEN UND WELLENPAKETE ........................................................................... 66 5.3 FOURIER-ANALYSE UND UNSCHÄRFERELATIONEN ...................................................................... 68 5.4 KLASSISCHE UND QUANTENMECHANISCHE FELDER ..................................................................... 71 5.4.1 Elektromagnetische Wellen ............................................................................................ 71 5.4.2 Materiewellen und Photonen........................................................................................... 72 5.4.3 Zerfließende Wellenpakete.............................................................................................. 73 5.5 WELLE-TEILCHEN-DUALISMUS ............................................................................................... 75 5.5.1 Beugung und Interferenz................................................................................................. 75 5.5.2 Beugung am Einzelspalt ................................................................................................ 76 5.5.3 Interferenz am Doppelspalt............................................................................................. 76 5.5.4 WelcherWeg?-Experimente............................................................................................. 79 6
DIE SCHRÖDINGER-GLEICHUNG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2 6.1 HEURISTISCHE HERLEITUNG DER WELLENGLEICHUNG................................................................. 82 6.2 DIE MATHEMATISCH-BEGRIFFLICHE BASIS DER QUANTENMECHANIK .............................................. 84 6.2.1 Die Wellenfunktion ...................................................................................................... 84 6.2.2 Mittelwerte und Erwartungswerte..................................................................................... 86 6.2.3 Operatoren .................................................................................................................. 90 6.3 DER HARMONISCHE OSZILLATOR ............................................................................................. 92 6.4 DER TUNNELEFFEKT ............................................................................................................. 95
7
DAS WASSERSTOFFATOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 0 0 7.1 7.2 7.3
8
DIE SCHRÖDINGER-GLEICHUNG FÜR DAS ZENTRALFELD ............................................................ 100 DER BAHNDREHIMPULS ....................................................................................................... 104 EIGENZUSTÄNDE DER ENERGIE UND EIGENFUNKTIONEN DES WASSERSTOFFATOMS ......................... 106
SPIN UND MAGNETISCHE MOMENTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 8.1 BAHNDREHIMPULS UND MAGNETISCHES DIPOLMOMENT............................................................. 111 8.2 SPIN DER ELEKTRONEN ....................................................................................................... 113 8.2.1 Der Stern-Gerlach-Versuch ........................................................................................... 113 8.2.2 Der Spin als halbzahliger Drehimpuls ............................................................................ 114 8.2.3 Das magnetische Spinmoment...................................................................................... 115 8.2.4 Spinoperatoren und Zustandsvektoren............................................................................. 117 8.2.5 Die Pauli-Gleichung ................................................................................................... 120 8.3 SPINRESONANZEN .............................................................................................................. 121 8.3.1 Theorie der Spinresonanz ............................................................................................. 122 8.3.2 Anwendungen............................................................................................................ 126
9
DAS WASSERSTOFFATOM IM DETAIL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 9 9.1 9.2 9.3
10
SPIN-BAHN-WECHSELWIRKUNG UND FEINSTRUKTUR ................................................................ 129 HYPERFEINSTRUKTUR.......................................................................................................... 134 QUANTENELEKTRODYNAMISCHE EFFEKTE: DIE LAMB-SHIFT ...................................................... 135 VEKTORADDITION DER DREHIMPULSE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 9
10.1 RUSSEL-SAUNDERS-KOPPLUNG UND J-J-KOPPLUNG ................................................................... 139 10.1.1 Nomenklatur der Terme ............................................................................................... 141 10.1.2 Spektroskopischer Wechselsatz und 3. Hundsche Regel...................................................... 142 10.1.3 Statistische Gewichte.................................................................................................. 142 10.1.4 Übergang von LS- zur jj-Kopplung................................................................................ 143 10.2 DER LANDÉ-FAKTOR .......................................................................................................... 143 10.3 CLEBSCH-GORDON-KOEFFIZIENTEN UND WIGNER-3J-SYMBOLE .................................................. 145 11 11.1
OPTISCHE STRAHLUNGSÜBERGÄNGE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 9 ZEITABHÄNGIGE QUANTENMECHANISCHE STÖRUNGSRECHNUNG ................................................ 149
G. Fussmann , Atomphysik SS 2002
3
11.2 INDUZIERTE ABSORPTION UND EMISSION ................................................................................ 150 11.3 DIE AUSWAHLREGELN BEI DIPOLSTRAHLUNG .......................................................................... 152 11.3.1 Klassische Dipolstrahlung............................................................................................ 152 11.3.2 Quantenmechanische Dipole......................................................................................... 154 11.3.3 Höhere Multipolstrahlung............................................................................................ 159 11.4 NACHWEIS DES PHOTONENSPINS ........................................................................................... 160 11.5 SCHWARZKÖRPERSTRAHLUNG UND SPONTANE EMISSION ........................................................... 161 11.6 WEISSKOPF-WIGNER THEORIE DER SPONTANEN EMISSION .......................................................... 165 11.7 DER LASER........................................................................................................................ 166 11.7.1 Schwellwertbedingung................................................................................................. 167 11.7.2 Modenselektion.......................................................................................................... 168 11.7.3 Rubinlaser ................................................................................................................ 169 11.7.4 Vier-Niveau-Laser....................................................................................................... 170 11.7.5 Farbstofflaser............................................................................................................. 170 11.7.6 Maser und kurzwellige Laser......................................................................................... 171 11.7.7 Laseranwendungen in der Atomphysik............................................................................ 172 12
ATOME IN STATISCHEN FELDERN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 7 6
12.1 TERMAUFSPALTUNG IM MAGNETFELD .................................................................................... 176 12.1.1 Level-Crossing und Hanle-Effekt................................................................................... 178 12.2 TERMAUFSPALTUNG IN ELEKTRISCHEN FELDERN UND ELEKTRISCHE DIPOLE .................................. 179 13 13.1 13.2 13.3 14 14.1 14.2 14.3 14.4 14.5 15
MEHRELEKTRONEN-ATOME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 8 2 DAS PAULI-PRINZIP UND DIE SYMMETRIE DER WELLENFUNKTIONEN ........................................... 182 DAS PERIODENSYSTEM DER ELEMENTE................................................................................... 184 TERMSYSTEMATIK .............................................................................................................. 186 RÖNTGENSTRAHLUNG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 9 0 ERZEUGUNG UND NACHWEIS VON RÖNTGENSTRAHLUNG .......................................................... 190 BREMSSTRAHLUNG UND CHARAKTERISTISCHE STRAHLUNG ........................................................ 191 DIE CHARAKTERISTISCHEN RÖNTGENSPEKTREN ....................................................................... 192 RÖNTGENABSORPTION UND STREUUNG .................................................................................. 195 DER COMPTON-EFFEKT........................................................................................................ 197 EINFÜHRUNG IN DIE PHYSIK DER MOLEKÜLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 9 9
15.1 WAS SIND MOLEKÜLE?........................................................................................................ 199 15.2 DIATOMARE MOLEKÜLE...................................................................................................... 199 15.3 DAS H+2-MOLEKÜL ............................................................................................................ 199 15.4 MOLEKULARE BINDUNGEN .................................................................................................. 202 15.4.1 Kovalente Bindung in homonuklearen Molekülen............................................................. 202 15.4.2 Ionische Bindung in heteronuklearen Molekülen............................................................... 203 15.4.3 Andere Bindungen....................................................................................................... 204 15.5 SCHWINGUNGS - UND ROTATIONSZUSTÄNDE .......................................................................... 205 15.6 DIE MOLEKULAREN SPEKTREN.............................................................................................. 206 15.6.1 Rotationsspektren:...................................................................................................... 209 15.6.2 Vibrations-Rotationsspektren........................................................................................ 209 15.6.3 Molekülbanden in elektronischen Übergängen.................................................................. 211 15.6.4 Das Franck-Condon Prinzip.......................................................................................... 211 15.7 HYBRIDISIERUNG IN MEHRATOMIGEN MOLEKÜLEN .................................................................. 213 16
LITERATUR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1 9
G. Fussmann , Atomphysik SS 2002
4
Grundlagen
1 1.1
GRUNDLAGEN Beziehung der Atomphysik zu anderen Bereichen
Grundlagen Atomphysik Physik
Technik
Anwendungen
Festkörperphysik (Kristalle, Supraleiter, Halbleiter )
Quantenelektronik (Laser, Atomuhren)
Eichungen (1 V, 1 m, 1 s etc., Fundamentalkonst.)
Chemische Physik (Molekülbildung)
Medizinische Technik (Kernspintomographie)
Weltraumforschung ( Atmosphäre)
Astrophysik (Atomspektroskopie)
Computertechnik (Lasertechniken, Chips)
Umweltschutz (Verunreinigungsnachweis)
Plasmaphysik (Ionen-Spektroskopie)
Energieerzeugung (Kernenergie, Solarenergie)
Biophysik (komplexe Moleküle)
1.2 Historische Übersicht Demokrit (460-371 v. Chr.) Begründet den antiken Atombegriff mit den Worten: "Die Menschen glauben, es gäbe Weißes und Schwarzes, Süßes, Bitteres und anderes derartiges, in Wahrheit aber gibt es nur Atome und das Nichts. Die Atome1 sind nun allesamt winzige Körper ohne Qualitäten, das Leere ist eine Art Raum, in dem diese Körper, immerfort aufwärts und abwärts bewegt, entweder sich miteinander verbinden oder stoßen und weggeschleudert werden. Sie trennen und verbinden sich wiederum miteinander, diesen Prozessen gemäß. Daraus lassen sie sowohl alle sonstigen Verbindungen als auch unsere Körper und deren Empfindungen und Wahrnehmungen entstehen." Isaac Newton (1643-1727) In Erweiterung des Gedankens von Demokrit schreibt er: "Nach allen Betrachtungen ist es mir wahrscheinlich, daß Gott im Anfang der Dinge die Materie in massiven, festen, harten, undurchdringlichen und bewegten Partikeln schuf, von solcher Größe und Gestalt, mit solchen Eigenschaften und in solchem Verhältnis zum Raum, wie sie zu dem Endzweck führten, für den er sie gebildet hatte, daß ferner diese primitiven Teilchen, weil sie fest sind, unvergleichlich härter sind als irgendwelche aus ihnen zusammengesetzte poröse Körper, ja so hart, daß sie nimmer verderben oder zerbrechen können, denn keine Macht von gewöhnlicher Art würde im Stande sein, das zu zerteilen, was Gott selbst bei der ersten Schöpfung als Ganzes erschuf. 1 von griech. atomos = unzerteilbar
G. Fussmann , Atomphysik SS 2002
5
Grundlagen Solange die Teilchen als Ganzes bestehen bleiben, können sie zu allen Zeiten Körper ein und derselben Natur und Bauart zusammensetzen; sollten sie aber abgenutzt werden oder zerbrechen, so würde sich die Natur der von ihnen abhängenden Körper verändern. Wasser und Erde, zusammengesetzt aus alten abgenutzten Partikeln und Bruchstücken von solchen, besäßen nicht dieselbe Natur und Textur, wie Wasser und Erde, die beim Anbeginn der Dinge aus ganzen Partikeln zusammengesetzt waren. Damit also die Natur von beständiger Dauer sei, ist der Wandel der körperlichen Dinge ausschließlich in die verschiedenen Trennungen, neuen Vereinigungen und Bewegungen dieser permanenten Teilchen zu verlegen, da zusammengesetzte Körper dem Zerbrechen ausgesetzt sind, nicht etwa mitten durch die festen Teilchen, sondern da, wo diese aneinander gelagert sind und sich nur in wenigen Punkten berühren." John Dalton (1802) gilt als der Begründer der neuzeitlichen Atomtheorie. Er entdeckt das Gesetz der multiplen Proportionen: Vereinigt sich das Element A in mehr als einem Verhältnis mit dem Element B, so stehen die Gewichtsmengen von B, die sich mit konstanten Gewichtsmengen von A vereinigen, im Verhältnis ganzer Zahlen. Ein Beispiel hierfür zeigt die Tabelle 1-1 für die fünf Oxide des Mangans.
Mangan(II)oxyd Mangan(III)oxyd Mangan(IV)oxyd Mangan(VI)oxyd Mangan(VII)oxyd
Element A
Element B
2 Mn 2 Mn 2 Mn 2 Mn 2 Mn
2O 3O 4O 6O 7O
Verhältnis A:B 2:2 2:3 2:4 2:6 2:7
Formel Mn O Mn2 O3 Mn O2 Mn O3 Mn2 O7
Tabelle 1-1: Oxide des Mangans Amadeo Avogadro (1811) : Begründet die Molekültheorie der Gasgesetze. In gleichen Gasvolumina befindet sich (bei gleichem Druck und Temperatur) die gleiche Anzahl von Atomen bzw. Molekülen: NA = Avogadro- oder Loschmidtzahl = 6,022◊ 10 23 / mol (2 Proust, J. L.(1815) Mendeleev, D. I. (1868) Balmer, J. (1885) Röntgen, W. C. (1895) Bequerel, (1896) Zeeman, P. (1896) Thomson, J. J. (1897) Wien,W. (1900)
Massen = Vielfache des Wasserstoffs Periodensystem der Elemente Formel für H-Strahlung Entdeckung der "X-Strahlung" Entdeckung der Radioaktivität Aufspaltung der Spektrallinien im Magnetfeld Kathodenstrahlen = Elektronen Kanalstrahlen = positive Ionen
Abb. 1-1: Gasentladungsröhre
2 1 mol= Molekulargewicht in Gramm
G. Fussmann , Atomphysik SS 2002
6
Grundlagen Planck, M. (1900) Einstein, A. (1905) Millikan, R. A. (1911) v. Laue, M. (1912) Stark, J. (1913) Rutherford, E. (1913) Franck-Hertz (1913) Bohr, N. (1913) Einstein, A. (1917) Compton, A. H. (1923) Stern-Gerlach (1924) de Broglie, L. (1924) Pauli, W. (1925) Bose, S., Einstein, A (1924-25) Schrödinger, E. (1926) Uhlenbeck-Goudsmit (1926) Davisson-Germer (1927) Heisenberg, W. (1927) Dirac, H. P. (1928) Anderson (1932) Chadwick (1932) Ruska, E (1932) Rabi, I. I. (1932) Hahn-Strassmann (1938) Lamb-Retherford (1952) Gordon, Zeiger, Townes (1955) Maiman, T. H. (1960) Mößbauer, R. (1961) Paul, W. (1965) Binning-Rohrer (1984) Wieman C.E, Cornell E. A. (1995) 1.3 1.3.1
begründet die Quantentheorie (Hohlraumstrahlung) E = mc2, Photoeffekt Quantelung der Ladung Röntgenbeugung an Kristallen Aufspaltung der Spektrallinien im E-Feld Größe des Atomkerns Quantelung der Energie Atommodell Induzierte Emission Compton-Effekt (Photonen haben Teilchencharakter) Quantelung des Drehimpulses (Spin) Postulat: Welleneigensch. d. Materie "Pauli-Verbot" Bose Einstein Statistik Wellengleichung der Quantenmechanik Postulat des Spins Welleneigenschaft d. Elektrons Unschärferelation Postulat des Positrons Nachweis des Positrons Entdeckung des Neutrons Elektronenmikroskop Spinresonanz Entdeckung d. Kernspaltung QED-Effekte am H-Atom NH3-Maser erster Laser Emission rückstoßfreier g-Quanten Quadrupol-Ionenfalle Raster-Tunnel-Mikroskop Nachweis der Bose-Einstein Kondensation am 87Ru
Der atomare Aufbau der Materie EINFACHE BEOBACHTUNGEN ZUR TEILBARKEIT DER MATERIE
∑ ∑ ∑
Goldschmiede hämmern Goldfolien bis zu 10-5 cm Dicke Ölhaut auf Wasser verdünnt sich bis auf 2 x10-7 cm Dicke Eine Menge von 0,01mm3 Fuchsin färbt 1 Liter Weingeist noch deutlich rot, d.h. 10-8 mm3 pro 1mm3
∑ Merkaptan ist noch riechbar in Konzentrationen von 2 x 10-14 l pro 1 Liter Luft Folgerung: Falls es Atome gibt, so müssen sie sehr klein (<10-7 cm ) und i. a. ihre Zahl riesig groß 20 sein (>10 m-3). 1.3.2
ATOMTHEORIE UND DIE BAUSTEINE DER MATERIE
Im Gegensatz zur der früher akzeptierten Kontinuumstheorie geht die Atomtheorie (Atomistik) davon aus, daß alle Materie aus kleinsten Bausteinen zusammengesetzt ist. Im Laufe der letzten 100 Jahre hat sich die Atomtheorie bestätigt. Die Kontinuumstheorie spielt jedoch nach wie vor in zahlreichen Anwendungen eine bedeutende Rolle als Näherungstheorie (z.B. Festigkeits- und Strömungslehre).
G. Fussmann , Atomphysik SS 2002
7
Grundlagen Atome Genauer sind die Atome die kleinsten unveränderlichen Bestandteile eines chemischen Elements. Sie lassen sich durch chemische Reaktionen (z.B. durch Einwirkung von Laugen, Säuren) nicht verändern. Es gibt nur eine relativ kleine Zahl von unterschiedlichen Atomen. Es sind die 106 im Periodensystem zusammengestellten Elemente. In der Natur kommen nur die 92 Atome Wasserstoff bis Uran vor. Die sogenannten Transurane (Neptunium,…, Unnilhexium) mit den Kernladungszahlen Z = 93-106 werden künstlich hergestellt; sie sind allesamt radioaktiv und zerfallen mit z.T. sehr kurzen Halbwertzeiten. Metastabile Atome Alle Atome besitzen eine unendliche Anzahl energetischer Anregungszustände3 (Energieniveaus). Im allgemeinen können sich die Atome aber nur für extrem kurze Zeiten (typisch 10-9 s) in diesen höheren Energiezuständen aufhalten, indem sie unter Aussendung von Strahlung in den tiefliegensten Zustand, den Grundzustand zerfallen. Die Mehrzahl der Atome (Ausnahmen sind die Alkali-Atome) besitzt jedoch außer diesen sehr kurzlebigen Zuständen auch einen oder mehrere Zustände mit einer deutlich längeren Lebensdauer (typisch 10-3s bis 1 s). Atome in derartigen langlebigen Zuständen bezeichnet man als metastabil. Sie spielen bei vielen Erscheinungen und Experimenten eine bedeutsame Rolle. So können sie beispielsweise ihre Anregungsenergie über große Strecken transportieren und dann an Wände oder andere Atome abgeben. Auf diese Weise leisten sie u.U. einen erheblichen Beitrag zum konvektiven Wärmetransport. Isotope Daneben gibt es noch Isotope, das sind Atome mit gleicher chemischer Eigenschaft, aber unterschiedlicher Masse. Insgesamt gibt es mehr als 1000 Isotope, doch sind hiervon nur 261 stabil. Die übrigen zerfallen radioaktiv unter Aussendung von Teilchen (a- oder b--bzw. b+Strahlung). Einige Elemente, wie z.B. Quecksilber, besitzen bis zu sieben stabile Isotope. Ein wichtiges Beispiel sind die Isotope des Kohlenstoffs: 12C (98.89%), 13C (1.1%) und 14C (Halbwertzeit = 5730 a). Während 12C als als Einheit der Atommasse dient4, wird das radioaktive 14C zur Altersbestimmung von organischen Substanzen benutzt. Die 14C-Atome entstehen in der Ionosphäre durch Einwirkung des Sonnenwindes: Hochenergetische Protonen werden dort zu Neutronen umgewandelt, welche sodann von 13C Atomen eingefangen werden. Im Gleichgewicht zwischen Erzeugung und Zerfall stellt sich so in der gesamten Atmosphäre ein konstantes Verhältnis von 12C zu 14C ein. Solange ein biologischer Organismus lebt, ist dieses Isotopenverhältnis auch in seinem Körper vorhanden. Mit dem Tode nimmt die 14C -Konzentration laufend ab, da die Atome zerfallen und keine neuen mehr aufgenommen werden. Aus dem Vergleich der Isotopenverhältnisse bestimmter Elemente in irdischen Materialien mit Proben von Meteoriten oder Mondgestein erhält man interessante kosmologische Informationen. So findet man beispielsweise die gleichen Verhältnisse im Erd- und Mondgestein sowie in den Meteoriten für Bor (10B/11B = 0,25) und Magnesium (26Mg/24Mg = 0,14). Diese Befunde stützen die Hypothese, daß das gesamte Sonnensystem aus dem gleichen Urmaterial entstanden ist. Viele künstlich hergestellte Isotope (Kernreaktor, Beschleuniger) sind radioaktiv. Sie zerfallen mit höchst unterschiedlicher Zerfallszeit (10-19 s < t < 1016 a, z.B a-Zerfall von 209Bi) unter Aussendung von Elementarteilchen (Elektronen (b- ), Positronen (b+) oder seltener, Helium-Kerne (a), in stabile Isotope. Häufig ist dieser Zerfall von g-Strahlung (harte elektromagnetische Strahlung) begleitet, durch die angeregte Atomkerne in den Grundzustand relaxieren. Für die Energiegewinnung aus Kernspaltung ist das seltene Uranisotop 235U (Isotopenhäufigkeit 0,7%) von besonderer Bedeutung. Im Gegensatz zu dem viel häufiger vorkommenden Isotop 238U 3 Das trifft nicht uneingeschränkt auf alle gebundenen Teilchen zu. Z.B. besitzt das durch Elektronenanlagerung entstehende
H- -Ion keinen angeregten Zustand. 4 1 amu (atomic mass unit) = 1/12 der A t o m m a s s e eines
C -Atoms ª 1,66056 10-27 kg =√ 931,478 MeV/c2. Üblich sind auch die Bezeichnungen: 1 AME (atomare Masseneinheit) = 1 Dalton.
G. Fussmann , Atomphysik SS 2002
12
8
Grundlagen besitzt 235U einen großen Einfangsquerschnitt für Neutronen und neigt nach einem solchen Einfang zur Spaltung. Es bilden sich dann zwei mittelschwere Atome (z.B. Kr und Ba) und mehrere Neutronen unter Freisetzung sehr großer Energien. Bei der kontrollierten Kernfusion werden die Isotope des Wasserstoffs Deuterium (D = 2H) und Tritium (T = 3H) miteinander verschmolzen. Als Reaktionsprodukt entstehen (gemäß D + T Æ 4He + n) Heliumkerne (a-Teilchen) und Neutronen und zusätzlich eine große Energiemenge. Moleküle Atome können sich in chemischen Reaktionen vereinigen und Moleküle bilden. Moleküle sind somit die kleinsten Bausteine einer chemischen Verbindung, wie z.B. O2, CH4 (Methan). Komplizierte Moleküle können aus einigen 104 Atomen bestehen. Die Zahl der möglichen Moleküle ist zwar endlich, aber riesig (z.Z. bekannt einige 106). Ionen Atome und Moleküle können sowohl Elektronen anlagern als auch verlieren (z.B H +, H -, OH-, Ar2+, O8+). Die so entstehenden negativen bzw. positiven Atome nennt man Ionen. Bei Temperaturen oberhalb von etwa 1000 K werden die neutralen Atome zunehmend durch Elektronenstoßionisation zerstört. Die so entstehenden positiven Ionen und negativen Elektronen bilden ein sogenanntes Plasma (Materie im 4. Aggregatzustand), das nach außen hin als quasineutrales Gas erscheint, sich aber durch eine hohe elektrische Leitfähigkeit auszeichnet. 1.3.3
ELEMENTARTEILCHEN
Wir wissen seit langem, daß die Atome nicht die kleinsten Bausteine der Natur sind. Die Atome setzen sich vielmehr aus negativ geladenen Elektronen und einem positiven Kern zusammen. Der Atomkern besteht seinerseits aus Protonen und Neutronen, den sogenannten Nukleonen, die auch nicht – wie lange Zeit angenommen - elementare Teilchen sind, sondern wiederum aus jeweils drei Quarks zusammengesetzt sind. E l e k t r o n e n , Q u a r k s s o w i e N e u t r i n o s sind aus heutiger Sicht wirkliche Fundamental- oder Elementarteilchen, aus denen die Materie aufgebaut ist. Indem sie sich nicht weiter in andere Bestandteile zerlegen lassen, entsprechen sie am ehesten den "antiken Atomen". Sie haben jedoch die merkwürdige Eigenschaft, daß sie nicht in jedem Fall ihre Identität bewahren. So können sich auch diese Elementarteilchen bei Stößen mit hohen Energien in andere umwandeln und neue erzeugen. Diese Umwandlung vollzieht sich jedoch nicht völlig willkürlich, sondern unterliegt gewissen Gesetzen (Symmetrieerhaltungen). Aus diesem Grunde kann man auch mit einer gewissen Berechtigung von einer Bestätigung der Vorstellungen Platons durch die moderne Physik sprechen. Platon hatte nicht die Materie (Teilchen) selbst – wie Demokrit – als das Wichtigste angesehen, sondern das hinter den Erscheinungen liegende Prinzip, den Bauplan der Welt, der sich hier in den Gesetzen für die Bildung der Teilchen offenbart. Standardmodell der Elementarteilchen Mit dem Betrieb von zunehmend leistungsfähigeren Beschleunigern konnten in der zweiten Hälfte des 20. Jahrhunderts scheinbar immer neue Teilchen erzeugt werden. In diesem ausufernden Zoo von Teilchen konnte schließlich mit Hilfe der relativistischen Quantenfeldtheorie (sogenannte Eichtheorien) eine weitgehende Systematik erkannt werden, die unter dem Begriff Standardmodell zusammengefaßt wird. Eine wichtige Rolle spielen dabei die Quark-Teilchen (eingeführt von Murray Gell-Man 1964), die die elektrischen Ladungen 2/3 e bzw. –1/3 e tragen. Insgesamt gibt es sechs verschiedene Quarks (s. Tabelle 1-2) und zu jedem nochmals das entsprechende Antiteilchen5 mit gleicher Masse aber entgegengesetzem Ladungsvorzeichen. Quarks kommen in der Natur nicht als freie einzelne Teilchen vor, doch können jeweils drei oder zwei von ihnen ein beobachtbares Teilchen, ein sogenanntes Hadron (von griech. hadros = stark), bilden. Wie in der Abb. 1-2 veranschaulicht, 5 Antiteilchen sind komplimentäre Teilchen. Sie haben die gleiche Masse und Spin aber entgegengesetzte Ladung und
ladungsartige Quantenzahlen wie Strangeness (up, down) und Helizität. G. Fussmann , Atomphysik SS 2002
9
Grundlagen entsteht so beispielsweise ein Proton mit der Ladung q = +1e durch die Vereinigung von zwei UpQuarks und einem Down-Quark. Ebenso ergibt sich ein neutrales Neutron durch zwei DownQuarks und einem Up-Quark. u(+2/3)
d(-1/3)
d(-1/3)
u(+2/3)
u(+2/3)
d(-1/3)
Proton (+1)
Neutron (0)
Abb. 1-2: Proton und Neutron aus drei Quarks zusammengesetzt Die drei verschiedenen Pionen, die man in den Experimenten beobachtet, ergeben sich dagegen durch die Kombinationen von jeweils einem Quark und einem Antiquark-Teilchen (in der Abb. 1-3 durch
einen Überstrich gekenzeichent)
u
p+
d
u
p0
u
u
d
p-
Abb. 1-3. Pionenbildung durch Quark-Antiquarkbindung. Das positive p+ ist gleichzeitig das Antiteilchen des p—und umgekehrt. Im Falle des neutralen p 0 ist das Antiteilchen mit dem Teilchen indentisch (wie beim Photon).
Quarks – und damit auch die Hadronen – unterliegen der sogenannten „starken Wechselwirkung“, diejenige Kraft, die die Atomkerne zusammenhält. Daneben gibt es Teilchen, die von der starken Wechselwirkung unbeeinflußt bleiben. Man nennt sie Leptonen (griech. lepto = zart, klein). Ihre bekanntesten Vertreter sind das Elektron und das Neutrino (genauer Elektron-Neutrino genannt). Leptonen können aber auf zwei andere Kräfte reagieren: der „elektromagnetischen Kraft“ und der sogenannten „schwachen Wechselwirkung“. Der elektromagnetischen Kraft unterliegen sie jedoch nur, wenn sie eine elektrische Ladung besitzen (z. B. Elektronen, aber auch geladene Hadronen). Neutrinos dagegen sind nur durch die „schwache Wechselwirkung“ zu beeinflußen. Man weiß heute, daß schwache Wechselwirkung und elektromagnetische Wechselwirkung eine gemeinsame Wurzel haben. Dies ist etwa vergleichbar mit den elektrischen und magnetischen Kräften, die im statischen Fall sehr unterschiedlich erscheinen, aber dennoch durch eine einheitliche Theorie (den Maxwell-Gleichungen) zur elektromagnetischen Wechselwirkung zusammengefaßt werden können. Wie der Name bereits sagt, ist die schwache Kraft im allgemeinen (d.h. bei großen Abständen) viel schwächer als die elektromagnetische und erst recht klein im Vergleich zur „starken Kraft“; sie ist daher im normalen Alltag von geringer Bedeutung. Dennoch verursacht sie den Zerfall der Atomkerne (b-Zerfall) und spielt auch bei der Kernfusion in der Sonne eine entscheidende Rolle. Bezogen auf die Kernverschmelzungsprozesse in der Sonne kann man es geradezu als eine besonders glückliche Fügung betrachten, daß diese Kraft weder zu stark noch zu schwach ist; denn im ersten Fall wäre unsere Sonne schon lange erloschen, im zweiten Fall würde ihre Strahlungsleistung zu gering sein, um Leben auf der Erde zu ermöglichen. In der Tabelle 1-2 sind die Teilchen nach dem Standardmodell zusammengestellt. Wir sehen, daß man drei Familien unterscheiden muß, in denen jeweils zwei Leptonen und zwei Quarks vorkommen. Nur die erste Familie ist im gewöhnlichen Umfeld (d.h. nach dem Urknall und außerhalb von Beschleunigern) von Bedeutung. Alle Teilchen der drei Familien haben die Spinquantenzahl 1/2. Deratige Teilchen mit halbzahligem Spin bezeichnet man als Fermionen. Sie unterscheiden sich hinsichtlich ihres Verhaltens im Ensemble ganz erheblich von Teilchen mit ganzzahligem Spin, die man als Bosonen bezeichnet. Bei den Elementarteilchen kommt den Bosonen als sogenannte Eichbosonen eine besondere Beutung zu: sie vermitteln die Kräfte indem sie zwischen den Fermionen ausgetauscht werden. Man spricht daher auch von Kraft- oder Botenteilchen. Von besonderer Bedeutung sind die Photonen als Botenteilchen der elektromagnetischen Wechselwirkung. Sie sind damit auch die Träger des Lichts. Im Gegensatz zu Elektronen, Quarks und den übrigen Botenteilchen besitzen sie keine Ruhemasse, d.h. wenn sie existieren, bewegen sie sich immer mit Lichtgeschwindigkeit. Entsprechende Botenteilchen existieren auch für die starke Wechselwirkung (Gluonen) und die schwache Wechselwirkung (WG. Fussmann , Atomphysik SS 2002
10
Grundlagen und Z-Bosonen). Das Graviton als Botenteilchen der Schwerkraft (Gravitation), der vierten uns bekannten Kraft, konnte bislang noch nicht nachgewiesen werden. Eine Sonderrolle spielt auch das hypothetische Higgsteilchen. Vieles spricht dafür, dass den Quarks und Leptonen ihre Masse durch ein besonderes Feld, das Higgs-Feld, zugewiesen wird. Mit diesem Feld sollte auch ein spezielles Teilchen (Spin 0 und Ladung 0) verbunden sein. Die bisher zur Verfügung stehenden Beschleuniger erreichten jedoch noch nicht die notwendigen Energien, um es erscheinen zu lassen. Bemerkung Teilchen Masse Ladung [e] Spin [ h ] 1. Famile
2. Familie
3. Famile
Kraftteilchen (Eich-Bosonen)
Elektron
0.5 MeV
-1
1/2
Neutrino
< 3 eV
0
1/2
Up-Quark
1.5-5 MeV
2/3
1/2
Down-Quark
3-9 MeV
-1/3
1/2
Myon
105 MeV
-1
1/2
Myon-Neutrino
< 0.2 MeV
0
1/2
Charm-Quark
1.1-1.4 GeV
2/3
1/2
Strange-Quark
60-170 MeV
-1/3
1/2
Tau
1.7 GeV
-1
1/2
Tau-Neutrino
< 18 MeV
0
1/2
Top-Quark
174±5 GeV
2/3
1/2
Bottom-Quark
4.2±0.2 GeV
-1/3
1/2
Gluonen
0
0
1
starke Kraft
W-Bosonen
80.6 GeV
±1
1
Z-Bosonen
91.1 GeV
0
1
elektro-schwache Kraft
Photon
0
0
1
elektromagnetische Kraft
0
2
Gravitation (postuliert)
0
0
postuliert
Graviton Higgs-Teilchen
> 112 GeV
Leptonen Quarks Leptonen Quarks Leptonen Quarks
Tabelle 1-2: Klassifizierung der Elementarteilchen nach dem Standardmodell. Zu jedem Teilchen der drei Familien existiert ein Antiteilchen mit gleicher Masse und entgegengesetzter Ladung. Quarks und Gluonen besitzen zusätzliche Farblungen (rot, blau oder grün). Im unteren Teil sind die Botenteilchen der vier bekannten Kräfte angegeben. Eine Sonderstellung nimmt das mit Massenzuweisung verbundene Higgsteilchen ein. Die Quarks haben neben ihrer elektrischen Ladung noch eine andere Ladung, die man als Farbladung bezeichnet. Diese kann drei verschiedene Werte „rot“, „blau“ und „grün“ annehmen. Die Farbladungen charakterisieren die Eigenschaften der Teilchen bezüglich der starken Kraft in ähnlicher Weise, wie dies die elektrischen Ladungen für die elektromagnetische Wechselwirkung leisten. Die starke Wechselwirkung wird daher auch häufig als Farbkraft bezeichnet. Im Gegensatz zu den Photonen, die keine elektrische Ladung aufweisen, besitzen die Gluonen, die Botenteilchen der starken Kraft, ebenfalls eine der drei Farbladungen. Sie koppeln daher nicht nur an die Quarks G. Fussmann , Atomphysik SS 2002
11
Grundlagen sondern auch untereinander. Dies ist ein entscheidender Unterschied zu den Photonen, deren Wechselwirkung untereinander nicht zu berücksichtigen ist (und bisher auch nicht nachgewiesen werden konnte). Die zusätzliche Gluon-Gluon- Wechselwirkung macht verständlich, daß die Theorie der starken Kraft (die Quantenchromodynamik, QCD) sehr kompliziert ist. 1.3.4
ZUR BEOBACHTUNG DER ATOME
∑ Lichtmikroskope haben - bedingt durch die relativ große Wellenlänge von lª 500 nm - ein begrenztes Auflösungsvermögen und können unter günstigsten Bedingungen noch Objekte im Abstand l, d.h. etwa 5000 Atomabstände trennen. ∑ Röntgenmikroskope könnten prinzipiell ein höheres Auflösungsvermögen erreichen, haben aber das Problem, daß Abbildungselemente nur für das sehr weiche Röntgengebiet (l ª 1- 10 nm) verfügbar sind. Hier arbeitet man anstelle von Linsen mit Fresnelschen Zonenplatten in Miniaturausführung. Gegenüber Elektronenmikroskopen haben Röntgenmikroskope den Vorteil, auch Beobachtungen unter Wasser (Biologie) zu ermöglichen. Sie erreichen bislang aber bei weitem noch nicht das Auflösungvermögen der Elektronenmikroskope. ∑ Feldemissions-Mikroskope ermöglichen die Sichtbarmachung von einzelnen großen Atomen oder Molekülen auf extrem spitzen Metallnadeln. Aufgrund der hohen elektrischen Feldstärke an der Oberfläche der Spitze treten Elektronen aus den einzelnen Atomen aus und werden (geleitet durch das E-Feld) auf einem geerdeten Schirm abgebildet. ∑ Raster-Elektronenmikroskope bzw. Hochspannungs-Elektronenmikroskope erreichen wegen der kleinen de Broglie-Wellenlänge (105 eV Æ 0,037 Å) ein wesentlich höheres Auflösungsvermögen. Raster-E.M. ª 0,5 nm ª einige Atomradien, Hochspannungs -E.M. ª 0,2 nm ª 1 Atomradius. ∑ Raster-Tunnelmikroskope wurden in den 80er Jahren entwickelt (G. Binning und H. Rohrer, Nobelpreis 1986). Dieses Instrument basiert – ähnlich wie das Feldemissionsmikroskop – auf der erhöhten Elektronenemission zwischen einer elektrisch geladenen Spitze und einzelnen Atomen. Bringt man die Spitze sehr nahe an die Oberfläche eines elektrischen Leiters, so wird die Feldemission durch den quantenmechanischen Tunneleffekt erheblich verstärkt. ∑ Kraftmikroskope sind eine Weiterentwicklung des Raster-Tunnelmikroskops. Hierbei wird nicht der elektrische Strom, sondern die auf die Spitze ausgeübte Kraft gemessen. Damit kann das Verfahren auch auf Nichtleiter angewandt werden. ∑ In der sogenannten Paul-Falle können einzelne Ionen für mehrere Stunden eingeschlossen und sichtbar gemacht werden. W. Paul erhielt für die von ihm in den 60er Jahren geleistete Vorarbeit 1989 Nobelpreis. Abb. 1-4: Auf einer Ni-(110)-Oberfläche wurden die Buchstaben IBM durch einzelne Xe-Atome realisiert. Die Anordnung erfolgte durch Manipulation mit einem Kraftmikroskop.
Man beachte aber: Die Struktur eines Atoms kann man im üblichen Sinne des Wortes nicht sichtbar machen! Gründe: ∑ Es gibt im atomaren Bereich prinzipiell kein störungsfreies Meßverfahren (quantenmechanische Unschärferelationen). ∑ Die Elektronen sind im Atom nicht scharf lokalisiert (kein Planetensystem!). G. Fussmann , Atomphysik SS 2002
12
Grundlagen Daher: D a s E r g e b n i s methode ab. 1.3.5
(Bild)
hängt
von
der
Untersuchungs-
GRÖßENBESTIMMUNG DER ATOME
Radienbestimmung (r) aus : A) dem Kovolumen (b) der Van-der-Waals-Gleichung: Ê aN 2 ˆ p + Á ˜ (V - Nb) = NkT V2 ¯ Ë
(1.1)
Wobei gilt : b=4
4p 3 r 3
(1.2)
B) der Zähigkeit von Gasen: h=
r l vth 3
(1.3)
mit
l=
1 1 = sn 2 4 p 2nr 2
(1.4)
wobei: h = Viskosität, s = Wirkungsquerschnitt für Streuung, l = freie Weglänge, r = n◊m = Massendichte, n = Teilchendichte, N = Gesamtteilchenzahl, a/V2 = Binnendruck. C) der Röntgenbeugung an Kristallen Röntgenreflexe treten nur unter bestimmten Winkeln auf, die der Bragg-Bedingung (Interferenz) genügen (M. v. Laue, W. H. Bragg):. (1.5)
nl = 2 d sin q n = Ordnungszahl, l = Wellenlänge, Q = Bragg-Winkel , d = Gitterabstand ª r Atomradien in Å, gemessen nach Methode A, B, C He Neon Xenon
aus b
aus d
1,33 1,2 1,72
1,76 1,60 2,20
aus h 0,91 1,18 1,75
Tabelle 1-3: Vergleich der drei Verfahren Fazit : Atomradien sind von der Größenordnung von 1 Å = 10-10 m. Eine exakte Atomgröße gibt es nicht, vielmehr hängen die Ergebnisse für ein und das gleiche Atom vom Experiment ab.
G. Fussmann , Atomphysik SS 2002
13
Grundlagen 1.3.6
QUANTELUNGEN
Ladungsquantelung : Der Millikan-Versuch 6 Ein elektrisch geladenes Öltröpfchen schwebt im luftgefüllten Kondensator: ++++++++++++++++ -e E
Abb. 1-5: Schema des Millikan-Versuchs.
• mg - - - - - - - - - - - - - - - - - -
Kräftebilanzen: (Stokes´sches-Gesetz, h = Viskositätskonstante ) Umpolung des E-Felds führt zu zwei Geschwindigkeiten v+, v- und den zwei Gleichungen (Kräfte nach unten werden positiv gezählt): 4 pr 3 ( r - rLuft ) g + qE - 6 phrv+ = 0 3 3 Öl 4 pr Tröpfchen steigt: ( rÖl - rLuft ) g - qE + 6 phrv- = 0 3 Tröpfchen fällt:
(1.6)
Hieraus ergibt sich die Ladung zu: q=
9 ph 3/2 ( v+ - v- ) v+ + v2E g( rÖl - rLuft )
(1.7)
Insbesondere läßt sich auch eine Ladungsänderung (z.B. Ionisation durch Röntgenstrahlung bei ein und dem gleichen Tröpfchen mit gleichem Radius r) gut bestimmen aus dem Verhältnis : q1 (v+ + v- )1 = q2 (v+ + v- )2
(1.8)
Es zeigt sich: q = ± n e mit n = 1,2,3,... wobei e = 1.602 10-19 C. Ladung kann also nur in diskreten (gequantelten) Portionen der Größe e aufgenommen oder abgegeben werden. Kennt man die Ladung des Elektrons, so ergibt sich aus dem Faradayschen Gesetz der Elektrolyse (ein Mol einer einwertigen Substanz scheidet die Ladung von QF = 96485 C ab) die Avogadrozahl NA = QF /e . Quarks haben zwar kleinere Ladungen (e/3, 2/3 e), aber sind - im Einklang mit der Theorie - nicht als freie Teilchen nachzuweisen. Energiequantelung: Der Photoeffekt Fällt Licht auf eine Alkalimetall-Oberfläche, so werden Elektronen herausgeschlagen. Lenard beobachtete, daß die so freigesetzten Elektronen eine kinetische Energie erhalten, die nicht von der
6 Die Millikan-Versuchsanordnung liefert bis heute die genauesten Werte für die Elementarladung.
G. Fussmann , Atomphysik SS 2002
14
Grundlagen Lichtintensität abhängt. Hieraus folgerte Einstein im Jahre 1905, daß Licht nur in Energiepaketen (Quanten) entsprechend Ephot = hn
(1.9)
transportiert werden kann. In der Versuchsanordnung nach Millikan (1916) konnte schließlich auch die Frequenzabhängigkeit nachgewiesen werden:
Bremspot. -e U
Alkali-Kathode
Quarzröhre
hn
I U
+ + + +
+ n
-
+
Abb. 1-6:Versuchsaufbau beim Photoeffekt
EA
Abb. 1-7: Bremspotential als Funktion der Photonenfrequenz
Die negative Bremsspannung U wird so eingestellt, daß I = 0. Dann ist - eU = Ekin = hn - EA
(1.10)
Aus der Steigung der gemessenen Geraden ergibt sich die Plancksche Konstante zu h = 4 , 14 ◊ 10 -15 eVs
(1.11)
Ephot = h n ist das Energiequantum eines Photons; es kann beim Photoeffekt nicht in kleinere Einheiten aufgeteilt werden, sondern wird vollständig auf ein Elektron übertragen. Die Größe h bezeichnet man als Plancksches Wirkungsquantum 7. N.B: Die Energiequantelung darf nicht dahingehend mißverstanden werden, als gäbe es eine kleinste Energie! Entsprechend der Unbeschränktheit bei kleinen Frequenzen (also große Wellenlängen) gibt es auch beliebig kleine Photonenenergien. Aber bei vorgegebener Frequenz gibt es keinen beliebig kleinen Energieaustausch, sondern es wird mindestens hn (oder 2 hn, 3 hn ...) übertragen. Die Austrittsarbeit EA hängt vom Material ab ( Na: 2,3 eV; Cs: 1,9 eV; W: 4,6 eV), die Größe h ist aber für alle Materialien gleich, sie ist eine universelle Konstante. Der hier diskutierte äußere Photoeffekt spielt auch in der Praxis eine große Rolle, z.B. für Belichtungsmesser. In Verbindung mit einem nachgeschalteten Elektronenvervielfacher (105fache Verstärkung) dient er als Photomultiplier (Abb. 1-8), d.h. als hochempfindlicher Photonenzähler (Nachweiswahrscheinlichkeit = Quantumefficiency ca. 25% für SbKCs Kathoden). Ein aus der Kathode (f ª - 1000V) über den Photoeffekt ausgelöstes Elektron wird durch ein E-Feld auf die 1. Dynode hin beschleunigt und schlägt hier eine Anzahl (h) Elektronen heraus. Dieser Auslösemechanismus wird als Sekundär-Elektronen-Emission bezeichnet. Man verwendet als Dynodenmaterialien meist Metalloxide mit einem hohen Emissionskoeffizienten wie AgMgO (h = 6 7Allgemein wird eine Größe der Dimension Energie x Zeit als Wirkung bezeichnet.
G. Fussmann , Atomphysik SS 2002
15
Grundlagen bei 200 eV) oder GaP(Cs) (h = 60 bei 1keV). Durch Hintereinanderschalten von 5 bis etwa 12 Dynoden lassen sich sehr hohe Verstärkungen erreichen. Die letzte Elektronenlawine wird von der Anode aufgenommen, die über einen Widerstand (Strommessung) oder ein RC-Glied (PhotonenPulsmessung) auf Erdpotential liegt. Die einzelnen Dynoden werden über eine hochohmige Widerstandskette (100kW - 1MW pro Glied, in Abb. 1-8 nicht gezeichnet) mit Hochspannung versorgt.
Abb. 1-8: Prinzipschaltung eines Photomultipliers für die Messung einzelner Photonen. In Halbleitern tritt auch der sogenannte innere Photoeffekt auf. Hierbei werden keine Elektronen freigesetzt, sondern vielmehr aus der Atomhülle herausgeschlagen und ins sogenannte Leitungsband transferiert. Dadurch erhöht sich die elektrische Leitfähigkeit des Materials. Der Effekt findet in den schnell schaltenden Photodioden eine bedeutende Anwendung. Auch die Atome, Moleküle und Atomkerne können nur in ganz bestimmten, diskreten Energiezuständen sein. Sie reagieren daher nur mit Licht, wenn dieses eine gewisse Mindestenergie besitzt. Daher kann man sich beispielsweise unter einer Glühbirne nicht bräunen. Die Moleküle der Pigmentzellen benötigen für den Ablauf des entsprechenden chemischen Prozesses das energiereichere UV-Licht mit kürzeren Wellenlängen. Ebenso kann man einen Schwarz-Weiß-Film durchaus bei Rotlicht entwickeln, während Blaulicht den Film sofort schwärzen würde. Drehimpulsquantelung Die Quantelung der Drehimpulse spielt in der Atomphysik eine wesentliche Rolle. Sie führt zu den Multiplettstrukturen und Aufspaltungen der Spektrallinien im magnetischen und elektrischen Feld. Ferner zeigt sich diese Quantelung anhand von zahlreichen Resonanzeffekten an Atomen und Atomkernen (z.B. Kernspintomographie). Im Unterschied zum klassischen Drehimpuls ist der quantenmechanische Drehimpuls kein Vektor im üblichen Sinne, da sich nicht alle drei Raumkomponenten (Lx, L y, Lz) angeben bzw. messen lassen. Nur die Komponente in eine beliebige Richtung (Lz) und das Quadrat (L2) des Betrages können gleichzeitig bestimmt werden (kompatible Messungen). Die Quantelung des Drehimpulses besagt, daß sich Lz nur um ganzzahlige Vielfache der Größe h = h/2p ändern kann. Das hat zur Folge, daß Lz/ h nur ganzzahlige oder halbzahlige (also: Lz = 0, ±1/2, ±1, ±3/2, ±2, ±5/2…) Werte annehmen kann. Auch der Betrag des Drehimpulses ist gequantelt. Hierfür gilt: L = [l (l+1) ]1/2 h wobei l die Werte 0, 1/2,1,3/2… annehmen kann. Die Quantelung von Lz wird häufig auch als Raumquantelung bezeichnet, da hiernach nur ganz bestimmte Projektionswerte in einer Richtung zugelassen werden. Von besonderem Interesse ist die Quantelung des Eigendrehimpulses (Spin) der Elementarteilchen. So hat ein Elektron nur zwei Möglichkeiten, seinen Spin in eine beliebig vorgegebene Richtung zu projizieren.
G. Fussmann , Atomphysik SS 2002
16
Massenspektrometer
2
MASSENANALYSE DER TEILCHEN
Neben der Spektralanalyse der von den Atomen absorbierten und emittierten Strahlung kommt der Massenanalyse der Teilchen eine besondere Bedeutung zu. Erste erfolgreiche Untersuchungen gehen auf die Zeiten um 1900 zurück. Sie wurden im Laufe der Jahrzehnte immer weiter verbessert und erreichen seit neuestem eine Meßgenauigkeit von m/Dm = 10 8. Allen diesen Verfahren ist jedoch gemeinsam, daß immer nur das Verhältnis von Ladung zu Masse (q/m) gemessen werden kann. Die Ladung muß daher mit anderen Verfahren (Millikan-Versuch) bestimmt werden. In den meisten Anwendungen ist jedoch q = +e, die Elementarladung des Protons (seltener +2e oder -e), so daß die relativen Massen (bezogen auf 1amu) mit sehr hoher Genauigkeit bestimmt werden können. 2.1 Thomsons Entdeckung des Elektrons Ab etwa 1895 wurden in Deutschland (W. Kaufmann an der Berliner Universität) und England (Sir J.J. Thomson) grundlegende Untersuchungen zur Natur der Kanalstrahlen durchgeführt.
Abb. 2-1: Thomsons Apparatur zur Bestimmung des Ladung/Masse-Verhältnisses beim Elektron. Thomson experimentierte mit der in Abb. 2-1 dargestellten Apparatur. In einem weitgehend evakuierten Glaskolben (p ª 100 Pa) wird zwischen Kathode (C) und Anode (A) eine Spannung von einigen 1000 V angelegt. Man beobachtet dann auf der der Kathode gegenüberliegenden runden Glaskolbenfläche einen leuchtenden Punkt (O). Wird an den im Mittelteil angebrachten Kondensatorplatten (P) eine Spannung mit skizzierter Polung angelegt (elektr. Feld: E = U/d), so wandert der Leuchtpunkt nach oben zum Punkt O', gerade so, wie eine negative Ladung im Kondensator abgelenkt wird. Durch einen hier nicht gezeigten Magneten kann zusätzlich ein Magnetfeld (B) in der zur Bildebene senkrechten Richtung angelegt werden. Weist das Magnetfeld in die Bildebene hinein, so wandert der Leuchtpunkt mit zunehmender Feldstärke wieder zum Punkt O zurück. Mit Hilfe dieser Kompensationsmethode bestimmte Thomson 1897 das Verhältnis von Ladung zu Masse der Teilchen aus der Beziehung Ed q = 2 m B La
(2.1)
mit den in der Abb. 2-1 angegebenen geometrischen Strecken. Da die Ergebnisse unabhängig von dem Material der Kathode und der Gasart waren, schloß Thomson, daß der Kathodenstrahl aus universellen Teilchen mit negativer Ladung bestehen müsse. Diese später von ihm als Elektronen benannten Teilchen sind zumindest in jedem metallischen Leiter vorhanden und können durch geeignete Maßnahmen (z.B. Aufheizen) aus ihm extrahiert werden.
G. Fussmann , Atomphysik SS 2002
17
Massenspektrometer 2.2
Erste Massenspektrometer
2.2.1
THOMSONS PARABELSPEKTROMETER
Im Anschluß an die Entdeckung des Elektrons konnte Thomson mit einer ähnlichen Apparatur erste Ionenmassen vermessen. Hierzu waren drei Abwandlungen an der in Abb. 2-1 gezeigten Apparatur vorzunehmen: 1. Hinter der Kathode wurde ein Gasentladungsraum angeschlossen, in dem die verschiedenen Gasionen erzeugt werden konnten. 2. Die Kathode erhielt eine Bohrung, so daß die Ionen durch sie hindurch in den sich rechts anschließenden Kondensatorbereich eintreten konnten. 3. Anstelle des runden Glaskolbens trat eine ebene Fläche mit einer photographischen Platte zum Nachweis der Ionen (Schwärzung). Photoplatte Abb. 2-2: Koordinatensystem für die Berechnung der Bahn im Parabel-Massenspektrometer.
x
B E
Thomson konnte zeigen, daß Ionen mit gleichem Verhältnis q/m, aber unterschiedlicher Geschwindigkeit, sich auf einer Parabel auf der Photoplatte ansammeln. Die entsprechende Ableitung ist recht lehrreich. Basis derartiger Berechnungen ist die allgemeine Kraftgleichung für ein geladenes Teilchen
+ z Kondensator
y
r r r r d(mv ) = q(E + v ¥ B). dt
(2.2)
Führen wir entsprechend Abb. 2-2 in Abb. 2-1 ein kartesisches Koordinatensystem ein, so lauten mit m = const. die Gleichungen für die x- und y-Komponenten im Bereich des Plattenkondensators m
d2x = qE; dt 2
m
d2 y = q vz B . dt 2
(2.3)
Wegen vz ª v können wir hieraus die Zeit gemäß dt = dz/vz ª dz/v eliminieren und erhalten q d2 y q d2x = E ; = B . 2 2 2 dz mv dz mv
(2.4)
Zweimalige Integration dieser Gleichungen führt am Ende des Kondensators (z = L) auf die Beziehungen q dx L dx = E L; x z = L = 2 dz z = L mv 2 dz z = L . dy q L dy B L; y z = L = = dz z = L mv 2 dz z = L
(2.5)
Wir entnehmen diesem Ergebnis noch die wichtigen Aussagen: Die Ablenkung im elektrischen Feld (dx/dz) ist umgekehrt proportional zur Energie. Die Ablenkung im Magnetfeld (dy/dz) ist umgekehrt proportional zum Impuls.
G. Fussmann , Atomphysik SS 2002
18
Massenspektrometer Nach dem Austritt aus dem Kondensator sind E = B = 0, so daß die Teilchen auf der Geraden
x( z) = x z = L +
dy dx ( z - L); y( z) = y z = L + ( z - L) dz z = L dz z = L
(2.6)
weiterfliegen. Einsetzen von Gl. (2.5) ergibt im Plattenabstand z = zP für die Koordinaten des Auftreffpunktes xP = x(zP), yP = y(zP) xP =
qEL qBL L L ( zP - ); y P = ( zP - ). 2 mv mv 2 2
(2.7)
Lösen wir die zweite Gleichung nach v auf und setzen dies in die erste ein, so erhalten wir die gesuchte Parabelgleichung xP =
m E y2 2 P q L( zP - L / 2)B
(2.8)
Ein Beispiel für eine derartige gemessene Schar von Parabelkurven ist in der Abb. 2-3 zu sehen. Abb. 2-3: Meßkurven des ParabelMassenspektrometers. Es wurden verschiedene Neon-Isotope ( m = 10, 11, 12) sowie die Massen von Wasser (18) und anderen Atomen und Molekülen nachgewiesen (nach J. Mattauch).
2.2.2
MASSENSPEKTROMETER NACH DEMPSTER
Im Nachgang zu Thomson wurden systematisch Apparaturen entwickelt, die es gestatteten, die Masse von Ionen mit immer höherer Genauigkeit zu vermessen. Einer der einfacheren, aber doch schon sehr genauen Apparate ist das in Abb. 2-4 skizzierte Massen-Spektrometer, das 1919 von J . Dempster fertiggestellt wurde. In der Quelle I werden durch Elektronenbeschuß oder UV-Strahlung aus Gasatomen einfach geladene Ionen gebildet. Diese langsamen Ionen treten durch einen Spalt in einen Plattenkondensator ein, wo sie auf kurzem Wege das elektrische Potential DV durchfallen und damit die Geschwindigkeit v= 2
q DV m
(2.9)
erhalten. G. Fussmann , Atomphysik SS 2002
19
Massenspektrometer Abb. 2-4: Massenspektrometer nach Dempster mit magnetischer Fokussierung.
Durch einen zweiten Spalt verlassen sie den Bereich des elektrischen Feldes und sind jetzt über einer großen Strecke einem magnetischen Feld ausgesetzt, das sie auf eine Kreisbahn vom Radius r =
p mv = qB qB
(2.10)
zwingt. Diesen Radius kann man als Schwärzungspunkt auf einer photographischen Platte direkt ablesen. Setzen wir nun Gl. (2.9) in (2.10) ein, so erhalten wir die Beziehung q 2 DV = , m r 2B2
(2.11)
aus der man direkt das Verhältnis q/m aus den Meßdaten angeben kann. Besonders einfach ist die Untersuchung von Elektronen. In diesem Fall genügt ein auf etwa 2500K aufgeheizter Wolframdraht als Teilchenquelle. Man stellt fest, daß auch bei höheren Beschleunigungsspannungen (DV > 100 kV) die Elektronen auf Kreisbahnen bleiben. Anstelle des Impulses p = m v ist jedoch in Gl. (2.10) die relativistische Beziehung p=
m0 v 1 - v2 / c2
(2.12)
einzusetzen. Dies kann auch – unter Beibehaltung der Beziehung p = mv – als eine geschwindigkeitsabhängige Masse gedeutet werden m 1 := g = ; m0 1 - v2 / c2
(2.13)
m0 wird die Ruhmasse der Teilchen genannt. Der Quotient g heißt relativistischer Parameter. Da sich die gemessenen Radien allein mit der relativistischen Massenabhängigkeit erklären lassen, ergibt sich die Unabhängigkeit der Ladung von der G e s c h w i n d i g k e i t . Dies wird u. a. durch die vollständige Neutralität der Atome belegt. In den schweren Atomen besitzen die auf inneren Schalen befindlichen Elektronen sehr hohe Geschwindigkeiten, die bereits der Lichtgeschwindigkeit nahe kommen. Wäre also die Elektronenladung von der Geschwindigkeit abhähngig, so würden die Atome der verschiedenen Elemente unterschiedlich elektrisch geladen sein, was jedoch nicht beobachtet wird.
G. Fussmann , Atomphysik SS 2002
20
Massenspektrometer 2.3 2.3.1
Moderne Massenspektrometer DOPPELFOKUSSIERENDE MASSENSPEKTROMETER
Ein Nachteil vieler älterer Massenspektrometer war die geringe Teilchenausbeute. So verteilen sich beim Parabel-Massenspektrometer die nachzuweisenden Ionen über eine Parabel, was eine relativ geringe Schwärzung der Photoplatte bzw. lange Meßzeiten zur Folge hat. Diesen Nachteil kann man durch fokussierende elektrische oder magnetische Felder weitgehend beheben. Bei dem in Abb. 2-5 skizzierten doppelfokussierenden Massenspektrometer benutzt man beide Möglichkeiten. Hier treten die Ionen durch den Eintrittspalt S 1 mit einem Öffnungswinkel a in einen Zylinderkondensator ein. Abb. 2-5: Doppelfokussierendes Massenspektrometer: Im Zylinderkondensator (links) wird eine Energieselektion vorgenommen. Das sich anschließende magnetische Sektorfeld trennt die Teilchen nach ihrer Masse (Impuls). Da die Ionen zuvor die gleiche Beschleunigungsspannung U durchlaufen haben, besitzen sie näherungsweise die gleiche Energie. Im elektrischen Feld des Zylinderkondensators werden sie – wie oben gezeigt – gleich stark abgelenkt, was bei Wahl eines Sektorwinkels von jel = p/÷2 = 127,3° zu einer Fokussierung auf den Austrittsspalt S2 führt. Die Spaltbreite von S2 legt nun das Energieintervall DE der durchgelassenen Teilchen fest. Im zweiten Teil des Spektrometers durchlaufen die Teilchen ein magnetisches Sektorfeld. Hier tritt eine Separation nach dem Impuls der Teilchen (d.h. nach der Masse) auf. Wählt man den magnetischen Sektorwinkel zu jmag= 60°, so ergibt sich eine Abbildung von S 2 auf die Detektionsebene mit der Brennweite f = rgyro/ sin(jmag/2) = 2 r gyro = 2 m v/qB. Mit derartigen Massenspektrometern erreicht man ein Auflösungsvermögen von etwa m/Dm > 6000. Daß eine derartig hohe Auflösung von großem Nutzen sein kann, verdeutlicht die Abb. 2-6 Abb. 2-6: Beispiel eines hochaufgelösten Massenspektrums in der Umgebung von 20 amu.
Wegen der kleinen Massendifferenzen der verschiedenen Isotope und zusammengesetzten Moleküle kann man beispielsweise das Schwer-Wassermolekül D216O vom NeonAtom 20Ne unterscheiden, die bei gröberer Auflösung unter der Masse 20 amu zusammenfallen würden. 2.3.2
QUADRUPOL-MASSENFILTER
Während die bisher besprochenen Meßapparate auf der geschickten Bahnführung der Teilchen in statischen, magnetischen und elektrischen Feldern beruhten, benutzt man im QuadrupolMassenspektrometer das Prinzip der D e s t a b i l i s i e r u n g , um aus einem Teilchengemisch eine bestimmte Sorte abzusondern. Man spricht daher auch oft vom Quadrupol-Massenfilter. Kernstück dieser von Paul und Steinwedel entwickelten Apparatur (Zeitschrift für Naturforschung, 8a, 448 (1953)), sind vier auf einem Kreis vom Radius r0 angeordnete Stäbe (Abb. 2-7), die ein elektrisches Quadrupolfeld
G. Fussmann , Atomphysik SS 2002
21
Massenspektrometer
f(x, y) =
f0 2 (y - x2 ) 2 2ro
(2.14)
erzeugen. Um ein exaktes Qudrupolfeld dieser Art aufzubauen, benötigt man Stäbe mit hyperbolischem Querschnitt, deren Oberflächen Äquipotentialflächen zu f(x,y) nach Gl. (2.14) abgeben. In der Praxis werden stattdessen meist kreisfömige Zylinder (typische Maße: r = 3 mm, L = 200 mm) verwandt. Die optimale Anpassung erreicht man dann mit dem Verhältnis r/r0 = 1,148, wobei r0 der innere Berührungsradius ist. Abb. 2-7: Prinzip des Quadrupolanalysators. Je zwei gegenüberliegende Stäbe in der xz- bzw. yz-Ebene sind elektrisch verbunden und liegen auf den Potentialen -U bzw. +U. Zusätzlich wird ein HF-Feld (w ª 107 s-1) der Amplitude V angelegt, das in den beiden Ebenen eine Phasendifferenz von 180° aufweist, so daß
f0 = U + V cos wt
(2.15)
r in Gl. (2.14) zu setzen ist. Mit E = -—f in Gl. (2.2) erhält man die Bewegungsgleichungen q f0 d2 y q f0 d2x x y ; z = vz t . = + ; =2 2 2 dt m r0 dt m r02
(2.16)
Hiervon lassen sich die beiden ersten auf die Form Mathieuscher Differentialgleichungen d2x - ( a + 2b cos 2t )x = 0; dt 2
d2 y + ( a + 2b cos 2t )y = 0 dt 2
(2.17)
mit den Koeffizienten a = 4qU/mr02w2 und b = 2qV/mr02w2 sowie t = w t/2 bringen. Die Größen a/2 und b sind die Verhältnisse von potentieller zu kinetischer Energie. Jede dieser Gleichungen besitzt nur für begrenzte Gebiete in der a-b-Ebene periodische, d.h. stabile Lösungen (Abb. 2-8). Für andere Werte von a und b ergeben sich exponentiell anwachsende Lösungen, so daß die Teilchen die Stäbe berühren und damit ausgesondert werden. a 0.25 0.2
y-instabil
0.15
x-instab
Abb. 2-8: Stabile und instabile Bereiche im Quadrupolfilter. Bei vorgegebenen Spannungen U, V liegen die Massen (Punkte) auf der Geraden a/b = 2U/V. Von rechts nach links nimmt die Massenzahl zu.
Anschaulich kann man sich das Filterprinzip wie folgt klar machen: In der yz-Ebene haben die Stäbe 0.05 stabil ein positives Gleichspannungspotential. Sie treiben somit die positiven Ionen in die Nullage zurück b (statische Stabilisierung). Legen wir aber zusätzlich 0.2 0.4 0.6 0.8 das HF-Feld an, so gilt das nur noch für hinreichend schwere Teilchen, die aufgrund ihrer Trägheit die raschen Feldänderungen ignorieren. Leichte Teilchen werden dagegen vom HF-Feld destabilisiert (dynamische Destabilisierung) und ausgesondert. Diese beiden Stäbe bilden daher einen Hochpaß-Filter: nur schwere Massen werden durchgelassen. Umgekehrt verhält es sich mit den Stäben in der xz-Ebene, die mit ihrem Gleichfeld 0.1
G. Fussmann , Atomphysik SS 2002
22
Massenspektrometer gerade die schweren Teilchen nach rechts oder links anziehen und auf diese Weise aussondern (statisch destabilisieren). Leichte Teilchen werden dagegen in dieser Ebene durch das HF-Feld stabilisiert (dynamische Stabilisierung). Insgesamt bildet also dieses Stabpaar einen Tiefpaß: nur leichte Teilchen werden durchgelassen. Im Zusammenwirken haben wir damit einen H o c h u n d e i n e n T i e f p a ß , der nur noch Teilchen in einem mittleren Massenbereich durchläßt. Durch Wahl der Spannungen kann man diesen Transmissionsbereich beliebig klein machen, so daß sich – in bestimmten Grenzen – das Auflösungsvermögen (typisch ≥ 100) vorgeben läßt. Quadrupolfilter haben den sehr großen Vorteil, daß weder die Anfangsgeschwindigkeit noch der Eintrittswinkel eingehen, vorausgesetzt, die Teilchen bleiben lange genug im Analysator, so daß die Stabilisierung bzw. Destabilierung zum Tragen kommt. Dies kann man durch hinreichend niedrige Beschleunigungsspannung (10 - 150V) in der Ionenquelle bei vorgegebener Länge der Stäbe erreichen. Quadrupolfilter werden auch häufig zur R e s t g a s a n a l y s e in Hoch-Vakuumanlagen eingesetzt. In diesem Fall montiert man den in Abb. 2-7 gezeigten Analysator so, daß die Ionenquelle im Vakuum des zu untersuchenden Gefäßes (oder Apparatur) liegt. Mit Aufheizen der Kathode wird die Elektronenquelle aktiviert und die Atome des Restgases ionisiert. Durch sägezahnartige Spannungsrampen mit konstantem Verhältnis der Amplituden U/V kann man nun sehr schnell ein Massenspektrum durchfahren (scannen), das dann beispielsweise auf einem Oszilloskop oder einem Schreiber registriert wird. 2.3.3
PAUL-FALLE UND IONEN-ZYKLOTRON-RESONANZ-SPEKTROMETER
Biegt man die Stäbe des Quadrupolfilters zu einem Kreis, so hat man bereits in Näherung die Konfiguration einer axialsymmetrischen Ionen-Falle (nach ihrem Erfinder auch Paul-Falle genannt). Bei der technischen Realisierung werden aus den Stäben in der yz-Ebene die hyperbolischen Polkappen der Abb. 2-9. Von den Stäben der xz-Ebene wird dagegen der innere entfernt und der äußere wird zur ringförmigen Mantelfläche. Wieder entscheiden bei Anlegen einer Gleich- und HF-Spannung die Mathieuschen Differentialgleichungen über stabile und instabile Massenbereiche. Im Unterschied zum Quadrupolfilter eignet sich dieser axialsymmetrische Quadrupol besonders zum Einschluß (Falle) bestimmter Ionen. Durch geschickte Manipulation kann man es erreichen, daß schließlich nur noch ein einziges Ion in der Falle ist, das dann mit Hilfe von Laserstrahlung untersucht werden kann. Auf diesem Wege konnte in den 80er Jahren erstmals nachgewiesen werden, daß die statistischen Aussagen der Quantenmechanik tatsächlich bereits auf ein einzelnes Atom und nicht erst auf ein Teilchenensemble zutreffen. Abb. 2-9: Elektrische Quadrupol-Ionenfalle (Paul-Falle). Durch kurzzeitiges Einschießen von Atomen und Elektronen (Ionisation) wird die Falle gefüllt. Die Analyse der eingeschlossenen Ionen erfolgt durch laserinduzierte Fluoreszenz (n. H. Walther). Äußerlich ähnlich zur Paul-Falle sind die Penningfalle und das Zyklotron-ResonanzSpektrometer. In diesen Konfigurationen wird lediglich an die Polkappen ein einschließendes (also positives) statisches Potential angelegt. Der radiale Einschluß wird dagegen im wesentlichen durch ein zur Symmetrieachse (z-Richtung) paralleles Magnetfeld besorgt. Die Teilchen bewegen sich dann einerseits auf Kreisen, unterliegen aber gleichzeitig elektrostatischen Schwingungen in der z-Richtung. Beim Zyklotron-Resonanz-Spektrometer ist das Magnetfeld so groß, daß die Gyroradien der Ionen sehr viel kleiner als der Fallenradius sind. Die elektrostatische Eigenfrequenz wel = (qU/mz02)1/2 ist G. Fussmann , Atomphysik SS 2002
23
Massenspektrometer dann sehr viel langsamer als die Gyrofrequenz (wci= qB/m), und das Gyrozentrum vollführt langsame Oszillationen in z-Richtung, während es gleichzeitig um die z-Achse rotiert. Diese Schwingungen induzieren auf den Polkappen eine meßbare Potentialschwankung mit den Frequenzen
w=
w ci w ci2 w el2 ± . 2 4 2
(2.18)
Da man diese Eigenfrequenzen mit sehr hoher Genauigkeit messen kann, läßt sich auch das Verhältnis q/m sehr genau bestimmen. Das so erzielte Auflösungsvermögen von m/Dm = 108 reicht aus, auch die geringen Massenunterschiede aufgrund der chemischen Bindungen in den Ionenhüllen nachzuweisen. 2.3.4
FLUGZEITSPEKTROMETER
Die prinzipiell einfachste Form eines Massenspektrometers besteht darin, die Laufzeit eines Teilchenpulks mit bekannter kinetischer Energie zu messen. Werden die Teilchen zuvor durch die Spannung U beschleunigt und hat die Meßstrecke die Länge L, so erhält man aus der Meßzeit Dt =
L = v
L 2qU / m
(2.19)
bei bekannter Ladung q die Masse m. Wie so oft, liegen die Probleme in der technischen Realisierung. Man benötigt vor allem exakte Unterbrecher (shutter), die den meist kontinuierlichen Teilchenstrahl in wohl definierte kurze Pulse zerteilen, so daß man überhaupt weiß, wann die Teilchen gestartet sind. Hierzu werden gewöhnlich entsprechende Extraktions-Spannungspulse an die Beschleunigungsstrecke angelegt, doch finden auch mechanische Verschlüsse (z.B. die Schaufeln einer schnell umlaufenden Turbomolekularpumpe) Verwendung. Auch darf bei üblichen Ansprüchen an die Genauigkeit (m/Dm > 100) die Wegstrecke nicht zu kurz sein (typisch ≥ 1m). Flugzeitspektrometer werden vor allem bei sehr hohen Massenzahlen (schwere Moleküle, Teilchencluster) eingesetzt. Sie können natürlich auch bei bekannter Masse der Teilchen als Energieanalysatoren verwendet werden. 2.4
Einsteins Massen-Energie-Äquivalent
Bereits mit dem Massenspektrometer von Thomson fand man heraus, daß die Ionen in guter Näherung Massen besitzen, die ein ganzzahlig Vielfaches der Masse des H+-Ions, des Protons, darstellen. Mit steigender Genauigkeit der Meßapparaturen (Thomson Parabelmethode) wurden aber geringfügige Abweichungen von der Ganzzahligkeit bemerkbar. Diese haben ihre Erklärung zum einen in der Massendifferenz der Kernbausteine, Protonen (mp = 1,6726231◊10-27 kg) und Neutronen (mn = 1,6749286◊10-27 kg), zum anderen in der unterschiedlichen Bindungsenergie der Teilchen durch die starke Wechselwirkung in den Atomkernen. Letzteres steht im Zusammenhang mit der berühmten Formel Einsteins aus dem Jahre 1905 E = mc 2 ,
(2.20)
die, wenn wir sie auf Differenzen beziehen DE = c2 Dm, zu der Folgerung führt, daß eine unterschiedlich feste Bindung der Nukleonen im Kernverbund Massendifferenzen zur Folge hat. Umgekehrt können wir auch daraus schlußfolgern, daß Kerne mit einem hohen Massenüberschuß grundsätzlich weniger fest gebunden sind und daher prinzipiell Energie abgeben können, wenn G. Fussmann , Atomphysik SS 2002
24
Massenspektrometer man sie in stärker gebundene Zustände überführen kann. Diese Möglichkeit wurde in den ersten Jahrzehnten nach 1900 jedoch nicht für möglich gehalten. Dennoch hat Lord Rutherford schon 1923 erkannt, daß in dem geringfügigen Unterschied der Massen des He-Atoms im Vergleich zur Masse von vier Protonen die Lösung für das Energieproduktionsrätsel der Sonne liegen könnte. Während man nämlich für 4He lediglich eine relative Atommasse von mHe = 4,0026 amu findet, ergibt die Summation der vier Protonen: mp = 4 x 1,00783 amu = 4,0313 amu. Das Massendefizit von Dm = 0,0287 amu entspricht nach Multiplikation mit dem Quadrat der Lichtgeschwindigkeit (c2) einer Energie von 26 MeV. Diese riesige Energie wird freigesetzt bei der Verschmelzung von vier Wasserstoffkernen zu einem Heliumkern. Rutherford konnte über diese einfache Abschätzung hinaus nicht erklären, wie d’ie H-Atome in der Sonne verschmelzen können, da u.a. der quantenmechanische Tunneleffekt noch nicht bekannt war. Diese im einzelnen sehr komplizierten Vorgänge aufzuzeigen, gelang erst 1939 (H.Bethe und K. F. Weizsäcker). Heute wissen wir, daß im Zentrum der Sonne in jeder Sekunde 600 Millionen Tonnen Wasserstoff zu 595,7 Milionen Tonnen Helium umgewandelt werden. Die Differenz von dM/dt = 4,3 Millionen Tonnen Materie pro Sekunde wird in die ungeheure Leistung von L = c2 dM/dt = 3,85◊1026 W umgewandelt. Diesen Fusionsprozeß – oder einen ähnlichen – auf der Erde nachzuvollziehen, gelten die Anstrengungen auf dem Forschungsgebiet der kontrollierten Kernfusion. In der Abb. 2-10 sind die Bindungsenergien für die verschiedenen Kerne dargestellt, wie man sie aus genauen massenspektrometrischen Messungen erhält.
Abb. 2-10: Die Bindungsenergie pro Nukleon als Funktion der Kernmassenzahl. Die Kurve hat ein Maximum beim Eisenisotop 56 Fe, das somit als der stabilste Atomkern angesehen werden kann. Die Kurve offenbart auch, daß man auf zweierlei Weise aus den Atomkernen Energie gewinnen kann: Durch Fusion leichter Kerne (wie bereits besprochen) oder durch Spaltung eines sehr schweren Kerns (z.B. Uran). Während der erste Prozeß in verschiedenster Form in den Sternen abläuft, hat sich der Mensch die Kernspaltung bereits zur Energiegewinnung nutzbar gemacht.
G. Fussmann , Atomphysik SS 2002
25
Atomare Prozesse
3 3.1
ATOMARE STOßPROZESSE Das Konzept des Wirkungsquerschnitts
Unter dem Wirkungsquerschnitt s eines Teilchens versteht man seine e f f e k t i v e Q u e r s c h n i t t s f l ä c h e bei Stößen mit anderen Teilchen in Bezug auf eine bestimmte Reaktion (Ablenkung, Energieübertrag, Teilchenanlagerung, Fusion usw.). Zur Verdeutlichung betrachten wir einen Fluß von Testteilchen (Geschosse), die auf einen mit Feldteilchen (oft auch als Zielteilchen, engl.: targets bezeichnet; im folgenden durch einen Stern (*) gekennzeichnet) angefüllten Quader treffen. Test t ei l chen Fel dt ei l chen ( * ) ( Zi el t ei l chen, t ar get s)
Abb. 3-1: Zur Definition des Wirkungsquerschnittes. Denken wir uns nun die Wirkungsquerschnitte der N* stochastisch verteilten Zielteilchen in die Eintrittsfläche projiziert, so wird ein gewisser Bruchteil – den wir zu << 1 annehmen wollen – dieser Fläche von ihnen abgedeckt. Dieser Bruchteil gibt die Wahrscheinlichkeit w für den Stoß eines Testteilchens an. Wir haben also w=
alle Wirkungsquerschnitte der Zielteilchen s N * . = A Eintrittsfläche
(3.1)
Ist n*= N*/V die Teilchendichte der Zielteilchen und L die Länge des Volumens, so gilt N* = n* A L und damit w = n * s L,
(3.2)
sofern w << 1, d.h. bei hinreichend kleiner Länge L. Den allgemeinen Fall 0 £ w £ 1 können wir uns durch dünne Teilbereiche zusammengesetzt denken, in denen Gl. (3.2) jeweils gültig ist. Dazu betrachten wir die Zahl DN der Testteilchen, die durch Stöße in in einer solch dünnen Schicht Dx verlorengehen, wenn N Teilchen eintreten: DN = - n * s N Dx .
(3.3)
Der Grenzübergang D x Æ 0 führt auf die Differentialgleichung dN = - n * s N dx ,
(3.4)
die wir sogleich durch Integration auf Quadraturen zurückführen können
G. Fussmann , Atomphysik SS 2002
26
Atomare Prozesse N
Ú
N0
x
x
- Ú n * s dx © dN ¢ . = - Ú n * s dx ¢ fi N ( x) = N 0 e 0 N¢ 0
(3.5)
Sind s und n* konstant über die gesamte Länge L, so ergibt sich für die Zahl der austretenden Testteilchen N = N 0 e - n *sL .
(3.6)
Die Zahl der herausgestreuten bzw. absorbierten Testteilchen ist entsprechend N abs = N 0 (1 - e - n *sL ).
(3.7)
Das Verhältnis Nabs /N0 ist wiederum die Wahrscheinlichkeit für einen Verluststoß, so daß allgemein gilt w = 1 - e -sn * L .
(3.8)
Für s n*L << 1 kommen wir durch Entwicklung der e-Funktion wieder zur Ausgangsgleichung (3.2) zurück. Ein einfaches und oft brauchbares Modell für den Wirkungsquerschnitt der Atome und Moleküle ist, sie mit kleinen harten Kugeln gleichzusetzen. Haben nun die Test- und Feldteilchen die Radien r und r*, so ergibt sich aus geometrischen Gründen
s = (r + r *)2 p .
(3.9)
Das K o n z e p t d e s W i r k u n g s q u e r s c h n i t t e s ( W . Q . ) i s t a b e r v i e l a l l g e m e i n e r v e r w e n d b a r . Unter anderem können die Testteilchen auch Photonen sein, für die sich kein Radius im obigen Sinne definieren läßt. Ein wichtiger Prozeß ist beispielsweise die Absorption von Röntgenstrahlung in Materie (z.B. einer Bleiwand), wie er in der Abb. 3-2 veranschaulicht ist. Hier gilt ganz analog für die Intensität8 der Strahlung I = I0e X- Rays ei n
- n *s v x
.
(3.10)
Für das spezifizierte Material ist s dann von der Frequenz der einfallenden Strahlung abhängig. In solchen Fällen muß man zwischen dem totalen Wirkungsquerschnitt stot und dem differentiellen Wirkungsquerschnitt ds/dn unterscheiden.
X- Rays aus
Abb. 3-2: Absorption von Röntgenstrahlung.
I ei n Iau s
X
Im allgemeinen kann s eine Funktion von vielen Parametern sein. So gibt es neben der Absorption der Röntgenstrahlung auch den Prozeß der Röntgenstreuung (Compton-Effekt). Strahlung der Frequenz im Intervall n... n + dn wird in Richtung q zur Einstrahlrichtung in den Raumwinkel dW als
8 Unter der Intensität versteht man den Energiefluß der Strahlung pro Flächeneinheit, Frequenzintervall und Raumwinkel.
Also I = Nphot h n / (DA◊ DW.◊Dt). G. Fussmann , Atomphysik SS 2002
27
Atomare Prozesse Strahlung der Frequenz im Wirkungsquerschnitt :
Intervall
n’...n¢+ dn¢ gestreut. Hier
∂3s = F(n , n ¢ , q ) ∂n ∂n ¢ ∂W
lautet
der
differentielle
(3.11)
Der totale Wirkungsquerschnitt stot bzw. die partiellen Wirkungsquerschnitte ∂2s/(∂n ∂n¢), ds/dW usw. ergeben sich hieraus durch Integration über die Variablen. In welchem Umfang herausgestreute Teilchen als verloren zu betrachten sind, hängt vor allem von der Geometrie und u.U. auch vom Nachweissystem ab. Bei Verwendung von Blendensystemen (eventuell mit Streusümpfen) ist die Streuung meist gleichwertig mit der Absorption zu behandeln. Ebenso können energieselektive Nachweissysteme (Spektrometer) die inelastisch gestreuten Photonen aussortieren. Wirkungsquerschnitte werden einerseits experimentell bestimmt, andererseits auch berechnet. In der Regel basiert die Berechnung auf komplizierten quantenmechanischen Ableitungen, deren Auswertung numerisch vorgenommen werden muß. Der Vergleich zwischen Theorie und Experiment ist ein wichtiger Prüfstein für die Güte der theoretischen Beschreibung. Hat sich die theoretische Vorhersage bei einer Reihe von Tests bewährt, so kann man auch berechneten W.Q. vertrauen, für die keine Messungen vorliegen bzw. für die entsprechende Messungen noch nicht durchgeführt werden konnten. Notation: Zur Abkürzung der Schreibweise verwendet man häufig eine Kurznotation, indem durch explizite Angabe der Argumente der differentielle Wirkungsquerschnitt gekennzeichnet wird. Also z. B.
s (q , n ) :=
3.2
∂ 2s . ∂q ∂n
(3.12)
Die Rutherfordsche Streuformel
Rutherford untersuchte in den Jahren 1911-1913 die Streuung von Alpha-Teilchen (He-Kerne) durch dünne Gold- und Aluminiumfolien. Das Meßprinzip ist in der Abb. 3-3 dargestellt. Abb. 3-3: Prinzip der Rutherfordstreuung Für die Deutung der Meßresultate ging er davon aus, daß die positiv geladenen a-Teilchen durch Coulomb-Wechselwirkung mit den Atomkernen abgelenkt werden. Die Ableitung des entsprechenden differentiellen Wirkungsquerschnitts9
s ( c ) :=
ds , dW
(3.13)
9 In geringfügiger Abweichung der Notation 3.12 symbolisiert in dieser Definition s(c) nicht ds/dc. Das Argument
c charakterisiert hier lediglich den Raumwinkel dW = 2p sinc dc. G. Fussmann , Atomphysik SS 2002
28
Atomare Prozesse der angibt, mit welcher Wahrscheinlichkeit ein a-Teilchen um den Winkel c abgelenkt wird und in den Raumwinkel dW gestreut wird, gestaltet sich wie folgt: ds s
c
z
Abb. 3-4: Geometrie bei der RutherfordStreuung.
dW = 2p sin c dc
Zunächst liefert die Geometrie die Beziehungen ds = 2 ps ds
(3.14)
dW = 2 p sin c dc ,
(3.15)
und
wobei c der Ablenkungswinkel und s der sogenannte Stoßparameter ist (s. Abb. 3-4). Letzterer ist definiert als der kleinste Abstand zwischen Test- und Feldteilchen, wenn beide nicht miteinander wechselwirken würden, die Bahnen also Geraden darstellen. Setzen wir dies in Gl. (3.13) ein, so ergibt sich
s (c) =
s ds . sin c dc
(3.16)
Um hierin die rechte Seite berechnen zu können, benötigen wir eine Beziehung zwischen s und Diese Relation ergibt sich aus der Betrachtung der Kraftbilanz in y-Richtung (s. Abb. 3-5)
c.
m
dvy dt
= F sin f .
(3.17)
F ist der Betrag der Coulomb-Wechselwirkungskraft zwischen a-Teilchen (Ladung z1) und Atomkern (Feldteilchen: Ladung = z*, Masse = m*, ruhend) z z * e2 F= . 4 pe 0 r 2
(3.18)
Da diese Kräfte reine Zentralkräfte sind, bleibt beim Stoß der Drehimpuls l = mrvf = mr 2
df = const. dt
(3.19)
r erhalten (mit vf senkrecht zu r , wie bei der Planetenbewegung), woraus die zusätzliche Gleichung mr 2
G. Fussmann , Atomphysik SS 2002
df = mv0 s dt
(3.20)
29
Atomare Prozesse resultiert. v0
v0 sinc
y
Fy
F
Abb. 3-5: Coulomb-Streuung eines geladenen Teilchens auf einer Hyperbelbahn.
v0
r
s
f
c
z
Man eliminiert r2 aus (3.18) mit Hilfe von (3.20) und setzt F in (3.17) ein z z * e2 df sin f m = . 4 pe 0 sv0 dt dt dvy
(3.21)
Unter Beachtung der Integrationsgrenzen ist diese Gleichung leicht zu integrieren: v 0 sin c
z z * e2 Ú0 dvy = 4pe 0mv0 s
p- c
Ú sin f df
(3.22)
0
Hieraus ergibt sich z z * e2 v0 sin c = (1 + cos c ) 4 pe 0 mv0 s
(3.23)
Mit Hilfe der Identität cot
c 1 + cos c ∫ sin c 2
(3.24)
erhält man schließlich die gewünschte Relation zwischen Ablenkwinkel c und Stoßparameter s:
c 4 pe 0 mv02 s cot = . z z * e2 2
(3.25)
Hieraus erhalten wir nach Differentiation z z * e2 ds =. 2 2 c dc 8 pe 0 mv0 sin 2
(3.26)
Wir lösen (3.25) nach s auf und setzen dies zusammen mit dem letzten Ergebnis in (3.16) ein:
s (c) = -
G. Fussmann , Atomphysik SS 2002
z2 z *2 e 4
cos
c 2
( 4 pe 0 mv02 )2 2 sin c sin 3 c 2
.
(3.27)
30
Atomare Prozesse Mit der Identität sin c ∫ 2 sin
c c cos 2 2
(3.28)
und nach Einführung der kinetischen Energie E = m v02/2 ergibt sich schließlich die berühmte Rutherfordsche Streuformel: 2
Ê z z * e2 ˆ 1 s (c) = Á ˜ 2 4 Ë 4 pe 0 ¯ 16E sin
c 2
(3.29)
Obwohl klassisch abgeleitet, ergibt die quantenmechanische Behandlung für die reine CoulombWechselwirkung das gleiche Ergebnis. counts
Abb. 3-6: Rutherfords Messungen des differentiellen Streuquerschnitts (Punkte) im Vergleich zur Theorie (Kurve: s ~ sin -4q/2). Im Experiment wurde die Zahl der unter dem Winkel q registrierten Lichtblitze (Szintillation der a-Teilchen auf einem Zink-SulfidSchirm) mit einem Mikroskop ermittelt.
100000.
10000
1000
100
Die größte Annäherung an den Atomkern findet für die Rückstreuung c = 180° statt. Den entsprechenden kleinsten Abstand rmin erhält man aus der Energiebilanz 25
50
75
100
125
150
175
q
Ekin = Epot =
|z z*|e 2 4 pe 0 rmin
(3.30)
Für das Rutherfordsche Experiment 10 (Ekin = 7,7 MeV, z = 2, m = 4 amu (He) sowie z* = 13, m* = 27 (Al)) ergab sich rmin = 4.86◊10-15 m; das ist nur etwa der 105te Teil des Atomradius. Findet man daher, wie Rutherford, eine Abhängigkeit µ sin- 4 c /2 in der Streuintensität bis hin zu c ª 180°, so gilt das Coulomb-Gesetz mindestens bis zu Abständen r = rmin. Der Atomkern muß also noch kleiner sein. Daher zog Rutherford den Schluß: Die Atome s ind w eitgehend leer, der Atomkern, in dem s ich praktis ch die ges amte Atommas s e vereinigt, is t etw a 100 000 mal kleiner als der Atomradius . Genauere Untersuchungen wurden von Hofstadter (1956, Nobelpreis 1961) mit hochenergetischen 1 GeV-Elektronen, die im Gegensatz zu Protonen und a-Teilchen nicht der starken Wechselwirkung unterliegen, durchgeführt. Danach läßt sich der Kernradius in Abhängigkeit von der relativen Atommasse A wie folgt angeben: RKern = 1, 4 ◊ 10 -15 A1/ 3 (meter)
(3.31)
Für genauere Messungen und insbesondere bei leichteren Zielkernen bedarf die Gl. (3.29) einer Korrektur, die wir im folgenden erläutern werden. 10 Die Messungen wurden von E. Rutherfords Mitarbeitern E. Marsden und H. Geiger 1911 durchgeführt. Sie benutzten dabei jedoch noch keinen Leuchtschirm wie in Abb. 3-3, sondern beobachteten die Lichblitze auf einem Szintillator mit einem Mikroskop.
G. Fussmann , Atomphysik SS 2002
31
Atomare Prozesse 3.2.1
ZUSAMMENHÄNGE ZWISCHEN RELATIV-, SCHWERPUNKT- UND LABORSYSTEM
Bei der vorausgehenden Ableitung haben wir angenommen, daß die Feldteilchen nicht nur vor dem Stoß, sondern auch nachher in Ruhe sind. Das kann natürlich nur in Näherung für sehr schwere Feldteilchen richtig sein. Die abgeleiteten Beziehungen behalten jedoch weitgehend ihre Gültigkeit, wenn wir sie im sogenannten Relativsystem interpretieren. In diesem Fall beobachten wir die Bewegung des Testteilchens aus der Sicht des am Stoß beteiligten Feldteilchens. Gehen wir nämlich von den Gleichungen für beide Teilchen im üblichen Laborsystem aus r r r r r r z z * e2 r - r * dv * dv z z * e 2 r - r * = =m r r ; m* r r , dt dt 4 pe 0 |r - r *|3 4 pe 0 |r - r *|3
(3.32)
r r so sehen wir, daß die Addition der Gleichungen auf die Impulserhaltung mv + m * v * = const. hinausläuft. Wir können dies auch durch die Erhaltung der Schwerpunktgeschwindigkeit r mvr + m * vr * V= m+m*
(3.33)
ausdrücken. Multiplizieren wir nun die erste der beiden Gleichungen in (3.32) mit m*, die zweite mit m und subtrahieren, so erhalten wir r r r r mm * d(v - v *) z z * e 2 r - r * = r r . m+m* dt 4 pe 0 |r - r *|3
(3.34)
Hierin tauchen links und rechts nur die Geschwindigkeiten und Abstände auf, wie sie vom Ort des Feldteilchens aus beobachtet werden. In diesem sogenannten Relativsystem hat die Kraftgleichung also die ursprünglich vorausgesetzte Form r r dvrel z z * e 2 rrel m . = r dt 4 pe 0 |rrel |3
(3.35)
Allerdings ist die Masse des Testteilchens durch die reduzierte Masse m = m m*/(m+m*) zu ersetzen. Letztere ist für sehr unterschiedliche Massen mit der leichteren identisch, beträgt aber für gleiche Massen nur m = m/2. Multiplizieren wir die Gleichung (3.35) mit (-1), so sind die Abstandvektoren und Geschwindigkeiten diejenigen, wie sie vom Testteilchen aus gemessen werden; sie genügen offensichtlich derselben Differentialgleichung. In beiden Bezugssystemen bewegt sich also das jeweils andere Teilchen auf einer Hyperbelbahn.
y
y
x
y
x x
Abb. 3-7: Coulombstöße zwischen zwei Protonen (links), Proton und Antiproton (Mitte) und zwischen Proton und a-Teilchen (rechts). Die Teilchen starten mit gleichen aber entgegengesetzten Geschwindigkeiten parallel zur x-Achse am linken und rechten Bildrand.
G. Fussmann , Atomphysik SS 2002
32
Atomare Prozesse Für drei charakteristische Fälle sind die Trajektorien der stoßenden Teilchen im Laborsystem in der Abb. 3-7 dargestellt. Der Ablenkwinkel des Testteilchen in diesem Laborsystem q ist jedoch i.a. nicht mit dem früher eingeführten Ablenkwinkel c identisch. Letzterer ist nämlich der Winkel wie er im Relativsystem erscheint. Um den Zusammenhang zwischen q und c herzustellen, müssen wir einige Betrachtungen im Relativsystem und im Schwerpunktsystem anstellen. r Bezeichnen r r rwir zur Abkürzung die Relativgeschwindigkeiten vor und nach dem Stoß mit u = vrel = v - v * und r r r u©= v ©- v ¢ * , so können wir die entsprechenden Laborgeschwindigkeiten durch diese und die Schwerpunktsgeschwindigkeit ausdrücken r r r m* r r m r v=V+ u; v * = V u m + m * m + m * r r r m* r r m r v¢ = V + u¢ ; v ¢ * = V u¢ m+m* m+m*
(3.36)
Man zeigt nun leicht, daß bei einem elastischen Stoß (d.h. mv2 + m*v*2 = mv' 2 + m*v'*2) die r Relativgeschwindigkeit vor und nach dem Stoß dem Betrage nach gleich ist (u = u'). Der Vektor u des Relativsystems erfährt also eine reine Drehung. Vom Relativsystem zu unterscheiden ist das Schwerpunktsystem. rDieses Koordinatensystem bewegt sich gegenüber dem Labor mit derr Geschwindigkeit V nach Gl. (3.33). Die r r Geschwindigkeiten in diesem System vS = v - V usw. können wir direkt der Gleichung (3.36) r r r r r r entnehmen: vS = m * u /(m + m*), vS * = - mu /(m + m*) und ebenso v ¢ S = m * u¢ / (m + m*), r r vS ¢* = - mu©/(m + m*) . In großer Entfernung bewegen sich die Teilchen in diesem System vor dem Stoß auf einer Geraden auf den Koordinatenursprung zu und entfernen sich danach auf einer gedrehten Geraden wieder von ihm. Wegen u = u' erfahren auch im Schwerpunktsystem die Geschwindigkeiten eine reine Drehung (d.h. vS = v' S , vS* = v s'*). Der Drehwinkel c ist dabei der gleiche wie im Relativsystem. Die Verhältnisse sind in der Abb. 3-8 erläutert. r vS ¢
r vS r vS* ¢
r vS*
c
S-System
Abb. 3-8: Die Geschwindigkeitsvektoren vor und nach dem Stoß im Schwerpunktund Relativsystem.
Die Abb. 3-9 demonstriert nun den Zusammenhang des Winkels c mit den Winkeln des Testteilchens q r und des Feldteilchens q* im Laborsystem, wenn u* r das Feldteilchen vor dem Stoß ruhend ist. Hierbei u c ist es günstiger, sich auf die Impulse der Teilchen zu beziehen. Alle drei Winkel werden auf die Relativsystem Richtung des einfallenden Testteilchens bezogen. Zerlegen wir nun die Impulse des Testteilches vor und nach dem Stoß in Schwerpunkt- und Relativanteile gemäß r r r r r r r r r p = m(V + vS ) = mV + m u; p ¢ = m(V + v¢ S ) = mV + m u¢ ,
G. Fussmann , Atomphysik SS 2002
(3.37)
33
Atomare Prozesse Abb. 3-9: Zur Berechnung der Winkel im Schwerpunkt- und Laborsystem.
C r p¢
q A
r p¢ *
c
q*
M pr
so liegt wegen der Erhaltung des Betrages der Relativgeschwindigkeit der Vektor p' auf einem Kreis mit dem Radius m u B = m v. Die Strecke rAM zum Mittelpunkt des Kreises ist der Schwerpunktanteil m V des Testteilchenimpulses. Aus der Betrachtung des gleichschenkligen Dreiecks MBC erhalten wir sofort die Beziehung c + 2q* = 180°. Ferner entnehmen wir der Abb. 3-9 tan q =
m v sin c sin c = , mV + m v cos c m / m * + cos c
(3.38)
die wir nach dem Streuwinkel im Schwerpunktssystem auflösen können 2
Ê m ˆ m cos c = sin 2 q + cos q 1 - Á sin q ˜ . m* Ëm* ¯
(3.39)
Für m << m* erhalten wir hieraus cosc = cosq und somit c = q , so daß dann der Streuwinkel im Schwerpunktsystem (c) mit dem Ablenkwinkel im Laborsystem (q) zusammenfällt. Für gleiche Massen ergibt sich dagegen c = 2 q. Der Gleichung (3.39) entnehmen wir außerdem, daß im Laborsystem ein maximaler Ablenkwinkel mit sinqmax = m*/m und coscmax = -m*/m auftritt, falls die Testteilchen eine größere Masse als die Feldteilchen besitzen. In diesem Fall liegt in der Abb. 3-9 der Punkt A außerhalb des Kreises. Die Relationen zwischen q und c nach Gl. (3.38) sind in der Abb. 3-10 für einige Massenverhältnisse dargestellt. q p
Abb. 3-10: Ablenkwinkel im Laborsystem (q) als Funktion des Ablenkwinkels im Schwerpunktsystem (c) für die Massenverhältnisse m/m* = •, 2, 1 und 1/2.
3p ÅÅÅÅÅÅÅÅ 4 p ÅÅÅÅ 2
2 1
p ÅÅÅÅ 4
1ê2 p ÅÅÅÅ 4
p ÅÅÅÅ 2
E* =
3p ÅÅÅÅÅÅÅÅ 4
c p
Für die auf das Feldteilchen übertragene Energie E* = p*2/2m* erhalten wir unmittelbar aus der Abb. 3-9 die wichtige Beziehung
( m u 2 sin c / 2)2 4 mm * E. £ 2m * (m + m*)2
(3.40)
Zur Auswertung der Experimente kann man nun zwei Wege beschreiten. Die erste Möglichkeit besteht darin, alle gemessenen Winkel gemäß Gl. (3.39) auf das Schwerpunktssystem umzurechnen. Auch der Raumwinkel im Laborsystem D WL = 2p sinq Dq ist allerdings auf denjenigen im Schwerpunkt DWS = 2p sinc Dc = 2p sinc (dc/dq) Dq umzurechnen. Dividiert man G. Fussmann , Atomphysik SS 2002
34
Atomare Prozesse nun die gemessenen Teilchenzahlen N(c) durch DWS(c), so sollte sich bei reiner Coulombstreuung eine Proportionalität mit ~ sin-4(c/2) gemäß der Rutherfordformel (3.29) ergeben. Die zweite Vorgehensweise besteht darin, die Gl. (3.29) direkt auf das Laborsystem umzurechnen, was den Vorteil der direkten Verwendungsmöglichkeit hat, aber zu sehr unübersichtliche Formeln führt. Für diesen differentiellen Wirkungsquerschnitt im Laborsystem erhalten wir zunächst
s (q ) =
sin c dc ds = s (c) = s ( c (q )) f (q ) , 2 p sin q dq sin q dq
(3.41)
wobei c = c(q) nach Gl. (3.39) in Gl. (3.29) einzusetzen ist. Für die Korrekturfunktion der rechten Seite ergibt sich der etwas umständliche Ausdruck f (q ) =
sin c dc m 1 + (m / m*)2 cos 2q =2 cos q + . sin q dq m* 1 - (m / m*)2 sin 2 q
(3.42)
Für einige Massenverhältnisse ist die Abhängigkeit des Steuwirkungsquerschnittes vom Laborstreuwinkel der Abb. 3-11 zu entnehmen. Wie zu erwarten, reagiert die Rückwärtsstreuung besonders empfindlich auf Verhältnis der Massen. Diese Veränderung des Verlaufs von s(q) bei kleinen und mittleren Massenverhältnissen muß natürlich bei der Bestimmung der Kernradien beachtet werden. ln@sD 10 8 6 4
Abb. 3-11: Logarithmischer Verlauf des Wirkungsquerschnittes als Funktion des Laborwinkels für die Massenverhältnisse m/m* = • (durchgezogen), 5 (gepunktet), 1 (gestrichelt) und 1/2 (durchgezogen).
Als weitere Konsequenz der Gl. (3.35) ist in allen Relationen (und somit in der Gleichung (3.29)) q p p 3 p p anstelle der kinetischen Energie des ÅÅÅÅ ÅÅÅÅ ÅÅÅÅÅÅÅÅ 4 2 4 Testteilchens E = mv2/2 die 2 Relativenergie Erel = m u /2 einzusetzen, was bei anfänglich ruhendem Feldteilchen auf Erel = m v2/2 führt. 2
3.2.2
DISKUSSION DER RUTHERFORD-STREUFORMEL
∑ Der differentielle Wirkungsquerschnitt s(q) ist proportional zu den Quadraten beider Ladungen. Das Ladungsvorzeichen ist somit belanglos. ∑ Der Wirkungsquerschnitt ist umgekehrt proportional zum Quadrat der Relativenergie Erel = m v2/2 (relativistisch ist der Term 16 E2 in Gl. (3.29) durch 4 p 2 v2 zu ersetzen). Langsame Teilchen werden damit wesentlich stärker gestreut als schnelle. ∑ Die Winkelverteilung s ~ sin-4(c/2) bevorzugt sehr stark kleine Streuwinkel. Man beachte, daß c der Winkel im Relativ- bzw. Schwerpunktsystem ist. ∑ Der totale Wirkungsquerschnitt
G. Fussmann , Atomphysik SS 2002
35
Atomare Prozesse 2 c min 2 Ê z z * e 2 ˆ p cot 2 = Ú s ( c ) 2 p sin c dc = Á ˜ 2 4Erel Ë 4 pe 0 ¯ c min p
s tot
(3.43)
divergiert für cmin Æ 0 bzw. smax Æ •. Man muß daher anhand von physikalischen Überlegungen eine untere Grenze definieren. Hierfür ist insbesondere die Abschirmung der Feldteilchenladung zu betrachten. Im Festkörper geschieht dies durch die Elektronenhülle (smax ª rAtom), im Plasma durch die frei beweglichen Elektronen (smax = rDebye = (e0 kB Te/e2 n e)1/2). Für Rückstreuung (cmin = 90°) erhält man 2
s Rück
Ê z z * e2 ˆ p . =Á ˜ 2 Ë 4 pe 0 ¯ 4Erel
(3.44)
Das gleiche Resultat ergibt sich, wenn man aus Gl. (3.25) den Stoßparameter für 90°Ablenkung ausrechnet s90∞ =
|zz*|e 2 1 . 4 pe 0 2Erel
(3.45)
und in s90° = p s902 einsetzt. Mit dem Stoßparameter für 90°-Ablenkung läßt sich die RutherfordStreuformel in der kompakten Form 2 2 s90 s90 ∞ ∞ s (c) = = 4 4 sin c / 2 (1 - cos c )2
(3.46)
schreiben. ∑ Für viele Anwendungen (z.B. Berechnung von Reibungskräften, Diffusions- oder MobilitätsKoeffizienten) benötigt man nicht den totalen Wirkungsquerschnitt, sondern den Wirkungsquerschnitt für Impulsübertrag (momentum transfer cross-section), der wie folgt definiert ist p
s m :=
Ú s ( c )(1 - cos c ) 2p sin c dc .
(3.47)
c min
Als Wichtungsfaktor geht hier (1 - cosc) = 2 sin2c/2, der relative Impulsverlust des Testteilchens in Vorwärtsrichtung, ein. Gewöhnlich ist sm kleiner als s tot, da die Bedeutung der Vorwärtsstreuung durch den Wichtungsfaktor erheblich gemindert wird. Für die CoulombStreuung erhalten wir nun anstelle von Gl. (3.43) 2 s m = 4 ps90 ∞ ln
1 2 2 ª 4 ps90 . ∞ ln sin c min / 2 c min
(3.48)
Dieser Ausdruck divergiert zwar noch immer für cmin Æ 0, aber nur logarithmisch, so daß für cmin eine grobe Abschätzung genügt, um ein brauchbares Ergebnis zu erhalten.
G. Fussmann , Atomphysik SS 2002
36
Atomare Prozesse 3.2.3
RUTHERFORD RÜCKSTREUNG
Der Umstand, daß im Falle m < m* die Testteilchen (Projektile) an den schweren Feldteilchen auch zurückgestreut werden können, ermöglicht ein Analyseverfahren, das bereits von Rutherford selbst benutzt wurde (Rutherford Back Scattering, RBS). Hierbei schießt man leichte, monoenergetische Ionen (typisch 4He+ mit E0 = 1- 2 MeV) senkrecht auf die Oberfläche der zu untersuchenden Probe (s. Abb. Abb. 3-12) und mißt die Energie E1 = k E0 der reflektierten Projektile in Nähe der Rückwärtsrichtung (q ª 170°). Abb. 3-12: Prinzip der RBS Analyse Das Energiespektrum der gestreuten Teilchen gibt Auskunft über die Masse der Feldteilchen in unterschiedlichen Tiefen (bis zu etwa 100 Nanometer) der Probe. Für den kinematischen Faktor k = E1/E0 ergibt sich aus Gl. (3.40) k = 1 – E*/E ª 1- 4 m/m*. Für die quantitative Auswertung ist aber auch der Energieverlust der Projektile auf dem Hin- und Rückweg zu berücksichtigen, was in der Regel den Vergleich mit einer Computersimulation erforderlich macht.
3.3
Einige wichtige Stoßprozesse
In der Natur kommen sehr verschiedenartige atomare Stoßprozesse vor. Neben der Vielzahl der Teilchen, die miteinander in Wechselwirkung treten können, gibt es Zwei-, Drei- und Vielteilchenstöße. Schon die theoretische Behandlung der Zweierstöße führt auf erhebliche mathematische Probleme; Dreierstöße und Vielteilchenstöße sind u.a. wegen der Vielzahl der auftretenden Parameter (Dimensionen) nur in Ausnahmefällen untersucht. Glücklicherweise sind die Zweierstöße die mit Abstand häufigsten und, von Ausnahmen abgesehen, auch die wichtigsten. Dies ist insbesondere in Gasen und Plasmen mit geringer Dichte der Fall, da die Wahrscheinlichkeit, daß dann drei oder mehr Teilchen sich gleichzeitig so nahe kommen, daß sie miteinander reagieren können, sehr klein ist. In der folgenden Tabelle 3-1 sind einige wichtige Stoßprozesse zusammengestellt. Zu jedem Prozeß ist auch der entsprechende Umkehrprozeß (inverser Prozeß) angegeben. Sich selbst überlassen, strebt jedes System dem thermodynamischen Gleichgewicht zu, das durch das Prinzip der detaillierten Bilanz gekennzeichnet ist: jeder Prozeß steht dann mit seinem inversen im Gleichgewicht. Die S t o ß p r o z e s s e unterliegen den Erhaltungssätzen für E n e r g i e , I m p u l s u n d D r e h i m p u l s . Wegen der Erhaltung von Energie und Impuls ist es beispielsweise nicht möglich, daß ein Ion einfach ein Elektron einfängt und zum Atom rekombiniert. Es muß vielmehr gleichzeitig ein Photon abgestrahlt werden (Strahlungsrekombination, Reaktion 6B) oder es muß ein zweites Elektron zugegen sein, das den überschüssigen Impuls des ersten aufnehmen kann (Dreierstoßrekombination, Reaktion 3B).
G. Fussmann , Atomphysik SS 2002
37
Atomare Prozesse Reaktion 1 2 3 4 5
Prozeß (A) elastischer Elektronenstoß e+A
¤
Inverser Prozeß (B) inv. Stoß A+e
Elektronen-Stoßanregung e+A
¤
Stoßabregung (Stoß 2. Art) A* + e
Elektronen-Stoßionisation e+A
¤
Dreierstoßrekombination A+ + 2e
¤
inv. Streuung A + hn
inelastische Compton-Streuung hn + e
¤
inv. Compton-Streuung e + hn’
Photoionisation hn + A
¤
Strahlungsrekombination A+ + e
¤
spontane Emission A*
¤
Bremsstrahlung A+ + e
¤
inv. Atom-Atomstoß B+A
¤
Stoß -Abregung (2. Art) A + B*
Anregungsaustausch A* + B
¤
inv. Anregungsaustausch A + B*
Ladungstransfer A+ + B
¤
inv. Ladungstransfer A + B+
elastische Rayleigh-Streuung hn + A
6 7 8 9 10 11
Photoabsorption hn + A inverse Bremsstrahlung hn + e + A+ elast. Atom-Atomstoß A+B Atomstoß-Anregung A+B
12
Tabelle 3-1: Einige Stoßreaktionen: (1-3) Elektronen-Stöße mit Atomen und Ionen, (4-7) Photonenstöße mit Elektronen, Atomen und Ionen, (9-12) Atom-Atom- und Atom-Ionenstöße. 3.3.1
ELASTISCHE STREUUNG VON ELEKTRONEN
Totale Wirkungsquerschnitte für die Streuung von Elektronen an Atomen wurden erstmals von C. W. Ramsauer (1921) gemessen. Die von ihm verwendete Meßanordnung ist in der Abb. 3-13 dargestellt11. Einige Ergebnisse sind in der Abb. 3-14 wiedergegeben. Abb. 3-13: Ramsauer-Meßapparatur. Gemessen werden die Ströme DI und I7 an den Auffangelektroden A1 und A2.
DI
I7
An der negativ vorgespannten Zinkkathode (Z) werden durch Bestrahlung mit UV-Licht Elektronen ausgelöst. Diese werden durch ein senkrechtes Magnetfeld auf eine Kreisbahn mit dem Gyroradius rg = v me/eB gezwungen. Mit Hilfe der Blenden B1…B8 wird (je nach Magnetfeld) eine bestimmte Geschwindigkeit selektiert. Das gekrümmte Blendenrohr kann evakuiert und sodann mit Gas (Dichte n) gefüllt werden. Mit den Auffangelektroden A2 und A1 werden die Elektronenströme I7 = I1 exp(-n s L7) und DI =
11 Raumsauer führte auch 1915 erstmalig den Begriff des Wirkungsquerschnittes ein.
G. Fussmann , Atomphysik SS 2002
38
Atomare Prozesse I6 - I7 = I1 [exp(-n s L6) - exp(-n s L7)] gemessen. DI gibt an, wieviele Elektronen durch Stoß auf der Kreisbogenstrecke s = L7 - L6 verloren gehen. Der Wirkungsquerschnitt ergibt sich damit aus
s=
ln[( I7 + DI ) / DI ] ns
(3.49)
Die Ramsauersche Meßapparatur ist nicht in der Lage, elastische und inelastische Streuprozesse zu trennen. In der Apparatur ist jedoch der Elektronenenergiebereich so niedrig, daß letztere (d.h. Anregungs-und Ionisationsstöße) nicht auftreten können. Man entnimmt der Abbildung, daß bei den schweren Edelgasen (Ar, Kr, Xe) der W.Q: für elastische Elektronenstreuung bei Elektronenenergien um ª 1 eV extrem klein wird. Diese als Ramsauer-Effekt bezeichnete Erscheinung kann nur durch quanten-mechanische InterferenzEffekte erklärt werden: In den Minima von s ist die de Broglie-Wellenlänge der freien Elektronen näherungsweise gleich dem Atomradius (genauer: in den atomaren Potentialtopf passen ganzzahlige Vielfache von lBroglie.). Die Wellenfunktion des gestreuten Elektrons hat dann die gleiche Phase wie das nichtgestreute, und es kommt zu einer kohärenten Überlagerung der Wellen, die mit keiner Ablenkung des Teilchens verbunden ist.
Abb. 3-14: Totale Wirkungsquer-schnitte der Edelgase als Funktion der Elektronenenergie. Die praktische Bedeutung des RamsauerEffekts beruht auf folgendem: In Gasen mit kleinen elastischen Wirkungsquerschnitten besitzen die Elektronen eine große freie Weglänge. Liegt ein elektrisches Feld an, so können sie somit zwischen zwei Stößen eine hohe kinetische Energie aufnehmen, die u.U. ausreicht, die Gasatome zu ionisieren. Hierdurch werden weiter Elektronen erzeugt, und es bildet sich eine Elektronenlawine aus, die einen elektrischen Durchschlag zur Folge hat. Derartige Gase besitzen mithin eine kleine elektrische Spannungsfestigkeit. 3.3.2
ANREGUNG VON ATOMEN DURCH ELEKTRONENSTOß
Diese Prozesse sind durch eine Schwellenergie gekennzeichnet. Liegt die Elektronenenergie unterhalb des niedrigsten Anregungsniveaus, so ist keine Anregung möglich (s. Franck-HertzVersuch). Die Abb. 3-15 zeigt die Verhältnisse für die Anregung beim Wasserstoffatom für das Niveau mit der Hauptquantenzahl n = 2. Hier liegt die Schwellenergie bei E2 = 10,2 eV. Die Berechnung der Stoßanregung der Atome und Ionen von einem gebundenen Zustand i in einen anderen j erfordert i.a. sehr aufwendige quantenmechanische Rechnungen. Eine vereinfachte Behandlung des Problems ist im Rahmen der Bornschen Näherung für große kinetische Energien der stoßenden Elektronen (d.h. E >> Eij) möglich. H. Bethe fand auf diese Weise bereits 1930, daß der Wirkungsquerschnitt für Elektronenstoßanregung grundsätzlich die Form
G. Fussmann , Atomphysik SS 2002
39
Atomare Prozesse 2
[
s ij = 4 pa ( Ry / Eij ) fijU ln( aU ) + bU 2 0
2
-1
-2
( )] ª 3, 5 ◊ 10
+O U
-3
-20
Ê Ry ˆ ln U 2 Á E ˜ fij U [m ](3.50) Ë ij ¯
haben sollte. Hierin ist U = E/Eij, Eij = Ej - Ei die Anregungsenergie, Ry = Eion(H) = 13,6 eV; a0 = 5,29◊10-11 m der Bohrsche Radius und a, b Konstanten der Größenordnung 1. Die mit dem Dipolmoment dij des Übergangs zusammenhängende dimensionslose Größe fij =
2me Eij |dij |2
(3.51)
e 2h2
wird als Oszillatorenstärke12 bezeichnet, sie ist für starke Linien von der Größenordnung 1. Eine noch einfachere Beziehung wurde von Seaton und van Regemorter für optisch erlaubte Übergänge (s. Kap. 11) hergeleitet, indem sie den Stoßvorgang als einen induzierten Strahlungsübergang behandelten13. Sie erhielten
s ij = 4 pa02 (2 p / 3 )Ry 2 g
fij Eij E
= 2, 36 ◊ 10 -17 g
fij Eij E
(m -2 )
(3.52)
mit E und Eij in eV. Hierin ist g wiederum ein Anpassungsfaktor (Gauntfaktor), der für energiereiche Strahlung (d.h. Änderung der Hauptquantenzahl Dn ≥ 1) näherungsweise bei g = 0,2, für die energiearmen Dn = 0 Übergänge dagegen eher bei 0,8 liegt. Ein Beispiel für den Wirkungsquerschnitt des Wasserstoffatoms für die Anregung aus dem Grundzustand in das Niveau mit der Haupquantenzahl n = 2 (zerfällt unter Aussendung von Lyman-a -Strahlung) ist in der Abb. 3-15 gezeigt. Abb. 3-15: Wirkungsquerschnitte des Wasserstoffatoms für die Prozesse: 1) Elektronen-Stoßanregung: e + H (1s) -> e + H* (2p), 2) Elektronenstoßionisation : e + H(1s) -> e + H+ +e und 3) Ladungsaustausch: e + H -> H + e (CX, 100fach verkleinert).
s @m-2 D -20 1µ10 -21
1s->2p
-21
H->H+
8µ10 6µ10
-21
4µ10
CX *0.01 -21
2µ10
20
40
60
80
E @evD 100
Ein weiteres Beispiel zeigt die Abb. 3-16 für die Anregung des Heliumatoms. Für die beiden gezeigten Kurven ist die Schwellenergie nahezu gleich (Eij ª 21,7 eV). Der unterschiedliche Verlauf der Anregungswirkungsquerschnitte als Funktion der Elektronenenergie für den für Dipolstrahlung "erlaubten" und den "verbotenen" Übergang kann zur Messung der Elektronentemperatur eines dünnen Plasmas herangezogen werden. Aufgrund der unterschiedlichen Anregungswahrscheinlichkeiten ist das Verhältnis der Triplett/Singulett-Linienintensität der Strahlung eine Funktion der Temperatur. Erkärung: Mit zunehmender Energie (Temperatur) der Elektronen wird bevorzugt das Singulettsystem (1S) bevölkert, das unter Aussendung von Strahlung (spontane Emission) zerfällt. 12 Es gilt der f -Summensatz von Kuhn und Thomas : Ist i der Grundzustand und sind Z-Elektronen vorhanden, so gilt S f = Z . j ij
Für Wasserstoff (Z = 1) hat man: f12 = 0,42 (Ly-a), f13 = 0,079 (Ly-b) sowie für das Kontinuum f1• = 0,44. 13 Dies führt letztlich wieder auf eine zum Bremsstrahlungsproblem analoge Beschreibung. Einzelheiten findet man bei I. H. Hutchinson, Principles of Plasma Diagnostics, chap. 6. G. Fussmann , Atomphysik SS 2002
40
Atomare Prozesse
s @m-2 D -21 1µ10
Abb. 3-16: Wirkungsquerschnitte für Elektronen-Stoßanregung aus dem Grundzustand (1s2) beim Helium. Der Übergang zum Zustand 1s 2p 1P ist auch optisch erlaubt, derjenige zum metastabilen Niveau 1s2s 3S (gestrichelt) ist dagegen "verboten"; er kann nur durch Austausch eines der beiden Atomelektronen mit dem stoßenden Elektron angeregt werden
1s2 ->1s2p»1 P
-22
8µ10
-22
6µ10
-22
4µ10
-22
1s2 ->1s2s»3 S
2µ10
20
3.3.3
40
60
80
100
E @evD
IONISATION DURCH ELEKTRONENSTOß
Auch hier muß das Elektron mindestens die Ionisationsenergie als kinetische Energie besitzen, um einen Ionisationsprozeß auszulösen. Oberhalb eines Maximums nimmt der Querschnitt wieder langsam ab. In der Abb. 3-17 sind die Ionisationsquerschnitte der Edelgase im Vergleich zum Wasserstoff wiedergegeben. In grober Näherung lassen sich die Ionisationswirkungsquerschnitte wiederum durch eine Bethe-Formel der Art
s ion = az
ln(E / Eion ) EEion
(3.53)
mit a ª 4,4◊10-17 m-2 (eV)2 beschreiben. Hierin ist z die Zahl der Elektronen in der äußeren Schale, die zur Ionisation beitragen können und Eion deren Ionisationsenergie. Abb. 3-17: Wirkungsquerschnitt für die Ionisation von Wasserstoff und der Edelgasatome He, Ne, Ar und Xe. Für Ar und Xe sind die Kurven um die Faktoren 3 bzw. 5 verkleinert (n. Demtröder, Experimentalphysik III).
3.3.4
PHOTOIONISATION
Das Schwellverhalten ist hier besonders stark ausgeprägt. Die Abb. 3-18 zeigt einige Beispiele für die Alkalimetalle, die sich aufgrund ihrer geringen Ionisationsenergie besonders leicht durch UVLicht ionisieren lassen. Die Wirkungsquerschnitte (in der Abbildung in barn, der in der Kernphysik üblichen Größe, 1 barn: = 1◊10-28 m2) sind im Vergleich zu den anderen betrachteten Prozessen sehr klein
G. Fussmann , Atomphysik SS 2002
41
Atomare Prozesse
Abb. 3-18: Photoionisations-Wirkungsquerschnitte für Alkalidämpfe als Funktion der Wellenlänge (n. Marr, Plasmaspectroscopy).
3.3.5
LADUNGSAUSTAUSCHPROZESSE
Diese auch als Ladungstransfer-Prozesse (charge exchange, Abk. CX) bezeichneten Vorgänge zeichnen sich durch h o h e W i r k u n g s q u e r s c h n i t t e aus. Extrem hohe Wirkungsquerschnitte (>10-15 cm2) treten beim Stoß von Protonen mit Wasserstoffatomen auf, da hier wegen der Gleichheit der Atomrümpfe (das Elektron kann mit gleicher Wahrscheinlichkeit an das erste oder zweite Proton gebunden werden) ein Resonanzprozeß vorliegt. Im Gegensatz zu den Anregungs- und Ionisationsprozessen liegt hier aber k e i n S c h w e l l v e r h a l t e n hinsichtlich der Energie vor (s. Abb. 3-15). Für H-Atome und Protonen hat man im Bereich 0,1 < E < 105 eV die empirische Formel (1 - 0, 155 log 10 E)2 s cx = 0.694 ◊ 10 -17 (m -2 ) -14 3,3 1 + 0, 11 ◊ 10 E
(3.54)
Derartige Ladungsaustauschprozesse spielen in Gasentladungen und magnetisch eingeschlossenen Plasmen eine bedeutende Rolle, da hierdurch aus heißen Ionen (Protonen) hochenergetische neutrale Atome entstehen können. Letztere sind nicht mehr ans Magnetfeld gebunden und können bei Auftreffen auf Wänden zur Zerstäubung (sputtering) des Materials führen. 3.3.6
ZUSAMMENFASSUNG
∑ Elastische Elektronenstöße weisen Wirkungsquerschnitte in der Größenordnung von 10-19 m2 ª p a02 auf (a0 = Bohrscher Radius = 0,53◊10-10 m). Bei einigen Elementen treten jedoch bei kleinen Elektronenenergien deutlich verringerte Werte auf (Ramsauer-Effekt). ∑ Elektronenstoßanregung und Elektronenstoßionisation sind in der Praxis außerordentlich wichtige Prozesse. Sie führen zu Leuchterscheinungen (Anregung) in Gasen und beeinflussen auch sehr stark deren elektrische Leitfähigkeit (Ionisation). Die Wirkungsquerschnitte zeigen ein Schwellverhalten hinsichtlich der Elektronenenergie. Bei neutralen Atomen liegt diese Schwellenergie typisch bei einigen eV (Maximum bei He: 24,6 eV). Die Wirkungsquerschnitte fallen nach Erreichen eines Maximums (Größenordnung 10-19 m2 bei ca. 3x Schwellenergie) langsam ab. ∑ Photoionisationsprozesse sind durch wesentlich kleinere Wirkungsquerschnitte (ca. 10-23 m 2) gekennzeichnet. Sie zeigen ein sehr scharfes Schwellverhalten. Aufgrund der kleinen Wirkungsquerschnitte ist die Photoionisation (und ebenso die Photoanregung) in Gasen und Plasmen i.a. von untergeordneter Bedeutung. In Festkörpern dagegen kann die Photoionisation eine gewichtige Rolle spielen (Photoeffekt). G. Fussmann , Atomphysik SS 2002
42
Atomare Prozesse ∑ Ladungsaustauschprozesse sind in Gasen und Plasmen von großer Bedeutung aufgrund der sehr großen Wirkungsquerschnitte von ca. 10-18 m2 (die größten atomaren W.Q. überhaupt). Die Abhängigkeit von der Energie der Stoßpartner ist nicht sehr stark ausgeprägt. Die Kenntnis der Wirkungsquerschnitte ist zum Beispiel bei der Herstellung von neutralen Atomstrahlen von Bedeutung. 3.4
Freie Weglängen und mittlere Reaktionsraten
Unter der freien Weglänge l versteht man diejenige Strecke, auf der ein Testteilchen mit der Wahrscheinlichkeit w = 1 - 1/e = 0,63 einen Stoß vollführt. Der Gl. (3.8) entnehmen wir, daß damit die freie Weglänge durch die einfache Beziehung
l=
1 . n*s
(3.55)
gegeben ist. Häufig hat man es jedoch mit Test- und Feldteilchen zu tun, die eine Geschwindigkeitsverteilung aufweisen. Außerdem ist s selbst in der Regel noch von der Energie der stoßenden Teilchen abhängig. Man ist dann an der freien Weglänge bei Mittelung über alle Geschwindigkeiten interessiert. Diese gemittelte Größe ergibt sich aus der Betrachtung der Reaktionsrate (dn/dt), das ist die Zahl der Prozesse im Volumenelement pro Zeiteinheit. Für einen monoenergetischen Strahl von Testteilchen der Geschwindigkeit v und ruhenden Feldteilchen ist diese durch die Ratengleichung dn = - nv sn * dt
(3.56)
gegeben, wobei das Produkt n v die Teilchenflußdichte der Testteilchen ist. Im allgemeinen, d.h. bei sich bewegenden Test- undr Feldteilchen, ist aber die Reaktionsrate proportional zum Betrag der r Relativgeschwindigkeit u =|v - v *| der Teilchen; ebenso ist s bei einem Zweier-Stoß eine Funktion von u und wir haben dn = - nn * u s (u) . dt
(3.57)
Aus dieser Relation können wir sofort die r Stoßfrequenz n = |dn/dt|/n = n*u s(u) ablesen. Bei vorgegebener Testteilchengeschwindigkeit v ergibt sich die mittlere Stoßfrequenz durch Mittelung über alle Feldteilchengeschwindigkeiten. Der reziproke Wert ist die Stoßzeit für die betrachteten Testteilchen
t=
1 1 = n vr * n * u s (u)
.
(3.58)
r v*
r Sie ist i.a. noch eine Funktion von v. Bei isotroper Geschwindigkeitsverteilung der Feldteilchen wird sie jedoch unabhängig vom Einfallswinkel der Testteilchen und hängt dann lediglich noch von deren Betrag ab t = t(v). Multiplizieren wir sie mit der Geschwindigkeit der Testteilchen, so erhalten wir deren freie Weglänge.
l = vt =
G. Fussmann , Atomphysik SS 2002
v n * u s (u)
(3.59) r v*
43
Atomare Prozesse Bilden die Testteilchen jedoch keinen Teilchenstrahl mit einheitlicher Geschwindigkeit, so ist über ihre Geschwindigkeitsverteilungsfunktion ebenfalls zu mitteln, um die mittlere freie Weglänge zu erhalten.
l =
1 n*
v u s (u)
. r v*
(3.60)
r v
Unter Umständen kann das Testteilchen mit einer Feldteilchenart verschiedene Stöße vollführen (z.B. elastische Stöße, Anregungs- und Ionisationsstöße), und natürlich können mehrere Feldteilchensorten vorliegen. In diesem Falle ist die Stoßzeit reziprok zur totalen Stoßfrequenz und wir erhalten in Verallgemeinerung der letzten Gleichung für die mittlere freie Weglänge der Teilchensorte "a" die Beziehung
la
=
r |v a |
Ân b
b
r r r r |va - vb |Â k s abk (|va - vb |)
. r vb
(3.61)
r va
Hierbei ist über alle Teilchensorten vom Typ "b" (einschließlich b = a) und deren mögliche Reaktionen mit den "a"-Teilchen (Index k) zu summieren. Derartige Mittelungen über zwei Geschwindigkeitsverteilungen erfordern i.a. Fall eine sechsfache Integration über die Geschwindigkeitskoordinaten der beiden Teilchensorten. Einfachere Verhältnisse ergeben sich für die mittlere Reaktionsrate dn dt
= - nn * u s (u)
(3.62)
v,v*
insbesondere im Falle des thermodynamischen Gleichgewichts. Die und Geschwindigkeiten genügt dann der Boltzmann-Statistik14, Wahrscheinlichkeitsdichte für die Testteilchen ist durch Ê m ˆ w(vx , vy , vz ) dvx dvy dvz = Ë 2 pkT ¯
3/2
e
-
Verteilung der die normierte
m ( v x2 + v y2 + v z2 ) 2 kT
dvx dvy dvz
(3.63)
gegeben (k = 1,3807◊ 10-23 JK-1 ist die Boltzmann-Konstante). Eine entsprechende Relation mit gleicher absoluter Temperatur T* = T existiert für die Feldteilchen. Durch Abspaltung der Schwerpunktgeschwindigkeit ergibt sich hier eine erhebliche Vereinfachung. r r Mit den in Kap. 3.2.1 abgeleiteten Beziehungen zwischen Schwerpunkt( V = ( mv + m * v *)/(m + m*)), Relativr r r ( u = v - v *) und Laborgeschwindigkeit r r v=V+
r m* r r m r u u; v * = V m+m* m+m*
(3.64)
berechnet sich der Mittelwert einer Größe A durch Integration über Schwerpunkt- und Relativgeschwindigkeit 14 Anstelle der Wahrscheinlichkeitsfunktionen w betrachtet man in der kinetischen Theorie die Verteilungsfunktionen f = w◊n, die als Dichten im 6-dimensionalen Phasenraum (x, y, ,z, vx, vy , vz) aufzufassen sind. Hierin ist n die übliche Ortsraumdichte. Die Boltzmann-Besetzung ist dann identisch mit der Maxwell-Verteilung fM = n (m/2pkT)3/2 exp(-m v2/2kT).
G. Fussmann , Atomphysik SS 2002
44
Atomare Prozesse r r (mm*)3 / 2 A = ÚÚ A w(v ) w(v *) d 3 v d 3 v* = (2 pkT )3
ÚÚA
e
-
( m + m *)V 2 + m u 2 2 kT
d 3Vd 3u
(3.65)
mit der reduzierten Masse m = m m*(m+m*). Falls A = A(u), läßt sich die Integration über die Schwerpunktgeschwindigkeit analytisch abspalten, so daß die gesamte Mittelung auf ein Einfachintegral reduziert werden kann. Für die in Gl. (3.62) auftretende Größe u s(u) ergibt sich somit nach Einführung der Relativenergie Er = m u2/2 2
•
us
•
m u2
(mm*)3 / 2 - ( m +2mkT*)V = e 4 pV 2 dV Ú e 2 kT us (u) 4 pu2 du 3 Ú (2 pkT ) 0 0
(3.66) =
2Ê m ˆ p Ë kT ¯
2
3/2 •
Ú
e
-
mu 2 kT
u3s (u) du =
0
4 2 pm( kT )3
•
Ú
e
-
Er kT
Ers (Er ) dEr
0
worin das letzte Integral gewöhnlich numerisch ausgewertet werden muß. Setzen wir in Gl. (3.66) s = 1, so erhalten wir die mittlere Relativgeschwindigkeit u =
8 kT . pm
(3.67)
Die Berechnung der mittleren freien Weglänge gestaltet sich wesentlich schwieriger. Man verwendet daher häufig für Gl. (3.60) die Näherung v 1 n * u s (u)
l ª
(3.68)
und benutzt die Beziehung (3.66). Für eine Maxwell-Verteilung der Testteilchen ergibt sich = (8kT/pm)1/2. Bei niederenergetischen Stößen zwischen Atomen oder Molekülen ist s = p (r+ r*)2 = const. gewöhnlich eine gute Näherung. Man erhält damit anstelle von Gl. (3.61)
l ª
Â
*
1 , s n * 1 + m/ m *
(3.69)
was für die Stöße einer Teilchensorte mit sich selbst auf die wichtige Beziehung <> = (s n ÷2)-1 = 0,71/s n hinausläuft (vgl. Gl. (1.4)). Den letzten Fall wollen wir noch genauer untersuchen, um einen Anhalt über die möglichen Ungenauigkeiten zu erhalten. Dazu betrachten wir zunächst die freie Weglänge eines monoenergetischen Teilchenstrahls in einem thermischen Gas mit s = const. und berechnen sie einmal wie oben gemäß der Definition 1 = v/ und zum anderen in der formal korrekten Weise 2 = v <1/n>. Setzen wir zur Vereinfachung der Schreibweise s n* = 1, so ergibt sich mit der ersten Definition
G. Fussmann , Atomphysik SS 2002
45
Atomare Prozesse p È• ˘ v l1= r r = v ÍÚ dv * w( v*) v *2 Ú v2 + v *2 -2 vv * cos q 2 p sin qdq ˙ |v - v*| vr * 0 Î0 ˚ 6 x2 = 3 2 2 x (1 - erf ( x)) + ( 3 + 6 x2 ) erf ( x) + (6 - 4 x2 + 4 x3 ) xe -x / p
-1
(3.70)
wobei x = v/vth mit vth = (2kT*/m*)1/2 der thermischen Geschwindigkeit der Feldteilchen. Nach der zweiten erhalten wir
l
2
=v
1 r r |v - v *|
• r v*
p
= v Ú dv * w(v*)v * 2 0
Ú 0
2 p sin qdq v 2 + v * 2 -2vv * cos q
= erf ( x)
(3.71)
1
Abb. 3-19: Freie Weglängen als Funktion der normierten Geschwindigkeit x= v/vth in den Definitionen nach Gl. (3.70) und (3.71).
2 0.8 1 0.6 0.4 0.2
Wie man der Abbildung entnimmt, streben beide Mittelwerte gegen 1, weisen aber in der Umgebung x = 1 deutliche Abweichungen auf. Führen wir nun eine zweite Mittelung mit einer Maxwell-Verteilung für die Feldteilchen durch 1
2
4
3
5
x
•
l = Ú l w(v)4 pv 2 dv = 0
4 p
•
Ú
2
l e - x x 2 dx ,
(3.72)
0
so ergibt sich aus numerischer Rechnung <>1 = 0,66 und zum anderen <>2= (1/2 +1/p)= 0,82. Wir lernen aus diesem Beispiel, daß Mittelwerte nur eine Genauigkeit von etwa 20 % besitzen, wenn man nicht streng auf die Definition achtet. Im Rahmen dieser Genauigkeit können dann auch die Näherungsbeziehungen (3.68) bzw. (3.69) verwendet werden. In der Praxis kommen gewöhnlich noch größere Ungenauigkeiten infolge der Fehler experimentellen Datenmaterials hinzu. Sehr einfache Verhältnisse ergeben sich, wenn eine Teilchensorte wesentlich schneller als die andere ist. Dies ist in der Regel bei Elektronen-Atom-Stößen zutreffend. Wir können dann die Mittelungen über die langsamen Teilchen (Atome) von denen über die schnellen (Elektronen) trennen und erhalten so zunächst für die Atome
la
ª
va . ne ves (ve )
(3.73)
1 . na s (ve )
(3.74)
Für die Elektronen dagegen ergibt sich
le
G. Fussmann , Atomphysik SS 2002
ª
46
Atomspektren, Grenzen der klass. Mechanik
4 4.1 4.1.1
ATOMSPEKTREN UND DIE GRENZEN DER KLASSISCHEN MECHANIK Grundlagen der spektroskopischen Analyse EMISSION- UND ABSORPTIONSLINIEN
Spektralapparate wie das in Abb. 4-1 skizzierte Prismenspektrometer zerlegen das von einer bestimmten Quelle ausgesandte Licht in seine Wellenlängenbestandteile (Farben). Es stellt sich heraus, daß das so aufgenommene Intensitätsspektrum I(l) neben kontinuierlichen Anteilen auch diskrete "Linien" enthält. Wie schon G. Kirchhoff und R. Bunsen 1859 erkannten, ist die Wellenlänge dieser Linien charakteristisch für die in der Quelle vorkommenden Atome. So erscheinen beispielsweise zwei dichtbenachbarte hell leuchtende, gelbe Schlitzblende Linien (Dublett: l1= 589,6 nm, l2 = 589,0 nm) im Spektrum, wenn man über eine Kerzenflamme etwas Kochsalz (NaCl) streut. Sie stammen von den Natrium-Atomen, die in der Flamme zur Linse Strahlung angeregt werden. In diesem Prisma Lichtquelle Fall sprechen wir von Linien in Emission Linse oder Emissionslinien. Gewöhnliche Glühbirnen (ebenso Kerzen rot bei geringer Auflösung) und insbesondere Wolfram-Bandlampen senden ein blau kontinuierliches Spektrum aus. Schickt Photoplatte man dieses Licht durch ein Glasgefäß, in dem durch Erwärmung etwas Natrium verdampft wurde, so beobachtet man im Spektrum zwei dunkle Linien an der Abb. 4-1: Klassische Spektralanalyse unter gleichen Stelle. Wir sprechen jetzt von Verwendung eines Prismas Absorptionslinien. Derartige dunkle Linien vor hellem Hintergrund waren erstmalig von J. Fraunhofer 1817 im Spektrum der Sonne entdeckt worden. Später stellte man fest, daß die Fixsterne Spektrallinien sowohl in Emission als auch Absorption aufweisen können. Wir wissen heute, daß diese Erscheinungen mit den Temperaturgradienten in der Fixsternatmosphäre zusammenhängen. Grundsätzlich können kalte vorgelagerte Schichten die Strahlung aus tieferen heißen Zonen wieder absorbieren und so die dunklen Linien erzeugen. 4.1.2
MODERNE SPEKTROSKOPIE
Anstelle des Prismas benutzt man in moderneren Instrumenten zumeist geritzte Gitter (typisch: 600 bis 3600 Striche/mm), die sowohl eine höhere spektrale Auflösung als auch eine theoretisch ableitbare Dispersionbeziehung (Wellenlänge als Funktion des Winkels) aufweisen, was bei Prismen aufgrund des nur ungenau bekannten Verlaufs des Brechungsindex der verschiedenen Glassorten nicht gegeben ist. Wie in der Abb. 4-2 dargestellt, wird das zu untersuchende Licht auf den Eintrittspalt (Breite typisch 5 - 100 mm) des Spektrometers abgebildet, so daß der sphärische Spiegel im Abstand der Brennweite (f = 0,25 m bis etwa 5 m) voll ausgeleuchtet wird. Der so erzeugte parallele Lichtstrahl fällt unter dem Winkel a zur Normalenrichtung auf das geritzte Reflexionsgitter (Gesamtstrichzahl N ª 100 000). Von jeweils zwei benachbarten Gitterritzen (Abstand: g = Gitterkonstante) überlagern sich die ausgehenden Wellenfronten. Interferenz führt zur Auslöschung, wenn der geometrische Gangunterschied D = (g sina - g sinb) gleich wird mit l/2, 3/2l, 5/2 etc. Umgekehrt kommt es zur additiven Überlagerung, d.h. Reflexion, falls D ein ganzzahliges Vielfaches der Wellenlänge ist. G. Fussmann , Atomphysik SS 2002
47
Atomspektren, Grenzen der klass. Mechanik Blende
Linse Spalt
a d
Gitter
Hohlspiegel
b
Lichtquelle Spalt
Photomultiplier
Abb. 4-2: Spektralanalyse unter Verwendung eines Gitterspektrometers (Typ: Czerny-Turner). Zur Aufnahme des Spektrums wird das Gitter gedreht (Winkel d ) und der Strom des Photomultipliers auf einem X-Y-Schreiber registriert. Damit haben wir für die Reflexionsbedingung des Gitters die Dispersionsrelation nl = g(sin a - sin b ) = 2 g cos g sin d .
(4.1)
Man nennt n = 0, 1, 2, 3 … die Ordnung der Reflexion. Gewöhnlich arbeitet man in niedriger Ordnung (n = 1 - 4), doch gibt es für sehr hochauflösende Messungen spezielle Gitter (EchelleGitter), die besonders gut in sehr hoher Ordnung (n > 20) reflektieren. Um das Spektrum zu erhalten, wird das Gitter gedreht. Dabei ändert sich sowohl der Eingangs- als auch der Ausgangswinkel gemäß a = g + d und b = g - d, wobei g (typisch 20°) ein vom Spektrometeraufbau vorgegebener Winkel ist. Das mit gewöhnlichen Gitterspektrometern erreichbare Auflösungsvermögen l/Dl beträgt etwa 105 (mit Echelle-Gittern ª 5◊105). Glasfaser Fiberkopf
Spalt
Gitter Lichtquelle CCD-Kamera
Abb. 4-3: Moderner Spektrometeraufbau. Das Licht wird über eine Glasfaser direkt in den Eintrittsspalt geführt. In der Austrittsebene wird das Spektrum auf ein lichtempfindliches Multikanalsystem (array) abgebildet. Die graphische Darstellung und Auswertung des Spektrums geschieht über einen Computer. Seit einiger Zeit sind elektronische CCD-Kameras verfügbar, die eine Zeilenauslesung (sogenannte pixels = Kanäle, etwa 1024 mit einer Breite von je 20 mm) gestatten. Jedes einzelne Pixel entspricht einem kleinen Kondensator, der durch freigesetzte Elektronen entladen wird (CCD = charged coupled device). Die Elektronen werden an der lichtempfindlichen Kathodeneintrittsfläche über den Photoeffekt ausgelöst. Nach einer vorgebbaren Belichtungszeit (10 ms bis einige Sekunden) ist vom Kondensator eine Ladung abgeflossen, die proportional zur Fluenz (Zeitintegral des Photonenflusses) ist. Man mißt die für die Wiederaufladung des Kondensators benötigte Ladung. So kann man ohne Drehung des Gitters ein Spektrum aufnehmen. Häufig wird noch ein Verstärker (intensifier) vorgeschaltet. Dieser besteht aus einer zweidimensionalen Mikrokanalplatte, die zahlreiche zylinderförmige Kanäle (etwa 8 mm Durchmesser, 1 mm lang) aufweist. Am Eintrittsende besitzt jeder Kanal eine kleine trichterförmige Kathodenöffnung, in der aus Photonen Elektronen gebildet werden. Über eine angelegte Hochspannung wird das Elektron beschleunigt und schlägt bei Aufprall aus der Kanalwand weitere Elektronen heraus. Dieser Prozeß wiederholt sich mehrmals, bis am Ende der Platte eine G. Fussmann , Atomphysik SS 2002
48
Atomspektren, Grenzen der klass. Mechanik Elektronenlawine (typisch 105fache Verstärkung) auf einer Phosphorplatte einen relativ hellen Lichtblitz hervorruft, der das Eingangssignal für die CCD-Kamera darstellt. Durch Schalten der Hochspannung kann man den Verstärker kurzzeitig aus- und einschalten (engl. gaten). Auf diese Weise lassen sich auf einer Zeitskala von Dt > 10 ns Spektren ausblenden, was u.a. oft benötigt wird, um die Kamera vor Zerstörung zu schützen, wenn der Beobachtungsphase eine sehr helle Leuchterscheinung vorangeht oder folgt. Eine große Erleichterung bedeuten auch oft Lichtleiter in Form von biegbaren Glas- oder Quarzfasern (typisch 0,4 mm Durchmesser), mit denen das Licht bequem über Distanzen von bis zu 200 m geleitet werden kann. Im einfachsten Fall verzichtet man auf eine Abbildung auf den Eintrittsspalt des Spektrometers und führt die Glasfaser in den hinreichend weit geöffneten Spalt ein. Man kann auch mehrere Glasfasern übereinander anbringen und somit mehrere Spektren gleichzeitig aufnehmen. Hierfür benötigt man allerdings auch eine zweidimensionale CCD-Kamera, die seit kurzem verfügbar ist. 4.1.3
FLUORESZENZ
Schickt man das Licht einer Natriumlampe (z.B. eine Geißler-Röhre, eine NiederdruckGasentladung) durch ein Glasgefäß, in dem etwas Natrium durch Erwärmen verdampft wurde, so beobachtet man im durchgehenden Licht eine Abschwächung der Intensität. Andererseits beobachtet man in anderen Richtungen gestreutes Licht der gleichen Wellenlänge.
gelbes Fluoreszenzlicht Linse Na-Lichtquelle
Na Dampf
geschwächtes Na-Licht
Abb. 4-4: Resonanzfluoreszenz der Na-Linien. Die Na-Atome im Glasgefäß werden offensichtlich durch das einfallende Licht angeregt. Nach erfolgter Anregung strahlen sie (innerhalb sehr kurzer Zeit ª 10-8 s) Photonen gleicher Frequenz wieder ab, jedoch gleichmäßig in alle Richtungen (isotrope Streuung). Diese Isotropierung der Strahlung erklärt die Schwächung der Lichtintensität in Vorwärtsrichtung, so daß in dieser Richtung Absorptionslinien beobachtet werden. Der Streueffekt tritt nicht auf, wenn Licht anderer Frequenz gewählt wird, er hat also Resonanzcharakter. Fluoreszin und Eosin zeigen den Effekt der oben am Beispiel von Na-Dampf beschriebenen resonanten Streuung von sichtbarem Licht auch in flüssiger Lösung. Man nennt ihn deshalb Resonanz-Fluoreszenz. Bei anderen Atomen kann das Streulicht neben der eingestrahlten Frequenz auch andere (meist niedrigere) Frequenzen aufweisen. Man spricht dann von nicht-resonanter Fluoreszenz oder einfach von Fluoreszenz. Hierdurch kann insbesondere U V - L i c h t u n d R ö n t g e n s t r a h l u n g i n s i c h t b a r e s L i c h t k o n v e r t i e r t w e r d e n . Wichtige Fluoreszenz-Materialien sind Na-J und Barium-Platin-Zyanür für Röntgenstrahlung sowie Natriumsalycilat und Uranglas für UV-Licht.
G. Fussmann , Atomphysik SS 2002
49
Atomspektren, Grenzen der klass. Mechanik Nicht immer erfolgt auf die Anregung eine prompte Abstrahlung. Bei manchen Materialien – wie z.B. beim Phosphor – ist die Abstrahlung um Sekunden bis Tage verzögert, da langlebige metastabile Niveaus angeregt wurden. Man nennt diese Erscheinung Phosphoreszenz. In der Experimentalphysik und im Instrumentenbau ist dieser Effekt meist unerwünscht, da er keine exakten Kurzzeitmessungen zuläßt. Auch die Kathoden der Photomultiplier und die Glasfaserkabel zeigen in abgeschwächter Form (Abklingzeiten ª 0,1 - 1 ns) diesen Effekt. 4.1.4
DOPPLERPROFILE
In einem Gas oder Plasma sind die Atome und Ionen einer thermischen Bewegung unterworfen, die durch die in Kap. 3.4 (Gl. (3.63) eingeführte Maxwellsche Verteilung beschrieben wird. Beobachten wir diese Atome aus einer bestimmten Richtung (z-Achse), so strahlen sie infolge des Doppler-Effektes15 Dn n - n 0 vz := = c n0 n0
(4.2)
mit unterschiedlicher Frequenz. Die Photonen eines Atoms, das sich auf uns zu bewegt (vz > 0), erfahren eine Blauverschiebung; das sich von uns entfernende Atom (vz < 0) strahlt dagegen mit kleinerer Frequenz (Rotverschiebung) als das ruhende Atom (n0). Insgesamt kommt es so einer Verbreiterung der Spektrallinie, die sich als Projektion der Maxwell-Verteilung in die z-Richtung auffassen läßt. Mathematisch heißt das, wir haben die Verteilung w(v x, v y, vz) über v x und vy zu integrieren und die vz-Komponente gemäß Gl. (4.2) in Frequenzeinheiten umzurechnen. Für die auf 1 normierte Intensität ergibt sich damit ein gaußförmiges Profil
I ( Dn ) dn =
Ê m ˆ Ë 2 pkT ¯
1/ 2
c e n0
m ( c Dn /n 0 ) 2 2 kT
Ê Dn ˆ -Á ˜ Ë Dn D ¯
dn =
2
e dn Dn D p
(4.3)
mit DD = n0 (2kT/m)1/2/c = n0 vth/c. Die Spektrometerbreite dn (<< Dn) ist hierbei durch die Spaltbreiten Ds1,2 (bzw. Breite der Pixel) und die Dispersionsrelation des Gitters festgelegt: dn = - c l-2 dl ª - c l -2 dl/dd (Ds1+Ds2)/2f mit dl/dd = 2 g cosg cosd/n. Für kleine Frequenzabstände (Dn/n << 1) haben wir wegen n = c/l die Beziehung Dn /n ª - Dl/l, was zur Folge hat, daß auch als Funktion der Wellenlänge ein Gaußprofil beobachtet wird. Messen wir nun mit einem hochauflösenden Spektrometer ein solches Gaußprofil, so können wir daraus die Temperatur bestimmen. Für höhere Ansprüche an die Genauigkeit wird ein Gaußprofil mit mehreren freien Parametern (Berücksichtigung des Untergrundes) an die experimentellen Daten gefittet. Für eine erste Abschätzung genügt die Bestimmung der (vollen) Halbwertsbreite des Linienprofils. Für diese Größe ergibt sich aus Gl. (4.3) Dl1/2 Dn 1/2 T [eV] 2 kT ln 2 = 7 , 71 ◊ 10 -5 . ª =2 2 l0 n0 mc m [amu]
(4.4)
Natürlich ist diese Formel nur brauchbar, wenn andere Verbreiterungseffekte (an erster Stelle Apparateverbreiterung, aber auch Druckverbreiterung, selten dagegen natürliche Verbreiterung) vernachlässigt werden können. 15
Relativistisch korrekt lautet diese Beziehung n =
n
0
mit b = v/c und g = (1 - b2)-1/2. Die Frequenz n ist die vom
g (1 - b cos q )
Beobachter gemessene; n0 ist die Frequenz der Quelle im Ruhezustand. Geschwindigkeitsbetrag v und der Winkel q zwischen Geschwindigkeit und Beobachtungsrichtung sind auf das System des Beobachters (Relativ-system) bezogen. Man beachte: auch für q = 90° tritt ein Dopplereffekt (~ b2) auf. G. Fussmann , Atomphysik SS 2002
50
Atomspektren, Grenzen der klass. Mechanik Mit derartigen spektroskopischen Messungen lassen sich insbesondere sehr leicht sehr hohe Temperaturen messen. So treten bei der kontrollierten Kernfusion Temperaturen um 108 K und darüber auf, die man nicht mehr auf konventionellem Wege (etwa Thermometer oder Sonden) messen kann. In diesem Falle beobachtet man die Strahlung hochionisierter Atome (z.B. Heähnliches Eisen, Fe+24) im weichen Röntgengebiet und mißt deren Linienverbreiterung mit einem Kristallspektrometer. 4.1.5
LASERINDUZIERTE FLUORESZENZ
Die soeben beschriebene Meßmethode wird als passive Spektroskopie bezeichnet. Im Gegensatz dazu spricht man von aktiver Spektroskopie, wenn man das zu untersuchende Medium mit einem Laser gezielt anregt. Bei der Temperaturbestimmung hat die passive Methode den großen Nachteil, daß sie diese nicht lokal messen kann. Sie liefert nur einen Mittelwert, da ja die Strahlung entlang des gesamten Beobachtungsweges aufgesammelt wird. Ortsaufgelöste Temperaturmessungen werden mit Hilfe der laserinduzierten Fluoreszenz (LIF) unter Verwendung eines durchstimmbaren Farbstofflasers möglich (Abb. 4-5). Dazu strahlt man den Laserstrahl in das Medium ein und beobachtet die erzeugte resonante Fluoreszenzstrahlung unter 90° zur Strahlrichtung. Abb. 4-5: Temperaturmessung nach der Methode der laserinduzierten Fluoreszenz. Die Frequenz des Lasers wird über die Resonanzlinie der Atome verstimmt. Der Strom des Photomultipliers liefert das Dopplerprofil der Linie.
l-verstimmbarer Laserstrahl
I (l)
l0
Gasatome
l
Fluoreszenzlicht
Interferenzfilter Linse Photomultiplier
4.1.6
Ein Nachteil der LIF-Methode ist, daß man sie bei vielen Atomen nicht anwenden kann, da die benötigten abstimmbaren UV-Laser nicht zur Verfügung stehen. Atome wie H, He, C, O, N u.a. besitzen keine tief liegenden Niveaus, die man mit sichtbarem Licht aus dem Grundzustand anregen kann.
BEDINGUNGEN FÜR DIE RESONANTE FLUORESZENZ
Man kann sich mit Recht fragen, ob eine resonante Fluoreszenz, wie in Abb. 4-4 am Beispiel des Natriums gezeigt, in jedem Fall erwartet werden kann. Letztlich setzt dies voraus, daß das Atom die gleiche Frequenz absorbiert, die es abstrahlt. Geht man davon aus, daß das Atom eine scharfe innere Anregungsenergie DE besitzt, so ist die Frage, ob diese dem Photon gemäß DE = hn0 voll übertragen werden kann. Wir zeigen nun, daß dies in der Tat nicht zutrifft, wenn man neben dem Energiesatz auch den Impulssatz betrachtet. Wegen E = mph c2 = hn besitzt das Photon die Masse mph = hn/c2 und damit den Impuls pph =
hn c
(4.5)
Ein zunächst ruhendes Atom erhält nach der Emission den gleich großen entgegengesetzten Impuls m v = - hn/c. Mithin wird der Bruchteil mv2/2 = (hn)2/(2 mc2) in kinetische Energie des Atoms umgewandelt. Wir haben also für die ausgesandte Frequenz die Beziehung G. Fussmann , Atomphysik SS 2002
51
Atomspektren, Grenzen der klass. Mechanik
hn e = D E -
( hn e ) 2 . 2mc 2
(4.6)
Ähnlich verhält es sich bei der Absorption. Hier muß die Photonenenergie etwas größer als erwartet sein, um dem Atom die erforderliche kinetische Energie mitgeben zu können: ( hn a )2 hn a = DE + . 2mc 2
(4.7)
Insgesamt unterscheiden sich beide Frequenzen um den relativen Betrag Dn n a - n e h(n a2 + n e2 ) hn 0 := = ª . n0 n0 mc 2 2mc 2n 0
(4.8)
Die rechte Seite ist der Quotient aus Photonenenergie und Ruhenergie. Für sichtbare Strahlung (hn ª 2 eV und mit 1 amu c2 = 931,478 MeV) ist dieses Verhältnis von der Größenordnung 10-9 und damit klein zur natürlichen Breite der Linien (Dn/n)nat = (n t)-1 ª (1015s-1◊10-8s)-1 = 10-7. Es kommt also zum Überlapp zwischen Emissions- und Absorptionsprofil. Anders liegen die Verhältnisse oft im Bereich der Röntgen- und insbesondere bei g-Strahlung. Da hier die Energie (> 1 keV) und der Impuls der Photonen um den Faktor 103 und mehr erhöht sind, die Lebensdauern der Niveaus aber durchaus noch 10-7s betragen können, tritt in der Regel kein Überlapp der Profile mehr auf; es gibt also unter diesen Verhältnissen keine resonante Fluoreszenz für Atome in der Gasphase. 4.1.7
DER MÖßBAUER-EFFEKT
Im Festkörper sind die Atomkerne an ihre Gitterplätze gebunden, so daß sie eigentlich keiner thermischen Bewegung ausgesetzt sind. Zerfällt ein so eingebundener radioaktiver Atomkern unter Aussendung eines g-Quants (hochenergetisches Photon), so werden jedoch durch den Photonenrückstoß Gitterschwingungen (Phononen) angefacht, die ebenfalls eine Erniedrigung der emittierten Photonenenergie zur Folge haben. Bei tiefen Temperaturen kommt es jedoch mit einer gewissen Wahrscheinlichkeit (Debye-Waller-Faktor) zur Unterdrückung dieser Phononenanregung. Die Atomkerne sind dann so fest aneinander gekoppelt, daß sie quasi in summa zu betrachten sind. Anstelle der Masse des einzelnen Atoms tritt dann in Gl. (4.8) die Gesamtmasse des Kristalls, so daß der Rückstoßeffekt faktisch ausbleibt und die Frequenzen in Absorption und Emission exakt gleich werden, sofern Quelle und Absorber in Ruhe sind. Diese Erscheinung ist der Mößbauer-Effekt (Nobelpreis 1961). 57 Fe-Absorber v Zählrate g-Photonen Zählrohr v [cm/s] 57 Bleiblenden Fe-Quelle +1 -1 Abb. 4-6: Meßanordnung beim Mößbauereffekt (links) und g-Zählrate als Funktion der Geschwindigkeit (rechts) Unter solchen Bedingungen kann eine extrem hohe Linienschärfe erreicht werden. Beim Zerfall eines angeregten Fe57-Kerns, der durch K-Elektronen Einfang aus 57Co ensteht (T1/2 = 270 d), wird beispielsweise eine g-Energie von 14,4 keV (n = 3,7◊1018 s-1) freigesetzt bei einer Lebensdauer des angeregten Niveaus von t = 1◊ 10-7 s. Das liefert eine natürliche Breite der Linie von Dn ª 4◊10-11 n. G. Fussmann , Atomphysik SS 2002
52
Atomspektren, Grenzen der klass. Mechanik Bewegt man daher die Quelle gegenüber dem Absorber mit der sehr kleinen Relativgeschwindigkeit von v/c > Dn/n = 4◊10-11 (d.h. v > 1.2 cm/s), so wird über den Doppler-Effekt die Resonanzbedingung zerstört und die Absorption geht stark zurück. Dies ist in der Abb. 4-6 Die unglaubliche Genauigkeit des Mößbauer-Effektes erlaubt auch den e x p e r i m e n t e l l e n N a c h w e i s d e r P h o t o n e n m a s s e mPh = hn/c2. Läßt man nämlich – wie R. V. Pound und G.A. Rebka (1960) – Photonen gegen das Schwerefeld der Erde die Strecke H = 45 m in die Höhe fliegen, so verringert sich dabei ihre Frequenz über den Energiesatz gemäß h(n-n0) = -mphg H, was auf g Dn = - 2 H = -5 ◊ 10 -15 c n0
(4.9)
hinausläuft. Die genannten Wissenschaftler konnten mit Hilfe des Mößbauer-Effektes diese winzige Frequenzverschiebung nachweisen. 4.2
Die Spektren des Wasserstoffs
Die charakteristischen Spektren der Elemente geben außerordentlich wichtige Informationen über Atomaufbau und die im atomaren Bereich gültigen Gesetze. Besonders einfach sind die Verhältnisse beim Wasserstoff. Schon 1885 fand Balmer die Formel, nach der sich die Linien im sichtbaren Spektralbereich anordnen. Sie wird besonders einfach, wenn wir die gemessenen Wellenlängen (l) auf reziproke Wellenlängen umrechnen.
n :=
1 Ê1 1 ˆ = RH ; Ë 4 n2 ¯ l
n = 3, 4 , 5,º(Balmer - Serie)
(4.10)
Die hier verwandten inversen Wellenlängen (auch Wellenzahlen genannt) sind über n = c/l und E phot = hn sowohl proportional zur Frequenz als auch der Energie der Photonen. Um unabhängig vom genauen Wert der Lichtgeschwindigkeit c zu bleiben und wegen der später einzuführenden Wellenzahlvektoren, wird die Größe n = 1/l (Einheiten: 1 cm-1 = 1 Kayser) auch heute noch verwendet 16. Die sehr genau bestimmte Rydberg-Konstante RH nimmt den Wert von 109 677, 585 cm-1 an. Später wurden noch andere Serien im Ultravioletten (Lyman-Serie, m=1) und im Infraroten (Paschen-Serie: m = 3, Bracket-Serie: m = 4, Pfund-Serie: m = 5 usw.) gefunden. Sie lassen sich zusammenfassend darstellen als 1 1ˆ Ê 1 = RH - 2 2 Ëm n ¯ l
(4.11)
Wie in Abb. 4-7 am Beispiel der Sonne aufgezeigt, erkennt man sie leicht an der Anhäufung der Linien zur Seriengrenze (nÆ•) hin. Die entsprechenden Grenzwellenlängen sind durch lm = m2/RH gegeben: l1 = 91,17 nm (Lyman), l2 = 364,7 nm (Balmer), l3 = 820,6 nm (Paschen) usw.; sie liegen allesamt außerhalb des sichtbaren Spektralbereichs (bei großer Helligkeit : 380 - 750 nm, sonst etwa 400 bis 700 nm). Die in Abb. 4-7 abzulesende maximale obere Quantenzahl nmax gibt Auskunft über die Elektronendichte (über die Stark-Verbreiterung der Linien), der ebenfalls eingezeichnete Balmer-Sprung in der Kontinuumsintensität erlaubt Rückschlüsse auf die Temperatur der Elektronen.
16
Wellenzahlen sind energieäquivalent. Es gilt 1eV =√ 8065 , 48 cm
G. Fussmann , Atomphysik SS 2002
-1
53
Atomspektren, Grenzen der klass. Mechanik Abb. 4-7: Emissionsspektrum vom Sonnenrand (Chromosphäre), aufgenommen bei einer Sonnenfinsternis. Die Balmer-Serie des Wasserstoffs läßt sich bis zur Hauptquantenzahl nmax = 30 beobachten (n. U. Feldman, Physica Scripta 24, 681, 1981).
Einige kompliziertere Atome (insbesondere die Alkaliatome) lassen sich in Verallgemeinerung des obigen Ausdrucks durch ein Gesetz der Form 1 ˆ Ê 1 n = RH Á 2 - 2 ˜ Ë m* n* ¯
(4.12)
mit den effektiven Quantenzahlen n* = n und m* beschreiben, die in der Regel nicht ganzzahlig sind. Die Gleichungen (4.11) und (4.12) liefern die Frequenzen als Differenz zweier Terme. Sie sind in der Tat Spezialfälle eines allgemeingültigen Prinzips, wonach die Frequenz bzw. E n e r g i e d e r abges trahlten P hotonen s ich immer aus der Differenz von j e w e i l s z w e i E n e r g i e t e r m e n angeben läßt hn nm = Em - En
(4.13)
In der Praxis bedeutet dies zunächst, daß die zweidimensionale Mannigfaltigkeit nmn aus der eindimensionalen Ei (i = 1, 2, 3…) hervorgeht. Die überaus wichtige Beziehung (4.13) wurde nahegelegt durch die Entdeckung des Ritzschen Kombinationsprinzips (Ritz 1908), welches besagt, daß aus der Kombination von je zwei gemessenen Wellenlängen eine dritte hervorgeht. Allerdings gilt das Kombinationsprinzip in dieser Form nur beim Wasserstoff exakt. Bei anderen Elementen gilt diese Regel auf Grund der später zu besprechenden Feinstrukturaufspaltung und der sogenannten Auswahlregeln für die Strahlungsemission nur näherungsweise. Beim Lithium z.B. mißt man die Wellenlängen l 1 = 323,26 nm, l2 = 610,35 nm, l3 = 670,85 nm. Die inversen Wellenlängen betragen: nƒ1 = 30935 cm1 , nƒ2 = 16384 cm-1, nƒ3 = 14908 cm-1. Damit ergibt sich für die Differenz nƒ1 - nƒ2 = 14550 cm-1 ª nƒ3 . Hieraus darf jedoch nicht der falsche Schluß gezogen werden, daß die Relation (4.13) ebenfalls nur näherungsweise gültig wäre; sie gilt vielmehr in voller Strenge (abgesehen von den kleinen Differenzen zwischen Emission und Absorption aufgrund des Impulssatzes, die wir zuvor besprochen haben). Die Auswahlregeln verbieten jedoch zahlreiche Kombinationen, so daß nicht alle möglichen Differenzen als Licht beobachtbar sind. Wichtig ist die physikalische Interpretation der Relation (4.13): Die Energien Ei sind diejenigen diskreten Energien, in denen das Atom entweder stabil ist (i = 1, Grundzustand) oder sich quasi stabil (i > 1) verhält. Emission oder Absorption von Licht (Photonen) entstehen durch Abregung (Em > En) bzw. Anregung (Em < En) der Atome zwischen diesen diskreten Energieniveaus. Diese Vorgänge sind mit einem Sprung des Elektrons (Leuchtelektron) oder allgemeiner bei Mehrelektronen-Atomen mit einer entsprechenden Umordnung der Elektronenkonfiguration verbunden.
G. Fussmann , Atomphysik SS 2002
54
Atomspektren, Grenzen der klass. Mechanik 4.2.1
BOHRS POSTULATE UND SEIN ATOMMODELL
Die klassische Mechanik konnte die Beobachtungen im atomaren Bereich nicht beschreiben. Niels Bohr suchte eine modellmäßige Beschreibung in Analogie zur Planetenbewegung: In beiden Fällen treten zentrale Anziehungskräfte auf. Bei der Bewegung der Planeten wird die Anziehungskraft der Sonne durch eine gleich große Fliehkraft kompensiert. Könnte daher nicht ebenso auch die Coulomb-Kraft, mit der die Elektronen vom positiven Atomkern angezogen werden, durch die Zentrifugalkraft aufgehoben werden? Bei dieser Analogie treten jedoch zwei schwerwiegende Probleme auf: ∑ Man wußte bereits seit langem, daß beschleunigt bewegte Ladungen, z.B. auf einer Kreisbahn, elektromagnetische Wellen abstrahlen. Die Elektronen sollten somit Energie verlieren und müßten demnach auf einer Spiralbahn in den Atomkern stürzen. ∑ Warum sind nur ganz bestimmte Bahnen mit diskreten Energien zugelassen? Planeten können sich prinzipiell auf den verschiedensten Ellipsenbahnen mit beliebiger Energie bewegen. Diese Probleme setzte Bohr durch zwei ad hoc-Postulate außer Kraft: ∑
Nur solche (Kreis-) Bahnen sind erlaubt, bei denen der Drehimpuls ein ganzzahliges Vielfaches der Größe h = h/(2p) ist: l = me vr = nh; n = 1, 2, 3º
(4.14)
Die natürliche Zahl n wird Hauptquantenzahl genannt. 2. Auf den erlaubten Bahnen strahlen die Elektronen nicht. Die Aussendung von Strahlung ist nur mit dem Übergang von einer erlaubten Bahn zu einer anderen verbunden. Hierbei wird Strahlung der Frequenz n = (E2 - E1)/h abgegeben. Mit der Einführung dieser Postulate führt das analoge Planetenmodell zu Resultaten, die mit den Messungen am Wasserstoff ausgezeichnet übereinstimmen. Die Ableitung der theoretischen Ergebnisse ist einfach: Zentripetalkraft gleich Anziehungskraft liefert für Wasserstoff (Z = 1) oder ein wasserstoffähnliches Ion mit der Kernladung Z r dv m v 2 r ( - e )( eZ) r me = - e er = er . dt r 4 pe 0 r 2
(4.15)
Multiplikation mit r2/v ergibt Ze 2 = me vr = nh . 4pe 0 v
(4.16)
Hier haben wir auf der rechten Seite bereits vom ersten Bohrschen Postulat (4.14) Gebrauch gemacht. Aus (4.16) berechnen wir die Geschwindigkeit v und den Radius der Kreisbahn r : v=
G. Fussmann , Atomphysik SS 2002
e2 Z , 4 pe 0 h n
(4.17)
55
Atomspektren, Grenzen der klass. Mechanik
r=
nh 4 pe 0 h 2 n2 = . me v me e 2 Z
(4.18)
Für die Gesamtenergie als Summe aus kinetischer und negativer potentieller Energie ergibt sich damit bei der Hauptquantenzahl n En = Ekin + Epot =
me 2 Ze 2 e4 Z2 v =. 2 4 pe 0 r 2( 4 pe 0 )2 h 2 n2
(4.19)
Hiermit erhalten wir unter Benutzung des zweiten Bohrschen Postulats die Wasserstoff-Formel (4.11)
n=
Em - En Z 2 e 4 me Ê 1 1ˆ 1ˆ Ê 1 = - 2 = Z 2 R• 2 - 2 . 3 2 3 2 Ëm hc n ¯ n ¯ 64 p e 0 h c Ë m
(4.20)
Die Rydberg-Konstante ergibt sich also hieraus für Wasserstoff (Z =1) zu R• =
e 4 me = 109737 , 318 cm -1. 3 2 3 64 p e 0 h c
(4.21)
Die mit dieser Größe berechneten Wellenlängen stimmen mit den für Wasserstoff gemessenen noch nicht genau überein, sondern weisen kleine Verschiebungen auf. Dies beruht einerseits darauf, daß bei den Messungen der Brechungsindex der Luft (nBrech = 1,00272 unter Normalbedingungen) die Wellenlängen gegenüber den Vakuumwerten geringfügig verkleinert17. Zum anderen aber haben wir in der Rechnung den Atomkern als unendlich schwer angenommen. Wie in Kap. 3 ausgeführt, besteht die notwendige Korrektur darin, die Elektronenmasse durch die reduzierte Masse zu ersetzen. Damit hat man R = R•
m R• = . me 1 + me / mKern
(4.22)
Mit mp/me = 1836,15 ergibt sich für Wasserstoff eine hervorragende Übereinstimmung zwischen dem Bohrschen Modell und den experimentellen Werten. Auch zeigt sich der hiernach zu erwartende Isotopeneffekt, wenn man die Spektren von Wasserstoff und Deuterium vergleicht. Die Bindungsenergie des niedrigsten Zustands n = 1 erhalten wir aus (4.19) zu e 4 me Z 2 E1 = = -13, 6 Z 2 eV . 2 2 2( 4 pe 0 ) h
(4.23)
Es ist die bei der Ionisation aufzubringende Energie. Ferner erhalten wir aus der Beziehung (4.18) für n = Z = 1 den Atomradius des Wasserstoffatoms im Grundzustand zu r1 = a0 =
4 pe 0 h 2 = 0, 529 ◊ 10 -10 m ; 2 me e
(4.24)
17
Man beachte in der Praxis, daß in den Spektraltabellen (für l > 200 nm) gewöhnlich die Wellenlängen in Luft angegeben werden. G. Fussmann , Atomphysik SS 2002
56
Atomspektren, Grenzen der klass. Mechanik er wird Bohrscher Bahnradius genannt. Trotz des offensichtlichen Erfolges des Bohrschen Modells war damit das Problem der Unzulänglichkeit der klassischen Physik nicht beseitigt. Zum einen waren die e i n g e f ü h r t e n P o s t u l a t e k e i n e s w e g s e v i d e n t . Außerdem gab das Modell keinen Hinweis, wie andere Atome mit mehreren Elektronen zu berechnen seien. A. Sommerfeld hatte in dieser Hinsicht einen gewissen Teilerfolg, indem er eine zweite Quantenzahl einführte und neben Kreisbahnen auch Ellipsen zuließ. Schließlich waren aber zahlreiche andere Fragen, wie etwa die Berechnung der Anregung der Atome durch Elektronenstoß oder die Intensität des ausgesandten Lichtes, prinzipiell nicht auf diesem Wege behandelbar. Es bestand somit die Notwendigkeit für ein allgemeineres Konzept bzw. eine Grundgleichung, mit der man die verschiedenen Probleme behandeln konnte. Eine derartige Grundgleichung ist die später zu behandelnde Schrödinger-Gleichung. Grotian-Diagramme Das nachfolgend gezeigte Termschema (Abb. 4-8) verdeutlicht noch einmal die Entstehung der Spektralserien im Wasserstoffatom. Derartige Termschemata sind erstmalig von Grotrian für zahlreiche Atome zusammengestellt worden. Sie werden daher häufig auch als Grotrian-Diagramme bezeichnet. • Hg 434, 0
Hb 486,1
Ha 656,3
0 Paschen -Serie
3 Lb
2
Lyman Serie
Lb 102,5 Lg 97,3
La 121,5
2
-13,6 eV
Lg
La
BalmerSerie
1
Ha Hb
3 n=4
Pa
n=1
Abb. 4-9: Bohrsches Modell und LinienAbb. 4-8: Das Termschema des Wasser- übergänge der Lyman-(VUV), Balmer(sichtbar) und Paschen-(IR) Spektralstoffatoms. serien. Die Entstehung der Strahlung durch Sprung der Elektronen von einer Bahn (Orbit) in eine andere ist auf anschauliche Weise nochmals in Abb. 4-9 dargestellt. Das Bohrsche Korrespondenzprinzip In Erkenntnis der Schwächen seines Atommodells hat Bohr die Frage aufgeworfen, auf welche Weise sich aus der klassischen Physik die korrespondierenden quantenmechanischen Größen gewinnen lassen. Seine Schlußfolgerungen führten zum sogenannte Korrespondenzprinzip: Jede nicht-klassische Theorie muß im Grenzfall hoher Energien und kleiner Energieänderungen in die klassische Theorie übergehen.
Das Korrespondenzprinzip gilt somit im Grenzfall hoher Hauptquantenzahlen n und kleiner Änderungen Dn << n. Es kann grundsätzlich zum Test für quantenmechanische Berechnungen herangezogen werden. Dies muß insbesondere auf die abgestrahlte Frequenz zutreffen. Für n >> 1 muß ein Atom dann wie ein entsprechender schwingender Dipol mit der Umlauffrequenz des Elektrons G. Fussmann , Atomphysik SS 2002
57
Atomspektren, Grenzen der klass. Mechanik
n Bahn =
v Z2 = 2 Rc 3 2 pr n
(4.25)
strahlen. Berechnen wir andererseits die abgestrahlte Frequenz für den Übergang von n + Dn nach n entsprechend der Gl.(4.20), so erhalten wir
n n + DnÆ n
2 1 Ê 1 ˆ 2 RcZ = RcZ Á 2 Dn . ˜ª Ën n3 (n + Dn)2 ¯ 2
(4.26)
Das Korrespondenzprinzip erfordert demnach, daß nur Übergänge mit Dn = 1 möglich sein sollten. Dies wird sowohl durch die Beobachtung als auch durch die quantenmechanische Berechnung bestätigt. Rydberg-Atome Alle Atome oder Ionen in sehr hoch angeregten Zuständen sind wieder wasserstoffähnlich, da sich das angeregte Elektron in großer Entfernung vom Atomrumpf aufhält. Entsprechende Atome werden als Rydberg-Atome bezeichnet. Sie haben in den letzten Jahren großes wissenschaftliches Interesse gefunden, da man im Weltraum entsprechende H-Atome mit n bis zu 350 beobachten konnte. Auch im Labor konnten mit Hilfe moderner, abstimmbarer Laser Atome sehr hoch angeregt werden (n ª 10 - 300). ∑ Die Lebensdauer solch hochangeregter Atome ist außerordentlich lang (t ~ n4.5) und kann bis zu einer Sekunde betragen. ∑ Ihr Radius (rn = a0 n2) ist bis zu einigen 10 000 mal größer als der übliche Atomradius von ca. 1 Å. ∑ Entsprechend den Gesetzen der Quantenmechanik und im Einklang mit dem Korrespondenzprinzip zerfallen sie in Dn = 1 Kaskaden unter Aussendung von Infrarotlicht bzw. Mikrowellenstrahlung. Wegen der außerordentlich geringen Bindungsenergie können sie bereits in schwachen elektrischen Feldern ionisiert werden (Feldionisation). Diesen Effekt kann man im Labor ausnutzen, um Rydberg-Atome nachzuweisen. Andererseits kann man auf diesem Wege auch e l e k t r i s c h e F e l d e r m e s s e n . In Gasen oder schwach ionisierten Plasmen kann man die durch Lasereinstrahlung freigesetzten Elektronen anhand der erhöhten elektrischen Leitfähigkeit nachweisen (photoelektrische Methode). Exotische Atome Neben dem normalen Wasserstoffatom (p+ e-) können auch eine Reihe ähnlicher Atome aus anderen Elementarteilchen gebildet werden. Bekannt sind insbesondere das Positroniumatom, bestehend aus Positron und Elektron (e+ e-), sowie der myonische Wasserstoff (p+ m -). Aufgrund der unterschiedlichen Masse (mm = 207 me) ergeben sich insbesondere beim myonischen Wasserstoff Radien (aom = 2,6◊10-13m) und Energien (E1,2 = 2,79 keV), die sich sehr stark vom gewöhnlichen Wasserstoff unterscheiden. Diese und andere exotische Atome können insbesondere Aufschluß über quantenelektrodynamische Effekte und andere grundlegende Fragen der Physik geben. Im Rahmen der Kernfusionsforschung ist der myonische Wasserstoff auch von Interesse. Wie A . Sacharow erkannte, erlaubt er prinzipiell die myonisch katalysierte Verschmelzung der Wasserstoffisotope, da infolge des sehr kleinen Radius des gebundenen Myons aom die CoulombAbstoßung der Nukleonen sehr stark reduziert ist. Leider ist die Lebensdauer des Myons (2,2 ms) sehr kurz, so daß auf diesem Wege eine wirtschaftliche Nutzung der Kernfusion nur sehr schwer zu erreichen sein wird. Seit langem ist man in der Lage, die Antiteilchen der Elektronen (Positronen) und Protonen (Antiprotonen) herzustellen. Vor kurzem aber erst gelang es auch, das aus diesen Teilchen zusammengesetzte Anti-Wasserstoffatom herzustellen. Man darf gespannt sein, ob – wie erwartet– G. Fussmann , Atomphysik SS 2002
58
Atomspektren, Grenzen der klass. Mechanik die von diesem Atom ausgesandte Strahlung mit der des gewöhnlichen Wasserstoffs exakt übereinstimmt. Falls das nicht der Fall sein sollte, bestünde die Möglichkeit anhand der Spektren der Sterne und Galaxien, den Nachweis zu führen, ob hierunter vielleicht einige aus Antimaterie bestehen. 4.3
Spektren der Alkali-Atome
Neben Wasserstoff zeigen auch die Alkali-Atome verhältnismäßig einfache Spektren. Hier treten vier verschiedene Serien im sichtbaren und infraroten Spektralbereich auf, die sich durch folgende Formeln beschreiben lassen: Prinzipal - Serie
n=
R R 2 (n 0 - s) (n - p)2
; n ≥ n0
Sharp - Serie
n=
R R 2 (n 0 - p) (n - s)2
; n ≥ n0 + 1
Diffuse - Serie
R R n= 2 (n 0 - p) (n - d)2
Fundamental - Serie n =
R R 2 (n 0 - d) (n - f )2
(4.27) ; n ≥ n0 ; n ≥ n0 + 1
Die unteren Hauptquantenzahlen n0 steigen von n0 = 2 beim Lithium bis n0 = 6 beim Cäsium an. Die zweite Hauptquantenzahl n produziert die jeweilige Serie. Die Größen s, p, d und f nennt man Quantumdefekte. Sie ergeben mit n und n0 die effektiven Hauptquantenzahlen n* und n 0*, die die Termenergien charakterisieren. Die Namen der Serien sind historisch und beschreiben grob die Eigenschaften der Spektren. Die Prinzipal-Serie (auch Hauptserie genannt) ist gewöhnlich nicht nur die hellste, sondern auch die einzige, die in Absorption zu beobachten ist. Die S- und D-Serie unterscheiden sich bei geringer Auflösung durch ihre Schärfe bzw. Unschärfe. Die Fundamentalserie liegt vollständig im IR-Gebiet. In der Tabelle 4-1 sind die unteren Hauptquantenzahlen und die Quantendefekte zusammengestellt. Da letztere nur sehr schwach von der jeweiligen Hauptquantenzahl abhängen, können wir die Energieterme in Näherung durch zwei Quantenzahlen, nämlich die schon bekannte Hauptquantenzahl m und die neue Indexzahl l, darstellen: Eml = -
R* . ( m - D l )2
(4.28)
Hierin ist R* = R h c = 13,6 eV die Rydberg-Konstante in Energieeinheiten, und die Quantendefekte sind als D0 = s, D1 = p , D2 = d und D3 = f bezeichnet. Offensichtlich hat man beim Wasserstoff mit Dl = 0 einen Spezialfall vor sich (Entartung), der bei den Alkali-Atomen erst in Nähe der Seriegrenzen (n Æ •) gültig wird. Wie wir später noch genauer sehen werden, benennt die zweite Quantenzahl l den Drehimpuls (in Einheiten von h ) des äußeren Elektrons (Leuchtelektron). Die Bezeichnungen s für l = 0, p für l = 1, und d für l = 2 werden aber auch heute noch benutzt, um den Drehimpuls eines Teilchens anzugeben. So spricht man von einem pElektron, wenn dieses den Drehimpuls 1 h besitzt.
G. Fussmann , Atomphysik SS 2002
59
Atomspektren, Grenzen der klass. Mechanik n0
s = D0
p = D1
d = D2
f = D3
Li
2
0.412
0.1
0
0
Na
3
1.373
0.88
0.01
0
K
4
2.23
1.75
0.25
0
Rb
5
3.195
2.6
1.2
0
Cs
6
4.13
3.7
2.5
0
Tabelle 4-1: Untere Hauptquantenzahlen n0 und Quantendefekte der Alkaliatome. In der Abb. 4-10 ist das Spektrum des Natriums mit seinen sich teilweise überlappenden Serien dargestellt. Wie die hierin auftretenden Linien aus Termdifferenzen entstehen, entnimmt man der Abb. 4-11. Die Energien der Terme können wir mit Hilfe der Beziehung (4.28) berechnen, doch werden dabei die geringen Unterschiede der Terme 2P 1/2 und 2P 3/2 (Feinstruktur) nicht wiedergegeben. Von diesen Feinheiten abgesehen, entsprechen die in der Abbildung oben erscheinenden Symbole S, P, D, F unseren bisherigen kleinen Buchstaben bzw. den Quantenzahlen l = 0, 1, 2, 3. Wir sehen nun, daß die Strahlung der Sharp-Serie durch Übergänge von S nach P , also l = 0 Æ 1 zustande kommt. Ebenso entsteht die Prinzipal-Serie durch Übergänge von P nach S (l = 1 Æ 0) und die Diffuse-Serie durch D nach P (l = 2 Æ 1) und schließlich die Fundamental-Serie durch solche von F nach D (l = 3 Æ 2). Offensichtlich gibt es aber keine Übergänge von S nach D oder von S nach F, sondern eben nur solche, in denen sich die Drehimpulsquantenzahl l um Dl = ±1 ändert. Wir haben damit eine sehr wichtige Auswahlregel für die Ausstrahlung von Licht kennengelernt.
Bergmann Diffuse Sharp
Abb. 4-10: Spektrum des Na-Atoms im Sichtbaren und den angrenzenden UV- und InfrarotBereichen (oben). Darunter die verschiedenen Serien aus denen sich das Spektrum zusammensetzt (Bergmannserie = Fundamentalserie).
Principal 200
300
400
500
600
700
800
l @nmD 900 1000
Insgesamt weisen die Grotian-Diagramme der Alkali-Atome noch eine große Ähnlichkeit zum Termschema des Wasserstoffs auf, wenn man sich im letzteren den unteren Teil (n < n0) wegdenkt. Beim Lithium, dem leichtesten dieser Atome, ist diese Ähnlichkeit am deutlichsten, beim Cäsium, dem schwersten, am schwächsten ausgeprägt. Bei diesen Atomen handelt es sich in guter Näherung um Ein-Elektronenatome, da von der Gesamtzahl der Elektronen (3 bei Li, 11 bei Na usw.) alle bis auf eins, nämlich das äußerste, sehr fest gebunden sind und daher im niederenergetischen Bereich nicht zur Strahlung angeregt werden können. Die übrigen Elektronen schirmen dann wegen ihrer größeren Nähe zum Atomkern dessen Ladung ab, so daß ein äußeres Elektron auf einer Kreisbahn wie beim Wasserstoff einem Coulomb-Feld der Ladung Z = 1 ausgesetzt ist. Wir entnehmen dem Grotrian-Diagramm auch, daß d-Elektronen erst mit der Quantenzahl n = 3 auftauchen und f-Elektronen nur für n ≥ 4 in Erscheinung treten. Dieser Befund G. Fussmann , Atomphysik SS 2002
60
Atomspektren, Grenzen der klass. Mechanik besagt offensichtlich, daß bei einer gegebenen Hauptquantenzahl das Elektron nicht einen beliebig hohen Drehimpuls aufweisen kann. In der Tat gilt in Verallgemeinerung der obigen Beobachtung lmax = n - 1, im Gegensatz zur Bohrschen Annahme l = n. Dies wird auch durch die Quantentheorie bestätigt (s. Kap. 7). Die Unterschiede zum H-Atom lassen sich nun qualitativ dadurch erklären, daß auch elliptische Bahnen vorkommen, die in das Innere des Atomrumpfes eintauchen und dort natürlich kein Coulomb-Potential (V ~ 1/r) mehr vorfinden. Ein Blick auf die Tabelle 4-1 zeigt uns, daß demnach die s-Elektronen, die ja die größten Quantendefekte aufweisen, diejenigen sein müssen, die am tiefsten in den Rumpf eintauchen. Wie wir bereits wissen, besitzen sie allerdings überhaupt keinen Drehimpuls und schwingen demnach im klassischen Bild auf einer Geraden durch den Atomkern. Wegen dieser absurd anmutenden Vorstellung hatte N. Bohr auch derartige drehimpulslose Elektronen durch sein 1. Postulat ausdrücklich ausgeschlossen. Abb. 4-11: Grotian-Diagramm des Natriums. Die Quantenmechnik löst dieses Problem weitgehend, indem sie derartigen Elektronen eine kugelsymmetrische stehende Welle zuweist. Nach wie vor ist aber auch in diesem Bild die Aufenthaltswahrscheinlichkeit dieser Elektronen am Atomkern von null verschieden, so daß sie mit ihm in Wechselwirkung treten können – was im übrigen oft benutzt wird, um etwas über den Kern zu erfahren. Die Elektronen mit maximalem Drehimpuls (l = n 1; also: p-Elektronen für n = 2, d-Elektronen für n = 3 usw.) bewegen sich im klassischen Bild auf Kreisbahnen. Für sie sind in der Tat die Quantendefekte sehr klein (Tabelle 4-1). Darüber hinaus werden die Abweichungen zum Wasserstofftermschema mit wachsender oberer Hauptquantenzahl immer kleiner und die verschiedenen l-Terme fallen schließlich zusammen (Abb. 4-11). Nicht zuletzt durch diesen Sachverhalt erhält das Wasserstoffatom eine generelle Bedeutung, die wir mit folgender Aussage betonen wollen: Für sehr hohe Hauptquantenzahlen, d.h. in der Nähe der Ionisierungsenergie, werden alle Atome wasserstoffähnlich.
Zusammenfassend können wir feststellen, daß einige Aspekte der Alkali-Spektren noch qualitativ im klassischen Bild verstanden werden können, andere jedoch, insbesondere die Auswahlregeln für die Strahlung und die Feinstruktur der Terme, nicht mehr im Rahmen dieser Theorie erklärt werden können.
4.4
Der Versuch von Franck und Hertz
Die aus den spektroskopischen Beobachtungen abgeleiteten Folgerungen erfuhren durch einen von Franck und Hertz im Jahre 1914 durchgeführten Versuch eine wichtige Bestätigung. Hierbei wurde die Energiequantelung bei der Anregung der Atome durch Elektronenstoß nachgewiesen.
G. Fussmann , Atomphysik SS 2002
61
Atomspektren, Grenzen der klass. Mechanik AuffangElektrode
Gitter Kathode
0.4
-
I [mA]
0.3 0.2
Hg Dampf
0.1
I 5
-
+ UG
+
10
[V] U 15 G
UB
Abb. 4-12: Schematischer Versuchsaufbau des Franck-Hertz-Versuchs.
Abb. 4-13: Strom -SpannungsCharakteristik beim Franck-Hertz-Versuch.
In einer mit Quecksilberdampf gefüllten Glasröhre befinden sich drei Elektroden (Abb. 4-12). Aus der beheizten Kathode treten Elektronen aus und werden durch eine Spannung U, die zwischen der Kathode und der netzartigen Gitterelektrode anliegt, beschleunigt. Zwischen diesem Gitter und der Anode liegt wiederum eine kleine Bremsspannung von etwa 0,5V. Mit Erhöhen der Beschleunigungsspannung zeigt sich zunächst die erwartete Zunahme des im Gitter-Anodenkreis fließenden elektrischen Stromes I (s. Abb. 4-13). Bei Erreichen von UG = Ures = 4,9 V sinkt jedoch I rasch ab und steigt erst ab 6 V wieder an. Bei UG = 2Ures, 3Ures, 4Ures werden ebenfalls Einbrüche im Strom gemessen. Zusätzlich beobachteten Franck und Hertz die Emission der Quecksilberstrahlung bei l = 253,7 nm nach Erreichen des ersten Stromeinbruchs. D e u t u n g : Mit Erreichen einer kinetischen Energie von E = eUres = 4,9 eV können die Elektronen erstmalig Energie auf die Hg-Atome übertragen, indem sie diese in einen höheren Energiezustand befördern. Damit verbleibt ihnen nur eine sehr geringe kinetische Energie, die nicht ausreicht, um die Bremsspannung von 0,5 V zu durchlaufen: es fließt kein Strom mehr. Bei den ganzzahligen Vielfachen der Resonanzenergie eUres kann ein Elektron mehrmals ein Atom anregen und bleibt danach wiederum mit einer zu kleinen Restenergie übrig. Die angeregten Hg-Atome gehen durch Ausstrahlung der beobachteten UV-Photonen der Energie h n = 4 ,9 eV in den Grundzustand zurück. Der Franck-Hertz-Versuch beweist somit, daß die Spektralterme tatsächlich als die diskreten Energiezustände der Atome aufzufassen sind.
Eine Verfeinerung der Franck-Hertz-Anordnung ließ später weitere Anregungszustände der HgAtome erkennen. Dabei stellte sich heraus, daß nicht jede Anregung mit der Emission von Licht verbunden ist. Dies ist ein Hinweis darauf, daß zur Emission (ebenso bei Absorption) von Lichtquanten zusätzliche Kriterien (optische Auswahlregeln) erfüllt sein müssen, die im Falle der Anregung durch Elektronen eine untergeordnete Rolle spielen.
G. Fussmann , Atomphysik SS 2002
62
Teilchen und Wellen
5 5.1
TEILCHEN UND WELLEN Interferenzen von Licht und Teilchen
Die Wellennatur des Lichtes offenbart sich in den zahlreichen Interferenzerscheinungen (am Spalt, Kante, Draht, Gitter usw.), bei denen sich Teilwellen entsprechend ihrer Phasenrelationen überlagern und somit auch gegenseitig auslöschen können. Es entstehen auf diese Weise bei Verwendung von monochromatischem Licht die bekannten Interferenzmuster mit wechselnden dunklen und hellen Streifen hinter Spalten und dünnen Drähten. Diese Erscheinung ist nicht auf sichtbares Licht begrenzt, sondern wird im gesamten Bereich der elektromagnetischen Wellen beobachtet. Entsprechende Interferenzerscheinungen treten insbesondere im Röntgengebiet bei der Beugung an Kristallen auf. In diesem Fall bilden die Kristallatome geordnete Streuzentren für die einfallende Strahlung. Bei Verwendung von kontinuierlicher Röntgenstrahlung bildet die von diesen Zentren eines Einkristalls reflektierte Strahlung durch Überlagerung Punktmuster (Laue-Interferenzen, Abb. 5-4). Ebenso ergeben sich bei der Streuung monochromatischer Röntgenstrahlung an Kristallpulver (viele kleine Kristalle mit statistischer Orientierung) charakteristische Ringe (Debye-Scherrer-Aufnahmen, Abb. 5-2). Louis de Broglie hatte 1924 die Idee, auch den Teilchen einen Wellencharakter zuzuordnen, der in ganz analoger Weise zu Interferenzerscheinungen führen sollte. Bevor wir auf die experimentelle Bestätigung dieser Vermutung eingehen, soll zunächst das logische Konzept dargelegt werden. Aus der speziellen Relativitätstheorie ergibt sich E = m c2 = g m0 c2. mit g = (1-b 2 )-1/2 und b = v/c. Andererseits haben wir für den Impuls p = m v = m0 c b g = m0 c (1-g2)1/2. Lösen wir die letzte Beziehung nach g auf und setzen sie in die Energiegleichung ein, so schreibt sich diese E = c 4 m02 + c 2 p 2 .
(5.1)
Setzen wir in diese Beziehung m0 = 0 für die Ruhemasse der Photonen ein, so erhalten wir eine einfache Proportionalität zwischen Gesamtenergie E und Impuls p EPh = c pPh ,
(5.2)
die wir auch einfacher aus den schon früher abgeleiteten Relationen für die Photonenmasse mPh= hn/c2 und ihren Impuls pPh = mph c hätten gewinnen können. Mit Hilfe von E = h n erhalten wir weiterhin p = h n / c und schließlich
l=
h pPh
(5.3)
De Broglie postulierte nun, daß diese Relation nicht nur für Photonen, sondern a u c h f ü r b e l i e b i g e T e i l c h e n g ü l t i g s e i n s o l l t e . Um allerdings den Impuls durch die kinetische Energie Ek = E - m0 c 2
(5.4)
ausdrücken zu können, müssen wir Gl. (5.1) nach p auflösen. Dies führt auf
G. Fussmann , Atomphysik SS 2002
63
Teilchen und Wellen
l=
h 2mo Ek + Ek2 / c 2
.
(5.5)
Für nicht-relativistische Teilchen (Ek << m0 c2), auf die wir uns weiterhin beschränken wollen, vereinfacht sich dies wegen p2 2m0
(5.6)
l=
h . 2m0Ek
(5.7)
l=
1, 23 nm Ek [eV ]
(5.8)
Ek = auf
Speziell für Elektronen hat man
Bei relativ kleinen Energien von etwa 50 eV sind dies typische Wellenlängen, wie sie auch als charakteristische K-Strahlung von Metallen abgegeben wird. Mit Elektronen dieser Energie sollten sich demnach ganz ähnliche Interferenzerscheinungen zeigen wie mit Röntgenlicht. Dies entspricht in der Tat den Beobachtungen: ∑
Versuch von Davisson und Germer (1927, s. Abb. 5-1): Reflexion von Elektronen an Nickelkristallen entspricht Bragg-Gesetz für Röntgenstrahlung nach Gl. (1.5), wenn l entsprechend der de Broglie-Beziehung (5.8) angenommen wird. 2. G.P Thomson (1927): Transmission eines Elektronenstrahls durch dünne Kristallfilme liefert in Vorwärtsrichtung auf einer Photoplatte Ringstrukturen, ganz analog, wie sie im DebyeScherrer-Versuch für Röntgenstrahlen beobachtet werden (Abb. 5-1). 3. Analog zu den Laue-Interferenzmustern zeigten sich Punktstrukturen beim Durchgang hochenergetischer Elektronen durch Einkristalle (Abb. 5-4). 4. Auch der bereits im Kap. 3 beschriebene Ramsauer-Effekt ist eine Bestätigung der Wellenhypothese der Teilchen. Abb. 5-1: Reflexion eines Elektronenstrahls an einem Nickel-Einkristall. Die in einem Polardiagramm dargestellte Intensität zeigt für Energien um 50 eV ein relatives Maximum bei einem Streuwinkel von q = 50°, das durch Interferenz entsteht (n. Davisson u. Germer). Ebenso konnten später Beugungserscheinungen an Drähten und Spalten nachgewiesen werden. Schließlich gelang auch der Nachweis der Wellennatur bei anderen Elementarteilchen und Atomen. Von besonderer Bedeutung sind G. Fussmann , Atomphysik SS 2002
64
Teilchen und Wellen entsprechende Bragg-Interferenzen, die mit Hilfe von Neutronenstrahlen erzeugt werden, für die Strukturanalyse von Festkörpern. Die hierfür benötigten monoenergetischen Neutronenstrahlen werden nach dem gleichen Prinzip durch Reflexion von thermischen Neutronen an Einkristallen erzeugt. Abb. 5-2: Beugungsringe, erzeugt von einem Elektronen-strahl beim Durchgang durch ein Kristallpulver (n. L. Germer). Die Beziehung (5.3) wird häufig in einer anderen Form geschrieben, die insbesondere dem Vektorcharakter des Impulses Rechnung trägt und im Zusammenhang mit den Wellenformeln benötigt wird. Dazu führt man den Wellenvektor k ein, der die Ausbreitungsrichtung der Welle
Abb. 5-3: Röntgenanordnung zur Aufnahme von Kristallbeugungsmustern in Transmission (n. V. Laue, Friedrich und Knipping).
Abb. 5-4: Laue-Diagramm eines NaClEinkristalls. Die angegebenen Zahlentripel sind die Millerschen Indizes der Netzebenen, an denen die verschiedenen Wellenlängen gebeugt werden.
angibt und dessen Betrag mit der Wellenlänge durch die reziproke Beziehung r 2p |k |= l
(5.9)
definiert ist. Zwischen diesem Vektor und dem Impuls des Photons oder Teilchens besteht dann die einfache Relation r r p = hk .
(5.10)
Ebenso benutzt man in der Regel nicht die gewöhnliche Frequenz n, sondern die Kreisfrequenz w . Die Energiebeziehung lautet dann anstelle von E = h n E = hw .
G. Fussmann , Atomphysik SS 2002
(5.11)
65
Teilchen und Wellen 5.2 Harmonische Wellen und Wellenpakete Die Wellengleichung 1 ∂ 2u ∂ 2u = v 2 ∂t 2 ∂x 2
(5.12)
begegnet uns in der Physik an den verschiedensten Stellen, wobei u gänzlich verschiedene Größen darstellt. Bei elastischen Wellen oder Schallwellen beispielsweise steht u für die Auslenkung x eines Volumenelementes bzw. des Drucks p. Bei den elektromagnetischen Wellen kann u sowohl das elektrische (E) als auch das magnetische Feld (B) sein. Wie man durch Einsetzen leicht bestätigt, hat die obige Differentialgleichung für konstantes v Lösungen vom Typ: u( x , t) = f ( x - vt) + g( x + vt)
(5.13)
mit beliebigen Funktionen f und g. Kennt man die Lösungsfunktion u und ihre zeitliche Ableitung zum Zeitpunkt t = t0, so sind damit die Funktionen f und g festgelegt (z.B. die beiden unterschiedlichen Pulse für t0 = -3 in Abb. 5-5). Die Lösungsfunktion für spätere Zeiten ergibt sich dann einfach durch Verschiebung dieser beiden partiellen Lösungen in unterschiedlichen Richtungen entlang der x-Achse und ihrer Addition (auch Überlagerung oder Superposition genannt). Die in der Abb. 5-5 veranschaulichte Beibehaltung der Pulsform der Teillösungen f und g ist ganz entscheidend davon abhängig, daß die Ausbreitungsgeschwindigkeit v eine Konstante ist und insbesondere nicht abhängig von der Frequenz ist. Ein Medium mit dieser Eigenschaft wird als nichtdispersiv bezeichnet. t = -2
t = -1
x
t = 0
x
t = 1
x
t = 2
x
x
Abb. 5-5: Propagation und Überlagerung zweier ungleicher Pulse (f, g) in einem nicht-dispersiven Medium, entsprechend Gl. (5.13). Da in der Ebene x = const. das Argument f = x ± v t (bei Wellen Phase genannt) der Funktionen f und g sich nicht ändert, nimmt somit die Lösung u(x,t) ebenfalls in der betrachteten y-z-Ebene überall den gleichen Wert an. Wir haben es also mit e b e n e n W e l l e n zu tun. Die Flächen gleicher Phase f = const. laufen mit der Geschwindigkeit dx/dt = ±v , die man deshalb auch die Phasengeschwindigkeit nennt. Von besonderer Bedeutung sind harmonische Wellenlösungen mit u( x , t) = A sin( kx ± wt).
(5.14)
Sie stellen ebene, unendlich ausgedehnte, monochromatische Wellen dar. Die Flächen konstanter Phase f = k x ±w t laufen hier mit der Phasengeschwindigkeit vPhase =
dx w =m dt k
(5.15)
wie man leicht durch Differentiation (df/dt = k dx/dt ± w = 0) bestätigt. G. Fussmann , Atomphysik SS 2002
66
Teilchen und Wellen Die Beschreibung von Erscheinungen mit derartigen Wellen stellt eine starke Idealisierung dar, die aber für zahlreiche optische Betrachtungen dennoch hinreichend ist. Für den Fall, daß man jedoch lokalisierte Teilchen beschreiben möchte, die sich ihrer Natur nach immer nur in begrenzten Gebieten aufhalten, muß man von unendlich ausgedehnten Wellen zu lokalisierten Wellenpaketen übergehen. Dies kann man durch Überlagerung von Wellen mit etwas unterschiedlicher Wellenzahl k erreichen. Außerdem wird es sich später als notwendig erweisen, vermöge der Eulerschen Beziehungen e ia - e - ia e ia + e - ia ; cos a = 2i 2i e ia = cos a + i sin a ; e - ia = cos a - i sin a
sin a =
(5.16)
zur komplexen Schreibweise überzugehen. An dieser Stelle - wie auch sonst in der klassischen Physik üblich - ist dies lediglich als eine Vereinfachung anzusehen, indem bei allen Ausdrücken immer der Realteil gemeint ist. Später werden wir jedoch sehen, daß im Rahmen der Quantenphysik die Verwendung von komplexwertigen Funktionen unabdingbar ist. Man kann somit ein Wellenpaket darstellen durch k 0 + Dk / 2
u( x , t) =
A( k ) e i ( kx -w ( k )t ) dk .
Ú
(5.17)
k 0 - Dk / 2
Das Integral über k (also kontinuierliches k-Spektrum) sorgt dafür, daß die Funktion für x Æ ± • verschwindet, während ein diskretes Spektrum immer zu periodischen Funktionen führt. Im allgemeinen ist w noch eine Funktion von k. Da Dk klein ist, können wir aber w(k) an der Stelle k = k0 in eine Taylor-Reihe entwickeln und für kurze Zeiten höhere als lineare Glieder vernachlässigen: w( k ) = w 0 +
dw dk
( k - k0 ) + º.
(5.18)
k0
Mit k = k0 + (k-k0) = k0 + k erhalten wir dann Dk / 2
u( x , t) = A( k0 ) e
i ( k 0 x -w 0 t )
Ú
e
Ê dw iÁ x dk Ë
k0
ˆ t˜ k ¯
dk .
(5.19)
- Dk / 2
Die Integration läßt sich leicht ausführen und führt auf u( x , t) = 2 A( k0 )
sin[( x - w ¢t)Dk / 2]
( x - w ¢t )
e i ( k 0 x -w 0 t ) = A( x , t) e i ( k 0 x -w 0 t )
(5.20)
mit w' = dw/dk|k0. Der Realteil dieser Funktion ist in der Abb. 5-6 veranschaulicht.
G. Fussmann , Atomphysik SS 2002
67
Teilchen und Wellen Abb. 5-6: Wellenpaket für t = 0 nach Gl. (5.20).
Re(u)
Da im Argument des Sinus die kleine Größe Dk steht, wird sich die Funktion A(x,t) nur langsam ändern; sie ist die Amplitude (Einhüllende in Abb. 5-6) der nahezu monochromatischen Welle mit der Phase (ko x - wo t). Diese Amplitude hat ihr Maximum an der Stelle x= w o ' t. Das Wellenpaket (auch Wellengruppe genannt) läuft also mit der Gruppengeschwindigkeit
x
vG =
dw dk
.
(5.21)
k = k0
Die Amplitude besitzt links und rechts vom absoluten Maximum benachbarte Nullstellen, die dadurch gegeben sind, daß das Argument der Sinusfunktion ± p wird. Für t = 0 liegen diese an den Stellen x 1,2 = ± 2p/Dk. Der Abstand der Nullstellen beträgt also 4p/Dk. Den halben Wert hiervon definiert man (mit einiger Willkür) als Breite im Ortsraum Dx = 2p/Dk. Zwischen diesem und der Breite im k-Raum besteht also der grundlegende Zusammenhang Dx Dk = 2 p .
(5.22)
Abgesehen vom genauen Wert der rechten Seite ist dies bereits der wesentliche Inhalt der im folgenden zu diskutierenden Unschärferelationen. 5.3
Fourier-Analyse und Unschärferelationen
Im letzten Abschnitt haben wir bereits festgestellt, daß zur Beschreibung eines lokalisierten Wellenpaketes eine Unschärfe der Wellenzahl und damit des Impulses zugelassen werden muß. Diesen wichtigen Zusammenhang wollen wir im folgenden vertiefen und erweitern. Aus der Theorie der Fourier-Analyse ist bekannt, daß eine zeitliche Funktion f(t) in den Frequenzraum F(w) überführt werden kann vermöge der Integraltransformation F(w ) =
1 2p
+•
Ú f (t ) e
- iw t
dt .
(5.23)
dw .
(5.24)
-•
Die Rücktransformation ergibt sich zu f (t ) =
1 2p
+•
Ú F(w ) e
iw t
-•
Für periodische Funktionen f(t) liefert das Integral (5.23) nur diskrete Amplituden Fn, so daß das Fourier-Integral (5.24) in eine Fourier-Reihe übergeht: •
f (t ) =
ÂFe n
- inw 0 t
(5.25)
n = -•
Hierbei ist w0 = 2p /T die Grundfrequenz, wenn T die entsprechende Periodendauer ist. Im Spezialfall einer reinen Sinusschwingung besteht diese Summe aus nur zwei Termen mit Fn=m und G. Fussmann , Atomphysik SS 2002
68
Teilchen und Wellen Fn=-m, alle übrigen Fourier-Koeffizienten verschwinden. In der Abb. 5-7 und Abb. 5-8 ist das Ergebnis für den Fall F 0 = 0, Fn= 1/(i p n) mit n = ±1, ±2... gezeigt, das einen periodischen Sägezahn liefert. yf 1
Fn /i p
0.5 -4
-3
-2
-1 1
2
3
n
4
-20
-10
10
20
t
-0.5 -1
Abb. 5-7: Fourier-Zerlegung einer Sägezahnoszillation.
Abb. 5-8: Rekonstruktion einer Sägezahnoszillation unter Verwendung der ersten zehn Fourier-Komponenten.
Im allgemeinen Fall einer nichtperiodischen Funktion hat man es jedoch mit den Integraldarstellungen (5.23) und (5.24) zu tun, und die Spektralfunktion F(w) ist kontinuierlich. Dies ist auch dann der Fall, wenn beispielsweise f(t) zwar eine reine Sinusfunktion ist, jedoch nur innerhalb eines Zeitintervalls Dt vorliegt, wie sie in der Abb. 5-9 dargestellt ist. Abb. 5-9: Zeitlich begrenzte Sinusschwingung.
yf
t
Die Rechnung liefert in diesem Fall
F(w ) =
1 2p
Dt / 2
Ú
sin w 0t e - iw t dt =
- Dt / 2
i Ê sin[(w 0 - w ) D2t ] sin[(w 0 + w ) D2t ]ˆ Á ˜ w0 - w w0 + w 2p Ë ¯
(5.26)
Diese Frequenzfunktion ist in der Abb. 5-10 abgebildet; sie oszilliert um die Stellen w = ±w 0, wobei in der Umgebung w = +w0 die Amplitude mit 1/Dw abnimmt, wenn Dw = w0 - w. Im(F) 0.4
Abb. 5-10: Das Fourier-Spektrum nach Gl.(5.26)
0.2 -40
-20
20
40
ww
für Dt = 2 und wo = 20.
-0.2
In obigem Ergebnis ist insbesondere der erste Term von Bedeutung, da er für große Frequenzen w0 für benachbarte Werte von w ª w 0 langsam oszilliert. Die dem Maximum benachbarten Nullstellen haben den Abstand 4p/Dt. Die Hälfte dieses Wertes definieren wir als die Frequenzunschärfe Dw = 2p/Dt. Damit beträgt die entsprechende Frequenzunschärfe Dn = 1/Dt. Setzen wir in dem Ergebnis -0.4
G. Fussmann , Atomphysik SS 2002
69
Teilchen und Wellen Dw Dt = 2 p
(5.27)
die Energie entsprechend DE = h Dw ein, so ergibt sich die Energie-Zeit-Unschärfe-Relation in der Form DE Dt = h .
(5.28)
Es ist wichtig festzustellen, daß die F o u r i e r - T r a n s f o r m a t i o n eine A b b i l d u n g z w i s c h e n i n v e r s e n V a r i a b l e n (in Gl. (5.27) Zeit (s) und Frequenz (s-1)) darstellt. Anstelle von inversen Variablen spricht man in der Physik meist von komplementären Größen, womit aber das gleiche gemeint ist. Ganz analoge Transformationen sind daher auch für andere inverse Variablenpaare möglich. Als solche haben wir bereits Strecken x und Wellenzahlen k betrachtet und die der Gl. (5.27) entsprechende Beziehung (5.22) erhalten, aus der nach Multiplikation mit h die Orts-Impuls-Unschärfe-Relation in der Form Dx Dpx = h
(5.29)
hervorgeht. Später werden wir sehen, daß die letzte und andere Unschärfe-Relationen (z.B. für die Drehimpulskomponenten) sich aus der Unvertauschbarkeit von Operatoren ableiten lassen. Die Energie-Zeit-Unschärfe nimmt in diesem Sinne eine Sonderstellung ein, da der Zeitmessung kein Operator zugeordnet werden kann. Die Beziehungen (5.28) und (5.29) wurden für einen endlichen Sinuswellenzug abgeleitet. Betrachtet man andere Wellenpakete, so ergeben sich andere Zahlenwerte für die Produkte der komplementären Größen. Man kann zeigen, daß für gaußförmige Amplitudenverteilungen die rechte Seite ein Minimum annimmt und um den Faktor 4p kleiner ausfällt. Nach wie vor besteht jedoch eine gewisse Willkür in der Breitendefinition. W. Heisenberg definierte sie in seiner berühmten Arbeit von 1927 über die gemittelten Schwankungsquadrate gemäß Dx: = ( x - x )2 ; Dp: = ( p - p )2
(5.30)
und ähnlich für die Energie und Zeit. In diesen Größen ausgedrückt, lauten dann die Heisenbergschen Unschärferelationen Dx Dp ≥
h 2
(5.31)
DE Dt ≥
h . 2
(5.32)
und
Die Zeit-Energie-Unschärfe haben wir schon im Zusammenhang mit der Abschätzung der Frequenzbreite der Spektrallinien aus den Lebensdauern der atomaren Niveaus kennengelernt. Die Orts-Impulsunschärfe hat eine fast noch größere Bedeutung. Als Beispiel sei folgende Überlegung angeführt: Angenommen, das Elektron im Wasserstoffatom würde strahlen und dadurch als Folge des Verlusts an kinetischer Energie in den Atomkern stürzen. Die Ortsunschärfe wäre dann nahe bei null. Gl. (5.31) würde dann aber einen unendlich großen Impuls (Dp = p) und damit wegen E = p2/ 2m auch eine unendliche Energie postulieren, im Gegensatz zur Annahme. Eine endliche Energie des Elektrons führt somit automatisch auf einen endlichen Radius. Dieses Argument kann man auch quantifizieren und zu einer Abschätzung des Bohrschen Radius und der Bindungsenergie G. Fussmann , Atomphysik SS 2002
70
Teilchen und Wellen verwenden. I n s g e s a m t s t e l l e n w i r a l s o f e s t , d a ß d i e O r t s Impulsunschärfe eine einfache Erklärung für die Stabilität der Atome liefert. Wir fassen das Wichtigste noch einmal zusammen: Die Frequenz eines Schwingungsvorgangs kann nicht instantan gemessen werden, sondern erfordert eine Zeitspanne. Je genauer die Frequenz bestimmt werden soll, um so mehr Schwingungsperioden müssen erfaßt werden, d.h. um so länger dauert die Messung. Ebenso kann man die Wellenlänge nicht in einem Punkt bestimmen, sondern benötigt eine Strecke, die zumindest einen Wellenberg und ein Wellental erkennen läßt. Demgemäß sind die U n s c h ä r f e r e l a t i o n e n e i n e n a t ü r l i c h e Fo lg e d e r We lle n n at u r d e r Te ilch e n .
5.4
Klassische und quantenmechanische Felder
Die zuvor betrachteten Wellenpakete können sowohl zur Beschreibung von Photonen wie auch von Teilchen verwendet werden. Wir orientieren uns zunächst an der Beschreibung einer klassischen elektromagnetischen Welle und betrachten dann die Möglichkeit, Photonen und materielle Teilchen in analoger Weise zu beschreiben. 5.4.1
ELEKTROMAGNETISCHE WELLEN
Hier stellt die skalare Funktion u in Gl. (5.12) die Komponente des schwingenden E-Feldes in einer bestimmten Richtung dar. Im Vakuum oder einem anderen linearen Medium (charakterisiert durch Dielektrizitätskonstante e0 und Permeabilität m) breitet sich die Welle in einer Richtung senkrecht hierzu aus, die durch den k-Vektor gegeben ist. Das Magnetfeld wiederum steht senkrecht zu diesen beiden Richtungen. Genauer ergeben die Maxwell-Gleichungen für ein vorgegebenes E-Feld einer monochromatischen Welle r r rr E = E0 e i ( k ◊r -w 0 t )
(5.33)
r r die Bedingung E0 ◊ k = 0 und liefern für das entsprechende schwingende Magnetfeld r r r k ¥E B= . w0
(5.34)
Hieraus erhält man die zeitlich gemittelte Energiedichte der Welle zu U=
e 1 r r r r H ◊ B + E ◊ D = E02 2 2
(
)
(5.35)
wobei neben H = B/m, D = e E und vph2 = (w0/k)2 = 1/(e m) die Relation Re( F )Re(G) =
1 1 Re( FG*) = Re( F * G) 2 2
(5.36)
für den Mittelwert eines Produkts komplexer Größen (G, F) verwendet wurde (G*, F* sind die konjugiert komplexen Größen). Der Beziehung (5.35) entnehmen wir insbesondere, daß bei einem klassischen Feld die E n e r g i e d i c h t e p r o p o r t i o n a l z u m Q u a d r a t d e s E F e l d e s (allgemein also ~ |u|2) ist. Gehen wir nun von monochromatischen Wellen zu Wellenpaketen über, so bezieht sich die zeitliche Mittelung auf die hochfrequente Oszillation mit der Frequenz w0. Die Amplitudenfunktion E0 und G. Fussmann , Atomphysik SS 2002
71
Teilchen und Wellen damit auch die zu E02 proportionale Energiedichte ist nun jedoch nicht konstant im Raum, sondern ihr Maximum läuft – wie wir bereits gesehen haben – mit der Gruppengeschwindigkeit dw/dk. Die Gruppengeschwindigkeit ist demzufolge auch die Geschwindigkeit, mit der sich die Energie im Raum f o r t p f l a n z t . Für ein dispersionfreies Medium (Brechungsindex = nBrech π f(w)) ist n l = c/nBrech also w = c k /nBrech und wir erhalten vGr = vPhase =
5.4.2
c nBrech
.
(5.37)
MATERIEWELLEN UND PHOTONEN
Analog zu diesen Betrachtungen für ebene elektromagnetische Wellen können wir zunächst für die Beschreibung von Photonen und Teilchen eine Wellenfunktion einführen: rr
y = y 0 e i ( k ◊r -w t ) .
(5.38)
Setzen wir hierin die Beziehungen für Impuls (5.10) und Energie (5.11) ein, so erhalten wir die Darstellung i
rr
y = y 0 e h ( p ◊r - Et ) ,
(5.39)
die, wenn noch E = p2/2m eingesetzt wird, auch als de-Brogliesche Materiewelle bezeichnet wird. Solange wir aber die Energiebeziehung nicht spezifizieren, ist die Unterscheidung zwischen Photon (m0 = 0) und materiellem Teilchen (m0 > 0) noch nicht getroffen. Allerdings ist der Ausdruck (5.39) nach unseren Ausführungen in Kap. 5.2 noch nicht geeignet, ein lokalisiertes Teilchen zu beschreiben. Dazu müssen wir entsprechend Gl. (5.17) zu Wellenpaketen übergehen. Für ein Teilchen, das sich in x-Richtung bewegt, haben wir demnach anzusetzen p o + Dp / 2
y ( x , t) =
Ú
i
A( p) e h ( px - Et ) dp .
(5.40)
p 0 - Dp / 2
Im Einklang mit Gl. (5.31) benötigen wir demnach eine Impulsunschärfe, um ein lokalisiertes Teilchen beschreiben zu können. Spätestens an dieser Stelle müssen wir uns der Frage stellen, was denn die Größe y eigentlich beschreiben soll. Bei den klassischen elektromagnetischen Wellen hatten wir der entsprechenden Funktion u das den Raum erfüllende E-Feld zugeordnet. Wollten wir hier in gleicher Weise verfahren, so könnten wir versuchen, im Fall der Materiewellen dem Realteil der Funktion y formal ein „Materiefeld“ zuzuordnen und bei den Photonen wie zuvor das E-Feld als reale physikalische Größe in Betracht ziehen. Es ergibt sich aber nun die Schwierigkeit, daß die Funktion y beliebig kleine Werte annehmen kann – und um die später zu besprechende Normalisierung erfüllen zu können, auch muß. Damit müßten wir zulassen, daß ein materielles Teilchen, das wir andererseits als kompakte, unteilbare Einheit in den Experimenten kennengelernt haben, sich in dieser Beschreibung beliebig verdünnen und ausdehnen könnte. Auch bei den Photonen treten Probleme auf. Um nämlich einige Interferenz-Experimente mit hochmonochromatischem Licht bei sehr schwacher Intensität erklären zu können, muß die entsprechende Wellengruppe – und damit dem einzelnen Photon – eine große räumliche Ausdehnung zugesprochen werden. Es zeigt sich, daß diese sogenannte Kohärenzlänge, die beispielsweise mit Hilfe eines Michelson-Interferometers durch Verlängerung der Armlänge bis zum Verschwinden der Interferenz leicht bestimmt werden kann, wie erwartet durch die Beziehung G. Fussmann , Atomphysik SS 2002
72
Teilchen und Wellen L = c t gegeben ist. Extreme Verhältnisse findet man bei der Emission von g-Strahlung, wo die Zerfallszeiten (t) der angeregten Kernniveaus viele Jahre betragen können. Damit ergeben sich Kohärenzlängen von mehreren Lichtjahren. Entsprechend würde sich nach klassischer Auffassung die elektromagnetische Energiedichte zu beliebig kleinen Werten verdünnen. In den Experimenten zum Photoeffekt dagegen hatte sich gezeigt, daß ein Photon seine Energie immer vollständig auf ein einzelnes Elektron überträgt. Die Vorstellung nun, daß beispielsweise ein über Millionen von Kilometern ausgedehntes Photon seine Energie schlagartig an ein einzelnes Elektron abgeben kann, erscheint absurd und bringt uns außerdem in Konflikt mit der Relativitätstheorie, nach der keine Energie mit einer Geschwindigkeit oberhalb der Lichtgeschwindigkeit transportiert werden kann. Auch hier muß man demnach die Zuordnung von |y|2 mit der Energiedichte des Feldes fallen lassen. In der Quantentheorie können in der Tat Felder auch ohne Energie existieren18. Dies muß u. a. auch gefordert werden, um den Prozess der Photonenemission bei Anwesenheit von Stößen erklären zu können. Einerseits ist es für die Deutung der in den Experimenten beobachteten Kohärenzlänge erforderlich, die Photonenemission als einen kontinuierlichen Prozeß zu verstehen, der sich über die Zeitspanne t erstreckt. Erfährt jedoch das Atom etwa nach Zeit t/2 einen unelastischen Stoß mit einem anderen Atom, so wird dem Stoßpartner die gesamte Anregungsenergie übertragen (abzüglich der kinetischen Energien, die die gleichzeitige Erfüllung von Energie- und Impulssatz erfordern), und es wird überhaupt keine Energie abgestrahlt. Wäre nun die während der Zeit t/2 abgestrahlte Welle mit Energie versehen, so müßte diese praktisch instantan zurück gespult werden – was wiederum mit der Relativitätstheorie nicht vereinbar ist. Einen Ausweg aus dem geschilderten Dilemma hat M. Born angeboten, indem er vorschlug, der Größe |y|2 eine Wahrscheinlichkeitsdichte zuzuordnen. Demnach ist r w(r ) dx dy dz =|y |2 dx dy dz
(5.41)
die r Wahrscheinlichkeit, das Teilchen oder Photon im Volumenelement dV = dx dy dz am Aufpunkt r anzutreffen. Mit dieser heutzutage allenthalben akzeptierten Interpretation der Wellenfunktion wurde allerdings der klassische Realitätsbegriff weitgehend aufgegeben. Nach der Bornschen Deutung ist es ja nicht so, daß das Feld in jedem Raumpunkt eine Veränderung hervorruft, die zumindest im Prinzip (beim klassischen elektromagnetischen Feld z.B. durch die Kraft auf eine Probeladung) nachweisbar ist. Im Gegenteil, im Großteil des Beobachtungsvolumens wird man zu einem bestimmten Zeitpunkt auch mit den feinsten Meßgeräten keinerlei Veränderung feststellen können. Grundsätzlich sind Beobachtungen nur noch im statistischen Sinne möglich. H. Paul faßt diesen Sachverhalt in seinem sehr lesenswerten Buch "Photonen" treffend so zusammen: Ans telle des F aktis chen is t damit das Mögliche in der B e s c h r e i b u n g g e t r e t e n . Dazu kommt, daß der komplexwertigen Wellenfunktion y keine direkte physikalische Bedeutung zukommt. Obwohl wir letztlich nur an der Wahrscheinlichkeitsdichte w = |y|2 interessiert sind, ist aber der Umweg über die Wellenfunktion unverzichtbar, da nur so die beobachtbaren Interferenzerscheinungen (z.B. am Doppelspalt) in die theoretische Beschreibung einfließen. 5.4.3
ZERFLIEßENDE WELLENPAKETE
Neben der bisher betonten Parallelität zwischen materiellen Teilchen und Photonen gibt es jedoch einen wichtigen Unterschied. Während nämlich das Vakuum für die Photonen ein nicht-dispersives Medium darstellt, ist das bei den Teilchen nicht mehr so. Die Ursache für diesen Unterschied liegt in den Energiegleichungen Gl. (5.2) (Eph ~ p) und Gl. (5.6) (Ekin ~ p 2). Berechnen wir hiermit die Phasen- und Gruppengeschwindigkeiten, so erhalten wir 18 Umgekehrt können aber auch – beispielsweise in einem Resonator– E-Felder auftreten, ohne daß ein Photon vorhanden
ist. Es sind dies die berühmten Feldfluktuationen des Vakuumzustandes, die wir im Kapitel 9 noch genauer betrachten werden. G. Fussmann , Atomphysik SS 2002
73
Teilchen und Wellen Photonen dw dE = vGr = dk dp w E vPh = = k p
Teilchen p m p v = Gr 2m 2
c c
(5.42)
Während bei den Teilchen die Gruppengeschwindigkeit mit der üblichen Teilchengeschwindigkeit v = p/m übereinstimmt, ist die Phasengeschwindigkeit nur halb so groß. Die verbleibende Proportionalität vGr ~ p hat zur Folge, daß das aus Teilwellen mit unterschiedlichem p zusammengesetzte Wellenpaket eines Teilchens nicht seine Form beibehält, sondern im Laufe der Zeit auseinanderfließt. Um diesen Effekt aufzuzeigen, betrachten wir einen wichtigen Spezialfall, in dem die Impulsamplitude A(p) in Gl. (5.40) eine Gaußverteilung ist
A( p) = A0 e
-
( p - p0 )2 b 2 h2
.
(5.43)
Die Wellenfunktion ergibt sich dann nach Gl.(5.40) aus +•
Ú
y ( x , t) =
i
A( p) e h ( px
p2
- 2m t)
dp .
(5.44)
-•
Die Integration läßt sich analytisch durchführen und führt für das Betragsquadrat auf 2
w( x , t) =|y ( x , t)| =
e
( x - v Gr t ) 2 2 b 2 ( 1 + L2 ) 2
b 2 p(1 + L )
; mit L(t) =
ht . 2mb 2
(5.45)
Über die Größe A0 = (8p b2)1/4 wurde dabei so verfügt, daß die Normierung • 2
Ú |y | dx = 1
(5.46)
-•
besteht. Damit ist gewährleistet daß, wenn |y|2 dx = w(x) dx die Wahrscheinlichkeit ist, das Teilchen im Intervall dx zu finden, es mit Sicherheit irgendwo anzutreffen ist. Definieren wir mit Dx0 die anfängliche Breite des Wellenpakets in der Weise, daß an den Stellen x 1,2 = ± Dx0/2 die Wahrscheinlichkeitsdichte w(x1,2) auf den Bruchteil e-1/2 des Maximalwertes w(0) abgefallen ist, so erhalten wir zunächst x1,2 = ±b und damit Dx0 = 2b. Ebenso definieren wir die Impulsbreite Dp über den Abfall auf e-1/2 des Maximalwertes der Funktion |A|2. Hierfür ergibt sich mit Gl. (5.43) Dp = 2( h /2b). Mit diesen Definitionen lautet die Unschärferelation diesmal Dx Dp = 2 h . Wir entnehmen jedoch der Gl. (5.45), daß die Breite des Wellenpaketes im Laufe der Zeit zunimmt, entsprechend 2
Dx(t) = Dx(0) 1 + L2 = 2b 1 +
G. Fussmann , Atomphysik SS 2002
Ê ht ˆ . Ë 2mb 2 ¯
(5.47)
74
Teilchen und Wellen 0.4
Dies ist auch in der Abb. 5-11 dargestellt, die drei Zeitaufnahmen des Pulses darstellt. Die charakteristische Zeit t = 2 m b2/ h für das Auseinanderfließen hängt nur von der Anfangsunschärfe und der Masse der Teilchen ab.
|y|2
0.3 t=0
0.2 t=3t
0.1
t = 7t
5
10
15
20
Abb. 5-11: Zerfließendes Wellenpaket. Der Puls läuft von links nach rechts. x
Für ein Elektron auf 1. Bohrscher Bahn haben wir etwa b ª 10-10 m. Das ergibt t = 1,6◊10-16 s, was in Näherung der klassischen Umlaufzeit entspricht. Mit anderen Worten: innerhalb weniger Umläufe ist das anfänglich scharf lokalisierte Teilchen völlig verschwommen. Die klassische Vorstellung vom Elektron im Atom als kreisendes Partikel muß damit aufgegeben werden. Die Impuls-Ort-Unschärfe-Relation und das Zerfließen des Wellenpakets hat aber auch sonst zur Folge, daß man einem freien oder gebundenen Teilchen k e i n e T r a j e k t o r i e im Sinne der klassischen Mechanik m e h r z u o r d n e n kann. Das Verhalten eines Teilchens in der Zukunft ist somit nicht mehr allein durch die Gegenwart bestimmt. Dies gilt natürlich auch für die klassische Mechanik, wenn die Anfangsbedingungen für Ort und Impuls nur ungenau bekannt sind (führt auf die Erscheinungen des determinierten Chaos). Im Gegensatz zur klassischen Mechanik kann man aber einem Teilchen, das der Unschärfe-Relation unterliegt, auch prinzipiell keine genauen Anfangsbedingungen auferlegen. Der Determinismus der klassischen Physik ist damit endgültig aufgehoben. 5.5 5.5.1
Welle-Teilchen-Dualismus BEUGUNG UND INTERFERENZ
In Abschnitt 5.1 haben wir bereits einige experimentelle Befunde dafür angeführt, daß Teilchen und Photonen Wellencharakter besitzen und Interferenzmuster bilden. Dieses Phänomen der Interferenz wollen wir nun genauer betrachten. Wir erinnern zunächst daran, daß Licht an Blenden, Kanten und Schlitzen g e b e u g t wird. Darunter versteht man die Abweichung von der geometrischen Optik; insbesondere, daß Licht auch im eigentlichen Schattenbereich angetroffen wird. Beugungserscheinungen kann man sehr gut an einem Einzelspalt beobachten (s. Abb. 5-13). Trifft paralleles, monochromatisches Licht der Wellenlänge l auf einen Spalt der Breite b (Höhe: h >> b), so erhält man für b >> l eine scharfe Abbildung des Spaltes auf einem Auffangschirm im Abstand L. Bei Verkleinerung der Spaltbreite werden die Beugungserscheinungen stärker und es kommt für b ª l zur Ausbildung von sich abwechselnden hellen und dunklen Streifen. Schließlich wird für b << l das einfallende Licht durch den Spalt homogen gestreut, gleichsam als wenn am Ort des Spaltes eine kleine zylindrische Lichtquelle vorhanden wäre. Diese Erscheinungen lassen sich durch das Hygenssche Prinzip erkären: An jedem Ort des Spaltes entstehen neue Elementarwellen, die sich kugelförmig (oder beim eindimensionalen Spalt zylindersymmetisch) ausbreiten. An einem gewählten Aufpunkt hinter dem Spalt überlagern sich alle diese Elementarwellen und je nach ihrer Phasenbeziehung kann es zur konstruktiven Interferenz (maximale Intensität) oder destruktiven Interferenz (Auslöschung) kommen. Liegt der Aufpunkt in der Nahzone der Blende (L ª l), so spricht man von Fresnel-Beugung, ist er dagegen weit entfernt (L >> l) oder verwendet man hinter der Blende eine Linse, um die parallelen Strahlen auf den Schirm abzubilden, so hat man es mit Fraunhofer-Beugung zu tun. Letztere ist mathematisch wesentlich einfacher zu beschreiben. Interferenz19 und Beugung sind in ihrer Definition nicht scharf voneinander zu trennen und basieren beide auf dem gleichen physikalischen Prinzip. Von Interferenz im eigenlichen Sinne spricht man, wenn die typischen Hell-Dunkel-Muster in Erscheinung treten. Unter Beugung versteht man dagegen eher die sich aus dem Wellencharakter ergebende Unschärfe der Abbildungen. 19 Interferieren (lat.: inter-ferre = zwischen-tragen) wird meist in der Bedeutung von beeinflussen, stören, überlagern
G. Fussmann , Atomphysik SS 2002
75
Teilchen und Wellen
5.5.2
BEUGUNG AM EINZELSPALT
Betrachten wir nun anhand der Abb. 5-12 die Verhältnisse am Einzelspalt quantitativ in der Fraunhofer-Näherung. Die vom Spalt ausgehenden zylindrischen Elementarwellen haben die r r Darstellung y elem = C / r exp[i( k ◊ r - w t )] . In Richtung des Winkels j zur x-Achse haben sie die r r Phasendifferenzen Df = k ◊ r = ( 2 p / l ) y sin j . Integrieren wir diese Elementarwellen über die Breite des Spaltes, so erhalten wir für die Gesamt-wellenfunktion am Aufpunktort P des ebenen Schirms b/ 2
y=
Ú
Ce
- b/ 2
i(
2p y sin j - wt ) l
L / cos j
P
y
+b/2 j
p sin[ b sin j ] Ce l . p L / cos j sin j l - iwt
dy =
(5.48)
Abb. 5-12: Zur Überlagerung der Elementarwellen am Einzelspalt. Man beachte, daß für L >> l die Phasenunterschiede zwischen den parallelen Strahlen und den im Punkt P konvergierenden Strahlen (gestrichelt) gleich werden.
x=L
y sinj -b/2
Die Intensität ist proportional zu y y* und ergibt sich somit nach der Renormierung I(j = 0) = I0 zu
pb pb sin j ] sin 2 [ j ] l l , I = I 0 cos j ª I0 b pb p ( sin j )2 ( j )2 l l sin 2 [
(5.49)
wobei die rechte Näherung für die Beschränkung auf kleine Winkel gilt. Für zwei verschiedene Verhältnisse von b/l sind die Profile in der Abb. 5-13 wiedergeben. 1 0.8
I/I0
0.6
Abb. 5-13: Intensitätsprofil des Einzelspaltes für b/l = 10 und b/l = 1 (gestrichelt).
0.4 0.2 -0.3-0.2-0.1 5.5.3
0.1 0.2 0.3
INTERFERENZ AM DOPPELSPALT
Erste Untersuchungen zur Beugung von Licht am Doppelspalt wurden von dem englischen Wissenschaftler und Arzt Th. Young um 1800 durchgeführt. Er beleuchtete zwei enge Spalte (Breite: b ª 1 mm, Abstand: d ª 10 mm) mit dem monochromatischen Licht eines symmetrisch verwendet. G. Fussmann , Atomphysik SS 2002
76
Teilchen und Wellen angebrachten Spaltes (b ª 1 mm), der als Punktquelle diente (Abb. 5-14). Wegen des gleichen Abstands zu den beiden Spalten haben die Lichtwellen dort gleiche Phase. Licht oder Teilchenstrahlen
Abb. 5-14: Youngs Experiment zur Beugung am Doppelspalt.
L1 d
Wie wir bereits gesehen haben, gehen unter den Bedingungen b ª l von den beiden Spalten in Näherung homogene Zylinderwellen aus (Abb. 5-14). Ist j der Winkel vom Koordinatenursprung (zwischen den Spalten) zum weit entfernten Aufpunkt P, so haben wir die beiden Teilwellen y1 = C/r1-1/2 exp[-i (2p/l d/2 sinj - wt)] und y2 = C/r1-1/2 exp[-i (-2p/l d/2 sinj - wt)] mit r1 ª r2 ª L. Berechnen wir die Intensitätsverteilung hinter den Spalten gemäß
j L2 P
2
2
2
I = y 1 + y 2 = y 1 + y 2 + (y 1y 2 * +y 1 * y 2 ) ,
(5.50)
so sind die Betragsquadrate die Wahrscheinlichkeiten für die Passage durch Spalt 1 und Spalt 2, während der in Klammern gesetzte Ausdruck den Interferenzterm darstellt. Letzterer bringt zum Ausdruck, daß die Welle gleichzeitig durch den einen wie durch den anderen Spalt hindurchtreten kann. Einsetzen der angegeben Ausdrücke für y1 und y2 ergibt I=
4|C|2 pd sin j 4|C|2 pd y cos 2 ( )= cos 2 ( ). L L l l L2
(5.51)
Diese Verteilung ist ein gleichförmiges Streifenmuster auf dem Auffangschirm, anhand dessen Young zum ersten Mal die Wellenlänge des sichtbaren Lichtes bestimmte. Eine genauere Rechnung zeigt, daß für den Fall endlicher Spaltbreiten die Intensitätsverteilung durch das Produkt der Einzelergebnisse von Gl. (5.51) und (5.49) gegeben ist, was für kleine Winkel auf pb sin 2 [ j ] d p l I = I 0 cos 2 ( j ) b p l ( j )2 l
(5.52)
hinausläuft. Wegen des relativ großen Spaltabstandes (d >> l) ist der erste Faktor in (2.14) eine schnell veränderliche Funktion. Der zweite Faktor hingegen ergibt aufgrund der schmalen Spaltbreiten (b << d) eine relativ langsame Amplitudenvariation. In der Abb. 5-15 ist diese Verteilung dargestellt für die Verhältnisse, wie sie bei einem Beugungsexperiment mit Neutronen vorlagen (A. Zeilinger in: "Wieviel Leben hat Schrödingers Katze"). I
-400 -200
Abb. 5-15: Intensitätsverteilung hinter Doppelspalt nach Gl. (5.52) für l = 1,9 nm, d = 127 mm, b = 22 mm, L1 = L2 = 5m. Die geometrisch bedingte Verteilung für klassische Teilchen ist gestrichelt eingetragen.
200
x 400
In diesem Fall wurden kalte Neutronen (T = 25 K) mit Hilfe eines Prismas auf eine de-BroglieWellenlänge von l = 1,9 nm (v = 200m/s) monochromatisiert und dann durch eine Spaltanordnung G. Fussmann , Atomphysik SS 2002
77
Teilchen und Wellen geleitet. Im Abstand von 5 m hinter dem Doppelspalt wurde die Neutronenverteilung unter Verwendung eines verfahrbaren Zählrohres (Argonfüllung mit BF3-Zusatz zum Neutronennachsweis) mit einem Eingangsschlitz von 20 mm Breite gemessen. Die Ergebnisse sind der Abb. 5-16 und Abb. 5-17 zu entnehmen. Sie stimmen mit den wellentheoretischen Beschreibungen hervorragend überein. Der große Unterschied zwischen diesen Ergebnissen und Erwartungen auf der Basis einer rein geometrischen Beschreibung für klassische Teilchen ist in der Abb. 5-15 verdeutlicht. In diesem Fall würde man eine Doppelhöckerverteilung erwarten, da jedes Teilchen entweder durch den einen oder durch den anderen Spalt hindurchtreten kann. Es ist hervorzuheben, daß sich in den Experimenten j e w e i l s n u r e i n N e u t r o n i n d e r A p p a r a t u r befand, da die Pulsrate unter 1 pro Sekunde lag. J e d e s T e i l c h e n interferiert demnach mit sich selbst.
Abb. 5-16: Neutronenverteilung beim Einzelspaltexperiment.(Theorie: durchgezogene Linie)
Abb. 5-17: Neutronenverteilung beim Doppelspaltexperiment. (Theorie: durchgezogene Linie)
Ähnliche Befunde konnten auch für andere Teilchen erhalten werden. Bei analogen Experimenten mit Photonen wurde die Fähigkeit, mit sich selbst zu interferieren, bereits in den 30er Jahren festgestellt, indem die Eingangsintensität sukzessiv verringert wurde. Auf den zum Teil tagelang belichteten Photoplatten trat mit zunehmender Belichtungszeit immer das charakteristische Interferenzmuster in Erscheinung. Bei den beschriebenen Neutronenexperimenten konnte zudem gezeigt werden, daß beim Wechsel vom Einzel- zum Doppelspalt an einzelnen Stellen die Intensität zurückgeht, anstatt zuzunehmen. Die Teilchen nehmen daher sehr wohl beide Spalte wahr, obwohl sie nach unserer Vorstellung nur die Möglichkeit haben, durch einen hindurch zu gehen. Der Durchgang durch das Spaltsystem ist daher nur im Wellenbild, in dem die Teilchen über ein Volumen ausgedehnt sind, zu verstehen. Anders dagegen ist die Schwärzung der Photoplatte oder das Ansprechen des Zählrohres nur im Teilchenbild verständlich. Ein einzelnes Photon – oder ein anderes Teilchen – führt nur zu einer Schwärzung in einem winzigen Bereich der Photoschicht. Das zeigen auch Versuche, in denen Multikanalplatten für den Nachweis verwendet werden, die es gestatten, den Auftreffort jedes einzelnen Photons (mit einer Nachweiswahrscheinlichkeit von ca 30% und einer Ortsauflösung von ca 50 mm) zu registrieren. Infolge der Messung kollabiert also die Wellenfunktion von einem raumausfüllenden Gebilde zu einer scharf lokalisierten Funktion (näherungsweise d-Funktion) im Ort. Man nennt diesen durch Messung hervorgerufenen Schrumpfungsprozeß die Reduktion des Wellenpaketes. Es ist wichtig, nochmals darauf hinzuweisen, daß dieser Kollaps des Wellenpaketes aus energetischer Sicht auch erforderlich ist, um die für den Nachweis benötigte Energie bereitzustellen. Würde sich nämlich die Photonenenergie auf viele Elektronen verteilen, so könnte das beim Photoeffekt nachgewiesene Elektron die Austrittsarbeit nicht aufbringen und auch nicht immer die gleiche Energie besitzen, wie es in den Experimenten ausnahmslos der Fall ist. G. Fussmann , Atomphysik SS 2002
78
Teilchen und Wellen Die Photonen und die Teilchen insgesamt besitzen also ein merkwürdiges Zwitterwesen: einmal erscheinen sie uns als Wellen, zum anderen als Teilchen. Diese Zweideutigkeit in der Erscheinungsmöglichkeit bezeichnet man als den Dualismus der Materie. Es hat nicht an Versuchen gefehlt, diesen Dualismus zu überwinden und zu einem eindeutigen Bild zurückzukommen. So plädiert beispielsweise R.Feynman in seinem interessanten Buch "The Strange Theory of Light and Matter" für das Teilchenbild. Allerdings muß er seine Teilchen mit der besonderen Fähigkeit ausstatten, ihre Umgebung auszukundschaften, um etwa festzustellen, ob zwei Spalte oder nur einer vorhanden ist. Mit diesem Teilchenkonzept haben daher viele Wissenschaftler noch mehr Probleme als mit dem Dualismus. Glücklicherweise ist der Dualismus ein echter, was besagen will, daß die Teilchen entweder als Welle oder als Teilchen auftreten und nicht etwa noch Zwischenformen annehmen können. Man spricht deshalb auch von Komplementarität: Wellen- und Teilchencharakter ergänzen sich zum Gesamtbild eines Teilchens; es läßt sich aber nie gleichzeitig in beiden Zuständen beobachten20. Grundsätzlich kann man davon ausgehen, daß bei allen Versuchen, in denen unvollständige Information vorliegt, der Wellencharakter mit den charakteristischen Interferenzerscheinungen zu beobachten ist, während M e s s u n g e n , die – w e n n a u c h n u r p r i n z i p i e l l – Information liefern können, den Wellencharakter zerstören und den Teilchencharakter hervortreten lassen. Diesen Punkt wollen wir im folgenden noch genauer beleuchten. 5.5.4
WELCHERWEG?-EXPERIMENTE
Konfrontiert mit den Doppelspaltexperimenten, blieben einige Wissenschaftler (u.a. A. Einstein) bei der Auffassung, daß das Teilchen in der Realität sich schon für einen Spalt entscheiden würde und die merkwürdigen Meßergebnisse nur ein Folge unzulänglicher Kenntnisse von weiteren Einflüssen ("verborgene Parameter") seien (man betrachte die Abb. 5-19). Solange nur Photonenexperimente vorlagen, konnte diese Streitfrage nicht entschieden werden, da es keine Möglichkeit gibt, ein Photon durch Streuung an einem anderem nachzuweisen21. Anders verhält es sich aber, wenn beispielsweise Elektronen am Doppelspalt gebeugt werden. In diesem Fall kann man, zumindest in einem Gedankenexperiment, die Position des Elektrons durch Streuung von Photonen herausfinden. Teilchenlokalisierung durch Laserstreuung am Doppelspalt S1
S2
hn Mikroskop z
y x
Elektron
Abb. 5-18: Zur Ortsmessung des Elektrons durch Laserstreuung
Dazu beleuchtet man die Umgebung am Ausgang eines Spaltes mit intensivem Laserlicht und betrachtet das Streulicht unter 90° (in y-Richtung), wie in der Abb. 5-18 skizziert. So kann man tatsächlich herausfinden, ob ein unmittelbar darauf am Auffangschirm nachgewiesenes Teilchen durch den ersten oder zweiten Spalt gegangen ist. Fragen wir uns zunächst, mit welcher Genauigkeit der Ort des Elektrons bestimmt werden kann. Benutzen wir ein Mikroskop oder ein sonstiges abbildendes Objektiv für diese Messung, so kommt es auf den Durchmesser D der Eingangslinse im Verhältnis zur Laserwellenlänge l an. Umgekehrt betrachtet, wird ein paralleles Lichtbündel durch das Objektiv zu einem verschmierten Fokus gebündelt, der aufgrund der Beugung den ersten dunklen Interferenzring unter dem Winkel q = arcsin(1,22 l/D) zur optischen Achse aufweist. Im Abstand der Brennweite f entsteht damit ein
20 Eine ähnliche Koplementarität begegnet uns auch beim quantenmechanischen Drehimpuls. Die Teilchen sind entweder in einem "Oben-Unten"- oder "Rechts-Links"-Zustand. Mischformen vom Typ "Rechts-Unten" oder "Links-Oben" kommen nicht vor. 21 Die Wirkungsquerschnitte für die Photon-Photon-Streuung werden von der Theorie in der Größenordnung 10-30 m2 angegeben. Der experimentelle Beweis, daß dieser Effekt existiert, steht aber noch aus.
G. Fussmann , Atomphysik SS 2002
79
Teilchen und Wellen Beugungsscheibchen vom Durchmesser d = 2 f tan q ª 2, 44 l
f . D
(5.53)
Dies ist auch die Genauigkeit, mit der wir den Ort bestimmen können, vorausgesetzt, die Eingangslinse des Mikroskops wird auch voll ausgeleuchtet. Damit dies der Fall ist, müssen die Photonen in einen entsprechenden Kegel mit einem Gesamtöffnungswinkel von 2a = D/f gestreut werden. Dies bedeutet aber, daß sie eine Impulsunschärfe in x-Richtung in der Größe Dpx/px = 2sina = D/f aufweisen müssen. Unter Beachtung von Gl. (5.53) schreibt sich dies als Dpx/px = 2,44 l/d. Setzen wir hierin noch px = h/l ein, so ergibt sich schließlich die von l unabhängige Beziehung Dpx = 2,44 h/d, die nichts anderes als die Orts-Impuls-Unschärfe-Relation in der Form Dx◊Dpx = 2,44 h ist (auf den genauen numerischen Faktor soll es hier nicht ankommen). Bei der Streuung wird dem Elektron Impuls übertragen. Würden die Photonen exakt unter 90° gestreut, so wüßten wir auch diesen Impulsübertrag genau und könnten die entsprechende Ablenkung des Elektrons angeben. Wegen der erforderlichen Unschärfe des Photonenimpulses ist jedoch auch in der Folge der Impulsübertrag auf das Elektron unscharf und damit seine Bahn weitgehend unbestimmt. Ja, die abgeleitete Unschärfe-Relation besagt uns, daß wir durch die Ortsmessung mit Hilfe des Lasers die gleiche Impulsunschärfe verursachen, wie sie das Teilchen bei Passage durch einen Einzelspalt der Breite d erfahren hätte. Das Interferenzmuster des Doppelspaltes verschwindet damit, und wir erhalten auf dem Auffangschirm die Intensitätsverteilung von zwei Spalten, wovon abwechselnd mal der eine, mal der andere zugehalten wird (Gl. (5.50) ohne den Klammerterm). Am diskutierten Beispiel haben wir gesehen, daß man im atomaren Bereich nicht davon ausgehen kann, durch eine Messung nur Auskunft über die gewünschte Größe zu erhalten, ohne weitere Veränderungen zu bewirken. Die Messung hat vielmehr in der Regel auch Auswirkungen auf andere Eigenschaften des Objekts. Im obigen Fall führte die Bestimmung, durch welchen Spalt das Elektron geht, dazu, das Interferenzmuster zu zerstören. Hierbei war der Impulsübertrag zwischen Photon und Elektron entscheidend für den Verlust der festen Phasenbeziehung (Kohärenz) zwischen den beiden Teilwellen. Neuere, noch nicht abgeschlossene Experimente mit angeregten Atomen erlauben, den Weg der Teilchen auch ohne Impulsübertrag zu bestimmen, indem diese ihre Anregungsenergie in dem einen oder anderen Hohlraum abgeben, die den beiden Spalten vorgelagert sind (B. G.-Englert et al., in "Quantenphilosophie"). Trotzdem zeigt sich auch hier die Zerstörung der Interferenz, sobald man weiß, welchen Weg das Atom nimmt. Es hat demnach den Anschein, daß – über die UnschärfeRelationen hinaus – der Information über den atomaren Zustand die wesentliche Bedeutung zukommt. Die unzulängliche Information über den Ort des Teilchens ist damit die eigentliche Voraussetzung für die Interferenzfähigkeit. Wir können das auch so ausdrücken: S o l a n g e man nicht weiß, welchen Weg ein Teilchen nimmt, verhält es sich als Welle, sobald diese Information gewonnen wurde, wird es zum Teilchen.
Abb. 5-19: Skiläufers.
G. Fussmann , Atomphysik SS 2002
Spur
eines
"nichtklassischen"
80
Teilchen und Wellen Photoneninterferometrie Zum Abschluß dieses Kapitels wollen wir das in Abb. 5-20 skizzierte Photonenexperiment betrachten. Es handelt sich hierbei um ein sogenanntes Mach-Zender-Interferometer, das eine rechteckige Anordnung von vier parallel zueinander ausgerichteten Reflektoren darstellt. Am Eingang und Ausgang befinden sich halbdurchlässige Spiegel, während in den beiden anderen Eckpunkten das Licht durch 100%ige Spiegel reflektiert wird. An den beiden Ausgangskanälen befinden sich Detektoren, mit denen die Photonen gezählt werden. Die Photonen können mit gleicher Wahrscheinlichkeit über den Weg 1 als auch über den Weg 2 zum Ausgangsspiegel gelangen. Halten wir ein Blatt Papier in den einen oder anderen Weg, so ist die Zählrate der beiden Detektoren gleich groß, da es ja gleichgültig ist, aus welcher Richtung die Photonen auf den halbdurchlässigen Ausgangsspiegel gelangen. In diesem Fall verhalten sich die Photonen wie klassische Teilchen. Lassen wir jedoch beide Wege zu, so kann die Intensität – je nach Dicke der halbdurchlässigen Spiegel – an dem einen Detektor zu null werden und alles Licht dem anderen zufallen. Hier müssen wir nun das Wellenbild heranziehen, um die Auslöschung im einen Kanal erklären zu können. Am qualitativen Ausgang des Experiments ändert sich auch nichts, wenn wir mit Hilfe des Abschwächers die Intensität so stark verringern, daß (im zeitlichen Mittel) zu einem Zeitpunkt sich höchstens ein Photon in der Anordnung befindet. Auch hier haben wir wieder das Problem, daß ein Photon sich einerseits nicht teilen kann, aber trotzdem beide Wege wahrnehmen muß, um zur Interferenz fähig zu sein. Abschwächer Weg 1 Laser Schalter
Abb. 5-20: Mach-Zender-Anordnung zur Untersuchung des Interferenzvermögens von Einzelphotonen.
Man hat versucht (mit kurzen Laserpulsen von 150 ps Dauer), das Photon zu überlisten, indem ein Detektor 1 schneller Schalter (Pockelszelle) im Weg 1 erst dann Weg 2 geöffnet wurde, wenn es bereits den ersten Strahlteiler hinter sich hatte. Bei diesen Experimenten mit verzögerter Detektor 2 E n t s c h e i d u n g sollte festgestellt werden, ob das Photon etwa beim Eintritt in die Apparatur bereits feststellt, ob es sich als Welle oder Teilchen zu verhalten hat. Das ist aber nicht der Fall: Wird der Schalter rechtzeitig geöffnet, so daß (im Teilchenbild) das Photon passieren kann, so kommt es auch zur Interferenz; wird er zu spät geöffnet, so daß dem Photon nur der Weg 2 offen bleibt, so sprechen beide Detektoren mit gleicher Wahrscheinlichkeit an. Derartige Verhaltensweisen – und der Dualismus insgesamt – sind mit einer anschaulichen Vorstellung nicht mehr zu begreifen. Der Formalismus der Quantenphysik gibt uns jedoch mathematische Methoden an die Hand, mit deren Hilfe wir bei korrekter Anwendung in jedem Fall zu einer richtigen Beschreibung der Experimente gelangen (ohne uns jedoch weitere Erklärungen zu liefern). Dabei brauchen wir uns um den Dualismus nicht mehr zu kümmern – der Formalismus entscheidet automatisch, ob es sich um ein Teilchen- oder Wellenphänomen handelt. Allerdings müssen die experimentellen Bedingungen genau beachtet werden. Insbesondere dürfen der Meßprozeß bzw . die experimentellen G egebenheiten, die eine Mes s ung im P rinzip ermöglichen, nicht außer acht gelas s en werden.
G. Fussmann , Atomphysik SS 2002
81
Die Schrödinger-Gleichung
6 6.1
DIE SCHRÖDINGER-GLEICHUNG Heuristische Herleitung der Wellengleichung
Im Kapitel 5 haben wir de-Brogliesche Materiewellen
y =y0 e
i ( p x x - Et ) h
(6.1)
kennengelernt, die geeignet sind, ein (nichtlokalisiertes) freies Teilchen zu beschreiben, welches sich in x-Richtung mit dem Impuls px bewegt. Differenzieren wir diesen Ausdruck nach x und multiplizieren mit h , so erhalten wir die Eigenwertgleichung h ∂y = pxy . i ∂x
(6.2)
Hierin können wir auf der linken Seite den Ausdruck h ∂ = px i ∂x
(6.3)
als einen Operator auffassen, der auf die rechts von ihm stehende Funktion y einwirkt und dabei die Funktion selbst, versehen mit dem numerischen Faktor p x, reproduziert. Die reelle Größe px wird als Eigenwert bezeichnet. Dieser Zusammenhang zwischen Operator und Eigenwert ist von fundamentaler Bedeutung für den formalen Aufbau der Quantenmechanik: Einer Meßgröße wird ein Operator zugeordnet; der aus der Eigenwertgleichung bestimmte Eigenwert ergibt den eigentlichen Meßwert. Also schematisch: Eigenwertgleichung : Operator fiy = Eigenwert ¥ y .
(6.4)
Den Operator px (man beachte die Fettschreibweise), der als Differentialoperator die x-Komponente des Impulses beschreibt, haben wir in Gl. (6.3) bereits angegeben. Wir können ihn sofort verallgemeinern für den Operator des Impulsvektors r h ∂ r ∂ r ∂ r h p = ( ex + ey + ez ) = — . ∂y ∂z i ∂x i
(6.5)
Ganz analog zum Vorhergehenden können wir uns aus Gl. (6.1) auch eine Eigenwertgleichung für die Energie verschaffen ih
∂ y = Ey . ∂t
(6.6)
Nun ist allerdings die Energie wiederum eine Funktion des Impulses E = p2/2m, so daß wir, wenn wir hierfür Gl. (6.5) einsetzen, die Gleichung ∂ p2 h2 2 ih y = Hy ; H = =— ∂t 2m 2m G. Fussmann , Atomphysik SS 2002
(6.7)
82
Die Schrödinger-Gleichung
erhalten. Hier haben wir mit H den Hamilton-Operator für ein freies Teilchen eingeführt (—2= D = Laplace-Operator). Allgemein ist H der Energieoperator. Soweit haben wir uns an der Lösung für ein freies Teilchen orientieren können. Die allgemeine Gleichung läßt sich hieraus heuristisch finden, wenn wir im Hamilton-Operator neben der kinetischen auch die potentielle Energie berücksichtigen. Diese ist in der Regel nur eine Funktion des Ortes V(x, y, z). Wir benötigen aber noch eine Übersetzungvorschrift, wie wir von V auf den entsprechende Operator V kommen. Diese Transformation erweist sich jedoch als sehr einfach. Zunächst ergibt sich beispielsweise für den Ortsoperator x, daß dieser identisch mit der Ortskoordinate x ist , ebenso y = y usw. Daher ist V mit der gewöhnlichen Funktion V(x,y,z) identisch. Von der Gleichung (6.6) kommen wir so unmittelbar zur zeitabhängigen SchrödingerGleichung ih
∂y = Hy ; ∂t
H=-
r h2 2 — + V( r ) , 2m
(6.8)
worin y eine komplexwertige Funktion des Ortes und der Zeit ist. Die Schrödinger-Gleichung ist eine lineare, partielle Differentialgleichung, die im Gegensatz zur gewöhnlichen Wellengleichung (5.12) nur die erste Ableitung nach der Zeit enthält. Abgesehen von der komplexen Wertigkeit der y-Funktion hat sie daher einige Ähnlichkeit mit der Diffusionsgleichung ( ∂n / ∂t = D — 2 n ) bzw. der Wärmeleitungsgleichung ( ∂T / ∂t = k — 2T ). Die Verallgemeinerung auf ein Mehrteilchenproblem macht in der Formulierung auch keine Probleme (wohl aber in der Lösung der Gleichung). Wellenfunktion und Hamilton-Operator hängen jetzt von allen N Ortsvektoren der Teilchen ab: N r r r r h2 2 y = y (r1 º rN ); H = Â — j + V(r1 º rN ) 2m j j =1
(6.9)
In vielen Fällen hat man es mit stationären Problemen zu tun, in denen die Energie konstant ist. Die Gleichung (6.8) vereinfacht sich dann zur zeitunabhängigen Schrödinger-Gleichung, die auch als Energie-Eigenwertgleichung aufgefaßt werden kann: Hy = Ey .
(6.10)
Gewöhnlich sind der Funktion y Randbedingungen auferlegt (z.B. y = 0 auf dem Rand oder für r> •), die nur mit einem diskreten Satz von Energiewerten E = En verträglich sind. Diese Bedingungen l i e f e r n s o m i t a u t o m a t i s c h d i e Q u a n t i s i e r u n g d e r E n e r g i e . Die diesen Werten entsprechenden Funktionen yn nennt man EnergieEigenfunktionen. Sie genügen der Gleichung Hy n = Eny n .
G. Fussmann , Atomphysik SS 2002
(6.11)
83
Die Schrödinger-Gleichung 6.2
Die mathematisch-begriffliche Basis der Quantenmechanik
6.2.1
DIE WELLENFUNKTION
Normierung Wie bereits erwähnt, hat die Wellenfunktion selbst keine physikalische Bedeutung, wohl aber ihr Betragsquadrat |y|2 = y y*, das als Wahrscheinlichkeitsdichte aufgefaßt werden kann. Die Wahrscheinlichkeit, ein Teilchen, das durch die Wellenfunktion y(x,y,z,t) repräsentiert wird, im Volumenelement dV = dx dy dz zu finden, ist damit |y|2dx dy dz. Die Wahrscheinlichkeit, das Teilchen irgendwo im gesamten Volumen zu finden, ist die Gewißheit, also 100%. Daraus leitet sich die Normierungsbedingung 2
Ú|y | dV = 1
(6.12)
ab, wobei die Integration über den gesamten Raum zu erstrecken ist. Falls kein Rand vorgegeben ist, auf dem y = 0 wird, muß gefordert werden, daß |y| hinreichend schnell im Unendlichen (z.B. -• < x < • ) verschwindet. Eigenfunktionen und Orthogonalität Die aus einer Eigenwertgleichung der Quantenmechanik hervorgehenden Eigenfunktionen besitzen die außerordentlich wichtige Eigenschaft der Orthogonalität. Betrachten wir z. B. die zwei Eigenfunktionen der eindimensionalen Energie-Eigenwertgleichung Hy n = Eny n und Hy m = Emy m
(6.13)
so gilt
Úy
* m
y n dx = d mn
(6.14)
mit der bekannten Eigenschaft des Kronecker-Symbols dmn = 0 für m π n und d nn = 1. Die der Gl. (6.14) genügenden Funktionen sind orthogonal (dmn = 0 ) und wegen d nn = 1 auch normiert (also orthonormal). Die Orthogonalität kennen wir vom skalaren Produkt von Basisvektoren, das ebenfalls Null ergibt für je zwei verschiedene Vektoren, da diese aufeinander senkrecht stehen. Diese Eigenschaft des Senkrechtstehens (Orthogonalität) kann somit auch auf Funktionen übertragen werden, wobei dem skalaren Produkt hier das Integral über das Produkt der Funktionen entspricht. Die Analogie zur Vektorrechnung kann noch weitergeführt werden indem, nach H. P. Dirac, den Wellenfunktionen y*und y sogenannte bra-Vektoren: y und ket-Vektoren: y zugeordnet werden. Das Integral in Gl. (6.14) schreibt man dann symbolisch als Skalarprodukt
y m y n = d mn . Im allgemeinen ist allerdings das Skalarprodukt i n v a r i a n t , und es gelten die Relationen
(6.15) y c nicht
y c = c y *; y cc = c y c ; cy c = c * y c
G. Fussmann , Atomphysik SS 2002
vertauschungs.
(6.16)
84
Die Schrödinger-Gleichung Die Eigenwerte können - z.B. die Energie bei freien Teilchen- auch ein kontinuierliches Spektrum bilden. In diesem Fall stehen infinitesimal benachbarte Vektoren bereits senkrecht aufeinander und das Kronecker-Symbol geht in eine Diracsche Deltafunktion über:
y k y k ¢ = d ( k - k ¢ ).
(6.17)
Vollständigkeit Ebenso wie man mit Hilfe von Einheitsvektoren einen beliebigen Vektor als Summe darstellen kann r 3 r a = Â an en ,
(6.18)
n=1
ist es möglich, eine beliebige Funktion nach Eigenfunktionen zu entwickeln. Ein bekanntes Beispiel hierfür ist die Fourier-Reihendarstellung mit sin(nx) oder cos(nx) als Eigenfunktionen. Die Eigenfunktionen können als Vektoren eines unendlichdimensionalen Funktionenraums (HilbertRaum) aufgefaßt werden. Demgemäß ist die Summation über einen unendlichen Satz von derartigen Eigenfunktionen un zu erstrecken: •
y ( x) = Â cn un ( x) .
(6.19)
n=1
Kann jede beliebige Funktion y in einer derartigen Weise dargestellt werden, so bezeichnet man den Funktionensatz un als v o l l s t ä n d i g . In der Dirac-Schreibweise können wir dies wie folgt darstellen: •
y = Â cn un .
(6.20)
n=1
r
r r
r
Ähnlich wie die an = a ◊ en Projektionen des Vektors a auf die Basisvektoren en sind, so sind die Koeffizienten cn entsprechende Projektionen cn = un y ,
(6.21)
wie man durch Multiplikation von (6.20) mit um von links unter Beachtung der Orthogonalität leicht bestätigt. Setzen wir dies in Gl. (6.20) ein, so erhalten wir •
y = Â un un y .
(6.22)
n=1
Es muß also gelten •
1 = Â un un .
(6.23)
n=1
Die Vollständigkeit der Eigenfunktionen erlaubt damit die Darstellung eines 1-Operators. Ausdrücke der Art un um werden als dyadische Produkte bezeichnet. Sie kommen auch in der gewöhnlichen Vektorrechnung vor und entfalten ihren eigentlichen Zweck erst nach Multiplikationen von links und rechts, was zu einem Produkt von zwei Skalarprodukten, d.h. G. Fussmann , Atomphysik SS 2002
85
Die Schrödinger-Gleichung einem Produkt von zwei komplexen Zahlen führt. Von der Zerlegung des Einheitsoperators nach Gl. (6.23) wird bei Umwandlungen von Ausdrücken häufig Gebrauch gemacht, indem entsprechende 1-Ausdrücke an passender Stelle eingeschoben werden. In normaler Schreibweise bedeutet die Vollständigkeitsrelation die Darstellung einer Delta-Funktion gemäß •
d ( x - x¢ ) = Ây n ( x)y n* ( x¢ ) .
(6.24)
n =1
Von dieser Darstellungsmöglichkeit der Delta-Funktion macht man häufig Gebrauch, wenn beispielsweise die Anfangsposition eines Teilchens festzulegen ist. 6.2.2
MITTELWERTE UND ERWARTUNGSWERTE
Wir betrachten einen manipulierten Würfel, der die Zahlen 1...6 mit den Wahrscheinlichkeiten P1 = 0,2; P2 = 0,1; P3 = 0,2; P 4 = 0,1; P 5 = 0,1; P 6 = 0,3 würfeln möge. Man beachte, daß diese Wahrscheinlichkeitsverteilung Pn die erforderliche Normierung aufweist 6
ÂP
= 1.
n
(6.25)
n= 1
Wir fragen nun nach dem Mittelwert der Zahlen, der sich bei einer großen Zahl von Würfen ergibt. Dieser berechnet sich aus 6
n = Â nPn
(6.26)
n=1
und führt im betrachteten Fall zu < n > = 3,7, während ein idealer Würfel mit P n = 1/6 einen Mittelwert von 3,5 liefert. Wir können diese Betrachtung verallgemeinern und den Mittelwert einer Größe A(n) entsprechend berechnen N
A = Â An Pn .
(6.27)
n=1
Im Falle der Wellenfunktion haben wir es nicht mit einer diskreten Wahrscheinlichkeit P n , sondern mit einer kontinuierlichen Wahrscheinlichkeitsdichte P(x) = |y|2 zu tun, die als Funktion des Ortes vorliegt bzw. berechnet werden kann. In Analogie zum Würfelproblem können wir den Schwerpunkt <x> der Verteilung ausrechnen •
•
2
x = Ú x y dx = Ú y * x y dx -•
-•
(6.28)
Dieser Mittelwert wird gleich dem Erwartungswert für eine Ortsmessung sein. Allgemein ist der Erwartungswert einer physikalischen Größe A, die in der Quantenmechanik durch einen Operator A repräsentiert wird, durch den Mittelwert entsprechend •
A = Ú y * Ay dx
(6.29)
-•
G. Fussmann , Atomphysik SS 2002
86
Die Schrödinger-Gleichung gegeben, wobei der Operator im Integranden auf die Funktion y einwirkt. Im Gegensatz zu Gl. (6.28) ist in diesem Fall auf die Reihenfolge im Integranden zu achten. Den Erwartungswert des Impulses erhalten wir demgemäß aus •
px
h ∂y = Úy * dx . i -• ∂x
(6.30)
In der Diracschen Notation ergibt sich die Bildung des Erwartungswertes (6.29) als Skalarprodukt der Vektoren A = y Ay .
(6.31)
Die Klammerschreibweise (bra-cket) ist daher der Mittelwertbildung besonders angemessen. Bei der Berechnung von Gl. (6.31) müssen wir vier Fälle unterscheiden: a) y ist die Eigenfunktion yn zum Operator A. Dies ist immer dann der Fall, wenn unmittelbar zuvor bereits die Observable A gemessen und diejenigen Teilchen mit dem Meßwert An von solchen mit einem anderen Meßwert separiert wurden. Der vorausgehende M e ß v o r g a n g u n d d i e S e p a r a t a t i o n h a t d a n n d i e T e i l c h e n p r ä p a r i e r t , so daß sie einheitlich durch die Wellenfunktion yn beschrieben werden können. In diesem Fall erhalten wir bei einer neuerlichen Messung A = y n Ay n = y n Any n = An y n y n = An .
(6.32)
Der E r w a r t u n g s w e r t i s t m i t d e m E i g e n w e r t i d e n t i s c h , er ist also scharf definiert, und bei beliebiger Wiederholung der Messung erhält man jeweils exakt den gleichen Meßwert An. b) In einem zweiten Fall führen wir eine Messung an einem präparierten Ensemble von Teilchen durch, wobei diesmal die M e ß g r ö ß e (B) n i c h t k o m p a t i b e l m i t d e r p r ä p a r i e r e n d e n M e s s u n g (A) ist (d.h. AB π BA). Wir erhalten dann eine Streuung der Meßwerte B, obwohl alle Teilchen des Ensembles im gleichen Zustand sind (eine bessere Auslese durch Messung von A also gar nicht möglich ist). Die sich ergebende s tatis tis che S chw ankung der Meßw erte is t in dies em F all eine inhärente quantenmechanische Eigenschaft der Teilchen. c) In einem dritten Fall lassen wir auf die zunächst separierten Teilchen, die durch den Zustand |y1 > repräsentiert werden, eine Störung einwirken. Dann werden nach einer gewissen Zeit auch Teilchen in anderen Zuständen |y2 >, y3 >,… zu finden sein, und wir haben den neuen Zustand |y> = c1 |y1 > + c2 |y2 > +…. Auch an diesem Ensemble können wir wiederum Messungen der Größe A oder B durchführen. In jedem Fall werden wir nun eine Streuung der Meßwerte beobachten. In den obigen Fällen sprechen wir von einer reinen Gesamtheit: Alle Teilchen der Gesamtheit (Ensemble) sind so gleich, wie sie unter gegebenen Voraussetzungen nur sein können. d) Die reine Gesamtheit ist zu unterscheiden von einer Teilchenmischung. Diese liegt immer dann vor, wenn unterschiedliche reine Gesamtheiten zusammengemischt werden. Eine solche Mischung kann z.B. auch dann vorliegen, wenn wir zwar eine Messung der Größe A vorgenommen haben, die Teilchen mit unterschiedlichen Meßwerten (A1, A 2, A3 …) aber nicht getrennt haben. Durch die vorausgehende Messung wissen wir in diesem Fall aber, daß der G. Fussmann , Atomphysik SS 2002
87
Die Schrödinger-Gleichung Bruchteil P n der Teilchen im Zustand |yn> ist und bei nochmaliger Messung der Größe A den Eigenwert An liefern wird. Der Erwartungswert der Messung wird sich also in diesem Mischfall wie bei der Würfelwahrscheinlichkeit zu A = Â Pn An
(6.33)
n
ergeben. Mischungen liegen u.a. bei Teilchengesamtheiten im thermodynamischen Gleichgewicht vor. Besonders bei höheren Temperaturen können dann gleichzeitig mehrere Energieeigenzustände besetzt sein, wobei die P n durch die Bose- oder Fermistatistik (je nachdem, ob der Spin der Teilchen ganz- oder halbzahlig ist) gegeben sind. Bei höheren Temperaturen verschwindet der Unterschied zwischen diesen beiden Verteilungen und mündet in die Boltzmannbesetzung P n ~exp(-En/kT) ein. Dichteoperator Zur Unterscheidung, ob man es mit einer reinen Gesamtheit oder einem Gemisch zu tun hat, dient der Dichteoperator (bzw. die Dichtematrix) r. Er läßt sich im ersten Fall sehr einfach als dyadisches Produkt schreiben. rrein = y y .
(6.34)
Die Matrixelemente dieses Operators ergeben sich in einer gewählten Basis durch Multiplikation von rechts und links rein rnm = yn y
y ym .
(6.35)
Im Falle eines Gemisches wird r als Summe von Dyaden mit den Wahrscheinkeitsamplituden P n dargestellt rGemisch = Â Pn y n y n .
(6.36)
n
Mit Hilfe des Dichteoperators bzw. der Dichtematrix kann man den Erwartungswert ganz allgemein, d.h. unabhängig von der gewählten Basis, als Spur (Summe der Diagonalelemente) der r A) berechnen: Produktmatrix (r A = Sp(r A) .
(6.37)
Den Zusammenhang mit Gl. (6.33) sehen wir sofort aus A = Sp(Â Pn y n y n A) = Â Pn y m y n y n A y m = Â Pn An . n
n,m
(6.38)
n
Der U n t e r s c h i e d z w i s c h e n e i n e r r e i n e n G e s a m t h e i t u n d e i n e m G e m i s c h i s t s e h r b e d e u t s a m . Nur bei reinen Gesamtheiten tritt eine Interferenz, wie im Zusammenhang mit dem Doppelspaltexperiment besprochen, in Erscheinung. Um diesen Unterschied deutlicher werden zu lassen, betrachten wir nochmals die Verhältnisse am Doppelspalt. G. Fussmann , Atomphysik SS 2002
88
Die Schrödinger-Gleichung Es seien |y1> bzw. |y2> die entsprechenden Eigenzustände (Teilchen geht durch Spalt 1 bzw. Spalt 2). Betrachten wir zunächst den Fall des Gemisches. Hier können wir beispielsweise zwei getrennte Teilchenquellen haben und durch eine vorgeschaltete Trennwand dafür sorgen, daß die Teilchen der ersten Quelle nur durch den ersten Spalt und die der zweiten nur durch den anderen Spalt fliegen können. Ist diese Wahrscheinlichkeit gleich groß, so schreibt sich der Dichteoperator rGemisch =
1 1 y1 y1 + y2 y2 2 2
.
(6.39)
Die entsprechende Dichtematrix ergibt sich nach Gl. (6.35) zu rGemisch =
1 Ê 1 0ˆ Á ˜. 2 Ë 0 1¯
(6.40)
Typischerweise sind hier nur die Diagonalelemente von Null verschieden. Im anderen Fall mit nur einer Teilchenquelle ohne Trennwand, kann jedes Teilchen mit gleicher Wahrscheinlichkeit durch den einen oder anderen Spalt gelangen, und wir haben daher für die normierte Gesamtwellenfunktion die allgemeine Darstellung
y =
1 ij 1 ( e y 1 + e ij 2 y 2 ) , 2
(6.41)
worin j1 und j2 beliebige Phasenwinkel darstellen. Der Dichteoperator lautet diesmal rrein = y y =
1 ( y 1 y 1 + e i (j 1 -j 2 ) y 1 y 2 + e - i (j 1 -j 2 ) y 2 y 1 + y 2 y 2 ) . (6.42) 2
Seine Matrix hat die Gestalt rein
r
1 1Ê = Á - i (j 1 - j 2 ) 2 Ëe
e i (j 1 - j 2 ) ˆ . 1 ˜¯
(6.43)
Die nicht veschwindenden Nicht-Diagonalelemente sind offensichtlich wesentlich für die Interferenz. Wir erkennen ferner anhand von Gl. (6.43), daß es bei der reinen Gesamtheit auf die definierte Phasenbeziehung zwischen den beiden Zuständen ankommt. Ist die Phasendifferenz für jedes Teilchen gleich, so kommt es zur Interferenz. Andererseits kann die Phasendifferenz sehr wohl noch vom Ort, von der Zeit oder anderen Parametern abhängen. Sind diese Phasendifferenzen hingegen für die Teilchen statistisch streuend, so verschwinden die Nicht-Diagonalelemente bei einer entsprechenden Mittelung über das Ensemble und wir erhalten die Dichtematrix eines Gemisches. Bilden wir noch in beiden Fällen die Quadratmatrix (rGemisch )2 =
1 Gemisch π rGemisch ; r 2
(rrein )2 = rrein ,
(6.44)
so sieht man, daß nur bei der reinen Gesamtheit das Quadrat des Operators mit dem Operator selbst identisch ist. Dies ist eine generelle Eigenschaft und läßt sich leicht anhand der Definitionen (6.34) und (6.39) beweisen. Andererseits kann die Relation (6.44) auch zur formalen Unterscheidung von reinen Gesamtheiten und Gemischen herangezogen werden. G. Fussmann , Atomphysik SS 2002
89
Die Schrödinger-Gleichung
6.2.3
OPERATOREN
Lineare und Hermitesche Operatoren Operatoren wirken auf eine Funktion ein und erzeugen eine neue Funktion nach bestimmten Regeln. Der Operator O = ( 1+ x - d/dx ) erzeugt beispielsweise aus der Funktion y = xn die Funktion O y = xn + xn+1 - n x n. Er ist ein linearer Operator, da O(y1+y2) = O y1 + O y2. In der Quantenmechanik sind insbesondere die Hermiteschen Operatoren von Bedeutung, da diese r e e l l e E i g e n w e r t e produzieren und damit Meßgrößen (Observable) repräsentieren können. Zunächst führen wir den Begriff des adjungierten Operators ein. Def.: Der zum Operator L adjungierte Operator L† genügt der Gleichung22:
c Ly = cL≤ y
(6.45)
Ein hermitescher Operator H ist selbstadjungiert, d.h. es gilt: H = H≤ .
(6.46)
Man darf also diese Operatoren beliebig nach links oder rechts wirken lassen. Bilden wir speziell den Erwartungswert von zur Eigenfunktion yn, so erhalten wir zunächst H = y n Hy n = H n
(6.47)
und aufgrund obiger Eigenschaft und mit Gl. (6.16) H = y nH y n = H n* .
(6.48)
Der Erwartungswert ist somit in der Tat reell. r r Neben dem Ortsoperator r und dem Impulsoperator p sind die aus beiden zusammengesetzten Drehimpuls- und Hamilton (Energie)- Operatoren die wichtigsten. Wir stellen sie unten mit ihren klassischen Pendants zusammen dar.
22 Es sind verschiedene Schreibweisen üblich. Wir verwenden L |y > = | L y >. Der adjungierte Operator L† wirkt in jedem
Fall nach links auf den Bra-Vektor
90
Die Schrödinger-Gleichung
Observable
klassisch Q. - Operator
Ort
r r
r r
Impuls
r p
h — i
Kin.Energie
p2 2m
-h2 D 2m
Drehimpuls
r r r¥p
hr r¥— i
.
(6.49)
Vertauschbarkeit der Operatoren Im Gegensatz zu normalen Zahlen sind Operatoren in der Regel nicht vertauschbar, sondern es kommt auf die Reihenfolge ihrer Anwendung an. Dies wird sofort klar, wenn wir den Orts- und den Impulsoperator betrachten: Es ist ja x
∂y ∂( xy ) ∂y π =y + x . ∂x ∂x ∂x
(6.50)
Diese Eigenschaft der Operatoren ist andererseits gerade vonnöten, um die Unverträglichkeit von Orts- und Impulsmessung zum Ausdruck zu bringen, die in der Unschärferelation zutage tritt. Über die Verträglichkeit (Kompatibilität) bzw. Unverträglichkeit von zwei durch die Operatoren L und M repräsentierten Observablen entscheidet der Kommutator [L, M] := LM - ML ,
(6.51)
der selbst wieder ein Operator ist. Wir erhalten beispielsweise für den Kommutator aus Orts- und Impulsoperator [p x , x ] =
h 1 i
(6.52)
mit 1 als Einheitsoperator. Die a l l g e m e i n e F o r m d e r U n s c h ä r f e r e l a t i o n läßt sich unter Verwendung des Kommutators wie folgt angeben
G. Fussmann , Atomphysik SS 2002
91
Die Schrödinger-Gleichung
DL DM ≥
1 [L, M] . 2i
(6.53)
N ur s olche Obs ervablen können gleichzeitig an einem S ys tem g e m e s s e n w e r d e n , d e r e n K o m m u t a t o r v e r s c h w i n d e t . Die Gesamtheit derartiger Observablen ergibt einen vollständigen Satz der beobachtbaren Größen des Systems. Eine Messung eines vollständigen Satzes liefert die maximal mögliche Information über das System. Verglichen mit der klassischen Physik, wo bei einem N-Teilchensystem 6N Variable für Orte und Impulse gemessen werden können, kann in der Quantenmechanik nur die Hälfte dieser Variablen (Orte oder Impulse) bestimmt werden. Daher kann die Quantenmechanik insgesamt auch nicht die Genauigkeit der Vorhersage der klassischen Mechanik erreichen. 6.3
Der harmonische Oszillator
Eine der einfachsten und zugleich in der Praxis bedeutsame Anwendungen ist die quantenmechanische Lösung des harmonischen Oszillators. Klassisch stellt er die Schwingung einer zwischen zwei Federn gespannten Masse dar. Wir behandeln ihn im folgenden in der konventionellen Weise über die Lösung der Schrödinger-Gleichung. Der Hamilton-Operator setzt sich aus der schon bekannten kinetischen Energie und der proportional zum Quadrat der Auslenkung (x) anwachsenden potentiellen Energie (Kraft = D x) zusammen: H=
p2 D 2 p2 mw 2 2 + x = + x . 2m 2 2m 2
(6.54)
In der potentiellen Energie haben wir die Federkonstante D durch die beobachtbare Eigenfrequenz w= (D/m)1/2 ersetzt. Die zeitunabhängige Schrödinger-Gleichung lautet dann - h 2 d 2y mw 2 2 + x y = Ey . 2m dx 2 2
(6.55)
Zweckmäßigerweise führt man folgende Transformationen durch x0 =
h 2E x ; x= ; l= . hw mw x0
(6.56)
Wir haben dann (mit y´ = dy/dx) die Differentialgleichung
y ¢¢ + (l - x 2 )y = 0 .
(6.57)
Diese hat nur für bestimmte Werte von l Lösungen, die für x -> ±• verschwinden. Daß dies keine Selbstverständlichkeit ist, zeigt die Abb. 6-1, die numerische Rechnungen zu den Eigenwerten l = 0,99; 1.00 und 1,01 wiedergibt.
G. Fussmann , Atomphysik SS 2002
92
Die Schrödinger-Gleichung Abb. 6-1: Asymptotisches Verhalten der Lösungen für verschiedene Eigenwerte l. l = 0.99
In allen drei Fällen wurde die Rechnung an der Stelle x= 0 mit den Anfangsbedingungen y(0) = 1 und y'(0) = 0 gestartet. Nur für den Eigenwert l = 1 entschwindet y mit wachsendem x nicht nach +• oder -•. Die allgemeine Lösung von (6.57) ergibt sich aus einem Produktansatz
l=1 x
l = 1.01
y (x ) = y • (x ) H (x ) ,
(6.58)
wobei y• die Lösung für x -> • darstellt, die der DGL. y • '' - x2 y• = 0 und der Normierbarkeitsbedingung y• -> 0 für x-> • genügt. Hierfür findet man
y • (x ) = C e - x
2
/2
(6.59)
mit C als freiem Normierungsfaktor. Für H(x) macht man einen Polynom-Ansatz N
H (x ) = Â an x
n
(6.60)
n =0
und erhält eine Rekursionsformel für die Koeffizienten an + 2 2n + 1 - l . = an (n + 1)(n + 2)
(6.61)
Für n -> • hat man an+2/an = 2/n. Eine Potenzreihe mit solch langsam fallenden Koeffizienten würde keine Konvergenz für x-> • erzwingen, da sie die Funktion exp(x2) approximiert. Wir müssen daher fordern, daß die Reihe bei endlichem, ganzzahligem n abbricht. Dies wird erreicht durch die Forderung
l = 2n + 1
(6.62)
mit n = 0, 1, 2, 3,…Die normierten Lösungen ergeben sich damit zu
y n (x ) =
e
-
x2 2
2 n n! p
2
n x2
H n (x ); H n (x ) = ( -1) e
d ne -x , dx n
(6.63)
wobei die H n die Hermiteschen Polynome darstellen. In Gl. (6.63) haben wir die sogenannte Rodrigues-Darstellung für diese Polynome angegeben, die H n durch n-fache Differentiation erzeugt. Diese Art der Darstellung ist bei vielen Problemen (Integrationen) besonders vorteilhaft. Die ersten drei Hermiteschen Polynome lauten explizit: H0(x) = 1, H1(x) = 2x, H2(x) = 4 x 2 - 2. Wichtig ist insbesondere die Diskretheit der Eigenwerte l, die nach Einsetzen in die Definitionsgleichung für l die Energie-Eigenwerte liefern: G. Fussmann , Atomphysik SS 2002
93
Die Schrödinger-Gleichung 1 En = hw (n + ) . 2
(6.64)
Für n = 0 ergibt sich die kleinstmögliche Energie E0 = h w/2, die Nullpunktsenergie, die ein typisches quantenmechanisches Resultat darstellt. Anders als in der klassischen Mechanik (wo E0 = 0 ) kann also nach der Quantenmechanik ein Teilchen im Potentialtopf 23 nie in Ruhe sein. Die Ergebnisse für die niedrigsten drei Eigenfunktionen und Eigenwerte sowie der Verlauf der Potentialfunktion sind in Abb. 6-2 und Abb. 6-3 veranschaulicht. Die Eigenfunktionen zerfallen in zwei Klassen: Für ungerade n sind die Funktionen auch ungerade y2k+1(-x) = - y 2k+1(x), während sich für gerades n auch gerade Funktionen ergeben y2k(-x) = y 2k(x). Man nennt diese Symmetrieeigenschaft (gerade bzw. ungerade) die Parität der Wellenfunktion. Die Parität ist im Rahmen der Quantenmechanik eine äußerst wichtige Eigenschaft; sie wird uns später noch häufig begegnen. Man beachte ferner, daß die Funktionen zur Quantenzahl n genau n Nullstellen (Knoten) besitzen. Dies ist ebenfalls eine generelle Eigenschaft der Eigenfunktionen und ist eine notwendige Bedingung, um die Orthogonalität zu erfüllen. Die Energieeigenwerte En (gestrichelt) und die Potentialfunktion V(x) = x2/2 sind ebenfalls dargestellt. In den Schnittpunkten von En und V ist Ekin = 0. Hier liegen die klassischen Umkehrpunkte. Die Funktionen yn haben an diesen Stellen Wendepunkte. V(x)
V (x) E6
E5 E4
E3 E2
E1 E0 x
Abb. 6-2: Gerade Wellenfunktionen yn für den harmonischen Oszillator.
x
Abb. 6-3: Die ungerade Wellenfunktionen
Interessant ist auch der Vergleich der quantenmechanischen Aufenthaltswahrscheinlichkeit y y* dx mit der klassischen. Ist T die Periodendauer der Schwingung, so hat man für die klassische Aufenthaltswahrscheinlichkeit P( x) dx =
dt w dx = . T 2p v
(6.65)
Setzen wir hier x(t) = xn sin(w t) für die klassische Schwingung im Eigenzustand n, so erhalten wir: v = dx /dt = xn w cos(w t) = xnw [1-(x/xn)2]1/2. Die Amplitude xn ist gleich dem klassischen Umkehrpunkt und bestimmt sich aus En = V(xn ) zu xn = [(2n+1) h / wm] 1/2. Einsetzen in (3.60) und Transformieren auf die dimensionslose Koordinate x bzw. xn = x/xn liefert
23 Diese Aussage gilt nicht nur für den hier betrachteten parabolischen, sondern für jeden beliebigen Potentialtopf.
G. Fussmann , Atomphysik SS 2002
94
Die Schrödinger-Gleichung
Pn (x ) dx =
1 dx ; xn = 2 n + 1 . 2 p 1 - (x / xn )2
(6.66)
P(x) 10
2
| y ( x)|
0
10
|Y(x)|
2
P0(x) x
Abb. 6-4 : Aufenthaltswahrscheinlichkeit für den quantenmechanischen Oszillator (|y0|2) im Grundzustand und sein klassisches Pendant (Po(x)).
x
Abb. 6-5: Wie Abb. 6-4 für den Zustand n = 10.
Der Vergleich zwischen Pn(x) und |y|2 ist in den Abbildungen für die Fälle n = 0 und n = 10 wiedergegeben. Für n = 0 ist die Diskrepanz offensichtlich: Quantenmechanisch hält sich das Teilchen bevorzugt im Zentrum bei x = 0 auf, während es klassisch die meiste Zeit in der Nähe der Umkehrpunkte x = 1 verweilt. Für n = 10 dagegen ist der Unterschied nicht mehr so eklatant, da sich jetzt auch quantenmechanisch (im Sinne des Korrespondenzprinzips) die Aufenthaltswahrscheinlichkeit auf den Rand hin konzentriert. Der harmonische Oszillator spielt in der Anwendung eine wichtige Rolle bei der approximativen Beschreibung von zweiatomigen Molekülen. Der äquidistante Abstand h/w zweier benachbarter Terme in einem solchen Molekül entspricht der Energie eines Schwingungsquants. Diese gleichen Abstände sind direkt in den Absorptions- oder Emissionsspektren als Schwingungsbanden beobachtbar. Historisch kam dem harmonischen Oszillator bei der Interpretation der Schwarzkörperstrahlung durch Max Planck eine große Bedeutung zu. Seine quantenmechanische Beschreibung gibt einen ersten Einblick in die Quantisierung des elektromagnetischen Feldes.
6.4
Der Tunneleffekt
Beim harmonischen Oszillator konnten wir feststellen, daß sich die Teilchen in Gebieten aufhalten können, die nach der klassischen Theorie unerreichbar sind. Es waren dies die Zonen außerhalb des Schnittpunkts der Kurven En = const. und V(x). Sie entsprechen klassisch einem Bereich, wo die kinetische Energie negativ wird, was natürlich nicht möglich sein sollte. Q u a n t e n m e c h a n i s c h löst sich dieses Paradoxon, indem hier die E n e r g i e n i c h t i n p o t e n t i e l l e u n d k i n e t i s c h e a u f g e t e i l t w e r d e n d a r f . Eine Verletzung von Ekin < 0 ist damit im Rahmen der Unschärferelation zulässig. Noch deutlicher als beim harmonischen Oszillator tritt der Effekt zutage, wenn man die Reflexion von Teilchen an einem Potentialwall untersucht. Ein besonders einfacher Fall mit einem rechteckigen Wall der Höhe U und der Breite a ist in der nachfolgenden Skizze ( Abb. 6-6) dargestellt.
G. Fussmann , Atomphysik SS 2002
95
Die Schrödinger-Gleichung
U
Abb. 6-6:Reflexion klassischer Teilchen an einem Potentialwall.
r echt ec kiger Potent ialwall
E x
a
k lassi sc he Ref lex ion
Freie Teilchen, die außerhalb des Walls die kinetischen Energie E < U besitzen, haben klassisch betrachtet keine Möglichkeit diesen Wall zu durchdringen, sondern werden vollständig reflektiert. Quantenmechanisch löst man die zeitunabhängige Schrödinger-Gleichung mit dem Ansatz für die drei Gebiete (s.Abb. 6-7):
x
Ï A eikx + Be -ikx Ô y ( x) = ÌC e -kx + D e +kx Ô A¢ eikx Ó ∑ ∑ ∑
; x<0 ; 0£ x£ a ; x> a
(6.67)
Vor dem Wall (x < 0) gibt es die einlaufende (nach rechts) und eine nach links laufende, reflektierte Welle mit der Wellenzahl k= (2mE)1/2/ h . Im Wall: (0 £ x £ a) werden die eindringende und die am Wallende reflektierte Welle gedämpft: die Wellenzahl wird imginär k'/i = k = [2m(U-E)]1/2/ h . Hinter dem Wall (x > a) gibt es nur eine auslaufende Welle mit gleicher Wellenzahl wie im Gebiet I aber verringerter Amplitude. ReHyL 1
0.5
-10
-5
5
10
x
Abb. 6-7: Tunneleffekt für den rechteckigen Potentialwall (grauer Hintergrund). Im Gebiet des Potentialwalls ist die kinetische Energie des Teilchens negativ. Dieses Gebiet ist somit für ein klassisches Teilchen unerreichbar. Dargestellt ist der Fall: A = 1, k = 3,k = 0.5 und a = 2.
-0.5
Die Stetigkeitsbedingungen für y und y' an den Stellen x = 0 und x = a liefern vier Gleichungen, -1 die es gestatten, die vier Konstanten B, C, D und A' als Funktionen von k, k, a und A zu bestimmen. Insbesondere ergibt sich aus dem Verhältnis der Amplitudenquadrate vor und hinter dem Potentialwall die Transmissions- oder Tunnelwahrscheinlichkeit T. Das Ergebnis lautet 2
A¢ 1 - E /U T= . 2 = (1 - E / U ) + (U / 4E)sinh 2 ( ak ) A
(6.68)
Für die Reflexionswahrscheinlichkeit der einlaufenden Welle an der Stelle x = 0 ergibt sich erwartungsgemäß R = 1 - T. Falls starke Dämpfung auftritt (a k >> 1), hat man die Näherung
G. Fussmann , Atomphysik SS 2002
96
Die Schrödinger-Gleichung E(U - E) - 2 a T ª 16 e U2
2 m (U - E ) h
.
(6.69)
Zu beachten ist, daß das quantenmechanische Resultat vom klassischen auch dann verschieden ist, wenn E > U. In diesem Fall ist die klassische Transmission 1, da das Teilchen ausreichend Energie besitzt, um den Wall zu überwinden. Die Lösung der Schrödinger-Gleichung liefert jedoch anstelle von Gl. (6.68) T=
E /U - 1
(6.70)
(E /U - 1) + (U / 4E)sin 2 ( ak ©)
mit k' = [2m(E-U)]1/2/ h . Wegen k' = 2p/lBroglie taucht hier die de-Broglie-Wellenlänge für ein Teilchen mit der Überschußenergie E-U im Wall auf. Ist nun a, die Breite des Walls, ein halbzahliges Vielfaches von dieser Wellenlänge, so verschwindet der sin2(a k')-Term im Nenner von (2.14) und die Transmission erreicht den Maximalwert T = 1 (s. Abb. 6-8). Wir können die beiden Ergebnisse (6.69) und (6.70) in der Beziehung T(x, y) =
1 sinh y 1 - x 2
1+
[
]
; x = E /U; y = a
(2Um) h
(6.71)
4 x(1 - x)
zusammenfassen, wenn wir sinh(i x) = i sin(x) beachten. Die Abb. 6-8, in der sowohl die Fälle E/U < 1 (Tklass = 0) als auch E/U > 1 (Tklass = 1) vorkommen, wurde mit Hilfe dieser Funktion berechnet. Bei der Schwellenergie E = U ergibt sich T(y, 1) = 1/(1 + y2ª/4) < 1. T 1
Abb. 6-8: Tunnelwahrscheinlichkeit als Funktion des Energieverhältnisses E/U für den Fall y = a (2mU)1/2/ h = p. T = 1 wird dann erreicht für (E/U-1)1/2 = n -> E/U = 2, 5, 10…
0.8 0.6 0.4 0.2 1
2
3
4
5 E/U
Die Relation (6.71) gibt darüber hinaus auch die Transmissionswahrscheinlichkeit an, wenn es sich nicht um einen Potentialwall, sondern um eine Potentialmulde mit U < 0 handelt. Man spricht in diesem Fall auch von einem rechteckigen Potentialtopf der Tiefe U. Auch in diesem Fall kann das Teilchen i.a. die Mulde nicht mit 100%-iger Wahrscheinlichkeit überwinden, da es zur Reflexion kommen kann. Vollständige Transmission T = 1 ergibt sich in diesem Fall, falls a (2m E + |U|)1/2/ h = p n wird (d.h. E/|U| = |xn| = (n p/ |y|)2 - 1) mit ganzzahligem n und n > |y|/p. Letzteres bedeutet wiederum nichts anderes, als daß die Breite des Topfes ein halbzahliges Vielfaches der deBroglie-Wellenlänge im Topf lBroglie = h/(2mE + |U|)1/2 beträgt.
G. Fussmann , Atomphysik SS 2002
97
Die Schrödinger-Gleichung
T 1
Abb. 6-9: Transmissionswahrscheinlichkeit für einen Potentialtopf mit y = a (2mU)1/2/ h = 50 i.
0.8 0.6 0.4 0.2 0.5
1
1.5
2
EêH-UL
Ein Beispiel für einen relativ breiten Topf ist in der Abb. 6-9 dargestellt. Die hohe Transmission für bestimmte Teilchen-energien ist das ein-dimensionale Pendant für die Abnahme der Streuamplitude bei der Durchquerung eines dreidimensionalen Potentialtopfes. Damit haben wir in qualitativer Näherung eine quantenmecha-nische Deutung für den Ramsauereffekt erhalten. Der Tunneleffekt ist an vielen Stellen in Physik und Technik von Bedeutung. Einige Beispiele seien genannt: ∑ a - T e i l c h e n z e r f a l l : Die im Potentialtopf des Atomkerns eingeschlossenen Teilchen können doch schließlich dem Atomkern entkommen (Abb. 6-10). E E3 E2
zr E1
Abb. 6-10: Radioaktiver a-Zerfall. Das Kernpotential wird durch einen Potentialtopf endlicher Tiefe repräsentiert. Im äußeren Bereich überlagert sich das abstoßende CoulombPotential. Das aTeilchen ist im Energiezustand E3 angenommen (untere Niveaus sind besetzt), aus dem es mit kleiner Wahrscheinlichkeit nach Durchtunnelung des Potentialwalls entweichen kann.
∑ I n v e r s i o n s - S c h w i n g u n g e n des N-Atoms im NH3-Molekül. Das Molekül hat die Form eines Tetraeders, wobei die drei H-Atome eine Dreiecksebene aufspannen und das NAtom auf der einen oder anderen Seite dieser Ebene den vierten Eckpunkt belegt. Das N-Atom "tunnelt" durch die Ebene der H-Atome und pendelt so zwischen den beiden Konfigurationen hin und her. ∑ K a l t e E m i s s i o n v o n E l e k t r o n e n aus elektrisch aufgeladenen Metallen. Verwandt hiermit ist die F e l d - I o n i s a t i o n von Atomen und Molekülen. Wie in der Abb. 6-10 illustriert, erniedrigt ein in z-Richtung konstantes, elektrisches Feld das Coulombpotential des Atoms, so daß das resultiernde Potential ein Maximum aufweist.
G. Fussmann , Atomphysik SS 2002
98
Die Schrödinger-Gleichung
E z f E = - Ez z Autoionisation
fCoul
Abb. 6-11: Zur Feldionisation der Atome durch den Tunneleffekt. Alle atomaren Energiezustände oberhalb dieses Maximums sind damit nicht mehr existent. Niveaus dicht beim Maximum können durch den Tunneleffekt entleert werden. Es entsteht so ein freies Elektron und ein Ion (daher Feldionisation).
∑ E l e k t r i s c h e r K o n t a k t bei oxidierten Metalloberflächen. Hier ermöglicht der Tunneleffekt die elektrische Verbindung zwischen zwei Metallen, wenn der isolierende Zwischenraum hinreichend dünn ist (einige Å). ∑ Erhöhung der K e r n f u s i o n s p r o z e s s e . Auch die Umkehrung des a-Zerfalls ist in der Natur von Bedeutung. Ebenso wie durch den Tunneleffekt die Teilchen dem Potential–topf der Atomkerne entkommen können, gelangen sie auch von außen in diesen hinein, selbst wenn sie nach klassischer Physik hierzu nicht die ausreichende Energie besitzen. Der Tunneleffekt erhöht somit die Wahrscheinlichkeit für die Verschmelzung der Atomkerne . Bei den in der Sonne ablaufenden Verschmelzungsprozessen (4H Æ He) ist dieser Effekt von essentieller Bedeutung – ohne ihn würde die Sonne keine Energie liefern!
G. Fussmann , Atomphysik SS 2002
99
Das Wasserstoffatom
7 7.1
DAS WASSERSTOFFATOM Die Schrödinger-Gleichung für das Zentralfeld
Im folgenden wollen wir die Schrödinger-Gleichung für das Wasserstoffatom behandeln. Dies ist ein schwieriges dreidimensionales Problem, das jedoch dank der Symmetrie der potentiellen EnergieV(r) = - (e2 Z) /(4pe0r) noch allgemein analytisch gelöst werden kann. Es erweist sich in solchen Fällen als zweckmäßig, zu einem der Symmetrie angepaßten Koordinatensystem überzugehen, d.h. hier zu Kugelkoordinaten: r, q, j. Wir wollen zunächst das Potential nicht genauer spezifizieren, sondern nur seine Kugelsymmetrie voraussetzen. Wie immer in den quantenmechanischen Rechnungen gilt es zunächst, den Hamilton-Operator anzugeben. Dieser lautet, wie bekannt, h2 H=D + V (r ). 2me
(7.1)
Den Laplace-Operator D können wir direkt in Kugelkoordinaten angeben D=
1 ∂ Ê 2 ∂ˆ 1 ∂ Ê ∂ˆ 1 ∂2 + + , r sin q Á ˜ Á ˜ ∂q ¯ r 2 sin 2 q ∂j 2 r 2 ∂r Ë ∂r ¯ r 2 sin q ∂q Ë
(7.2)
so daß die zeitunabhängige Schrödinger-Gleichung die folgende Form annimmt: Ï1 ∂ Ê 2 ∂ˆ 1 ∂ Ê ∂ˆ 1 ∂2 ¸ 2m sin + + r q y + 2 e (E - V )y = 0 . Á ˜ Á ˜ Ì 2 Ë 2 2 2 2˝ ∂r ¯ r sin q ∂q Ë ∂q ¯ r sin q ∂j ˛ h Ó r ∂r
(7.3)
Für die Wellenfunktion y machen wir nun einen Separationsansatz
y (r , q , j ) = R(r ) Y(q , j ) .
(7.4)
Gehen wir mit diesem Ansatz in die Gleichung (7.3) und dividieren durch RY/r2, so ergibt sich 1 ∂ Ê 2 ∂R ˆ 2me r 2 1È 1 ∂ Ê ∂Y ˆ 1 ∂ 2Y ˘ ( ) sin = + . E V q Ár ˜+ Á ˜ h2 ∂q ¯ sin 2 q ∂j 2 ˙˚ R ∂r Ë ∂r ¯ Y ÍÎ sin q ∂q Ë
(7.5)
Hier ist die linke Seite nur eine Funktion von r, die rechte dagegen eine von q und j. Daher müssen beide Seiten gleich einer Konstanten sein, die man aus später ersichtlichen Gründen l (l+1) setzt. Die rechte Seite von (7.5) können wir ohne Kenntnis des Potentials weiter behandeln. Wir wiederholen den vorausgegangenen Trick der Variablentrennung nochmals und setzen nun Y als Produktfunktion der Variablen q und j an: Y(q, j) = Q (q) F(j). Dies führt auf die Gleichung È 1 ˘ 1 ∂2F ∂ Ê ∂Q ˆ sin 2 q Í . Á sin q ˜ + l(l + 1)˙ = ∂q ¯ F ∂j 2 Î Q sin q ∂q Ë ˚
(7.6)
Wiederum sind linke und rechte Seite Funktionen unterschiedlicher Variablen, die nur gleich sein können, wenn sie eine Konstante sind. Diese zweite Separationskonstante setzen wir gleich m 2. G. Fussmann , Atomphysik SS 2002
100
Das Wasserstoffatom Auf diese Weise haben wir die ursprüngliche Gleichung mit drei Variablen in drei Gleichungen mit je einer Variablen zerlegt. Diese lauten ∂2F + m2F = 0 2 ∂f
(7.7)
1 ∂ Ê ∂Q ˆ È m2 ˘ Q=0 Á sin q ˜ + Íl(l + 1) ∂q ¯ Î sin q ∂q Ë sin 2 q ˙˚ ∂ Ê 2 ∂R ˆ 2me r 2 È l(l + 1)h 2 ˘ E V ( r ) R = 0. Ár ˜+ ∂r Ë ∂r ¯ h 2 ÍÎ 2me r 2 ˙˚
(7.8) (7.9)
Die beiden ersten Gleichungen sind Gleichungen für die Winkelvariablen q (Polarwinkel) und j (Azimut). Da Q (q) und F(j) eindeutige Funktionen auf der Kugel sein müssen, können sie nur periodische Funktionen sein. Dies führt - wie bei ähnlichen klassischen Problemen auf der Kugel zu einer Quantisierung. Das sieht man wie folgt: Im Falle der Gleichung (7.7) sind sin(mq) und cos(mq) die beiden Lösungen der Differentialgleichung. Damit sie die Periodizitätsbedingung erfüllen, muß m ganzahlig sein,. d.h. die in Gl. (7.7) auftauchende Konstante muß entweder null oder das Quadrat einer ganzen Zahl sein (daher c1 = m2). Ebenso hat die Gl. (7.8) – auch bereits für m = 0 – nur eindeutige Lösungen als Funktion von q auf der Kugel, wenn die hierin auftretende Konstante das Produkt zweier aufeinander folgender ganzer Zahlen ist (daher c2 = l (l+1)). Anstelle von sin(mq) und cos(mq) bevorzugen wir für F eine komplexe Darstellung in der Form F(j ) = e imj ;
m = 0, ±1, ±2, ±3º
(7.10)
Die zweite Gleichung (7.8) hat bereits eine viel kompliziertere Lösung. Für m = 0 ergeben sich gewöhnliche Legendre-Polynome Pl (cos q), die auch als Kugelfunktionen bezeichnet werden und allgemein bei azimutalsymmetrischen Problemen auf der Kugel eine herausragende Rolle spielen. Als Argument des Polynoms taucht der Kosinus des Winkels auf. Für m π 0 nennt man die verallgemeinerten Lösungsfunktionen Plm(cosq), die assoziierten Legendre-Polynome. Wie die gewöhnlichen Legendre-Polynome lassen sich auch diese wieder durch eine Rodrigues-Formel herleiten: m 1 dl 2 2 m/ 2 d Pl ( m ) l m Pl ( m ) = l ( m - 1) ; Pl ( m ) = (1 - m ) 2 l! dm l dm m
(7.11)
wobei in den Anwendungen i.a. die Substitution m = cosq gemeint ist. Die gewöhnlichen LegendrePolynome Pl sind dann mit den Pl0 identisch. Für axialsymmetrische Probleme (∂/∂j = 0) benötigt man nur die gewöhnlichen Legendre-Polynome24. Sie genügen der Orthonormierungsbedingung auf der Kugelobelfläche
Ú
p
0
+1
Pn (cosq ) Pm (cosq )sin q dq = Ú Pn ( m ) Pm ( m ) dm = -1
2 d nm . 2n + 1
(7.12)
Der nachfolgenden Zusammenstellung entnimmt man die niedrigsten Polynome von Pnl. 24 Wir erinnern daran, daß diese insbesondere in der Potentialtheorie für dieDarstellung von
r r -1 |r - r © | = 1/
l
Êr ˆ r + r © -2rr ©cos q = Â Á < ˜ Pl (cos q ) Verwendung finden (mit r< = Min(r,r'); r> = Max(r,r')). r> l = 0 Ë r> ¯ 2
2
G. Fussmann , Atomphysik SS 2002
1
•
101
Das Wasserstoffatom P0 = 1 1
P1 = m
2 1/ 2
P1 = (1 - m ) 2
1
P2 = ( 3 m - 1)/ 2
2 1/ 2
2
P2 = 3 m (1 - m )
3
1
P3 = ( 5 m - 3 m )/ 2
2
P2 = 3(1 - m ) 2 1/ 2
2
P3 = 3 / 2( 5 m - 1)(1 - m )
2
2
P3 = 15 m (1 - m )
3
2 3/2
P3 = 15(1 - m )
Tabelle 7-1: Die niedrigsten assoziierten Legendre-Polynome Polynome mit negativem oberem Index haben lediglich einen anderen Vorfaktor: Pl - m ( m ) = ( -1)m
(n - m)! m Pl ( m ) . (n + m)!
(7.13)
Für |m| > l ergibt sich Plm = 0 . Dies ist ersichlich aus (7.11), da (m2 -1)l ein Polynom vom Grade 2l ist, welches dann mehr als 2l-fach abgeleitet wird. Damit kann m nur die ganzzahligen Werte im Bereich |m| £ l annehmen. Unter Beachtung dieser Limitierung m = -l , -(l - 1),º , 0,º + (l - 1), l
(7.14)
lauten schließlich die normierten Produktfunktionen Yl m (q , j ) = ( -1)m
(2l + 1)(l - m)! m Pl (cosq ) e imj . 4 p(l + m)!
(7.15)
Diese sehr bedeutsamen Funktionen werden als Kugelflächenfunktionen (engl. "spherical harmonics") bezeichnet. Bis zu den Indizes |m| £ l £ 2 sind sie in der folgenden Tabelle zusammengestellt.
l=0
l=1
m = -2
-
-
m = -1
-
m=0
-1
Y1 = 1
0
Y0 =
4p
m = +1
-
m = +2
-
0
Y1 = 1
Y1 = -
3 8p
sin q e
4p 8p -
5
-2
Y2 =
3 3
l=2
- ij
0
cos q sin q e
-1
Y2 = Y2 =
ij
1
Y2 = 2
Y2 =
2
96 p 5 24 p
3 sin q e
-2 ij
3 sin q cos q e
5 16 p 5 24 p
- ij
(3 cos q - 1) 2
3 sin q cos q e
5 96 p
2
3 sin q e
ij
2 ij
Tabelle 7-2: Die niedrigsten Kugelflächenfunktionen Die Kugelflächenfunktionen erfüllen die Orthogonalitätseigenschaft sowohl hinsichtlich der Integration über j wie auch über J auf der Kugeloberfläche. Es gilt
G. Fussmann , Atomphysik SS 2002
102
Das Wasserstoffatom 2p
Ú Ú
p
j =0 q =0
Yl1m1 * Yl2m2 sin q dq dj = d l1l2 d m1m2
(7.16)
Wichtig ist auch wieder, die Symmetrieeigenschaft (Parität) dieser Funktionen festzustellen. Dazu r untersuchen wir rdas Verhalten bei Punktspiegelung am Zentrum, also Vertauschung des Vektors r = (x,y,z) mit - r = (-x,-y,-z). In Kugelkoordinaten läuft das auf eine Vertauschung der Winkel hinaus: j -> j + p und q -> p - J. Man erhält die Relation Yl m ( p - q , j + p) = ( -1)l Yl m (q , j )
(7.17)
Die P arität w ird demnach allein von der Quantenzahl l b e s t i m m t . Terme mit geradem l haben gerade Parität, während ungerades l ungerade Parität ergibt. In der folgenden Abbildung wird die Winkelverteilung der l=0,m=0 Betragsquadrate Abb. 7-1: Polare Verteilung der Aufenthaltswahrschein-lichkeit |Ylm(q,j)|2 ~ Pl2m (cosq) für l £ 3 und m £ l. (Die z-Achse weist nach oben)
x
l=1,m=0
l=1,m=1 x
x
|Ylm(q,j)|2 für einige niedrige
Werte von l und m wiedergegeben. Sie stellen die Aufenthaltswahrscheinlichkeit des Elektrons als Funktion des x x x Polarwinkels q dar (nach Integration über r). Die Kurven l=3,m=0 l=3,m=1 l=3,m=2 l=3,m=3 sind als rotations-symmetrische Gebilde um die z-Achse aufzufassen. Man stellt fest, daß x x x x sich Verteilungen mit maximaler zKomponente des Drehimulses |m| = l in der x-y-Ebene konzentrieren. Summiert man über alle m-Werte zu gegebener Drehimpulsquantenzahl l, so ergibt sich eine kugelsymmetrische Verteilung. Letzteres folgt aus dem häufig benötigten Additionstheorem für die Kugelflächenfunktionen: Sind (q1,j1) l=2,m=0
l=2,m=1
l=2,m=2
nd (q2,j2) die Koordinaten zweier Punkte auf der Einheitskugel, so ist der Zwischenwinkel g durch die geometrische Relation cos g = cos q1 cos q 2 + sin q1 sin q 2 cos(j 1 - j 2 ) gegeben. Es gilt dann das Additionstheorem +l +l 2l + 1 Pl (cos g ) = Â [Yl m (q1 , j 1 )] * Yl m (q 2 , j 2 ) = Â Yl m (q1 , j 1 )[Yl m (q 2 , j 2 )] * . 4p m= -l m= -l
G. Fussmann , Atomphysik SS 2002
(7.18)
(7.19)
103
Das Wasserstoffatom Hieraus ergibt sich die Kugelsymmetrie mit q1 = q2, j1= j2 wegen Pl(1) = 1. Man bezeichnet die Drehimulsverteilungen auch als Orbitale und spricht, wenn l = 0, 1, 2 von s-, p-, d-Orbitalen. Für das Verständnis der chemischen Bindungen sind insbesondere die Linearkombinationen der verschiedenen m-Verteilungen zu gegebenem l-Wert von Bedeutung. Für l = 1 hat man die drei folgenden Orbitale px =
-1 1 (Y1 - Y1-1 ) = 2
py =
-1 1 (Y1 + Y1-1 ) = i 2
pz = Y10 =
3 sin q cos j 4p 3 sin q sin j . 4p
(7.20)
3 cos q 4p
In der nachfolgenden Abbildung sind deren räumliche Verteilungen (d.h. |pi|2, mit i = 1, 2, 3 ) wiedergegeben. Es handelt sich um hantelförmige Gebilde, die zur jeweiligen Achse symmetrisch sind.
Abb. 7-2: 3D-Darstellungen der Orbitale px, py, pz. 7.2
Der Bahndrehimpuls
Bevor wir uns mit der radialen Lösung der Wellenfunktion nach Gl.(7.9) befassen, ist es angebracht, die bisher gewonnenen Ergebnisse von einer höheren physikalischen Warte her zu betrachten. Die folgenden Ausführungen über den quantenmechanischen Drehimpuls sind von grundlegender Bedeutung. Darüber hinaus erlauben die Kenntnisse über den Drehimpulszustand eines Atoms bereits wichtige Aussagen über sein Verhalten im Magnetfeld und über die Verhältnisse von Linienintensitäten. Im Kap.6 haben wir bereits den Operator für den Drehimpuls kennengelernt: r r r hr l = r ¥ p = r ¥ —. i
(7.21)
In kartesischen Koordinaten lauten seine Komponenten lx = -ih( y
∂ ∂ ∂ ∂ ∂ ∂ - z ); ly = -ih( z - x ); lz = -ih( x - y ). ∂z ∂y ∂x ∂z ∂y ∂x
G. Fussmann , Atomphysik SS 2002
(7.22) 104
Das Wasserstoffatom Die Transformation auf Kugelkoordianten führt zu lx = ih(sin j
∂ ∂ ∂ ∂ ∂ + cot q cos j ); ly = ih( - cos j + cot q sin j ); lz = -ih . (7.23) ∂q ∂j ∂q ∂j ∂j
Bilden wir hieraus den Operator für l2 so erhalten wir r2 ∂ Ê ∂ˆ 1 ∂2 ˘ 2 2 2 2È 1 sin . l = lx + ly + lz = - h Í Á q ˜+ ∂q ¯ sin 2 q ∂j 2 ˙˚ Î sin q ∂q Ë
(7.24)
Der Vergleich mit dem Hamilton-Operator (7.2) zeigt uns, daß dieser Ausdruck (bis auf den Faktor 1/r2) auch dort auftaucht. Dies ist natürlich kein Zufall, denn es ist ja l2/(2mer2) klassisch gerade die Rotationsenergie. Man überzeugt sich auch leicht davon, daß der Operator (7.24) mit dem Hamilton-Operator vertauscht werden darf. Das gleiche trifft auf den Operator der z-Komponente des Drehimpulses zu. Für die entsprechenden Kommutatoren erhalten wir in der Tat r2
[H, l ] = 0;
[H, lz ] = 0 .
(7.25)
Die gesuchten Eigenwertgleichungen für die Energie müssen damit gleichzeitig auch Eigenwertgleichungen für l2 und lz sein. Da diese Operatoren nur auf die Winkelvariablen wirken, müssen diese Funktionen die bereits abgeleiteten Ylm sein. Man findet durch Einsetzen r l 2 Yl m = h 2 l(l + 1) Yl m ; lz Yl m = h mYl m .
(7.26)
Die Separationsvariablen l und m kennzeichnen demnach die Eigenwerte des Betrags und der zKomponente des Drehimpulses. h m sind direkt die möglichen Eigenwerte der z-Komponente, dagegen sind die möglichen Eigenwerte des Drehimpulsbetrages h [l(l+/)]1/2; also keine ganzzahligen Vielfachen von h , wie das von Bohr in seiner Modellrechnung angenommen worden war. Bemerkenswert ist in diesem Zusammenhang auch die Feststellung, daß Atome mit dem Drehimpuls l = 0 durchaus vorkommen können und sogar häufig den Grundzustand bilden. Nach der Bohrschen Vorstellung war das nicht möglich, da Elektronen ohne Drehimpuls im klassischen Sinne keine Zentrifugalkraft erfahren und damit radial in den Kern stürzen sollten. Wir geben noch die Ergebnisse an für die Kommutatoren der verschiedenen Komponenten des Drehimpulses: r r r l 2 , lx = l 2 , ly = l 2 , lz = 0,
[
] [
] [
]
(7.27)
und
[l , l ] = ihl ; y
z
x
( und zyklische Vertauschungen) .
(7.28)
Ist also eine Komponente des Drehimpulses (hier immer die z-Komponente) gemessen, so sind die beiden übrigen nicht definiert. Diese wichtige Aussage, die sich hinter Gl. (7.28) verbirgt, kann man formal (Anwendung der Determinanten- bzw. zykl. Vertauschungsregel für Kreuzprodukte) auch in die Form r r r l ¥ l = ih l G. Fussmann , Atomphysik SS 2002
(7.29) 105
Das Wasserstoffatom bringen, was natürlich für gewöhnliche Vektoren eine widersprüchliche Aussage abgeben würde, sofern nicht l = 0. Der tiefere Grund für diese merkwürdige Relation ist darin zu sehen, daß i m Gegensatz zu gewöhnlichen Vektoren ein quantenmechanis cher Drehimpuls nie genau in eine Richtung w eis en k a n n . Diese Behauptung erklärt sich daraus, daß der Betrag25 des Drehimpulsvektors wegen [l (l+1)]1/2 ≥ l immer größer als seine z-Komponete (|lz| £ l) ist. Der Vektor l kann daher nie genau in Richtung der z-Achse zeigen, die wir andererseits ausdrücklich als Symmetrieachse ausgewählt haben. Es ist nützlich, sich diese Zusammenhänge auch bildlich klarzumachen. Dazu wählen wir den Fall eines f- Elektrons26 mit l = 3. Der Betrag des Drehimpulsvektors ist (3◊4)1/2 = 2 ÷3 = 3,46. Die Vektorspitze muß demnach auf einem Kreis mit dem Radius 3,46 liegen. Andererseits liegen die zKomponenten ebenfalls fest zu m = -3, -2, -1, 0, 1, 2, 3. Diese Verhältnisse sind in der Abb. 7-3 dargestellt. z - Achse m=3
Abb. 7-3: Quantisierung des Bahndrehimpulses für ein f-Elektron mit l = 3.
Das dem quantenmechanischem Drehimpuls angemessene Bild ist demnach nicht ein im Raum starrer Pfeil wie in der klassischen Mechanik, sondern ein Kegel, auf m=1 dessen Umfang der Drehimpulsvektor umläuft (präzidiert). Somit ist auch anschaulich klar, daß die lxm=0 und ly-Komponenten nicht gleichzeitig Konstante der Bewegung sein können. m = -1 Wir haben noch nachträglich zu zeigen, daß alle Größen, m =-2 deren Operatoren mit dem Hamilton-Operator m = -3 kommutieren, tatsächlich Konstante der Bewegung sind, vorausgesetzt, die Gesamtenergie ist konstant (d.h. H ist nicht explizit zeitabhängig). Dazu betrachten wir die zeitliche Änderung des Erwartungswertes eines hermiteschen Operators L m=2
∂L ∂y * ∂y Ly ) dx + Ú (y * L ) dx . = Ú( ∂t ∂t ∂t
(7.30)
Unter Verwendung der zeitabhängigen Schrödinger-Gleichung im ersten Schritt und der Hermitizität im zweiten erhalten wir ∂L i i -i = Ú ( Hy *)Ly dx + Ú (y * L( Hy ) dx = Ú (y * (HL - LH)y ) dx = [H , L] (7.31) h h h ∂t < L > ist somit konstant, wenn der Kommutator verschwindet. 7.3
Eigenzustände der Energie und Eigenfunktionen des Wasserstoffatoms
Wir kommen nun auf die bisher unbekannte radiale Komponente der Wellenfunktion Gl. (7.9) zurück. Im letzten Abschnitt haben wir gesehen, daß der hierin auftauchende Term
25 Wenn nicht explizit angeben, sind die Zahlenangaben bei Drehimpulsen immer als Vielfache von h gemeint. 26 Man weist den Drehimpulszuständen Buchstaben zu, die auch in den spektroskopischen Notationen vewendet werden. Aus
historischen Gründen lauten diese s, p, d, f für l = 0, 1, 2, 3 und dann in der Folge des Alphabets unter Auslassung der Vokale. G. Fussmann , Atomphysik SS 2002
106
Das Wasserstoffatom
Vl =
l(l + 1)h 2 2me r 2
(7.32)
die Drehimpulsenergie darstellt. Wir können ihn mit dem Potential V(r) = Vr zu einem effektiven Potential zusammenfassen Veff = Vr + Vl. Im Gegensatz zum reinen Coulom-Potential können nun für l > 0 Potentialmulden in Veff auftreten, wie dies in der Abb. 7-4 skizziert ist. V
Vrot
r Veff VCoul
Abb. 7-4: Effektives Potential als Summe von Coulomb- und Drehimpulspotential.
Aus unserer Erfahrung mit dem harmonischen Oszillator können wir vermuten, daß in diesen Mulden die Elektronen sich mit relativ großer Wahrscheinlichkeit aufhalten werden. Diese Vermutung wird sich als zutreffend erweisen. Die Rechnungen lassen sich für ein beliebiges Potential nicht weiter analytisch verfolgen, sondern machen im allgemeinen numerische Verfahren erforderlich. Für das Wasserstoffatom (bzw. wasserstoffähnliche Ionen) mit V (r ) =
-e 2Z 4 pe 0 r
(7.33)
kann man die allgemeine Lösung angeben. Dazu wird zunächst Gl. (7.9) durch die Transformationen
r = ar ; a 2 = 8me |E|/ h 2 ; l =
2me Ze 2 Ze 2 me = 2 4 pe 0ah 4 pe 0 h 2|E|
(7.34)
umgeformt, wobei r ein dimensionloser Radius ist. Es ergibt sich damit für die Radialfunktion R(r) die Gleichung 1 d Ê 2 dR ˆ È l 1 l(l + 1) ˘ - R = 0. ˜+ Ár r 2 dr Ë dr ¯ ÍÎ r 4 r 2 ˙˚
(7.35)
Die folgende Behandlung für die Berechnung der gebundenen Zustände27 mit E < 0 vollzieht sich analog zum Vorgehen beim harmonischen Oszillator, so daß wir den Weg hier nur skizzieren wollen. Man sucht zunächst die Lösung für r -> • (hier: e-l r /2) und modifiziert diese Funktion durch ein multiplikatives Polynom, für das eine Potenzreihe angesetzt wird. Ebenso wie beim harmonischen Oszillator muß ein Abbrechen der Reihe (bei der Potenz rn') gefordert werden, um die Konvergenz zu erzwingen. Dies liefert die dritte Quantenbedingung l = n = n' + l +1 mit den ganzahligen radialen Quantenzahlen n' und den Hauptquantenzahlen n. Da sowohl n' ≥ 0 wie auch l ≥ 0, ergibt sich bei Vorgabe von n eine obere Grenze für die Drehimpulsquantenzahl: l ≤ n - 1. Wir erhalten schließlich mit (7.34) die möglichen Eigenwerte der Energie
27 Der Fall E > 0 führt zu freien Elektronen und ist insbesondere für Streuprobleme, aber auch Bremsstahlungsrechnungen u.
a. von Bedeutung. G. Fussmann , Atomphysik SS 2002
107
Das Wasserstoffatom
En = -
me Z 2 e 4 1 . 2( 4 pe 0 h)2 n2
(7.36)
Dies sind die uns vom Bohrschen Atommodell her bereits bekannten Energieterme. Erstaunlicherweise kommt hierin die Drehimpulsquantenzahl l nicht vor. Eine genauere Analyse zeigt jedoch, daß dies eine Besonderheit ist, die nur für das exakte Coulomb-Potential Vr µ r-1 gilt. Bei den Alkaliatomen beispielsweise, wo das Potential des äußersten Elektrons durch die Rumpfelektronen verändert wird, zeigt sich im Einklang mit entsprechenden Rechnungen auch eine Aufspaltung der Energieniveaus in Abhängigkeit mit l . Die fehlende Abhängigkeit der Energieeigenwerte von den Quantenzahlen m und l wird als Entartung bezeichnet. Jedem Energieeigenwert En können unterschiedliche Wellenfunktionen zugeordnet sein. Die Anzahl dieser Wellenfunktionen ermittelt sich wie folgt: Zu jedem Wert von n gibt es n Werte von l (nämlich: l = 0, 1,…(n-1)) und zu jedem Wert von l existieren (2 l+1) Werte von m (nämlich: m = - l,…0,…l). Damit hat man eine Gesamtzahl (Entartungsgrad) von n-1
 2l + 1 = n
2
(7.37)
l=0
Kombinationen. Unter Berücksichtigung des später zu besprechenden Spindrehimpulses verdoppelt sich diese Zahl noch einmal, so daß jedes Energieniveau des Wasserstoffs 2n2fach entartet ist. Diese Entartung ist eine Folge des 1/r-Potentials und der Kugelsymmetrie. Durch Symmetriebrechung z.B. in elektrischen oder magnetischen Feldern kann diese Entartung teilweise oder auch ganz aufgehoben werden, was zu einem Aufspalten der Spektrallinien mit wachsender Feldstärke führt. Wir geben nun noch die normierten Radialfunktionen für das Wasserstoffatom an. Sie lassen sich mit Hilfe der assozierten Laguerre -Polynome Lpk(r) ausdrücken 3
Ê 2Z ˆ (n - l - 1)! - r /2 l 2 l + 1 Rnl = - Á e r Ln - l - 1 ( r ). ˜ Ë na0 ¯ 2n(n + l)!
(7.38)
Hierbei ist r = 2Z r/(n a0) ein entsprechend normierter, n- und Z-abhängiger Radius (a0 = Bohrscher Radius). Die vier niedrigsten normalen Laguerre-Polynome28 Ln = Ln0 lauten: L0(x) = 1, L1(x) = -x + 1, L2(x) = x2 - 4x + 2, L3(x) = -x3 + 9x2 -18x + 6. Sie genügen der Orthonormierungsbedingung
Ú
•
0
e - x Lm ( x)Ln ( x) dx = d nm ,
(7.39)
was ein Spezialfall von
Ú
•
0
e - x x k Lkm ( x)Lkn ( x) dx =
(n + k )! d nm n!
(7.40)
ist. Ähnlich wie bei den Hermiteschen- und den Legendre-Polynomen kann man die hier benötigten Laguerre-Polynome durch Differentiation gewinnen 28 Leider sind auch bei den Laguerre-Polynomen verschiedene Definitionen mit unterschiedlichen Vorfaktoren in der Literatur zu finden. Wir benutzen hier die Darstellung wie sie z.B. bei G. Arfken, Mathematical Methods for Physicists, (Academic Press Inc., N.Y., London) oder auch im Programmpaket von Mathematica (Wolfram) Verwendung findet.
G. Fussmann , Atomphysik SS 2002
108
Das Wasserstoffatom
Ln ( x) =
e x dn n - x e x x - k dn n+ k - x k x e ; L ( x ) = x e . n n! dx n n! dx n
(
(
)
)
(7.41)
Für die Berechnung von verschiedenen Mittelwerten ist die Relation
Ú
•
0
e - x x k + 1Lkm ( x)Lkn ( x) dx =
(n + k )! (2n + k + 1) n!
(7.42)
sehr hilfreich. Die drei niedrigsten Radialfunktionen lauten schließlich explizit 3/ 2
Ê Zˆ R10 (r ) = Á ˜ 2 e - Zr / a0 Ë a0 ¯ 3/ 2 3/ 2 1 Ê Zˆ Ê 1 Ê Zˆ Zr ˆ - Zr /2 a0 Zr - Zr /2 a0 R20 (r ) = ; R21 (r ) = e Á ˜ Á2 - ˜ e Á ˜ a0 ¯ 2 2 Ë a0 ¯ Ë 2 2 Ë a0 ¯ a0 3 (7.43) 2 3/ 2 Ê Zr ˆ ˘ - Zr /3 a0 2 Ê Zˆ 1 È Zr + 2Á ˜ ˙ e ; R30 (r ) = Á ˜ Í27 - 18 81 Ë a0 ¯ a0 a0 ¯ ˙ 3Í Ë Î ˚ 3/ 2 2 3/ 2 ˘ - Zr /3 a0 2 Ê Zˆ 2 Zr È Zr 2 Ê Zˆ 2 Ê Zr ˆ - Zr /3 a0 R31 (r ) = Á ˜ - 6˙ e ; R32 (r ) = Á ˜ Á ˜ e 81 Ë a0 ¯ 3 a0 ÍÎ a0 81 Ë a0 ¯ 15 Ë a0 ¯ ˚
Diese Funktionen sind für Z = 1 in der Abb. 7-5 dargestellt. Nur die Funktionen mit verschwindendem Drehimpuls (l = 0) haben bei r = 0 einen endlichen Wert. Die Aufenthaltswahrscheinlichkeit dieser s-Elektronen in der Umgebung des Atomkerns ist deshalb nicht null. Wir erinnern noch einmal daran, daß entsprechend Gl. (7.4) die von allen drei Quantenzahlen abhängende Gesamtwellenfunktion sich darstellt als
y nlm (r , q , j ) = Yl m (q , j ) Rnl (r ) .
(7.44)
In Verallgemeinerung von Gl.(7.16) ergibt sich nun die Orthonormalitätseigenschaft durch Integration über den gesamten Raum •
2p
Ú Ú Ú
p
r=0 j =0 q =0
y n*1l1m1 y n2 l2 m2 r 2 sin q dq dj dr = d n1n2 d l1l2 d m1m2 .
(7.45)
Neben der Wahrscheinlichkeit |ynlm|2 dV, das Elektron im Volumenelement dV = r2 dr dq dj zu finden, ist man häufig an der Wahrscheinlichkeitdichte P(r) interessiert, mit der sich das Teilchen zwischen den Radien r und r + dr aufhält. Diese ergibt sich durch Integration von |ynlm|2 über die Winkelvariablen. Unter Beachtung der Normierung der Ylm und mit Hilfe von (7.44) ergibt sich hierfür sofort Pnl (r ) = r 2 Ú
2p
0
Ú
p
0
2
2
y nlm (r , q , j ) sin q dq dj = r Rnl (r ) .
(7.46)
Diese Aufenthaltswahrscheinlichkeitsdichte ist für die Fälle n = 1, 2, 3 in der Abb. 7-6 dargestellt. Für die Bohrschen Radien bei der Hauptquantenzahl n hatten wir an = a0 n2/Z erhalten. Im Fall G. Fussmann , Atomphysik SS 2002
109
Das Wasserstoffatom n = 1 fällt diese Position exakt mit dem Maximum von P 10 zusammen. Dies gilt generell für den maximalen Drehimpuls rmax(n, l =n-1) = an, die im Bohr-Sommerfeldschen Bild durch Kreisbahnen ausgezeichnet waren. Für n > 1 und l < l max = n -1 treten jedoch mehrere Maxima und Nullstellen in Erscheinung. Der Schwerpunkt der Verteilung = Ú(r3 R2) dr ist bei gegebenem n nur schwach abhängig vom Drehimpuls; er nimmt mit zunehmendem l leicht ab. R 2
R
R 0.6
1.5
0.4
1 R10
0.3 R30
R20
0.2
0.2
0.5 2
4
6
8
10 rêa0
R21 4
2
0.1 6
8
10 rêa0
R31
R32 4
2
6
10 rêa0
8
Abb. 7-5: Radiale Wellenfunktionen für Z = 1 und den Hauptquantenzahlen n = 1 (links), 2 (mitte),3 (rechts). Die Drehimulpsquantenzahlen l laufen jeweils von l = 0 bis l = n - 1.
r2 R2 0.5 0.4 0.3 0.2 0.1
r2 R2 0.2
10
r2 R2 0.1 0.08 0.06 0.04 0.02 30
21
0.15 0.1 0.05 20 2
4
6
8
10 rêa0
2
4
6
8
10 rêa0
32 31
2
4
6
8
10 rêa0
Abb. 7-6: Aufenthaltswahrscheinlichkeiten Pnl = (r Rnl)2 in der Kugelschale r…r + dr für die Fälle wie in Abb. 7-5.
G. Fussmann , Atomphysik SS 2002
110
Spin und Magnetische Momente
8 8.1
SPIN UND MAGNETISCHE MOMENTE Bahndrehimpuls und magnetisches Dipolmoment
Im Abschnitt 6.2 haben wir den Bahndrehimpuls des Elektrons im Wasserstoffatom erläutert. Wir erinnern nochmals daran, daß Teilchen mit dem maximalen Drehimpuls l = n -1 in der klassischen Physik solche sind, die sich auf Kreisbahnen bewegen, während die s-Elektronen mit l = 0 durch den Atomkern pendeln würden. Aufgrund des Korrespondenzprinzips können wir erwarten, daß insbesondere bei sehr großem n und l die quantenmechanische Beschreibung in die klassische einmündet. Das führt uns dazu, für die mit Drehimpuls behafteten Elektronen auch ein magnetisches Dipolmoment zu postulieren, wie es die klassischen Teilchen besitzen. Dieses klassische magnetische Dipolmoment m = I A ist gleich dem Produkt aus Kreisstrom und eingeschlossener Fläche A = p r 2 . Der einem umlaufenden Elektron zugeordnete Strom ergibt sich aus der Periodendauer t und der Ladung -e entsprechend I = - e/t. Mit Hilfe der Bahngeschwindigkeit v und des Bahndrehimpulses l = mev r erhält man den Zusammenhang
m = AI = pr 2
-e -e erv e = pr 2 ==l. t 2 pr / v 2 2me
(8.1)
Diese letzte Gleichung können wir auch als Vektorgleichung schreiben29 r e r m=l . 2me
(8.2)
Magnetis ches Moment des Elektrons und Bahndrehimpuls s ind klassisch demnach antiparallel und proportional zueinander. Die Proportionalitätskonstante
g =
m l
(8.3)
nennt man gyromagnetisches Verhältnis. Für den Bahndrehimpuls l = 1 h ergibt sich gl = -e/2me und der Betrag
mB =
eh = 9, 27 ◊ 10 -24 [ Am 2 ], 2me
(8.4)
der als Bohrsches Magneton bezeichnet wird. Unter Verwendung dieser charakteristischen Größe können wir die Relation (8.2) schreiben als r r l m = -gl mB , h
(8.5)
I 29 Bei nicht-kreisfrömigen, geschlossenen Leiterschleifen definiert man allgemein mr : = 2
G. Fussmann , Atomphysik SS 2002
r
r
Ú r ¥ ds
mit der Bogenlänge ds.
111
Spin und Magnetische Momente wobei wir hier im Vorgriff auf spätere Betrachtungen noch einen freien Koeffizienten eingeführt haben, der im vorliegenden Fall des Bahndrehimpulses den Wert g = gl = 1 hat. z r B
Abb. 8-1: Veranschaulichung der Zusammenhänge zwischen Bahn-Drehimpuls l und magnetischem Moment m . Das Elektron kreist auf einer Bohrschen-Bahn mit sehr hoher Frequenz wBahn ª 1016 s-1. Der entsprechende Bahndrehimpuls beträgt l. Das hiermit verbundene magnetische Moment m weist in die entgegengesetzte Richtung. In z-Richtung sind die Projektionen lz und mz gequantelt. Im Magnetfeld kommt es zu einer Präzession mit der Larmorfrequenz wL << wBahn.
r l
wL lz -e
r m mz
Das magnetische Moment erlaubtr uns, die potentielle Energie V des Dipols in einem Magnetfeld der magnetischen Induktionsdichte B einfach anzugeben30: r r Vmag = - m ◊ B .
(8.6)
r Dies ist gleichzeitig diejenige Energie, die das Teilchen gewinnt oder verliert, wenn der Vektor m bzw. der Drehimpulsvektor aus der Senkrechtlage zu B verkippt wird. Sind m und B parallel zueinander, so ist die potentielle Energie des Teilchens minimal, für antiparallele Ausrichtung dagegen maximal und für 90°-Stellungen null. Die parallele Ausrichtung der (permanenten) magnetischen Dipole ist daher im thermodynamischen Gleichgewicht bevorzugt und führt zu einer Verstärkung des äußeren Magnetfelds (Paramagnetismus). Dagegen weist das mit der Gyration der freien Teilchen verbundene magnetische Moment (dieses ist nicht permanent vorhanden, sondern entsteht erst durch Induktion) immer antiparallel zum äußeren Feld und bedingt daher seine Abschwächung (Diamagnetismus). Weist B in Richtung der z-Achse, so ergibt sich für die Energieänderung DEmag = - Dm z B = gl mB
Dlz B. h
(8.7)
Im letzten Kapitel haben wir gefunden, daß die z-Komponente des Drehimpulses nach Aussage der Schrödinger-Gleichung nur die (2l +1) gequantelten Werte m = - l,…, 0,…, + l annehmen kann. Geben wir jetzt dieser Quantenzahl auch den Index l, so lautet die letzte Gleichung DEmag = gl mBB Dml .
(8.8)
Dieser Gleichung werden wir später bei der Besprechung der Spektrallinienaufspaltung im Magnetfeld wieder begegnen. Setzt man einen klassischen magnetischen Dipol in ein Magnetfeld, so erfährt er ein Drehmoment (s. Fußnote 30), das versucht ihn parallel zu B auszurichten, um einen Zustand minimaler r
r
r
30 Mit der Taylor-Entwicklung B(rr ) = B(0) + (rr ◊ —)B(0) + º ergibt sich in führender Ordung für einen magn. Dipol das
r r r r r r Drehmoment: D = m ¥ B(0) . Zur Kraft trägt dagegen das homogene Magnetfeld nicht bei, und es ergibt sich F = —( m ◊ B) . r r r Mit F = -—Vmag erhält man daraus für die potentielle Energie Vmag = - m ◊ B (s. J. D. Jackson, Classical Electrodynamics) G. Fussmann , Atomphysik SS 2002
112
Spin und Magnetische Momente potentieller Energie zu erreichen. Sein Drehimpuls verhindert jedoch diese Ausrichtung, und es kommt stattdessen zu einer Präzessionbewegung (ähnlich wie ein Kreisel im Erdanziehungsfeld), indem der Vektor m auf einem Kegel um B mit einer konstanten Winkelgeschwindigkeit umläuft. Diese Präzessionsfrequenz wird in diesem Zusammenhang gewöhnlich als Larmor-Frequenz bezeichnet. Sie ergibt sich aus der mechanischen Grundgleichung r r dl = D, dt
(8.9)
r r r dl r r = m ¥ B = g l ¥ B. dt
(8.10)
r wonach ein Drehmoment D eine Änderung des Drehimpulses bedingt. Das Drehmoment, das ein magnetischer Dipol im Magnetfeld erfährt, ergibt sich bekanntlich aus dem Kreuzprodukt mit dem Magnetfeld, so daß wir unter Verwendung des gyromagnetischen Verhältnisses g die obige Gleichung wie folgt schreiben können
Allgemein läßt sich damit die zeitliche Ableitung des Drehimpulses als Kreuzprodukt r r r dl = wL ¥ l dt
(8.11)
angeben, wobei im vorliegenden Fall der Vektor der Winkelgeschwindigkeit wL = wL B/B – je nach Vorzeichen von wL – parallel oder antiparallel zu B ist. Aus dem Vergleich mit Gl. (8.10) erhalten wir für diese Larmor-Frequenz die einfache Beziehung
w L = -g B .
(8.12)
Setzen wir hierin gl = -e/2me ein, so sehen wir, daß die Präzessionsfrequenz eines Elektrons (ohne Spin) gerade halb so groß wie seine Gyrofrequenz31 we= |e| B/me sein sollte. Weiterhin ergibt sich für Elektronen eine positive Larmor-Frequenz, d.h. der Spin präzediert rechtshändig um die Magnetfeldrichtung, ebenso wie die Elektronenbahn im Magnetfeld auf eine rechtshändige Schraubenbahn (Helix) führt.
8.2 8.2.1
Spin der Elektronen DER STERN-GERLACH-VERSUCH
O. Stern und W. Gerlach untersuchten 1921 die Bewegung von Silberatomen im inhomogenen Magnetfeld. Diesen Experimenten lag die Überlegung zugrunde, daß r r die Atome, wenn sie ein magnetisches Dipolmoment besitzen, im inhomogenen Feld B = B( z) ez eine Kraft entsprechend r r r ∂B r e F = -—Vmag = —(m ◊ B) = m z ∂z z
(8.13)
erfahren, die sie in Richtung des Gradienten ablenkt.
31 Häufig wird die Gyrofrequenz auch Zyklotronfrequenz genannt.
G. Fussmann , Atomphysik SS 2002
113
Spin und Magnetische Momente Das Experiment ist so aufgebaut, daß die aus einem Ofen austretenden Atome nach Kollimation durch eine Blende in einen langen Magneten eintreten, der durch entsprechende Formgebung (Schneide und Nut) ein stark inhomogenes Feld in z-Richtung erzeugt. Am Ende des Magneten werden die Ag-Atome auf einer Glasplatte aufgesammelt, wo man sie direkt an ihrem Niederschlag erkennt. Blende
Atomofen
Glasplatte
inhomogenes Magnetfeld
z
AgAtome
Abb. 8-2: Aufbau des Stern-Gerlach-Versuchs Erstaunlicherweise zeigte der Versuch, daß die Atome keineswegs eine kontinuierliche Verteilung um z = 0 auf der Platte bilden, wie dies nach klassischer Auffassung zu erwarten wäre, sondern sich auf zwei deutlich getrennte Flecken bei z= ± z0 verteilen. Auch die Quantenmechanik konnte zunächst keine Erklärung hierfür liefern. Hiernach erwartet man zwar eine diskontinuierliche Aufspaltung entsprechend der Quantelung von
m z = mB ml ,
(8.14)
da aber ml genau (2l+1) Werte annimmt und l ganzzahlig ist, sollte der Strahl immer in eine ungerade Zahl von Komponenten (also 1 für l = 0; 3 für l = 1 usw.) aufspalten. Schließlich zeigten auch Experimente mit Wasserstoffatomen, die, wie wir gesehen haben, im Grundzustand keinen Drehimpuls (l = 0) haben, die mysteriöse Doppelaufspaltung. D i e Q u a n t e l u n g des Bahndrehimpulses scheidet damit als mögliche Erklärung aus. Will man dennoch das Konzept der Drehimpulsquantelung als Erklärung heranziehen, so muß man offensichtlich halbzahlige Quantenzahlen fordern: anstelle von l = 0, 1, 2… also eine Drehimpulsquantenzahl s = 1/2. Anstelle von ml treten dann die zwei Quantenzahlen für die zKomponente ms = -1/2, +1/2, die die beobachtete symmetrische Doppelaufspaltung repräsentieren. 8.2.2
DER SPIN ALS HALBZAHLIGER DREHIMPULS
Die oben skizzierte Deutung des Stern-Gerlach-Versuchs durch eine halbzahlige Drehimpulsquantenzahl wurde von S.A. Goudsmit und G.E. Uhlenbeck 1925 nachgeliefert. Sie wird dem inneren Drehmoment der Elektronen, kurz Spin genannt, zugeordnet. Ähnlich wie die Erde neben ihrem durch den Umlauf um die Sonne bedingten Bahndrehimpuls noch einen Spindrehimpuls durch die Rotation um ihre Drehachse aufweist, haben auch die Elementarteilchen einen Spindrehimpuls. Da viele Elementarteilchen, wie beispielsweise Elektronen, keine meßbare radiale Ausdehnung aufweisen32, sind dieser anschaulichen Analogie jedoch erhebliche Grenzen gesetzt. Darüber hinaus haben die Experimente den merkwürdigen Umstand belegt, daß die Spinquantenzahl vieler Elementarteilchen (wie das Elektron) immer nur den einen Wert s = 1/2 hat. Ansonsten gelten für die Eigenwerte des Betrags und der z-Komponente des Spindrehimpulses die zum Bahndrehimpuls (vgl. Gl. 7.26-7.28) analogen Beziehungen
32 Streuexperimente lassen darauf schließen, daß der Elektronenradius weniger als 10-16m mißt und damit auf jeden Fall noch
kleiner als der sogenannte "klassische Elektronenradius" r0= e2/4e0m ec2 = 2,82◊10-15m ist. G. Fussmann , Atomphysik SS 2002
114
Spin und Magnetische Momente r |s |= s( s + 1)h =
3 h, 2
1 sz = ± h 2
(8.15)
wie sich durch Messungen bestätigen läßt. Die z-Komponente des Spins sz = ms h kann damit durch die zwei Quantenzahlen ms = 1/2 und -1/2 repräsentiert werden. z-Achse
Abb. 8-3: Veranschaulichung der zwei Spinzustände durch Kegel Ähnlich wie beim Bahndrehimpuls kann auch der Spin nur m s = +1/2 näherungsweise in die positive oder negative z-Richtung weisen, da wiederum |s| > |sz|. Man spricht trotzdem etwas salopp von "spin up" (d.h. sz > 0, s parallel zu B) oder "spin down" (sz < 0, s = 3 h- s antiparallel zu B). Das anschaulich zutreffendste Bild des 2 Spindrehimpulses ist ein nach oben oder unten geöffneter Kegel (s. Abb. 8-3). Im zeitlich konstanten Magnetfeld kreist d i e Spitze des Spinvektors mit der LarmorFrequenz auf dem oberen oder unteren m s = -1/2 K e g e l m a n t e l . Die x- und y-Komponenten des Spins verändern damit laufend ihre Werte. Unverändert bleibt dagegen die Länge des Vektors und seine Projektion auf die z-Achse. 8.2.3
DAS MAGNETISCHE SPINMOMENT
Im letzten Abschnitt haben wir einige wichtige Eigenschaften des Spindrehimpulses dargelegt. In den Experimenten äußert sich der Spin jedoch in erster Linie durch das ihm zugeordnete magnetische Dipolmoment ms. Wie beim Bahndrehimpuls kann man eine Relation der Art r r s m s = - gs mB h
(8.16)
vermuten, was nunmehr seit langem durch Experimente verifiziert ist. Der hier zunächst noch offen gelassene Faktor gs kann u.a. durch das im folgenden beschriebene Experiment von RichardsonEinstein-de-Haas (1915) bestimmt werden.
Quarzfaden
Abb. 8-4: Versuchsanordnung nach Richardson, Einstein und de Haas.
Man bringt eine lange, dünne Eisennadel (L = 100 mm, r = 3 mm) in ein starkes magnetisches Feld, das durch eine stromdurchflossene Spule erzeugt wird. Der Strom wird durch Entladung Lichtstrahl eines Kondensators gepulst. Ist das Magnetfeld hinreichend stark, so richten sich in einem ferromagnetischen Material (wie Eisen) alle Spins der N Elektronen parallel zu B aus (d.h. alle magnetischen Momente sind antiparallel zu B, Sättigung der Magnetisierung) und bleiben Kondensator (bei "hartem" Eisen) auch in dieser Stellung nach Abklingen des Magnetfelds (Remanenz). Magnetspule Man bringt nun zunächst die Nadel durch einen ersten Strompuls in Sättigung und kehrt dann Eisennadel im darauffolgenden Puls den Strom und damit die Magnetfeldrichtung um. Die (nicht sichtbare) Änderung der Spindrehimpulse DL = N Dsz = 2N S piegel
G. Fussmann , Atomphysik SS 2002
115
Spin und Magnetische Momente sz führt jedoch zu einer beobachtbaren, gleich großen Änderung des makroskopischen Drehimpulses mit entgegengesetztem Vorzeichen, da der Gesamtdrehimpuls unverändert null bleibt. Die Nadel ist an einem dünnen Quarzfaden aufgehängt, so daß dieser auf sie während der kurzen Pulsdauer übertragene Drehimpuls über die maximale Torsion des Fadens (Ablenkung des Lichtstrahls) gemessen werden kann. Zusätzlich mißt man das remanente Dipolmoment33 der Nadel M = N mz nach Abfall des Stromes (z.B. mit Hilfe einer Meßspule, in die man die Nadel eintaucht. Dabei ensteht ein zu M proportionaler Induktionsspannungpuls). Bildet man nun das Verhältnis aus gemessener Drehimpulsänderung und des remanenten Dipolmoments, so fällt die Elektronenzahl N heraus. Experimentell ergab sich für das so bestimmte gyromagnetische Verhältnis
gs =
mz -e = . sz me
Der Vergleich mit Gl. (8.3) zeigt, daß dies d o p p e l t s o B a h n d r e h i m p u l s . Der entsprechende g-Faktor ist also
(8.17) groß
gs = 2.
ist
wie
beim
(8.18)
Bei der z-Komponente des magnetischen Spinmoments kompensiert sich dieser Faktor 2 gegen den Faktor ms = 1/2 des Spineigenwertes und wir erhalten
mzs = - g s ms m B = m m B .
(8.19)
Betrachten wir allerdings die Änderung des magnetischen Spinmoments, so bleibt der Faktor gs = 2 erhalten |Dmz , s |= 2 m B .
(8.20)
Die soeben beschriebene Spinanomalie, d.h. gs = 2 anstatt gl = 1 wie beim Bahndrehimpuls, kann aus der relativistischen Abwandlung der Schrödinger-Gleichung, der sogenannten Dirac-Gleichung abgeleitet werden. Allerdings läßt sich die Dirac-Gleichung nicht anhand begründeter physikalischer Prinzipien ableiten; sie bezieht vielmehr ihre Hauptberechtigung aus der richtigen Beschreibung zahlreicher Phänomene. Leider versagt die Dirac-Gleichung aber bei einer Reihe von Erscheinungen (z.B. spontaner Zerfall) gänzlich; in anderen Fällen treten bei Steigerung der Meßgenauigkeit Abweichungen zwischen Theorie und Experiment auf. In diesen Fällen muß man die Quanten-Elektro-Dynamik (QED) zu Rate ziehen. Nach unserer heutigen Kenntnis ist diese Theorie in der Lage, sämtliche elektrodynamischen Wechselwirkungen exakt zu beschreiben. Als wichtiger Test der QED-Theorie gilt die Überprüfung des gs-Wertes. Die im folgenden beschriebenen Präzisionsmessungen zeigen nämlich winzige Abweichungen von gs = 2 auf. So liefern Experiment und QED-Theorie in geradezu phantastischer Übereinstimmung den Wert g s = 2,002319310. Mit dieser Übereinstimmung ist die Größe gs das genaueste Ergebnis im gesamten Bereich der exakten Naturwissenschaften. Bei den angesprochenen Messungen untersucht man den Unterschied zwischen Gyrofrequenz und Präzessionsfrequenz des Spins (Larmor-Frequenz) des Elektrons. Mit gs = 2 wären diese beiden Frequenzen nämlich nicht mehr um einen Faktor 2 verschieden – wie wir im Nachgang zu Gl. (8.12) zunächst gefolgert hatten – sondern wieder exakt gleich. Diese Phasenkopplung ist in der Abb. 8-5 veranschaulicht. Hier ist zum Zeitpunkt t = 0 der Spin eines Teilchens senkrecht zu seiner 33 Man verwendet „hartes“ Eisen, das sich durch ein sehr hohes Koerzitivfeld auszeichnet. Nach dem Abklingen des
Magnetfelds ist dann das remanente Magnetfeld nahezu gleich mit der Sättigungsfeldstärke. G. Fussmann , Atomphysik SS 2002
116
Spin und Magnetische Momente r
Geschwindigkeit ausgerichtet. In der Folgezeit rotiert der Erwartungswert des Vektors s mit der Larmor-Frequenz auf einem Kegelmantel, der – mit gleicher Wahrscheinlichkeit – zur oberen oder unteren Bildebene geöffnet ist. Nach einem Viertelumlauf auf dem Gyrationskreis hat sich auch der Spinvektor um 90° gedreht und Spin und Impuls stehen wiederum senkrecht zueinander. Wäre gs = 2, so würde auch für alle späteren Zeitpunkte diese Orthogonalität erhalten bleiben. Die winzige Abweichung gs-2 ª 0,002 führt dagegen zu einer etwas höheren Larmor-Frequenz. In der Folge bleiben Gyrationsbewegung und Spinpräzession des Elektrons nicht in Phase, sondern sind nach etwa 500 Umläufen im Magnetfeld deutlich verschieden. Abb. 8-5: Zur Phasenrelation zwischen Impuls und Spin bei der Gyration eines Teilchens im Magnetfeld (Bz). Um hierzu experimentelle Untersuchungen durchführen zu r p können, muß man in der Lage sein, Elektronen mit ausgerichtetem Spin zu präparieren. Dies gelingt mit Hilfe der sogenannten Mottr x s Streuung. Dazu streut man hochenergetische Elektronen (etwa 0,1 - 1 MeV) an einer dünnen Goldfolie. Im Coulomb-Feld der AuKerne erfahren die Elektronen eine starke l-s-Wechselwirkung (s. Kap. 9), die zu einer Spinpolarisierung der austretenden Elektronen führt. Die unter ±90° gestreuten Teilchen weisen dann eine deutliche transversale Polarisierung (spins "up" bzw. "down" zur Streuebene) auf34. Strahlt man umgekehrt, polarisierte Elektronen in eine Goldfolie ein, so beobachtet man eine r r asymmetrische Streuintensitätsverteilung (rechts-links, bezogen auf die von s und p aufgespannte Ebene). Die gleiche Folie kann somit nicht nur zur Präparation, sondern auch als Polarisationsanalysator benutzt werden. In den Experimenten, basierend auf Vorschlägen von Wilkinson und Crane, wurde dieser Effekt in der folgenden Weise ausgenutzt. y
Abb. 8-6: Versuchsaufbau zur Präzisionsmessung von gs (nach Wesley und Rich, Phys. Rev. A4, 1341, (1971)). Der unter ca. 90° an der Folie gestreute Elektronenpulk läuft in eine magnetische Flasche mit sehr kleinem Spiegelverhältnis ((Bmax - Bmin)/B ª 10-6). Um die Elektronen hierin einzufangen, wird ihnen durch einen elektrischen Spannungsimpuls zwischen zwei Halbzylindern der größte Teil der Parallelenergie entzogen. Sie pendeln sodann bis 106 mal in der Flasche hin und her. Durch einen zweiten Beschleunigungspuls werden sie schließlich extrahiert und an der Analysatorfolie gestreut. Die Streuintensität ist ein Maß für transversale Polarisation, sie variiert mit sin[(gs-2)we t] und erlaubt so, (gs-2) mit sehr hoher Genauigkeit zu bestimmen. 8.2.4
SPINOPERATOREN UND ZUSTANDSVEKTOREN
Der Spindrehimpuls kann nicht im bisher entwickelten Konzept der Wellenfunktion beschrieben werden. Konnten wir beispielsweise im Wasserstoffatom den Zustand eines Elektrons durch die drei Quantenzahlen n, l, ml kennzeichen, so müssen wir nun eine neue Variable ms hinzufügen, um 34 Elektronen können auch longitudinal polarisiert sein. Durch 90° Ablenkung in einem elektrischen Feld (Kondensator) kann man transversale in longitudinale Polarisation umwandeln, da das E-Feld keinen Einfluß auf die Spinrichtung hat. Longitudinal polarisierte Elektronen werden aufgrund der Schwachen-Wechselwirkung beim b -Zerfall emittiert.
G. Fussmann , Atomphysik SS 2002
117
Spin und Magnetische Momente auch den Spinzustand des Teilchens zu erfassen. Wie jedoch die Experimente an einem freien Teilchen gezeigt haben, kommen diesem Zustand nur zwei Möglichkeiten zu; denn wie auch immer wir das Magnetfeld in einer Stern-Gerlach-Apparatur (SGA) ausrichten, stets messen wir entweder + h /2 oder - h /2 für die Komponente des Spins in diese Richtung (die wir ohne Beschränkung der Allgemeinheit zur z-Richtung erklären dürfen). Haben wir aber in einer ersten SGA den Wert sz = + h /2 abgelesen, so liefert auch eine sich anschließende zweite SGA mit gleicher Magnetfeldrichtung den Wert sz = + h /2. Das gleiche trifft zu, wenn wir beim ersten Mal den Wert sz = - h /2 erhalten. Auch dann liefern eine beliebige Anzahl von nachgeschalteten SGAs mit gleicher Magnetfeldausrichtung den Wert sz = - h /2. Beginnen wir mit unpolarisierten Teilchen, so können wir hinter der ersten SGA natürlich durch Blenden solche mit positivem oder negativem Spin selektieren und damit einen bestimmten S p i n z u s t a n d p r ä p a r i e r e n . Wechseln wir jedoch bei der zweiten SGA die Magnetfeldrichtung (etwa 1.: z-SGA, 2.: x-SGA), so geht diese Präparation verloren, und wir messen mit gleicher Wahrscheinlichkeit die Werte sx = ± h /2 also im Mittel <sx> = 0 (s. Gl.(8.33)). Von einer mathematischen Beschreibung erwarten wir nun eine Aussage, mit welcher Wahrscheinlichkeit der Wert + h /2 bzw. - h /2 einer jeden Komponente sx, sy und sz gemessen wird. Natürlich wird diese Wahrscheinlichkeit davon abhängen, was wir bereits über das Teilchen wissen (ob z.B. schon eine Messung durchgeführt wurde) und welche äußeren Einflüsse (z.B. zeitlich variierende Magnetfelder) vorliegen. Unser Anfangswissen drückt sich in der Zustandsfunktion aus, während die Beeinflussung im Hamilton-Operator in Erscheinung tritt. Die beschreibende Gleichung, die zeitabhängige Schrödinger-Gleichung, wird für ein Teilchen mit Spin als PauliGleichung bezeichnet. Haben wir uns auf eine z-Richtung im Raum festgelegt, so können wir die beiden möglichen Spinzustände sz = ± h /2 durch die beiden Zustandsfunktionen |c> = |≠> ("spin-up", sz = + h /2) und |c> = |Ø> ("spin-down", sz = - h /2) charakterisieren. Will man ein gebundenes Teilchen beschreiben, so kann man zumeist in guter Näherung die Wechselwirkung des Spins von den anderen Wechselwirkungen abtrennen (solange die in Kap. 9 zu besprechende Spin-BahnWechselwirkung klein ist) und hat dann für die Gesamtzustandsfunktion eine Produktdarstellung Y =y c .
(8.21)
Die beiden Zustandsfunktionen |≠>, |Ø> bilden eine vollständige orthogonale Basis für die Beschreibung des Zustandes eines beliebigen freien Spinteilchens
c = a+ ≠ +a- Ø .
(8.22)
Die gesamte Information über den Zustand steckt in den beiden komplexen Koeffizienten a+ und a, die man in einem Spaltenvektor (Spinor genannt) zusammenfaßt Êa + ˆ c = Á -˜ . Ëa ¯
(8.23)
Den zugehörigen bra-Vektor
c * = (a + *, a -* ).
G. Fussmann , Atomphysik SS 2002
(8.24)
118
Spin und Magnetische Momente Da das Teilchen mit Gewißheit in einem der beiden Zustände vorgefunden wird, lautet die Normierungsbedingung |a+|2 + |a-|2 = 1. Es verbleibt nun noch, die Spinoperatoren anzugeben, die den Vorgang der Messung beschreiben. Zunächst muß gelten sz ≠ =
h h ≠ ; sz Ø = - Ø 2 2
(8.25)
und weiterhin wegen s(s+1) = (1/2) (3/2) = 3/4 s2 c =
3 2 h c . 4
(8.26)
Da wir den Zustand durch einen zweizeiligen Vektor angeben können, ist es naheliegend, für die Operatoren 2x2 Matrizen anzusetzen. Zweckmäßigerweise trennt man hiervon zunächst den numerischen Faktor h /2 ab und setzt r hr s = s. 2
(8.27)
Die sich ergebenden Pauli-Matrizen haben die Gestalt Ê 0 1ˆ Ê 0 - iˆ Ê1 0 ˆ sx = Á ; sy = Á ; sz = Á ˜ ˜ ˜. Ë 1 0¯ Ëi 0¯ Ë 0 -1¯
(8.28)
Sie weisen eine Reihe interessanter Eigenschaften auf. So sieht man durch Matrizenmultiplikation sofort
sx2 = 1 ; sy2 = 1 ; sz2 = 1 ,
(8.29)
woraus Gl. (8.26) wegen s2 = sx2 + s y2 + sz2 = 3 folgt. Weiterhin gilt
sx s y + s y sx = 0
(8.30)
sx sy = - sy sx = is z
(8.31)
sowie
und analoge Beziehungen bei zyklischer Vertauschung der Indizes. Die durch Gl. (8.30) ausgedrückte Eigenschaft wird antikommutativ genannt. Sie ist eine typische Erscheinung für Teilchen mit halbzahligem Drehimpuls und liegt beim Bahndrehimpuls nicht vor. Die Erwartungswerte berechnen sich nach den Regeln der Matrizen- und Vektorrechnung. So erhalten wir beispielsweie für den Erwartungswert der z-Komponente des Spins + h +* -* Ê 1 0 ˆ Ê a ˆ h sz = c sz c = (a , a )Á = (|a + |2 -|a - |2 ). ˜ Á -˜ 2 Ë 0 -1¯ Ë a ¯ 2
G. Fussmann , Atomphysik SS 2002
(8.32)
119
Spin und Magnetische Momente Analog ergibt sich + h +* -* Ê 0 1ˆ Ê a ˆ h +* sx = c sx c = (a , a )Á = (a a + a -*a + ) ˜ Á -˜ 2 Ë 1 0¯ Ë a ¯ 2
(8.33)
und sy
+ h +* -* Ê 0 -iˆ Ê a ˆ h = c sy c = (a , a )Á = i (a +a - * -a +*a - ). ˜ Á -˜ 2 2 Ë i 0 ¯ Ëa ¯
(8.34)
War das Teilchen vor der Messung in z-Richtung polarisiert, d.h. in dem "reinen Zustand" (a+ = 1; a- = 0), so ergeben sich die Erwartungswerte <sz> = + h /2 und <sx> = <sy> = 0. 8.2.5
DIE PAULI-GLEICHUNG
Mit den Pauli-Matrizen können wir nun sehr leicht den Hamilton-Operator angeben. Dazu brauchen wir nur die potentielle Energie entsprechend Gl. (8.6) und das darin vorkommende magnetische Moment ms nach Gl. (8.16) durch den Operator s bzw. s ausdrücken r r r r H spin = - ms ◊ B = mB s ◊ B .
(8.35)
Die zeitabhängige Schrödinger-Gleichung hat dann die Gestalt ih
∂c = H spin c , ∂t
(8.36)
wobei der Operator H spin auf den Spinor c einwirkt. Die Gleichung (8.36) besteht also aus zwei Einzelgleichungen, die wir für ein freies Elektron explizit in der Form ih
+ Êa + ˆ Ê Bz ∂ Êa ˆ m m = ( B s + B s + B s ) = B x x y y z z B Á B + iB Á ˜ Á ˜ ∂t Ë a - ¯ Ë x Ëa ¯ y
Bx - iBy ˆ Ê a + ˆ - Bz ˜¯ ÁË a - ˜¯
(8.37)
schreiben können. Auf diese Gleichungsform treffen wir generell bei Problemen, in denen nur zwei Zustände vorliegen bzw. wesentlich sind. Die Elemente der 2x2-Hamilton-Matrix haben dann grundsätzlich die Form H11 = E0 + DE, H22 = E0 - DE, H12 = H21*. Nehmen wir noch andere magnetische (A) und elektrische (f) Wechselwirkungen hinzu, so lautet der vollständige Hamilton-Operator H=
r 2 r 1 È h ˘ ( — A ) + f 1 m ( s ). e e B + ◊ B ˙˚ 2m ÍÎ i
(8.38)
+
Er wirkt auf die Gesamtwellenfunktion Y(x,y,z,t) = y c = Ê Y - ˆ ein und enthält über das ËY ¯ Vektorpotential A bereits den Wechselwirkungsanteil des Bahndrehimpulses. Die resultierende Gleichung
G. Fussmann , Atomphysik SS 2002
120
Spin und Magnetische Momente ih
∂ Ê Y+ ˆ Ê Y+ ˆ - = H ËY ¯ ∂t Ë Y ¯
(8.39)
wird als Pauli-Gleichung bezeichnet.
8.3
Spinresonanzen
In einer Reihe von Experimenten werden durch Einkopplung von Hochfrequenz die in einem statischen Magnetfeld ausgerichteten Spins zum Umklappen gebracht. Als Teilchen kommen Elektronen oder andere Elementarteilchen, aber auch Atome, Moleküle und Ionen in Betracht. Viele Experimente werden bevorzugt mit dem Spin der Atomkerne durchgeführt, da hierbei, bei üblichen Magnetfeldern der Größenordnung B0 = 1T, die Frequenz im bequem zugänglichen MHz-Bereich (UKW) liegt35. Die charakteristische Größe des Spinmoments ist hier das Kernmagneton mK= mB me/mProton, das etwa 1836 mal kleiner als das für die Atomhülle maßgebliche Bohrsche Magneton ist. Das erste Experiment dieser Art wurde 1937 von I.I. Rabi durchgeführt . Er ließ Atomstrahlen (z.B. Fluor) durch drei verschiedene Magnetfelder laufen (s. Abb. 8-7). Der erste und letzte Magnet weisen wie beim Stern-Gerlach-Versuch stark inhomogene Felder auf, sind aber entgegengesetzt gepolt. Der mittlere Magnet erzeugt ein homogenes statisches Feld B0 (in dem die Dipole nicht abgelenkt werden) in gleicher Richtung wie der erste Magnet. Überlagert wird an dieser Stelle mit Hilfe einer Spule ein hochfrequentes Magnetfeld B1 , welches senkrecht zu B o und der Strahlrichtung ist. Ohne dieses hochfrequente Störfeld ist die z-Komponente der Spins während der Passage durch alle drei Magnete konstant, und die Ablenkung im ersten Magneten wird im dritten wieder aufgehoben, so daß die Teilchen auf den Detektor am Ende der Apparatur auftreffen. Bei Durchstimmen der Frequenz w (oder auch bei fester Frequenz und Verändern von Bo) beobachtet man einen scharfen Resonanzeffekt, indem nun die Teilchen verloren gehen. Das entsprechende Intensitätsminimum liegt genau bei der Larmor-Frequenz wL = gI B o, wobei gI hier das gyromagnetische Verhältnis des Kernspins ist. Bei dieser Frequenz kann die Welle Energie in die Teilchen einkoppeln und ihren Spin zum Umklappen bringen. Die Ausnutzung dieser Resonanzerscheinung führt im Vergleich zur Stern-Gerlach-Anordnung zu einer enormen Steigerung der Empfindlichkeit, die überhaupt erst die Messung der sehr kleinen Kernspins möglich macht.
1. Magnet
2. Magnet
Atomstrahlquelle
3. Magnet
B1 —B
Detektor
—B B0
Abb. 8-7: Spinresonanz-Experiment nach Rabi Abb. 8-8: Meßkurve im Experiment mit Fluoratomen.
Rabi-
35 Die Larmor-Frequenzen betragen für B = 1 Tesla, für Elektronen n = w /2p = 28,026 GHz und für Protonen n = 42,576 e,L e,L p,L
MHz. G. Fussmann , Atomphysik SS 2002
121
Spin und Magnetische Momente In der unteren Tabelle geben wir für einige Teilchen den Spindrehimpuls und das magnetische Spinmoment an. Man beachte, daß auch das elektrisch neutrale Neutron ein magnetisches Moment aufweist, was auf seine innere Struktur (zusammengesetzt aus drei Quarks) hinweist. Im übrigen sind die gyromagnetischen Verhältnisse g = mz/Sz bei Protonen, Neutronen und anderen Atomkernen keineswegs ganzzahlig. Spindrehimpuls magnetisches Dipolmoment in Einheiten von h Elektron 1/2 -1,001 mB Proton 1/2 +2,79 mK Neutron 1/2 -1,91 mK Deuteron 1 +0,86 mK a -Teilchen 0 0 Ag-Atom 1/2 1 mB 3+ Dysprosium-Ion Dy 15/2 9,9 mB Tabelle 8-1: Spin und magnetische Momente einiger Teilchen. Neben der außerordentlich erfolgreichen Rabi-Methode haben sich andere Verfahren bewährt, die auch die Untersuchung von festen Substanzen erlauben. Eine typische Versuchsanordung zur nuklearen Spin-Resonanz (NMR: Nuclear Magnetic Resonanz) zeigt die nachfolgende Abbildung. Abb. 8-9: Apparatur zur Aufnahme von Kernspinresonanzen in festen und flüssigen Proben. Auch in diesem Fall wird über die Spule ein transversales HF-Magnetfeld mit w ª wL in die Probe eingekoppelt. Durch Variation des B0-Feldes (mit gezeigter Zusatzspule bei 50Hz) wird die Resonanz durchgefahren. Auf dem Oszilloskop kann entweder die vom HF-Generator abgegebene Leistung oder die von einer Meßspule aufgenommene Feldamplitude dargestellt werden. 8.3.1
THEORIE DER SPINRESONANZ
Für die Beschreibung der Spinresonanzen kann man direkt auf die Gl. (8.36) zurückgehen. Die Lösung dieser Pauli-Gleichung liefert die Spinoren als Funktionen der Zeit und erlaubt damit, alle interessierenden Größen zu berechnen. Betrachten wir Teilchen mit positivem gyro-magnetischem Verhältnis (g > 0, z.B. Protonen, links-drehend im Magnetfeld), so schreibt sich die Gl. (8.36) i
+ wL w 1 exp( + iwt)ˆ Ê a + ˆ ∂ Êa ˆ 1Ê = Á ˜Á -˜ . -w L ∂t ÁË a - ˜¯ 2 Ë w 1 exp(-iwt) ¯ Ëa ¯
(8.40)
Hierin ist wL = g B0 die Lamorfrequenz, w die Frequenz eines links umlaufenden Störfeldes (Bx = B1 coswt, By = -sinwt ), dessen Amplitude die Frequenz w1 = g B1festlegt. Für die Anfangsbedingung a+(0) = 1, a- (0) = 0 ergibt sich die Lösung
G. Fussmann , Atomphysik SS 2002
122
Spin und Magnetische Momente
w -w ˆ Ê iwt/2 (cos Wt + i L sin Wt) Êa + ˆ Á e ˜ 2W Áa - ˜ = Á ˜ w i t / w 2 1 Ë ¯ Á ˜ ie sin Wt ¯ Ë 2W
(8.41)
mit W =1/2 ((wL - w)2 + w12)1/2. Da 2W ≥ w1 wird nur im Resonanzfall (w = wL), wenn 2W = w 1, eine vollständige Besetzung des unteren Zustandes erreicht werden. In diesem Fall geht der Spinor über in Êa + ˆ Ê eiw Lt/2 cos(w1 t / 2) ˆ Áa - ˜ = Á ie -iw Lt/2 sin(w t / 2)˜ . ¯ Ë ¯ Ë 1
(8.42)
Setzen wir diese Lösung oder die allgemeinere (8.41) in die Gleichungen (8.32) - (8.34) ein, so ergeben sich die Erwartungswerte der Spinkomponenten <si> als Funktionen der Zeit. Wir wollen hierauf jedoch verzichten und stattdessen mit Gl. (8.42) die Dichtematrix berechnen. Es ergibt sich hierfür Ê (a + *a + ) (a + *a - ) ˆ Ê cos 2 (w 1t / 2) r= c c =Á =Á iw t + - ˜ Ë (a * a ) (a * a )¯ Ë - 2i e L sin w 1t
e - iw L t sin w 1tˆ . sin 2 (w 1t / 2) ˜¯
i 2
(8.43)
Die Nicht-Diagonalelemente deuten an, daß es sich um einen reinen Zustand handeln wird, was sich durch Überprüfen anhand von r2 = r bestätigt (s. Kap.6.2.2). Die Erwartungswerte des Spins lassen sich nun alternativ mit Hilfe von si = Sp(rs i ) =
h Sp(rs i ) 2
(8.44)
berechnen. Ist man jedoch nur an der Veränderung der Erwartungswerte des Spins interessiert, so eröffnet sich über das Ehrenfestsche Theorem ein wesentlich einfacherer Weg, der es auch leicht erlaubt Dämpfungseffekte zu berücksichtigen. Dieses Theorem macht eine allgemeine Aussage über die zeitliche Veränderung des Erwartungswertes zum Operator L. Wir hatten uns bereits im Zusammenhang mit Gl. (7.31) mit dieser Frage befaßt. Dort hatten wir aber angenommen, daß der Operator selbst keine Zeitabhängigkeit aufweist, und nur die Wellenfunktionen zeitabhängig sind. Im Gegensatz zu diesem sogenannten Schrödinger-Bild, kann man auch umgehrt die Zeitabhängigkeit allein den Operatoren zuordnen; man spricht dann vom Heisenberg-Bild36. Zum Operator L definieren wir nun gemäß i ∂L L«: = [ H , L] + h ∂t
(8.45)
den Operator seiner zeitlichen Veränderung. Das Ehrenfestsche Theorem lautet dann d L = L« . dt
(8.46)
36 Schließlich gibt es noch das Wechselwirkungs-Bild in dem sowohl die Operatoren als auch die Wellenfunktionen zeitabhängig sind. In jedem dieser drei Bilder ist die Quantenmechnik vollständig. Die Auswahl eines Bildes geschieht allein aus Gründen der Zweckmäßigkeit.
G. Fussmann , Atomphysik SS 2002
123
Spin und Magnetische Momente Ein einfaches, aber wichtiges Beispiel ist die Beziehung p d x = x . dt m
(8.47)
Mit den Beziehungen (8.35) und (8.31) erhalten wir nun zunächst für den für den Operator der zeitlichen Änderung von sz i i i H , sz ] = [ - m s ◊ B, sz ] = - g sx Bx + sy By + sz Bz , sz [ h h h . h i = - hg [s x , s z ]Bx + s y , s z By = g s x By - s y Bx = g (s ¥ B)z 4 2
[(
s«z =
(
[
) ]
] )
(
)
(8.48)
In Verallgemeinerung geht damit die Gl. (8.46) über in d s = g ( s ¥ B) dt
(8.49)
Diese Gleichung ist formal vom gleichen Typ wie die Bewegungsgleichung eines geladenen Teilchens im Magnetfeld: dv/dt = (q/m) v x B. Anstelle des Geschwindigkeitsvektors tritt in Gl. (8.49) der Spin-Erwartungswert, und q/m entspricht dem gyromagnetischen Verhältnis. Von dieser Analogie kann man häufig Gebrauch machen. Für ein konstantes Magnetfeld B = Bz liefert diese Gleichung die Lösungen sx = sy
0
sin w Lt + sx 0 cos w Lt ;
sy = sy
0
cos w Lt - sx 0 sin w Lt ;
sz = sz 0 (8.50)
mit der Larmor-Frequenz wL= gs B. Dies ist gerade die Präzession des Vektors s auf einem Kegel. Wir können mit Hilfe von Gl. (8.49) auch die bereits besprochene SpinumklappWahrscheinlichkeit in einem sich zeitlich verändernden Magnetfeld berechnen. Hierzu verwendet man in der Praxis ein starkes statisches Feld Bz und ein HF-Feld in x- oder y-Richtung. Für die mathematische Behandlung ist aber, wie wir bereits gesehen haben, ein magnetisches Drehfeld BxHF = B1 cos wt ; ByHF = ± B1 sin wt
(8.51)
wesentlich einfacher. Ähnlich wie man eine linear polarisierte Welle durch Überlagerung von linksund rechts-zirkular-polarisierten Wellen beschreiben kann, ist es hier möglich, das linear schwingende Feld durch zwei entgegengesetzte Drehfelder darzustellen. Je nach Vorzeichen von g ist entweder das eine oder andere in Resonanz (für Elektronen Vorzeichen +) und für w ª wL kann das nichtresonante Feld vernachlässigt werden. Unter Resonanzbedingungen w = wL und mit den Anfangsbedingungen <sx>0= <sy>0 = 0, <sz>0 = - h/2 ergibt sich beispielsweise die Lösung h h h sx = - sin w1 t sin w Lt ; sy = + sin w1 t cos w Lt ; sz = - cos w1 t (8.52) 2 2 2 r mit w1 = g B1. Der Vektor 2/ h < s > pendelt demnach auf der Einheitskugel zwischen den Polen mit der Frequenz w 1, die von der Stärke des Drehfeldes abhängt. Überlagert ist dem eine schnelle polare Rotation (falls wie üblich B1 << Bz) mit der Larmor-Frequenz. Läßt man das HF-Feld für die Zeit t90 = p/2w1 einwirken, so wird <sz> = 0; man spricht von einem 90°-Puls. Bei der doppelten Zeitspanne t180 = p/w1 spricht man von einen 180°-Puls. Es ist wichtig sich klar zu G. Fussmann , Atomphysik SS 2002
124
Spin und Magnetische Momente machen, daß die nicht verschwindenen Erwartungswerte in x- und y-Richtung (z.B. nach einem 90° Stoß) nur bei einer reinen Gesamtheit vorliegen und damit einen typisch quantenmechnischen Effekt darstellen. Sie sind Folge einer konstruktiven Interferenz, die wegen der definierten Phasenbeziehung zwischen dem oberen (a+) und unteren Zustand (a-) zustande kommt. In der Praxis kommt jedoch fast immer ein Dämpfungseffekt37 hinzu, der durch die Wechselwirkung der Spins mit der Umgebung oder auch durch die Messung selbst hervorgerufen wird. So koppeln die Spins in einem Festkörper oder in einer Flüssigkeit mit anderen benachbarten Teilchen und wandeln z.B. den ihnen zugeführten Drehimpuls in Gitterschwingungen um. Nach einem kurzen Störimpuls streben sie einem thermodynamischen Gleichgewichtszustand zu, bei dem nur eine Polarisierung in Richtung des statischen Feldes <sz>th übrigbleibt. Die Annäherung an den Gleichgewichtszustand vollzieht sich mit der charakteristischen Relaxationszeit t 1. Die Erwartungswerte <s x> und <s y> relaxieren ebenso gegen ihren Endwert <s x> = <s y> = 0, allerdings mit einer i.a. unterschiedlichen Zeitkonstanten t 2. Die hiermit verbundenen Drehimpulsdämpfungen kann man direkt in der Gl. (8.49) berücksichtigen, die damit zur Blochschen Gleichung Ê ˆ sx /t ^ r r r d Á ˜ s = gs s ¥ B- Á sy /t ^ ˜ dt Á( s ˜ ) / t s Ë z th z || ¯
(8.53)
wird. Mit der Blochschen Gleichung kann man die Spinresonanzphänomene quantitativ beschreiben. Damit insbesondere ständig Energie in die Probe eingekoppelt werden kann, darf die stationäre Polarisierung <sz>th nicht verschwinden. Ist nämlich <sz>th = 0, so sind oberer und unterer Spinzustand gleichbesetzt, was einer Temperatur T = • entspricht. Die Spinbesetzungszahlen im thermodynamischen Gleichgewicht genügen einer Boltzmann-Verteilung und lassen sich durch m ◊B)/kT] = c exp[g sz B/kT] beschreiben, wobei c die Normierungskonstante ist. N(sz) = c exp[-(-m Für Elektronen im parallelen (+) bzw. antiparallelen Spinzustand (-) erhält man damit N± = c exp[ m mB Bz/kT]. Für die mittlere Polarisierung pro Teilchen ergibt sich hieraus sz
th
=
h N+ - Nh mB = - tanh B z + 2N +N 2 kT
bzw.
mz
th
= mB tanh
mBBz . kT
(8.54)
Da <mz> positiv ist, also in Richtung von B weist, erhalten wir ein paramagnetisches Verhalten. Bei Raumtemperatur kT ª 1/40 eV und Bz = 1T beträgt das Verhältnis von magnetischer zur thermischer Energie lediglich mBBZ/kT = 0,002, so daß die Gleichgewichts-Polarisierung sehr gering ist. Für derart kleine Quotienten liefert eine Taylorentwicklung <m>th ª (mB)2 B/kT. Dies ist das Curiesche-Gesetz, wonach die Magnetisierung einer paramagnetischen Substanz eine 1/T Abhängigkeit zeigt. Als reine Gesamtheit kann nur der Bruchteil der polarisierten Spinteilchen (d.h. tanh(mBBZ/kT)) betrachtet werden, da die übrigen keine definierte Phasenbeziehung in den Zuständen a+ und aaufweisen. Nur mit dieser Minderheit sind also Spinresonanzexperimente möglich. Für Kernspins tritt an die Stelle von mB deren wesentlich kleineres magnetisches Dipolmoment gI m k (s. Tabelle 8-1). Für Protonen bei Bz = 1 T ergibt sich mp Bz ª 1,8◊10-7eV = 2,1 mK. Durch Kühlung der Proben auf sehr niedrige Temperturen (etwa 1 mK) kann das Verhältnis mpB/kT und damit die Meßeffekte wesentlich vergrößert werden. 37 Diese Dämpfung kann dissipativ sein oder auch nur durch Phasenstöße hervorgerufen werden.
G. Fussmann , Atomphysik SS 2002
125
Spin und Magnetische Momente Die Relaxationszeiten t^ und t|| sind ein Maß für die Ankopplung des präzedierenden Teilchens an die Umgebung. Sie liefern daher zusätzliche Information über die Nachbarschaft des Teilchens, die man oft bei der Interpretation der Messungen mit heranzieht. 8.3.2
ANWENDUNGEN
Spin-Echos Die erwähnten 90° -und 180°-Pulse können dazu verwandt werden, die magnetische Polarisation gezielt zu verändern. Nach einem 90°-Puls präzediert der Erwartungswert des Spins senkrecht zum statischen B-Feld, und die magnetisierte Probe gleicht einem in der in der x-y-Ebene rotierenden Stabmagneten. Mit einer Schleife oder kleinen Spule, deren Normale in x-Richtung weist, können wir den variierenden magnetischen Fluß durch diese Schleife aufgrund der Induktionspannung U = - df/dt ~ - d<sx>/dt messen. Wir beobachten die Larmor-Frequenz mit zeitlich konstanter Amplitude. In einem leicht inhomogenen Bz-Feld kommt es nach einem 90°-Puls aber zu einer Verbreiterung der Polarisation, da die Teilchen an verschiedenen Orten mit jeweils etwas anderer LarmorFrequenz präzedieren (w0-Dwin/2 £ wL £ w0+Dwin2), was zur Folge hat, daß der Mittelwert in der Ebene <s^>w im Laufe der Zeit kleiner wird. Die charakteristische Zeit für diese inhomogene Verbreiterung38 beträgt tinh = 2p/Dwinh. In der Blochgleichung (8.53) charakterisieren dagegen die Relaxationszeiten t^ und t|| die durch Stöße hervorgerufenen homogenen Verbreiterungsprozesse. Das Zerfließen der Polarisation in der x-y-Ebene infolge der Feldinhomogenität geht jedoch nicht mit einer Zunahme der Entropie einher, da hierbei keine Energie dissipiert wird. Es sollte daher – zumindest grundsätzlich – möglich sein, den anfänglich nach dem 90°-Puls vorliegenden hochpolarisierten Zustand wiederherzustellen. In ersten Experimenten dieser Art (E. L. Hahn, Pys. Rev. 80, 15, 580, (1950)) konnte dies tatsächlich durch aufeinanderfolgende 90°-Pulse demonstriert werden. Später stellte man fest, daß die Kombination von einem ersten 90°- und einem oder mehrere nachfogende 180°-Stöße noch zweckmäßiger ist. Zur Beschreibung der Vorgänge transformiert man am besten die Gleichung (8.49) in ein rotierendes Koordinatensystem (x´, y´, z´= z), das mit der mittleren Larmorfrequenz <wL> = g umläuft. Zwischen der zeitlichen Veränderung eines beliebigen Vektors A im Laborsystem und derjenigen im – mit der Winkelgeschwindigkeit w – rotierenden System besteht bekanntlich die Beziehung39 r r dA d ¢ A r r = + w ¥ A. dt dt
(8.55)
m > = N g <s> der Probe ergibt sich mit Angewandt auf den Vektor der Magnetisierung M = N <m Gl. (8.49) für dessen zeitliche Ableitung im rotierenden System r r r d¢ M r = M ¥ ( Dw + w1 ) dt
(8.56)
w = g (B z(x,y) – ) = Dw ez´ und dem mit der zeitlich konstanten Winkelgeschwindigkeit Dw Drehfeldvektor w1 = g B 1(t). Im folgenden soll angenommen werden, daß das Drehfeld ebenfalls mit <wL> umläuft (Resonanz) und der Vektor w1 immer in Richtung von x´ weist. Das Zustandekommen der Echosignale veranschaulichen die Abb. 8-10 und Abb. 8-11. 38 Man spricht von einem inhomogenen Verbreiterung der Linien, wenn sie – wie beispielsweise beim Dopplereffekt – durch Überlagerung von Teilchen mit unterschiedlicher Resonanzfrequenz zustande kommt. Im Gegensatz dazu liegt eine homogene Verbreiterung vor, wenn alle Atome mit der gleichen Wahrscheinlichkeit ein Photon der Frequenz n absorbieren bzw. emittieren. Natürliche Verbreitung und Stoßverbreiterung sind demnach homogene Verbreiterungsprozesse. 39 Siehe z.B. L.D. Landau und E.M. Lifschitz, Lehrbuch der Theoretischen Physik, Band I , Akademie- Verlag, Berlin
G. Fussmann , Atomphysik SS 2002
126
Spin und Magnetische Momente
Abb. 8-10: Zeitlicher Ablauf der Pulse bei Spinecho-Experimenten.
Abb. 8-11: Magnetisierungsvektor M im rotierenden Bezugssystem. a) Anfangsstellung, b) vollständige Magnetisierung in y´-Richtung unmittelbar nach dem 90°-Puls, c) Zerfließen der Magnetisierung infolge der Inhomogenität von Bz , d) Spiegelung an der x´- Achse während des 180°-Pulse,. e) unmittelbar nach 180°-Puls, f) vollständige Magnetisierung in –y´-Richtung. Im rotierenden Bezugssystem sieht man, daß nach dem 180°-Puls eine Spiegelung an der x´-Achse stattgefunden hat. Als Folge sind dann die langsam präzedierenden Spins mit den schnellen vertauscht und werden nun in der Folgezeit von diesen wieder eingeholt. Man erkennt dies an der induktiven Einkopplung in die Meßspule, die nach einer weiteren Zeitverzögerung von Dt = t2 – t1 wieder ein Maximum verzeichnet. Wiederholt man die 180°-Pulse zu den Zeiten t2n+1 = t1 + (2n+1) Dt mit n = 0,1,2,… und mißt die Echoimpulse zu den Zeiten t2n = t1 + 2n Dt, so beobachtet man ein exponentielles Abklingen der Signale gemäß U2n = U0 exp(-t2n/t^). Derartige Experimente werden als Spin-Echo-Experimente bezeichnet. Analoge Untersuchungen können inzwischen auch mit gepulsten Lasern an Zwei-Niveau-Atomen durchgeführt werden. An die Stelle der magnetischen Polarisation tritt in diesem Fall die elektrische Polarisation. Präzisionsmessungen von Magnetfeldern Da das magnetische Moment des Protons sehr genau vermessen wurde, kann man die Kernspinresonanz an einer Standardprobe benutzen, um über die sehr genau meßbare Resonanzfrequenz (np,L = 42,576 Mhz B[T]) das Magnetfeld zu bestimmen. Die Meßgenauigkeit erreicht dabei eine Güte von DB/B £ 10-8.
G. Fussmann , Atomphysik SS 2002
127
Spin und Magnetische Momente Chemische Verschiebung Je nach chemischer Einbidung des Protons im Molekülverbund kann es zur Aufspaltung der Resonanzlinie aufgrund der Wechselwirkung mit den benachbarten Kernspins kommen. Meist handelt es hierbei um eine diamagnetische Abschirmung der resonant angeregten Spins durch die Nachbaratome. So beobachtet man beispielsweise beim Aethylalkohol (C2H5OH) drei ProtonenResonanzlinien, die nur einige 100 Hz voneinander getrennt liegen. Sie entsprechen drei verschiedenen Positionen der fünf H-Atome im Molekül: 1 H in der OH-Gruppe, 2 H in der CH2Gruppe und 3 H in der CH3-Gruppe. Atomuhr Die aus einem Ofen austretenden Cäsium-Atome (133Cs: einziges stabiles Isotop, Kernspin I = 7/2, Grundzustand J = 1/2) durchlaufen eine Rabi-Resonanz-Apparatur, in der die Atome im Kernspinzustand F = I - J = 3 von denen im Zustand F = I + J = 4 abtrennt werden. Die abgesonderten Atome durchfliegen sodann einen Resonator, in den die Mikrowellenfrequenz des Überganges n3->4 = 9,192631770 GHz eingestrahlt wird. Bei exakter Frequenz werden die Atome durch induzierte Emission in den unteren Zustand F = 3 abgeregt. Ihre Strahlintensität wird am Ausgang einer zweiten Rabi-Apparatur durch Frequenzvariation auf ein Minimum geregelt. Zur Erhöhung der Genauigkeit wird im Resonator noch ein Magnetfeld überlagert, um durch ZeemanAufspaltung den Übergang auf MF4 = 0 -> MF3 = 0 einzugrenzen. Die Cäsium-Atomuhr erreicht eine Frequenzkonstanz von Dn/n < 10-13; sie dient deshalb als Zeitnormal. Kernspintomographie Von besonderer Bedeutung für die medizinische Diagnostik ist die Kernspintomographie. Hierbei handelt es sich im wesentlichen um eine ortsauflösende Protonendichtemessung. Mit kurzen Hochfrequenzpulsen werden die Protonenspins in einem i n h o m o g e n e n M a g n e t f e l d um 90° gedreht. In der darauffolgenden Zeit mißt man die Relaxation der Spinpolarisierung zurück zur Gleichgewichtsverteilung entsprechend Gl.(8.54), die dann mit Hilfe der Fourier-Analyse in Frequenzfunktionen umgewandelt werden. Aus der Inhomogenität des Magnetfeldes ergibt sich die Ortszuweisung, da jeder Ort eine andere Larmor-Frequenz aufweist. Die Fourier-Amplitude bei der entsprechenden Frequenz ist direkt ein Maß für die Protonendichte am jeweiligen Ort. Zusätzlich kann noch die chemische Verschiebung der Resonanz in den unterschiedlichen Geweben bei der Interpretation der Meßdaten Verwendung finden.
Abb. 8-12. Kernspintomographie des menschlichen Körpers: Die Abb. 8-13: Bild des Kopfes x-, y- und z-Spulen erzeugen die erforderlichen Inhomogenitäten in nach Umrechnung der Daten den drei Raumrichtungen. Die Antennenspule erzeugt das in Falschfarben. magnetische Drehfeld und dient nach einem 90°-Puls als Meßspule. Längs der z-Achse wird der Körper verschoben, bis die zu untersuchenden Organe im Zenrum der Antenne liegen.
G. Fussmann , Atomphysik SS 2002
128
Das Wasserstoffatom im Detail
9 9.1
DAS WASSERSTOFFATOM IM DETAIL Spin-Bahn-Wechselwirkung und Feinstruktur
Bei den Betrachtungen zum Spin im letzten Kapitel war das Magnetfeld, in dem sich das magnetische Moment des Spins einstellte, von außen vorgegeben. Im folgenden wollen wir aber nun beschreiben, welche Konsequenz der Spin des Elektrons für die Energieeigenwerte eines Atoms hat. Zunächst könnte man meinen, daß dieser Einfluß nicht existiert, da im Atom nur elektrische Coulomb-Kräfte wirken und kein Magnetfeld vorliegt. Diese Auffassung ist jedoch nicht zutreffend, denn nur im ruhenden Laborsystem ist das Magnetfeld Null, während im bewegten System des Elektrons, entsprechend den elektromagnetischen Feldtransformationen r r r¢ r Êr r r v ¥ E^ ˆ r ¢ B^ = g Á B^ E E v ; g = ¥ B^ ^ ^ c 2 ˜¯ Ë
(
)
(9.1)
aus dem radialen elektrischen Feld (E^) ein Magnetfeld (B') hervorgeht, dessen Richtung senkrecht zu der vom Radius- und Geschwindigkeitsvektor aufgespannten Ebene steht. Der Vorfaktor ist der schon aus Kap. 5 bekannte relativistische Parameter g = (1 - v2/c2)-1/2. Setzen wir in der ersten Gleichung E^ = Er = Z e / 4p e0 r2 und benutzen die Beziehungen l = me r v und c2 = ( m0 e0) -1, so erhalten wir in der Näherung v << c für den Betrag der magnetischen Induktion B^' = B l = Z e m 0 l /(4p me r3); das Magnetfeld ist also proportional zum Bahndrehimpuls, was wir durch den Index l zum Ausdruck gebracht haben40. Diese so abgeleitete Beziehung ist jedoch nicht korrekt, da die Transformationen (9.1) streng nur für unbeschleunigte Translationen und damit nicht für Rotationen gelten. Die genaue Berechnung des entsprechenden Magnetfelds ist recht kompliziert, so daß wir hier nur das Ergebnis angeben wollen r Zem0 r Bl = l, 8 pr 3 me
(9.2)
welches sich von dem oben abgeleiteten Ausdruck um den Faktor 1/2 (dies ist die sogenannte Thomas-Korrektur) unterscheidet. Eine Abschätzung für r = 0.1nm ª 2 a0 und Z=1 ergibt Bl ª 1T, was etwa einem typischen starken Labormagneten entspricht. In diesem Magnetfeld richtet sich der Spin des Elektrons aus, wodurch es zu einer geringfügigen Aufspaltung der Energieeigenzustände entsprechend r r r r r s r Ze 2 m0 s ◊ l DE = - m s ◊ Bl = gs mB ◊ Bl = h 8 pme2 r 3
(9.3)
kommt41 . Um diese Spin-Bahn-Wechselwirkung berechnen zu können, müssen wir das hier auftretende Skalarprodukt der Bahn- und Spindrehimpulsoperatoren durch geeignete Erhaltungsgrößen ausdrücken. Aufgrund der Wechselwirkung sind lz und s z keine Erhaltungsgrößen mehr, da die magnetischen Spin- und Bahnmomente über Drehmomente aufeinander einwirken, was zu einer Präzession der beiden Drehimpulsvektoren führt. Diese Präzessionsbewegung vollzieht sich um den Gesamtdrehimpulsvektor j , der die neue 40 Zum gleichen Ergebnis gelangt man, wenn man sich ins Bezugssystem des Elektrons begibt und das vom Kreisstrom des Protons hervorgerufene Magnetfeld berechnet. 41Ohne Beweis sei hier angeführt, daß eine stationäre Störungsrechnung in erster Ordnung für die Störenergie den Ausdruck DEn = < yn | H '| yn > ergibt, wobei H ' der Hamilton-Operator der Störung und yn die Wellenfunktionen ohne Störung darstellt.
G. Fussmann , Atomphysik SS 2002
129
Das Wasserstoffatom im Detail Erhaltungsgröße (genauer Betrag und z-Komponente) darstellt. j ergibt sich durch r dessen r Addition der Vektoren l und s . z
hm j r s
r j r l
Abb. 9-1: Vektoraddition von Drehimpuls und Spin. r r und s starr und mit hoher Frequenz um Anschaulich präzedieren l r r j , während j selbst mit kleinerer Frequenz um die z-Achse r r präzediert. Bei der raschen Präzession von l und s variieren die z-Komponenten dieser Vektoren, doch bleibt ihre Summe jz = lz + s z und damit die Quantenzahl mj = ml + ms erhalten. Diese Verhältnisse sind in der Abb. 9-1 dargestellt. Simultan beobachtbar -r und vertauschbar - sind die vier Observablen r 2 rdamit 2 2 j , l , s , jz .. Ihnen sind die Quanten-zahlen j, l, s = 1/2 und mj zugeordnet, die (zusammen mit dem Energieeigenwert) als Konstante der Bewegung aufgefaßt werden können. Darüber hinaus haben wir die Gleichungen der Vektoraddition für Betrag und z-Komponente von j r r r2 r r 2 r2 r2 j = (l + s ) = l + s + 2l ◊ s
(9.4)
jz = lz + sz fi m j = ml + ms
(9.5)
Entsprechend den beiden Eigenwerten von s z , nämlich ms = ± 1/2, ergeben sich auch zwei Möglichkeiten, die beiden Drehimpulse zu einem Gesamtdrehimpuls zu addieren. Dies folgt aus der Relation Max(mj) = j , die offensichtlich nur die beiden Möglichkeiten j = l + 1/2 und j = l - 1/2 zuläßt. Da l ganzzahlig ist, muß j halbzahlig sein42 . Man beachte ferner, daß - wie bei jedem Drehimpuls - der Betrag von j mit den Quantenzahlen j durch die Beziehungen |j| = h [j(j+1)]1/2 verknüpft ist. Die beiden Möglichkeiten der Drehimpulsaddition sind in der Abb. 9-2 für den Fall l = 2 veranschaulicht. An einen beliebig gerichteten Vektor l mit dem Radius |l | = (l (l +1)]1/2 = 61/2= 2,45 ist ein Kreis mit dem Radius des Spinvektors |s| = [3/4]1/2 = 0,87 angetragen (alle in Einheiten von h ). s
Abb. 9-2: Addition von Bahndrehimpuls (l = 2) und Spin zu den Gesamtdrehimpulsen mit j = 3/2 und j = 5/2
l
j
r
Er schneidet nur die Kreise der möglichen halbzahligen j -Vektoren mit den Quantenzahlen j1 = 3/2 (Radius = (15/4)1/2 = 1.94) und j2 = 5/2 (Radius = (35/4 )1/2 = 2.96). Die Kreise mit noch größerem (j = 3, Radius = 3.46) bzw. kleinerem Gesamtdrehimpuls (j = 1, Radius = 1.41) werden nicht mehr geschnitten.
Gleichung (9.4) bietet die Möglichkeit, das in Gl. (9.3) vorkommende Skalarprodukt anzugeben: 42 Generell müssen alle Drehimpulsquantenzahlen m ganz oder halbzahlig sein. Begründung: Die z-Komponente eines X
Drehimpulses kann nur um ganzzahlige Vielfache von h geändert werden. Benachbarte Werte mX,k und mX,k+1 unterscheiden sich deshalb genau um 1. Ferner existiert wegen der Isotropie des Raumes zu jedem Wert mX = a auch der gespiegelte Wert - a. Der mögliche Wertesatz hat also die Form: mX = { - X , - (X-1), …,(X-1), X}; dies bedingt, daß Max(mx) – Min(mx) = 2X eine ganze Zahl, X selbst daher entweder halb- oder ganzzahlig sein muß (Gegenbeispiel: X = 2/3 ergäbe die unsymmetrische Folge - 2/3,+1/3,+4/3 ; die Zahl +2/3 kommt nicht vor !). G. Fussmann , Atomphysik SS 2002
130
Das Wasserstoffatom im Detail r r h2 È 1 3˘ . l ◊ s = Í j( j + 1) - l(l + 1) 2 Î 2 2 ˙˚
(9.6)
Mit den beiden möglichen Zuständen j = l ± 1/2 ergeben sich zwei Werte für diesen Ausdruck: l h 2/2 für das Pluszeichen und - (l+1) h 2 /2 für das Minuszeichen. Diese Ausdrücke setzen wir in Gl. (9.3) ein und berechnen ferner den Erwartungswert unter Verwendung der Wasserstoffwellenfunktionen für die Quantenzahlen n und l. Die Berechnung des entsprechenden Intergals liefert r -3 =
Z3 1 . 3 3 a0 n l(l + 1 / 2)(l + 1)
(9.7)
Damit ergeben sich die beiden durch die l-s-Wechselwirkung hervorgerufenen Energieaufspaltungen zu Ï l me c 2 1 DEls = (Za )4 3 Ì n l(l + 1 / 2)(l + 1) Ó-(l + 1) 4
für j = l + 1 / 2 . für j = l - 1 / 2
(9.8)
Hierin ist zur Abkürzung die Sommerfeldsche Feinstrukturkonstante e2 1 a= ª 4 pe 0 hc 137 , 04
(9.9)
eingeführt worden, die 43als dimensionslose Größe die Stärke der elektromagnetischen Wechselwirkung charakterisiert und als wichtige Maßzahl in vielen quantenmechanischen Rechnungen auftaucht. Neben der im Vorangehenden betrachteten Spin-Bahn-Wechselwirkung ist noch eine weitere Korrektur zu beachten, die von gleicher Größenordnung ist und ihre Ursache in der relativistischen Massenkorrektur des Elektrons hat. Wir hatten bereits früher den relativistisch korrekten Ausdruck für die kinetische Energie eines freien Teilchen mit dem Impuls p kennengelernt p2 p4 H = c p + m c - m0 c ª . 2m0 8m03 c 2 2
2
2 4 0
2
(9.10)
Der zu p 4 proportionale Korrekturterm in der Entwicklung der Hamilton-Funktion wird für Geschwindigkeiten v << c, wie sie bei Elektronen von nicht zu schweren Atomen (d.h. rel. Atommasse << 1/a ª137) vorkommen, hinreichende Genauigkeit liefern. Der Erwartungswert der Energiekorrektur wird entsprechend der üblichen Transformation p Æ h /i — und mit Hilfe der ungestörten Wellenfunktionen des Wasserstoffatoms ausgerechnet DErel = -
p4 h4 * = y nlm — 4y nlm d 3 r . 3 2 3 2 Ú 8me c 8me c
(9.11)
Die hier nicht wiedergegebene Rechnung ergibt
43 Die Feinstrukturkonstanten für die drei übrigen Wechselwirkungen Gravitation, Schwache-Wechselwirkung und Starke-
Wechselwirkung betragen : a Grav = 0,5 10-40, a Schwach = 10 - 11, a Stark = 3,9. G. Fussmann , Atomphysik SS 2002
131
Das Wasserstoffatom im Detail
DErel = -
me c 2 1 3 ˆ Ê - 4˜ (Za )4 Á 3 Ë n (l + 1 / 2 ) 4 n ¯ 2
(9.12)
Fassen wir die beiden Korrekturen (9.8) und (9.12) zusammen, so fällt die Größe l heraus, und es ergibt sich ein Ausdruck, in dem nur noch die beiden Quantenzahlen n und j vorkommen me c 2 (Za )4 Ê 1 3ˆ DEFS = DEls + DErel = - ˜ Á 3 n Ë j + 1 / 2 4n ¯ 2
(9.13)
Diese Gleichung gibt die gesamte Feinstrukturaufspaltung des Wasserstoffatoms an. Den gleichen Ausdruck für DEFS erhält man im übrigen auch direkt aus der relativistischen Dirac-Gleichung. Dies - wie auch das Zusammenpassen der obigen Ausdrücke DErel und DEls - zeigt, daß der Spin seiner eigentlichen Natur nach ein relativistischer Effekt ist (und uns deshalb wohl so unanschaulich bleibt), wenngleich er bereits beim ruhenden Elektron in Erscheinung tritt. Schließlich können wir den Korrekturterm (9.13) mit dem unkorrigierten Termausdruck nach Gl. (4.19) En = - 1/2 me Z2 e4 /(4p e0 h n)2 zusammenfassen und die komplette Termenergie in der Form È (Za )4 Ê 1 3 ˆ˘ Enj = En Í1 + - ˜˙ Á n Ë j + 1 / 2 4n ¯ ˚ Î
(9.14)
angeben. Da En < 0 und wegen 1/(j+1/2) ≥ 1/(l+1) ≥ 1/n > 3/(4n), ist jeder Term abgesenkt, wie dies in der Abb. 9-3 dargestellt ist. Die Größenordnung der relativen Verschiebung beträgt DEFS /En ª (Z a) 2 / n = 5◊10-5 Z2/n. Bei gegebener Hauptquantenzahl haben die Terme mit gleicher Quantenzahl j die gleiche Energie. Dagegen sind die Terme mit gleicher Drehimpulsquantenzahl l > 1 aufgespalten. l=0
l= 1
l= 2
n=3
j = 5/2
j = 3/2 j = 1/2
j = 3/2 j = 1/2
n=2 j = 3/2 j = 1/2
j = 1/2
n=1 j = 1/2
Abb. 9-3: Feinstrukturaufspaltung der Wasserstoffniveaus n = 1, 2 , 3. Die erlaubten Übergänge der Balmer-(n = 3 Æ 2) und Lymanlinien (n = 2 Æ 1, 3 Æ 1) sind eingezeichnet. Die Aufspaltung zwischen den Niveaus j = 1/2 und j = 3/2 beträgt beim Wasserstoff 0,36 cm -1 und 0,11cm-1 für die Hauptquantenzahlen n = 2 bzw. n = 3. Wie später genauer dargelegt wird, zeichnen sich die erlaubten Übergänge durch die Bedingungen Dl = ±1und D j = 0, ± 1 aus. Man beachte, daß das Niveau n = 2, l = 0, j=1/2 (Termbezeichnung: 2 s1/2) nicht durch erlaubte G. Fussmann , Atomphysik SS 2002
132
Das Wasserstoffatom im Detail Strahlungsübergänge in den Grundzustand entvölkert werden kann. Es hat daher eine sehr lange Lebensdauer (metastabil) und zerfällt beispielsweise im Weltraum durch gleichzeitige Aus s endung von zw ei P hotonen. Gasatome, die durch Elektronenstoß zum Leuchten angeregt werden, sind in schneller thermischer Bewegung. Infolge des Doppler-Effektes kommt es daher zu einer charakteristischen Verbreiterung der ausgesandten Linienstrahlung (Doppler-Verbreiterung), die insbesondere beim leichten Wasserstoffatom sehr groß ist und die Beobachtung der Feinstrukturaufspaltung in gewöhnlichen Versuchsanordnungen unmöglich macht. Abb. 9-4: Ha-Spektrum des Wasserstoffs (nach Hänsch et al.). Oben: durch Doppler-Verbreiterung bei Raumtemperatur verschmiert. Unten: Spektrum unter Verwendung der dopplerfreien Spektroskopie. Die Feinstrukturaufspaltung der Balmer-Linien, die beim Wasserstoffatom etwa D l ª 0,01 nm beträgt, konnte demzufolge erst mit den modernen Methoden der dopplerfreien Spektroskopie nachgewiesen werden (Abb. 9-4). Hierbei experimentiert man prinzipiell mit zwei einander entgegenlaufenden Laserstrahlen, mit Hilfe derer der Doppler-Effekt auf verschiedene Weise eliminiert werden kann.
Abb. 9-5: Das Spektrum in der Umgebung von Lyman–a bei l ª 0,37 nm des wasserstoffähnlichen Ar17+. Die Feinstrukturkomponenten Lya1 und Lya2 sind deutlich getrennt. Auf der langwelligen Seite tritt eine Verunreinigungslinie von 32fach ionisiertem Molybdän auf. Noch weiter rechts liegen charakteristische Satellitenlinien, die durch Zwei-Elektronenrekombination (dielektronische Rek.) gebildet werden. Die Aufnahme wurde in einer Plasma-Hochtemperaturanlage (Tokamak) gewonnen (nach E. S. Marmar et al., Phys. Rev. A 33, 774 (1986)). Günstigere Bedingungen für die Beobachtung der Feinstruktur ergeben sich für hochgeladene, wasserstoffähnliche Ionen, da nach Gl. (9.14) die relative Aufspaltung der Linien Dl / l = - DE/E mit Z 2 rasch zunimmt. Abb. 9-5 zeigt als Beispiel hierfür eine Messung im weichen Röntgengebiet am wasserstoffähnlichen Ar+17, die mit Hilfe eines Kristallspektrometers an einer Hochtemperatur-Plasmaanlage (Tokamak) aufgenommen wurde. Die Spin-Bahn-Wechselwirkung tritt natürlich nicht nur beim Wasserstoffatom auf, sondern ist eine generelle Erscheinung bei allen Atomen. Sie führt zu einer Aufspaltung der Energieniveaus mit gleichem Bahndrehimpuls, die man ganz allgemein als Feinstruktur bezeichnet. Bei den meisten Atomen ist sie sogar wesentlich größer als beim Wasserstoffatom. So beobachtet man bei den Alkaliatomen - die ähnlich wie das H-Atom nur ein optisch aktives Elektron in der äußersten Schale besitzen - ebenfalls eine Dublettaufspaltung, die jedoch leicht meßbar ist und z.B. für das bekannte gelbe Na-Dublett ( 3s, 3p) bereits Dl = 0,7 nm beträgt. Außer Dubletts können sich bei G. Fussmann , Atomphysik SS 2002
133
Das Wasserstoffatom im Detail komplizierteren Atomen auch Tripletts, Quartetts, Quintetts usw. (allgemein Multipletts) ergeben, worauf wir in Kap.10 näher eingehen werden. 9.2
Hyperfeinstruktur
Neben der zuvor behandelten Spin-Bahn-Wechselwirkung, die die Feinstruktur der Spektren erklärt, gibt es noch zwei weitere - allerdings erheblich kleinere - Aufspaltungseffekte. Es sind dies die Hyperfeinstruktur und die sogenannte Lambshift. Die Hyperfeinstrukturaufspaltung kommt aufgrund der Wechselwirkung des Kernspins mit dem magnetischen Moment der Elektronenhülle zustande. Sie läßt sich für das Wasserstoffatom analog zur Feinstrukturaufspaltung behandeln, doch kann man die Größenordnung des Effekts leichter aus der klassischen Wechselwirkungsenergie der magnetischen Spinmomente von Proton und Elektron abschätzen. Hierfür hat man die Gleichung r r r r r r ( m e ◊ r )( m p ◊ r ) ˘ m0 È m e ◊ m p -3 E= ˙. r5 4 p ÍÎ r 3 ˚
(9.15)
Wie wir bereits gesehen haben, steht das von der Elektronenbewegung erzeugte Magnetfeld Bl (s. Gl. (9.2)) parallel zum Bahndrehimpuls und damit senkrecht zum Verbindungsvektor r = re - rP (und zur Geschwindigkeit). In diesem Magnetfeld richten sich beide Dipole entweder parallel oder antiparallel aus, so daß der zweite Term in Gl. (9.15) in jedem Fall verschwindet. Die Energieaufspaltung ist daher von der Größenordnung DE = 2
m0 m e m p . 4p r 3
(9.16)
Im allgemeinen Fall tritt der Gesamtdrehimpuls der Elektronenhülle an die Stelle des Bahndrehimpulses. Speziell für das Wasserstoffatom im Grundzustand (l = 0) handelt es sich um die Wechselwirkung der magnetischen Spinmomente von Elektron und Proton. In obiger Näherung ergibt sich DE ª 2
m0 2.79 mB2 = 1.1 ◊ 10 -6 eV , 3 4 p 1836 a0
(9.17)
was um den Faktor 16/3 ª 5 zu klein im Vergleich zum exakten Wert ausfällt. Der Grund für diese Diskrepanz liegt in erster Linie an der starken Wichtung der kleinen Abstände im Term in Gl. (9.16), der in Gl. (9.17) nicht Rechnung getragen wurde. Die Hyperfeinstrukturaufspaltung ist jedenfalls um mehr als eine Größenordnung kleiner als die Feinstrukturaufspaltung (|DEFS| ª 1,8◊104 eV). Sie spielt daher nur bei Experimenten mit extremer Auflösung (man benutzt Fabry-PerotInterferometer, seltener Lummer-Gehrke-Platten) eine Rolle. In den quantenmechanischen Rechnungen zur Hyperfeinstruktur betrachtet man die Kopplung der Drehimpulse der Elektronenhülle (J) mit dem Kerndrehimpuls (I). Sie ergeben den Gesamtvektor r r r F =J +I, dessen Eigenwerte wiederum durch = h [F(F+1)]1/2 bzw. = h MF Quantenzahlen F bzw. MF nehmen die Werte F = |J-I],…, J+I und MF = Berechnung vollzieht sich ganz analog zur Feinstrukturaufspaltung wie sie in wird. Die quantitative Berechnung des Aufspaltungsintervalls (d.h. die G. Fussmann , Atomphysik SS 2002
(9.18) gegeben sind. Die -F,…,+F an. Die Kap. 10 dargelegt Bestimmung der 134
Das Wasserstoffatom im Detail Konstanten C in Gl.(10.8))) ist jedoch in beiden Fällen schwierig und nur beim H-Atom exakt möglich. Für dessen Grundzustand fand E. Fermi das Ergebnis 8 8 1 DEHFS = m0 m e m p |y (0)|2 = m0 m e m p = 5.88 ◊ 10 -6 eV . 3 3 pa03
(9.19)
Anzumerken ist, daß diese Aufspaltung insbesondere wegen der endlichen Aufenthaltswahrscheinlichkeit des s-Elektrons im Kernbereich (|y(r=0)|2 = Z3/pa03 n3) relativ groß ist. Die geringe HFS-Grundzustandsaufspaltung von 5,87◊10- 6 eV des Wasserstoffatoms entspricht einer Frequenz von 1,4204 GHz bzw. einer Wellenlänge von 21 cm. Sie ist für die Astronomie von besonderer Bedeutung, da sie die Beobachtung von kalten Wasserstoffzonen im Universum anhand der charakteristischen 21cm-Radarstrahlung ermöglicht. Seit 1951 wird diese Strahlung an den verschiedensten Stelle der Erde mit Radioteleskopen aufgenommen und dokumentiert. Aus der Dopplerverschiebung dieser Strahlung läßt sich insbesondere die Geschwindigkeit der kalten Wasserstoffwolken in unserer Milchstraße bestimmen. Selbstverständlich gibt es auch bei anderen Elementen als dem Wasserstoff eine Hyperfeinstruktur. Bei schweren Atome werden die Verhältnisse in der Regel noch dadurch komplizierter, daß verschiedene Isotope mit unterschiedlichen Kernmomenten vorliegen können. Zu der gewöhnlichen Isotopieverschiebung infolge der unterschiedlichen reduzierten Massen kommt also noch eine zusätzliche Aufspaltung. Man spricht in diesem Fall von Isotopie-Hyperfeinstruktur. 9.3
Quantenelektrodynamische Effekte: die Lamb-Shift
Im Zeitraum 1947 bis 1952 führten die amerikanischen Physiker Lamb und Retherford Mikrowellenexperimente mit Wasserstoffatomen durch, die offenbarten, daß die von der DiracTheorie postulierte Feinstrukturentartung für gleiche j-Werte in Wirklichkeit nicht vorliegt. Die Versuche zielten zunächst darauf ab, durch Einstrahlung von Mikrowellen mit einer Frequenz von 10 GHz den Übergang zwischen dem metastabilen Zustand 2s1/2 und 2p3/2 zu induzieren44 . Der hierbei benutzte Versuchsaufbau ist in der Abb. 9-6 skizziert. Die in einem Ofen durch thermische Dissoziation erzeugten H-Atome werden durch einen Elektronenstrahl angeregt, wobei mit einer kleinen Wahrscheinlichkeit auch das 2s1/2-Niveau bevölkert wird. Um eine Mischung mit dem 2p1/2-Niveau zu vermeiden -was insbesondere sehr leicht durch elektrische Felder geschehen kannwird zusätzlich ein Magnetfeld angelegt. Treffen die metastabilen Atome auf eine Wolframoberfläche, so wird ihre Anregungsenergie von ca. 10 eV freigesetzt, was zu einer Absonderung von Elektronen führt und somit zum Nachweis ausgenutzt werden kann.
Ofen W-Elektrode H-Atome e
Abb. 9-6: Experiment von Lamb und Retherford zum Nachweis metastabiler HAtome.
Vorher können die metastabilen Atome jedoch Resonator beim Durchlaufen des im B-Feld Mikrowellenresonators abgeregt werden, und zwar dann, wenn die angelegte Frequenz in Resonanz ist ( h w = D E), so daß die Anregung in das Elektronenstrahl
A
44 Wir verwenden hier die spektroskopische Notation für Einelektronensysteme: z.B. in 2 p 3/2 gibt die erste Ziffer 2 die
Hauptquantenzahl n an. Der nachfolgende Buchstabe kennzeichnet den Bahndrehimpuls. Dabei steht s,p,d -wie bereits früher erläutert- für l = 0,1,2; der Index (hier 3/2) gibt den Gesamtdrehimpuls j in Einheiten von h an. G. Fussmann , Atomphysik SS 2002
135
Das Wasserstoffatom im Detail Niveau 2 p3/2 erfolgt, von wo aus die Atome innerhalb von 10-8 s in den Grundzustand zerfallen. In diesem Fall geht also der Detektorstrom der Wolframelektrode sehr stark zurück.Die Beobachtungen von Retherford und Lamb zeigten nun, daß eine derartige Resonanz nicht nur bei der erwarteten Frequenz von ª 10 GHz (DEFS = 4,53◊10-5 eV; entsprechend der Feinstrukturaufspaltung), sondern auch bei 1,05 GHz (DELamb = 4,31◊10-6 eV) auftrat. Dies mußte so gedeutet werden, daß diese kleinere Frequenz dem Energieunterschied zwischen den Niveaus 2s1/2 und 2p1/2 zuzuordnen ist. Inzwischen ist diese Energiedifferenz (sowie die entsprechenden Aufspaltungen bei anderen Niveaus des H-Atoms) sehr genau vermessen worden. Sie beträgt in Wellenzahlen 0,035 cm -1. Die Wirkung des Magnetfelds geht aus den Abb. 9-7 und Abb. 9-8 hervor. Aufgrund der ZeemanAufspaltung werden die Resonanzfrequenzen von der Magnetfeldstärke abhängig. Man stellt nun jeweils eine bestimmte Frequenz ein (Punkte) und variiert B, bis die Resonanz am Minimum des Elektronenstromes am W-Bleches beobachtet wird. Die Extrapolation zu B Æ 0 ergibt die gesuchten Frequenzwerte.
Abb. 9-7: Zeeman-Aufspaltung 2 2S und 2 2PTerme des Wasserstoffts.
Abb. 9-8: Resonanz-Frequenzen als Funktion des Magnetfeldes.
Die Linienstrahlung des Wasserstoffatoms wird damit bei höchster Auflösung recht kompliziert. Bohr n=2
Feinstruktur
Q. E.D.
l =1
l= 1
Abb. 9-9: Levelaufspaltung des n= 2-Niveaus j = 3/2
So ergibt sich beispielsweise anstelle der ehemals einen Ha-Linie ein Satz von l= 0 j = 1/2 l = 0, 1 insgesamt sieben Linien, wovon jedoch zwei j= 1/2 l= 1 sehr schwach sind und gewöhnlich nicht aus dem Rauschen hervortreten (s. Abb. 9-4). In der Abb. 9-9 wird, ausgehend vom -1 Lambshift: 0,035 cm Bohrschen Termwert, die Aufspaltung des n = 2-Niveaus in der Feinstrukturnäherung und unter Berücksichtigung der Lamb-Shift dargestellt. Obwohl die Lamb-Shift ein sehr kleiner Effekt ist, kann dennoch ihre Bedeutung kaum überschätzt werden. Er läßt sich quantitativ deuten mit Hilfe der Quantenelektrodynamik (Q.E.D.), die die Quantisierung der elektromagnetischen Felder berücksichtigt. Hiernach kommt die Wechselwirkung geladener Teilchen durch Austausch von Photonen zustande, die allerdings nicht frei in Erscheinung treten und deshalb als virtuelle Photonen bezeichnet werden. Ein Elektron im Potentialfeld des Atomkerns emittiert und absorbiert ständig Photonen unter kurzzeitiger Verletzung G. Fussmann , Atomphysik SS 2002
136
Das Wasserstoffatom im Detail des Energiesatzes, aber im Rahmen der Energieunschärferelation (DE ª h /Dt). Hierdurch kommt es zu einer Verschmierung der ursprünglich punktförmig angenommenen Ladungsverteilung des Elektrons über eine sogenannte Compton-Wellenlänge D = h / m0 c = 3,86◊10-13 m. Das hat eine Veränderung des Potentialmittelwertes ~ <(r+dr)-1> zur Folge. Dazu kommt noch der Prozeß der sogenannten Vakuumpolarisation, bei dem das Austauschquant ein virtuelles Elektron-PositronPaar bildet, was zu einer geringfügigen Abschirmung der Ladung des Elektrons führt. Insgesamt ergeben sich hierdurch bei sehr kleinen Distanzen Abweichungen vom exakten Coulomb-Potential (r -1), was andererseits nach Kap. 7 für die Bahndrehimpuls-Energieentartung verantwortlich war. Diese Effekte sind nur für s-Elektronen (l = 0) von Bedeutung, da nur diese eine hohe Aufenthaltswahrscheinlichkeit in Kernnähe besitzen. Entscheidend ist dabei die hohe elektrische Energiedichte in der Nähe des Kerns. Je größer die Energiedichte, umso wahrscheinlicher wird auch die spontane Bildung von Teilchen und Anti-Teilchen quasi aus dem Nichts. Das mit Energie angefüllte Vakuum weist somit Fluktuationen auf, die nicht nur virtuelle Photonen, sondern auch Teilchen entstehen lassen. Je schwerer (d.h. energiereicher: E = m c2) diese sind, umso seltener ist ihre Erzeugung bzw. umso kürzer ist ihre Lebensdauer. So verstehen wir auch die Umwandlung der Elementarteilchen in andere Teilchen in den Hochenergie-Experimenten: Bei der Wechselwirkung von langsamen Positronen und Elektronen kommt es lediglich zur Zerstrahlung in zwei g-Quanten von jeweils 0.511 MeV, was insgesamt der Ruhenergie der Teilchen entspricht. Beschleunigen wir jedoch beide Teilchen auf sehr hohe Energien (GeV-Bereich), so bilden sich beim Stoß zahlreiche neue Teilchen (u.a. Quarks und Antiquarks). Aufgrund dieser Überlegungen erwartet man auch eine Zunahme der Lambshift bei den schweren Kernen mit hoher Ladung. Dies konnte tatsächlich durch Messung an den wasserstoffähnlichen Ionen von beispielsweise Au71+ oder U91+ gezeigt werden, bei denen die Lambshiftaufspaltung auf 202 eV bzw. 470 eV ansteigt. Die Experimente bestätigen mit großer Genauigkeit die theoretische Relation DELamb (n) =
a (aZN )4 F(aZN ) me c 2 , 3 p n
(9.20)
worin, n die Hauptquantenzahl, ZN die Kernladungszahl, a die Feinstrukturkonstante und F eine schwach variierende Funktion (2 £ F£ 10) darstellt. Die elektromagnetische Wechselwirkung kann durch Feynman-Graphen veranschaulicht werden. Hierbei werden die Ereignisse in einem Raum-Zeit-Diagramm45 dargestellt. In der Abb. 9-10 ist der Effekt der Coulomb-Streuung, bei dem zwei Elektronen ein Photon austauschen, in einem solchen Diagramm dargestellt. Abb. 9-11 zeigt den Compton-Effekt, der als inelastische Streuung eines Photons im Coulomb-Feld eines Elektrons zu betrachten ist. Nach der Streuung haben sowohl das Elektron als auch das Photon ihre Energien geändert. Im Vergleich hierzu sind die zur Lamb-Shift beitragenden Effekte von höherer Ordnung, da hierbei jeweils zwei Photonen im Spiel sind. Die oben genannten Effekte der Photonenemission und -absorption und der Vakuumpolarisation sind in den Abb. 9-12 und Abb. 9-13 skizziert. Bei höheren Ansprüchen an die Genauigkeit sind noch weitere Effekte, d.h. mehr als Zwei-Photonenprozesse zu berücksichtigen, was zu einer raschen Steigerung des Rechenaufwandes führt.
45 Diese aus der Relativitätstheorie entnommenen Darstellungen sind eigentlich 4-dimensional aufzufassen. In der bildlichen Darstellung beschränkt man sich auf eine Ortskoordinate als Abszisse und die Zeitkoordiante (häufig auch c t) als Ordinate.
G. Fussmann , Atomphysik SS 2002
137
Das Wasserstoffatom im Detail Zeit
Zeit
h n' e
e'
e hn
hn e
e
e Ort
Abb. 9-10: Feynman-Graph für die Coulomb-Streuung zweier Elektronen. Zeit
Ort
Abb. 9-11: Graph des Compton-Effekts. Zeit p
e
+
e
e e
p
e
Ort
Abb. 9-12: Elektron-Proton-Wechselwirkung durch Emission und Absorption virtueller Photonen (n. Feynman).
G. Fussmann , Atomphysik SS 2002
Ort
Abb. 9-13: Elektron-ProtonWechselwirkung bei der ein virtuelles Elektron-Positron-Paar entsteht.
138
Vektoraddition der Drehimpulse
10 VEKTORADDITION DER DREHIMPULSE 10.1 Russel-Saunders-Kopplung und j-j-Kopplung Bisher haben wir fast ausschließlich das Wasserstoffatom und die ihm ähnlichen Ionen betrachtet. Im folgenden wollen wir nun zur Behandlung von Mehrelektronensystemen übergehen. Dabei soll nicht versucht werden, die Schrödinger-Gleichung für ein derartiges Vielkörpersystem zu lösen, was nur mit numerischen Näherungsverfahren möglich ist, sondern wir werden uns der Feinstruktur der Spektren zuwenden, die eine charakteristische Signatur für jedes Atom darstellt. Hierbei sind zwei Grenzfälle zu unterscheiden: I) Bei den leichten Atomen ist die Coulomb-Abstoßung der Elektronen untereinander wesentlich stärker als die Spin-Bahn-Wechselwirkung eines jeden Teilchens mit sich selbst. Letztere können wir dann in erster Näherung vernachlässigen und die Spins und Bahnen als getrennte Systeme behandeln, wie wir das in Kap. 7 bei der Behandlung des H-Atoms getan haben. Andererseits sind wegen der starken Coulomb-Abstoßung die Spins und Bahndrehimpulse der einzelnen Elektronen keine Erhaltungsgrößen mehr, wohl aber die Summen aller Spins und aller Bahndrehimpulse, die wir mit großen Buchstaben kennzeichnen r N r L = Â li
r N r S = Â si i=1
(10.1)
i=1
Darüber hinaus ist der Gesamtdrehimpuls r r r J = L+S
(10.2) r auch rnoch in zweiter Näherung eine Erhaltungsgröße, wenn also eine Kopplung zwischen L und S berücksichtigt wird. Diesen Grenzfall der schwachen Kopplung bezeichnet man nach seinen Erfindern als Russel-Saunders-Kopplung. II) Bei sehr schweren Atomen kann man den entgegengesetzten Grenzfall der j-j-Kopplung realisiert finden. In diesem Fall ist die Spin-Bahn-Kopplung stark im Vergleich zur CoulombAbstoßung. In erster Näherung bleibt daher der Gesamtdrehimpuls jedes einzelnen Elektrons r r r ji = li + si
(10.3)
erhalten. Der Gesamtdrehimpuls ist wiederum auch in zweiter Näherung, d.h. nach Einschalten der Coulomb-Abstoßung, erhalten r N r J = Â ji
(10.4)
i =1
In einigen Fällen kann weder die Russel-Saunders- noch die j-j-Kopplung als brauchbare Näherung verwandt werden, so daß sich die Atomstruktur einer vereinfachenden Deutung entzieht. In den meisten Fällen jedoch ist die Russel-Saunders-Kopplung, die man auch als L-S-Kopplung bezeichnet, eine gute Näherung. Im folgenden werden wir uns auf diesen Fall konzentrieren. Die Änderung der Termenergien r können wir ganz analog zur Spin-Bahn-Wechselwirkung r r betrachten. r r r An die Stelle von s und l treten jetzt die Summenvektoren L und S . Ebenso ist j durch J zu G. Fussmann , Atomphysik SS 2002
139
Vektoraddition der Drehimpulse r r r ersetzen. Die Erhaltungsgrößen sind J 2 , L2 , S 2 und J z mit den entsprechenden vier Quantenzahlen J, L, S, MJ. Die sogenannte magnetische Quantenzahl MJ kann - analog zu mj - die 2J+1 Werte M J = - J , -( J - 1),º ,( J - 1), J
(10.5)
annehmen. Bei gegebenen L und S kann J selbst alle Werte annehmen, die durch r r Quantenzahlen Addition der Vektoren L und S einen Vektor J mit den Eigenwerten | J |= [J (J+1)]1/2 h und Jz = MJ h erzeugen. Ist S £ L, so sind dies die (2S+1) Werte J = (L - S),(L - S + 1),º , L + S .
(10.6)
Im anderen Fall, S ≥ L, hat man die (2L+1) Möglichkeiten
J = S - L, S - L + 1,ºS + L .
(10.7)
Beide Fälle kann man durch J = |L-S|,…,(L+S) zusammenfassen. Die Berechnung der Energieaufpaltung vollzieht sich ähnlich zu der in Kap.9 durchgeführten Ableitung. Wiederum ist die Aufspaltungsenergie proportional zum Spin-Bahn-Skalarprodukt 2 Ê mB ˆ r r DE = 2C L◊S , Ë h¯
( )
(10.8)
wobei wir die Unkenntnis des Absolutwertes in geeigneter Weise durch den Vorfaktor ausgedrückt haben. Die Konstante C kann – je nach Atom – positive und negative Werte annehmen. Das Skalarprodukt drücken wir unter Verwendung von r r r r r r r J 2 = (L + S )2 = L2 + S 2 + 2L ◊ S
(10.9)
durch die Quantenzahlen J, L, und S aus und erhalten so DEJ = CmB2 [ J ( J + 1) - L(L + 1) - S(S + 1)] .
(10.10)
Für vorgegebene Werte von L und S ergibt sich jetzt entsprechend den verschiedenen Realisierungsmöglichkeiten von J nach Gl. (10.6) bzw. (10.7) ein Satz von dicht beieinanderliegenden Energiewerten, ein sogenanntes Multiplett. Beim Wasserstoff und den Alkaliatomen waren dies Dubletts. Im allgemeinen können wir Singuletts, Dubletts, Tripletts, Quartetts, Quintetts, Sextetts, usw. erhalten. Der Abstand zwischen zwei aufeinanderfolgenden Komponenten eines Multipletts ist proportional zu J DEJ - DEJ -1 = 2CmB2 J .
(10.11)
Diese Landésche Intervallregel gibt die Möglichkeit, die J-Werte und damit auch die Terme (bei geringer Aufspaltung) aus spektroskopischen Messungen zu bestimmen. Man beachte aber, daß obige Multiplettaufspaltung sich auf die Terme bezieht und nicht auf die Linienspektren, die ja durch Übergänge zwischen verschiedenen Termen eines Multipletts zustande kommen. So führt beispielsweise der in Abb. 9.3 dargestellte Übergang zwischen den Dubletts (n = 3, l =2) Æ (n = 2, l =1) zur Emission von drei Linien (Linientriplett).
G. Fussmann , Atomphysik SS 2002
140
Vektoraddition der Drehimpulse 10.1.1
NOMENKLATUR DER TERME
Für die spektroskopische Analyse ist eine sinnvolle Notation äußerst wichtig. In Verallgemeinerung der bereits erwähnten Notation für Einelektronensysteme schreibt man einen Term eines Vielelektronensystems in der Form 2S+1 L
J
, wobei für L = 0, 1, 2, 3, 4… die (jetzt großen) Buchstaben S, P, D, F, G… eingesetzt werden. Die Multiplizität des Terms beträgt nach Gl. (10.6) 2S+1; diese Zahl wird als vorangestellte Hochzahl angegeben (in den selteneren Fällen mit S > L, spricht man dann von einer nicht voll entwickelten Multiplizität). Der Term 3P 1/2 (sprich: Triplett P 1/2) bedeutet danach : S = 1, L = 1 und J = 1/2. Zusätzlich zur Angabe des Terms wird gewöhnlich noch die Elektronenkonfiguration angegeben. Die Zahl k der zu einer Hauptquantenzahl n und Drehimpulsquantenzahl l vorhandenen Elektronen wird als Exponent geschrieben (nlk). So lautet beispielsweise die volle Notation des Grundzustandes des Vanadiumatoms: 1s 2 2s 2 2p 6 3s 2 3p6 3d 3 4s 2 4F 3/2. Das bedeutet: es gibt 2 Elektronen in der n = 1-Schale mit dem Drehimpuls l = 0, ferner in der n=2Schale acht Elektronen, davon zwei mit l = 0 und sechs mit l = 1, in der n=3-Schale befinden sich drei Elektronen mit l = 2, sechs mit l = 1, zwei mit l = 0 und schließlich gibt es noch zwei Elektronen in der n= 4-Schale mit dem Bahndrehimpuls l = 0. Alle diese Elektronen addieren sich in diesem Fall zu einem Gesamtbahndrehimpuls L = 3 und einem Gesamtspin S = 3/2, was gemäß 2◊3/2 + 1 = 4 zu einem Quartett führt; diese beiden Drehimpulse S, L wiederum sind im Grundzustand so gekoppelt, daß der Gesamtdrehimpuls J = 3/2 beträgt. Meistens gibt man nur die äußeren, wesentlichen Elektronen an. So z.B. beim Grundzustand des Molybdäns: 4d5 5s 7S3. Häufig schreibt man noch die Konfiguration des Ausgangsterms in eckigen Klammern voran, wie beispielsweise np n’p [1P] n’’p 2S, was bedeutet: Zwei p-Elektronen mit den unterschiedlichen Hauptquantenzahlen (oft Schalen genannt) n und n’ koppeln zum Term 1P und ein drittes p-Elektron in der Schale n’’ bildet mit diesen den Term 2 S. Zur Charakterisierung des Ausgangsterms wird auch oft die Atomkonfiguration angegeben, wie etwa in Ba41+ ([Mg] 3p 3d 4s). In Worten heißt das: 41fach ionisiertes Barium mit einer magnesiumähnlichen Ausgangskonfiguration und drei zusätzlichen Elektronen, zwei in der n = 3 Schale mit Bahndrehimpuls 1 und 2 und eins in der n=4-Schale mit Bahndrehimpuls null. Bei Atomen mit mehreren wesentlichen Elektronen können auch mehrere Multipletts vom gleichen Typ (sogenannte gestrichene Terme) vorkommen46. Wichtig ist im Zusammenhang mit den Auswahlregeln die Parität der Terme. Ist die Parität eines Terms ungerade, so wird dies durch ein kleines hochgestelltes „o“ (engl. odd: ungerade) gekennzeichnet . Von den beiden Termen 2P 0 und 2P ist also der erste ungerade, der zweite gerade (das analoge hochgestellte „e“ für even (gerade) wird gewöhnlich nicht angegeben). Bei der j - j - K o p p l u n g verwendet man bei zwei Elektronen mit den Einzeldrehimpulsquantenzahlen j1, j2 und der Gesamtdrehimpulsquantenzahl J die Termnotation [j1, j2]J. Eine spezielle Notation verwendet man insbesondere bei den E d e l g a s e n . Hier koppelt das angeregte Elektron mit Bahndrehimpuls l an den Atomrumpf mit Drehimpuls j und bildet den Drehimpuls K = j + l . Die Hinzunahme des Elektronenspins s = 1/2 führt schließlich zu den Gesamtdrehimpulsen J = K±1/2. Die Terme werden dementsprechend in der Form 2S+1LJ nl [K]J angegeben.
46 So gibt es beispielsweise beim Kalzium mit zwei äußeren Elektronen die üblichen Singuletts 4s2 1S , 4s np 1P , 4s nd 1D , 0 1 2 4s nf 1F3 und Tripletts 4s2 3S1, 4s np 3P0,1,2, 4s nd 3D 1,2,3, 4s nf 3F2,3,4 mit n ≥ 4 (zusätzlich n = 3 beim Singulett 1D 2). Alle Tripletts mit L > 0 treten aber nochmals auf – als gestrichene Terme –, wobei aus dem 4s ein 3d-Elektron geworden ist (3d nd 3 P und 3d np mit 3P, 3D und 3F -Termen). Die entsprechende 3d-Seriengrenze liegt um 13711 cm-1 über der normalen 4sSeriengrenze (50 000 cm-1).
G. Fussmann , Atomphysik SS 2002
141
Vektoraddition der Drehimpulse 10.1.2
SPEKTROSKOPISCHER WECHSELSATZ UND 3. HUNDSCHE REGEL
Da – nach Definition – die Multiplizität durch die Gesamtspinzahl S festgelegt ist, haben Atome mit gerader Elektronenzahl ungerade Multiplizität (d.h. Singletts, Tripletts usw.), während bei ungerader Elektronenzahl die Multiplizität gerade ist (Dubletts, Quartetts usw.). Dieser Sachverhalt wird gelegentlich auch als spektroskopischer Wechselsatz bezeichnet. Ein Zweielektronensystem kann danach beispielsweise ein Triplett aufweisen, wie es in Abb. 10-1 dargestellt ist. Im abgebildeten Fall spricht man von einem regulären Triplett, da der Term mit J = 1 am niedrigsten liegt. Bei Atomen, deren äußere Schale mehr als zur Hälfte gefüllt ist (nach dem später zu behandelnden Pauli-Prinzip), ist dies umgekehrt, und das energetisch niedrigste Niveau ist dasjenige mit der höchsten J-Zahl. Dieser auch als 3. Hundsche Regel bezeichnete Befund läßt sich wie folgt ausdrücken: Schalen, die höchstens halb gefüllt sind, haben den Term 2S+1L J = |L-S|. Im anderen Fall lautet ihr Term 2S+1L J = L+S. Diese Regel läßt sich qualitativ verstehen, die Erklärung würde uns hier aber zu weit von der augenblicklichen Thematik entfernen.
10.1.3
J=3
3 D 3
J=2
3 D2
J=1
3D 1
2 E = +4 C m 3 B 2 E = -2C m B 2 2 E=-6Cm B 1
Abb. 10-1: Feinstrukturaufspaltung eines Triplettterms mit L = 2. Man beachte die Aufspaltung der beiden Abstände im Verhältnis 6:4 =3:2, entsprechend der Landéschen Intervallregel.
STATISTISCHE GEWICHTE
Schließlich möge zur Veranschaulichung einiger der möglichen Terme eines Zweielektronensystems die untere Tabelle dienen. In der vorletzten Zeile ist der Entartungsgrad gJ des jeweiligen Terms entsprechend zu g = 2J+1 eingetragen. Diese energetische Entartung ergibt sich aus dem Zusammenfallen der Terme mit gleichem Mj = -J…+J, welche erst durch Anlegen eines äußeren Magnetfelds aufgehoben werden kann. Man bezeichnet MJ deshalb auch als magnetische Quantenzahl.. Der Entartungsgrad gJ wiederum wird gewöhnlich als das s t a t i s t i s c h e G e w i c h t des Zustands bezeichnet. Es ist von großer Bedeutung für die Intensität der Spektrallinien und ist überhaupt eine wichtige Größe bei vielen atomphysikalischen Erscheinungen. In diesem Zusammenhang ist wichtig, daß jeder der energetisch zusammenfallenden Terme mit gleichem J aber unterschiedlichem MJ mit gleicher Wahrscheinlichkeit durch Elektronenstoß besetzt wird. Die Zahl der Atome in einem bestimmten JZustand ist dann direkt proportional zu 2J+1. Ferner ist das Verhältnis der Atomzahlen in zwei verschiedenen J-Zuständen – bei sehr hoher Temperatur der Elektronen – gleich dem Verhältnis der statistischen Gewichte: N 1/N2 = g1/g2 =(2J1+1)/(2J2+1). Bei endlicher Temperatur kommt der bekannte Boltzmann-Faktor hinzu und wir erhalten N 1 g1 = e N 2 g2
E 2 - E1 kTe
2J + 1 = 1 e 2 J2 + 1
E 2 - E1 kTe
.
(10.12)
Für viele Multipletts ist aber die Energieaufspaltung sehr gering im Vergleich zur thermischen Energie der Elektronen, so daß der Exponential-Faktor in Gl. (2.14) praktisch eins ist.
G. Fussmann , Atomphysik SS 2002
142
Vektoraddition der Drehimpulse S 0
2S+1 1
1
3
L 0 1 2 0 1
J 0 1 2 1 2 1 0
Term 1 S0 1 P1 1 D2 3 S1 3 P2 3 P1 3 P0
Komponenten 1 1 1 147) 3
statist. Gewicht: gJ = 2J+1 1 2 3 3 5 3 1
Multiplett Singulett “ “ "Triplett" Triplett
Tabelle 10-1: Termsystematik eines Zweielektronenatoms.
10.1.4
ÜBERGANG VON LS- ZUR JJ-KOPPLUNG
In der Abb. 10-2 ist die Energieaufspaltung der Terme beim Übergang von leichten zu schweren Atomen dargestellt, die durch ein p und ein s Elektron erzeugt werden (Konfiguration: n p 1, (n+1) s1 mit n = 2, 3, 4, 5, 6). Beim Kohlenstoff koppeln die Drehimpulse der beiden Elektronen (2p, 3s) zum Gesamtbahndrehimpuls L = 1, und Gesamtspin S = 0 oder S = 1. Hieraus ergeben sich in der LS-Kopplung das Singulett 1P 1 und das Triplett 3 P 0,1,2. Mit zunehmender Spin-BahnWechselwirkung bei Si, Ge und Sn kommt es zur Vergrößerung der Feinstrukturaufspaltung. Abb. 10-2:Energieaufspaltung beim Übergang von LS-Kopplung zu jj-Kopplung. Man beachte, daß durchweg die Gesamtzahl der Komponenten (4) erhalten bleibt. Beim Germanium ist noch näherungsweise die Landésche Intervallregel (Verhältnis 2:1 bei den beiden unteren Energiedifferenzen) erfüllt. Beim Blei dagegen beobachten wir eine näherungsweise symmetrische Aufspaltung, die der jj-Kopplung entspricht. Die Drehimpulse der Elektronen können dann entweder gleich (j1 = 1-1/2 =1/2, j2 = 0+1/2 = 1/2) oder verschieden sein (j1 = 1+1/2 =3/2, j2 = 0+1/2 = 1/2). Das macht den Hauptunterschied in der Energieaufspaltung aus. In zweiter Ordnung ergeben sich Unterschiede durch die unterschiedliche Kopplung der beiden Drehimpulse zu J = 0,1 im ersten Fall und J = 1, 2 im zweiten Fall (entsprechend J = |j1 -j2|,…,j1+j2). 10.2 Der Landé-Faktor Bei der Berechnung der Energieterme eines Atoms im Magnetfeld (Zeeman-Effekt) und auch in anderen Zusammenhängen benötigt man das magnetische Dipolmoment. In Kap.8 haben wir uns schon damit befaßt und die Relationen r r l m = - mB h
r r s bzw. m = -2 mB h
(10.13)
für Elektronen mit reinem Bahndrehimpuls (gl = 1) und reinem Spin (gs = 2) gefunden. Diese Beziehungen müssen wir jetzt verallgemeinern für beliebige Atome mit den Drehimpulsquantenzahlen L, S und J. Die Verhältnisse können wir recht gut mit Hilfe des Vektormodells veranschaulichen, wo nach oben wieder, wie früher, die Drehimpulse aufgetragen
47 Dieser Term ist unvollständig entwickelt.
G. Fussmann , Atomphysik SS 2002
143
Vektoraddition der Drehimpulse sind (Abb. 10-3). In jeweils entgegengesetzter Richtung tragen wir analog zu Gl. (10.13) die Vektoren r r L mL = - mB h
bzw.
r r S mS = -2 mB h
(10.14)
an. z-Achse s
Abb. 10-3: Vektormodell zur Berechnung des LandéFaktors
J L
mj,z m mJ
r wir den Vektor m J aus
Wir stellen fest, daß aufgrund des anomalen Spinfaktors gs = 2 der resultierende Vektor m nicht kollinear mit dem Vektor J ist. Da aber, wie wir gesehen hatten, die Vektoren L und S mit hoher Geschwindigkeit r um J präzedieren, kommt auch nur dem zu J parallelen Vektor m J eine Bedeutung zu. Schließlich aber präzediert auch dieser Vektor (mit einer relativ langsamen Frequenz) bei vorhandenem Bz-Feld um die z-Achse. r r Die Projektion mjz bestimmt die Energieaufspaltung gemäß DE = - m j ◊ B = mjz B z. Wir berechnen nun diese Projektionsgröße. Zunächst erhalten
r r r r r r r r r Ê - mB (L + 2S ) J ˆ J r r J mB Ê ( J + S ) ◊ J ˆ r J r mJ = (m ◊ r ) r = Á ◊ r )˜ r = - Á ˜J. h h Ë |J | |J | Ë |J | ¯|J | J2 ¯
(10.15)
Diesen projizieren wir auf die z-Achse (Richtung von B) r r r r r r r r r r r r r mB ( J + S ) ◊ J J 2 + S ◊ (S + L) J 2 + S2 + S ◊ L r r r m Jz = m J ◊ ez = J z = - m B Mz = - m B Mz .(10.16) h J2 J2 J2 Hierin drücken wir das Skalarprodukt S◊L mit Hilfe der Idendität (10.9) aus und erhalten r r r r r r r È S 2 + ( J 2 - L2 - S 2 )/ 2 ˘ È ( J 2 - L2 + S 2 ) ˘ r r m Jz = - mB Mz Í1 + ˙ = - mB Mz Í1 + ˙ | J |2 2| J |2 Î ˚ Î ˚
(10.17)
Der in der eckigen Klammer stehenden Ausdruck nennt man Landé-Faktor. Ausgedrückt durch die Quantenzahlen lautet er gJ = 1 +
J ( J + 1) + S(S + 1) - L(L + 1) 2 J ( J + 1)
(10.18)
Mit seiner Hilfe schreibt sich die Energieaufspaltung im Magnetfeld r r DE = - m J ◊ B = mB M J g J B
(10.19)
Man überzeugt sich sofort, daß der Landé-Faktor die Grenzfälle für S = 0 (also J = L) und L = 0 (also J = S) mit gL = 1 und gS = 2 richtig beschreibt. G. Fussmann , Atomphysik SS 2002
144
Vektoraddition der Drehimpulse Für einige Terme (wie 4D1/2 und 5F 1) ist gJ = 0. Sie spielen in der Meßtechnik gelegentlich eine Rolle, da bei optischen Übergängen zu diesen Termen der normale Zeeman-Effekt auftritt. Bei der unvermeidlichen Zeeman-Aufspaltung im Magnetfeld kann dann mit Hilfe eines Polarisationsfilters eine Spektrallinie im Spektrum (p-Komponente) isoliert werden, was für Temperaturmessungen über die Doppler-Verbreiterung natürlich erwünscht ist. 10.3 Clebsch-Gordon-Koeffizienten und Wigner-3J-Symbole Die vorausgehende semi-quantitative Betrachtung der Drehimpulsaddition im Rahmen des Vektormodells findet ihre Rechtfertigung in der analytischen Beschreibung, die wir im folgenden umreißen werden. Die hierbei auftretenden Clebsch-Gordon-Koeffizienten und Wigner-3JSymbole sind für die gesamte quantitative Spektroskopie von großer Bedeutung. Wir betrachten die Zustandsvektoren |j1,m1> und |j2,m2> zweier unterschiedlicher Drehimpulszustände, die sich entweder auf zwei verschiedene Elektronen oder auch auf ein und dasselbe Elektron, dann als Bahndrehimpuls und Spin, beziehen mögen. Wichtig ist die Annahme, daß der erste Zustand ein Eigenzustand zu den Operatoren j12 , j1z mit den Eigenwerten j1(j1+1) h 2 und m1 h ist; ebenso soll der zweite die nämlichen Eigenschaften für den Index 2 aufweisen. Wir fragen uns nun, welche Zustände wir mit den Produkten |j1,m1> |j2,m2> herstellen können. Lassen wir den Summenoperator der z-Komponenten ( j1 z + j2 z ) hierauf einwirken, so wirkt der erste nur auf |j1,m1>, der zweite nur auf |j2,m2> und wir erhalten ( j1z + j2 z ) j1 , m1 j2 , m2 = ( m1 + m2 )h j1 , m1 j2 , m2 .
(10.20)
Damit ist dieser Produktzustand ein Eigenzustand des Operators jz = ( j1 z + j2 z ) mit dem Eigenwert r r r m = m1 + m 2. Wie verhält es sich nun aber, wenn wir den Operator j 2 = ( j1 + j2 )2 auf unseren Produktansatz wirken lassen? davon ausgegangen werden, r r Dabei soll im Sinne rder r LS-Kopplung r r daß die beiden Opertoren j1 , j2 vertauschbar sind ( j1 j2 = j2 j1 ). Wir erhalten dann zunächst r r r r rr ( j1 + j2 )2 j1 , m1 j2 , m2 = ( j12 + j22 + 2 j1 j2 ) jr1 ,rm1 j2 , m2 = . [ j1 ( j1 + 1) + ( j2 ( j2 + 1)]h2 j1 , m1 j2 , m2 + 2 j1 j2 j1 , m1 j2 , m2
(10.21)
Hier ergibt sich die Notwendigkeit, das Operatorprodukt r r j1 j2 = j1x j2 x + j1y j2 y + j1z j2 z
(10.22)
zu behandeln. Dazu benötigt man die sogenannten Leiteroperatoren, die gemäß j± : = jx ± i jy
(10.23)
definiert sind und bei Einwirkung auf den Eigenzustand folgende Eigenschaften besitzen48 j± | j , m >= h j ( j + 1) - m( m ± 1) | j , m ± 1 > .
(10.24)
Offensichlich erzeugen sie neue Zustände, deren z-Komponente um 1 h erhöht (solange m < j) bzw. erniedrigt (solange -m < j) sind. Mit ihrer Hilfe lassen sich die benötigten Opertoren jx und jy wie folgt ausdrücken 48 Hiervon kann man sich anhand der Bahndrehimpulsoperatoren nach Gl. 7.23 explizit überzeugen.
G. Fussmann , Atomphysik SS 2002
145
Vektoraddition der Drehimpulse
jx =
1 (j+ + j- ); 2
jy =
1 (j+ - j- ) . 2i
(10.25)
Gehen wir hiermit in die Gl. (10.22) hinein, so erhalten wir r r ( j1 + j2 )2 j1 , m1 j2 , m2 = h 2 [ j1 ( j1 + 1) + j2 ( j2 + 1) + 2m1m2 ] j1 , m1 j2 , m2 + , (10.26) +(j1+ j2 - + j1- j2 + ) j1 , m1 j2 , m2 was explizit auf r r ( j1 + j2 )2 j1 , m1 j2 , m2 = h 2 [ j1 ( j1 + 1) + j2 ( j2 + 1) + 2m1m2 ] j1 , m1 j2 , m2 + + h 2 j1 ( j1 + 1) - m1 (m1 + 1) j2 ( j2 + 1) - m2 (m2 - 1) j1 , m1 + 1 j2 , m2 - 1
(10.27)
+ h 2 j1 ( j1 + 1) - m1 (m1 - 1) j2 ( j2 + 1) - m2 (m2 + 1) j1 , m1 - 1 j2 , m2 + 1 hinausläuft. Für den Fall m1 = j1 und m2 = j2 entfallen die beiden letzten Terme und wir haben die Eigenwertgleichung r r ( j1 + j2 )2 j1 , m1 j2 , m2 = h 2 [ j1 ( j1 + 1) + j2 ( j2 + 1) + 2 j1 j2 ] j1 , m1 j2 , m2 = h 2 ( j1 + j2 )( j1 + j2 + 1) j1 , m1 j2 , m2
.
(10.28)
mit dem Eigenwert j = j1 + j2. Der gleiche Eigenwert für j ergibt sich für m1 = -j1 und m2 = -j2. Im allgemeinen jedoch ist die Gl. (10.26) keine Eigenwertgleichung. Um solche zu erhalten, muß man mehrere Produktzustandsvektoren |j1j2m1m2>: = |j1,m1> |j2,m2> mit unterschiedlichen m 1, m2Werten superponieren. Damit jeder von ihnen den gleichen Eigenwert für die z-Komponente aufweist, hat man als Nebenbedingung m = m1 + m2 zu beachten. Die entsprechende Zusammensetzung der normierten Zustandvektoren lautet dann j, m =
ÂC
jm m1 m 2
j1 j2 m1m2 .
(10.29)
m1 , m 2
Die hierin auftretenden Koeffizienten Cjmm1,m2 heißen Clebsch-Gordon-Koeffizienten. Sie genügen der Bedingung Cjmm1 m2 = 0, falls nicht m1 + m2 = m und |j1 -j2| £ j £ j1 + j2. Multipliziert man Gl. (10.29) mit dem Bra-Vektor <j’,m’|, so sieht man, daß aufgrund der Orthonormalität die ClebschGordon-Koeffizienten als Skalarprodukt dargestellt werden können Cmjm1m2 = jm j1 j2 m1m2 .
(10.30)
Sie hängen also eigentlich von sechs Paramatern ab. Für ihre Berechnung stehen komplizierte Formeln zur Verfügung, die hier aber nicht wiedergegeben werden sollen49. Wir betrachten stattdessen den einfachen Fall der Spinaddition von zwei s-Elektronen, wie er beispielsweise im He-Atom vorkommt. Aus den allgemeinen Überlegungen im Anschluß an Gl. (10.27) lassen sich bereits zwei Ergebnisse für den Gesamtspin S = 1 angeben:
49 Für die numerische Berechnung dieser wie auch der 3J-Symbole kann man auf MATHEMATICA-Programme zurückgreifen.
G. Fussmann , Atomphysik SS 2002
146
Vektoraddition der Drehimpulse |1, 1 >=| 1 , 1 , 1 , 1 > 2 2 2 2
.
(10.31)
|1, -1 >=| 1 , 1 , - 1 , - 1 > 2 2 2 2 Sie stellen die Tripletterme 3S 1 mit m = ±1 dar. Der fehlende Term 3S 1 mit m = 0 hat die kompliziertere Darstellung 1 1 1 1 1 1 1 1 1 1 | , , ,- > + | , ,- , >. 2 2 2 2 2 2 2 2 2 2
|1, 0 >=
(10.32)
Dazu kommt schließlich noch der Singulettterm 1S1 mit der ebenfalls gemischten Darstellung 1 1 1 1 1 1 1 1 1 1 | , , ,- > | , , - , >. 2 2 2 2 2 2 2 2 2 2
|0, 0 >=
(10.33)
Die hier auftretenden Clebsch-Gordon-Koeffizienten sind in der Tabelle Tabelle 10-2 als Matrix dargestellt. Da j1 und j2 in diesem Fall immer 1/2 sind, ändern sich in den Produktzustandsvektoren nur die beiden die m -Werte. j m m1 m2
1/2 1/2 1/2 -1/2 1/2 -1/2 -1/2 -1/2
1 1 1
1 0
0 0
1 -1
1/ 2 1/ 2
1/ 2 -1/ 2
Tabelle 10-2: Clebsch-Gordon -Koeffizienten der Helium Zustandsfunktionen.
1
Für den etwas komplizierteren Fall j1 = 1, j2 = 1/2 entnimmt man die Clebsch-GordonKoeffizienten der nachfolgenden Tabelle. j m m1 m2
1 1/ 2 1 -1/ 2 0 1/ 2 0 -1/ 2 -1 1/ 2 -1 -1/ 2
3/2 3/2 1
3/2 1/ 2 1/ 3 2/3
1/ 2 1/ 2
3/2 -1/ 2
1/ 2 -1/ 2
3/2 -3 / 2
Tabelle 10-3: Clebsch-GordonKoeffizienten für j1= 1 und j2=1/2.
2/3 - 1/ 3 2/3 1/ 3
1/ 3 - 2/3 1
Bei der Berechnung der Clebsch-Gordon-Koeffizienten greift man gerne auf die hiermit eng verwandten Wigner-3j-Symbole zuück, die sich durch eine wesentlich höhere Symmetrie auszeichnen. Zwischen beiden besteht der Zusammenhang Ê j1 j , m| j1 , j2 , m1 , m2 = ( - )- j1 + j 2 - m 2 j + 1Á Ë m1
G. Fussmann , Atomphysik SS 2002
j2 m2
j ˆ . - m˜¯
(10.34)
147
Vektoraddition der Drehimpulse Die als 3x2-Matrix geschriebenen 3j-Symbole erhalten bei einer geradzahligen Anzahl von Spaltentranspositionen (d.h. zyklische Vertauschung) ihren Wert. Bei einer ungeradzahligen Anzahl von Spaltentranspositionen verändert sich ihr Wert um den Faktor ( -1) j1 + j 2 + j . Außerdem gelten die Relationen Ê j1 Ám Ë 1
j2 m2
jˆ Ê j1 = ( -1) j1 + j 2 + j Á ˜ m¯ Ë - m1
j2 - m2
j ˆ - m˜¯
(10.35)
und 0 , falls j1 + j2 + j = 2 g +1 Ï Ê j1 j2 j ˆ = Ô g! ( 2 g - 2 j1 )!( 2 g - 2 j2 )!( 2 g - 2 j )! .(10.36) g , falls j1 + j2 + j = 2 g Ë 0 0 0¯ Ì( -1) ÔÓ ( g - j1 )!( g - j2 )!( g - j )! ( 2 g +1)!
Mit den 3j-Symbolen lassen sich außerdem die im Zusammenhang mit den MultipolMatrixelementen auftretenden Integrale über ein Tripelprodukt von Kugelflächen-Funktionen 2p p m m m Ú Ú Yl 1 Yl 2 Yl 3 sin q dq dj = 2 3 0 0 1
( 2l1 +1)( 2l2 + 1)( 2l3 +1) Ê l1 l2 Ë0 0 4p
l3 ˆ Ê l1 l2 0 ¯ Ë m1 m2
l3 ˆ m3 ¯
(10.37)
und Legendre-Polynomen 2 l1 l2 l3 ˆ Ê Ú0 Pl1 Pl2 Pl3 sin q dq = 2Ë 0 0 0 ¯ p
(10.38)
angeben.
G. Fussmann , Atomphysik SS 2002
148
Optische Strahlungsübergänge
11 OPTISCHE STRAHLUNGSÜBERGÄNGE 11.1 Zeitabhängige quantenmechanische Störungsrechnung Wir betrachten im folgenden Atome, die einer zeitlichen äußeren Störung unterworfen sind. Die Störung kann beispielsweise darin bestehen, daß ein Magnetfeld eingeschaltet wird oder die Atome sich in einem elektrischen Hochfrequenzfeld befinden. Zunächst genügt es, die Störung durch einen zusätzlichen Anteil im Hamilton-Operator H' zu charakterisieren. Die zeitabhängige Schrödinger-Gleichung lautet dann ih
∂y = ( H 0 + H ¢ )y ∂t
(11.1)
wobei H 0 den zeitunabhängigen Anteil der Hamilton-Funktion darstellt. Für die Lösung dieser Differentialgleichung machen wir einen Ansatz der Form •
y ( x , t) = Â an (t)un ( x) e
-i
En t h
(11.2)
n=0
mit den Wellenfunktionen des ungestörten Problems yn0(x,t) = un(x) exp(-i En t/ h ). Der Ansatz (11.2) ist sehr sinnvoll, da für den Grenzfall H'Æ 0 die Koeffizienten an alle bis auf einen verschwinden und dieser (ak) dann konstant ist. Darüber hinaus erinnern wir daran, daß auf Grund der Vollständigkeit der Funktionen un(x) die Reihendarstellung in der Lage ist, jede beliebige Funktion zu approximieren. Setzen wir (11.2) in (11.1) ein, so ergibt sich •
•
Ï da ¸ ih  un Ì n e -iw nt - an iw n e -iw nt ˝ = ( H 0 + H ¢ )  un an e -iw nt , Ó dt ˛ n =0 n =0
(11.3)
was sich wegen H0 y0 = En y0 mit En = h wn sofort zu •
ih  un n =0
dan -iw nt • e = Â H ¢ un e -iw nt dt n =0
(11.4)
vereinfacht. Wir multiplizieren jetzt mit uk* und integrieren beide Seiten, um von der Orthogonalität der un zu profitieren. Wir erhalten dann dak -i • = Â an eiw knt H ¢ kn dt h n =0
(11.5)
Hierbei ist wkn = (Ek - En)/ h und H'kn = das Matrixelement der Störung. Die Gleichung (11.5) beschreibt ganz allgemein, wie sich unter dem Einfluß der Störung die Koeffizienten ak als Funktion der Zeit entwickeln. Es ist ein gekoppeltes Differentialgleichungssystem 1. Ordnung mit unendlich vielen Funktionen an(t). Die Anfangsbedingung lautet a k (0) = d mk (d.h. am = 1 und alle übrigen 0). Um die Gleichung (11.5) zu lösen, machen wir von der Kleinheit der Störung Gebrauch. Es wird dann gelten am(t) ª 1. Alle übrigen Koeffizienten sind im Vergleich hiermit sehr klein und ergeben sich aus der Integration der Gleichung (11.5) zu G. Fussmann , Atomphysik SS 2002
149
Optische Strahlungsübergänge
ak (t ) =
-i t iw km t e H ¢ km (t ) dt . h Ú0
(11.6)
Dies ist das allgemeine Resultat der zeitlichen Störungsrechnung in 1. Ordnung. 11.2 Induzierte Absorption und Emission Wir verwenden nun die Gleichung (11.6), um den Fall einer cosinusförmigen elektrischen Feldstörung zu behandeln, was in erster Näherung der wesentliche Störeffekt einer elektromagnetischen Welle (Photon) darstellt. Der Hamilton-Operator der Störung lautet in diesem Fall, wenn die elektrische Welle in x-Richtung linear polarisiert ist e H ¢(t) = - ex E (t) = - ex E ox cos wt = - xE ox ( e iwt + e - iwt ) . 2
(11.7)
Die Matrixelemente ergeben sich zu •
1 1 x H km . ¢ (t) = - E 0 X ( e iwt + e - iwt ) Ú uk* ( ex) um dx = - E 0 X ( e iwt + e - iwt )Dkm 2 2 -•
(11.8)
Hier taucht auf der rechten Seite das elektrische Dipol-Matrixelement Dxkm= e auf, das bei der Berechnung von Strahlungsübergangswahrscheinlichkeiten eine entscheidende Rolle spielt. Setzen wir (11.8) in die allgemeine Beziehung (11.6) ein, so ergibt sich x È e i (w km +w )t - 1 e i (w km -w )t - 1 ˘ E 0 x Dkm ak (t) = + Í ˙. (w km - w ) ˚ 2h Î (w km + w )
(11.9)
Hier wird der erste Term in der eckigen Klammer resonant für w ª - wkm = wmk = (Em - Ek)/ h > 0, wenn also der Ausgangszustand m eine größere Energie als der Endzustand k hat. Es handelt sich um induzierte oder wie man auch sagt, erzwungene Emission. Umgekehrt beschreibt der zweite Term mit Resonanz bei w ª wkm = (Ek -Em)/ h > 0 die induzierte Absorption eines Photons durch das Atom. Für den Fall der Absorption ergibt das Betragsquadrat der Amplitude
|ak (t)|2 =
2 0x 2
E x 2 (e |Dkm | 4h
i (w km - w ) t
- i (w km - w ) t
- 1)(e (w km - w )2
È (w - w )t ˘ sin 2 Í km ˙˚ - 1) E 2 x 2 Î |Dkm | . = (w km - w )2 h 2 0x 2
(11.10)
Diese Gleichung beschreibt die Wahrscheinlichkeit, daß, ausgehend von einem Anfangszustand m, der höher gelegene Zustand k nach der Zeit t besetzt ist. Da der Dipoloperator hermetisch ist, also Dxkm = Dx*mk, besagen die Gleichungen (11.9) und (11.10), daß (bei gleicher Besetzung und gleichen statistischen Gewichten von Ausgangs- und Endzustand) Absorption und Emission gleich wahrscheinlich sind, wie das auch aus der Identität È (w - w )t ˘ È (w + w )t ˘ sin 2 Í km sin 2 Í mk ˙ ˙˚ 2 2 x 2 Î ˚ =|D x |2 Î |Dkm | mk (w km - w )2 (w mk + w )2
(11.11)
hervorgeht.
G. Fussmann , Atomphysik SS 2002
150
Optische Strahlungsübergänge Bisher sind wir davon ausgegangen, daß die Störung monochromatisch erfolgt. Dies können wir auch so auffassen, daß wir ursprünglich anstelle von Ex(t) = Eoxcos(wt) von einer Funktion Ex(w',t) = Eoxcos(w't) d(w'-w)) ausgegangen sind und dann eine Integration über w' vorgenommen haben. Allgemein müssen wir nun die Deltafunktion durch eine Dichtefunktion r(w') ersetzen, die uns angibt, mit welcher Wahrscheinlichkeit eine Störung der Frequenz w' vorkommt. Die über die Frequenz integrierte Übergangswahrscheinlichkeit pro Zeiteinheit für den Wechsel von m nach k beträgt dann
Pmk =
2 0x 2
1 E |ak |2 dw ¢ = |Dxkm |2 Ú 0 h t •
Ú
•
0
È (w - w ¢ )t ˘ sin 2 Í km ˙˚ 2 Î r(w ¢ ) dw ¢ . t (w km - w ¢ )2
(11.12)
Bilden wir nun vor der Integration den Grenzübergang t Æ • (die Störung sei als so schwach angenommen, daß sich sich das Ausgangsniveau (m) nur sehr langsam entlehrt), so geht die erste Funktion im Integranden wegen 2
p sin 2 [(wmk - w ¢ )t / 2] 1 Ê sin [(wmk - w ¢ )t / 2]ˆ Ê w ¢ t ˆ dw ©= Á ˜ fi d (wmk - w ¢ ) dw ¢ (11.13) ˜ d ÁË 2 t (wmk - w ¢ ) 2 Ë (wmk - w ¢ )t / 2 ¯ 2 ¯ 2 in eine Deltafunktion über. Letzeres ergibt sich mit wkmt/2 = x0 auf Grund von •
lim { Ú0
x 0 Æ•
2 • sin x sin 2 ( x0 - x) dx = Ú-• x 2 dx = p . ( x0 - x )2
(11.14)
Damit geht Gl. (11.12) über in Pmk =
E20 x 2 p x r(wmk ) 2 |Dkm | h 2
(11.15)
Häufig hat man es mit nicht-polarisierter, isotroper Strahlung zu tun. In diesem Fall ist E 2ox = E 2oy = E2oz = E2o/3, wobei die Amplitude E 2o mit der E n e r g i e d i c h t e d e s S t r a h l u n g s f e l d e s u(n) (Energie pro Volumen und Frequenzeinheit, also [u] = J m-3 s) nach Gl. (5.35) durch u(w) dw = (e0/2) E 02 r(w) dw verknüpft ist. Neben dem Dipolelement für die x-Richtung treten jetzt die beiden anderen Komponenten gleichberechtigt auf, so daß sich anstelle von Gl. (11.15) der Ausdruck Pmk =
p u(w mk ) pr(w mk ) 2 x y 2 z x y 2 z |2 + E02y |Dmk | + E02z |Dmk |2 = |Dmk |2 +|Dmk | +|Dmk |2 E0 x |Dmk 2 2h 3e 0 h 2 (11.16)
{
}
{
}
ergibt. Mit dem Betragsquadrat des gesamten elektrischen Dipolmoments r x y 2 z |Dmk |2 = |Dmk |2 +|Dmk | +|Dmk |2 = e 2|rkm |2
{
}
(11.17)
und wegen u(w) = u(n) dn/dw = u(n)/2p sowie h = h / 2 p erhält man schließlich
G. Fussmann , Atomphysik SS 2002
151
Optische Strahlungsübergänge
Pmk =
2p 2 |Dmk |2 u(n mk ) = Bmk u(n mk ) 3e 0 h 2
(11.18)
Hier haben wir als Proportionalitätsfaktor zur Strahlungsenergiedichte den Einstein-Koeffizienten 50 für induzierte Absorption Bmk
2p 2 = |Dmk |2 2 3e 0 h
(11.19)
eingeführt, der eine rein atomare Größe (physikalische Einheit: m3 J-1 s-2)ist. 11.3 Die Auswahlregeln bei Dipolstrahlung 11.3.1
KLASSISCHE DIPOLSTRAHLUNG
Linearer Dipol r r Wir erinnern zunächst daran, daß ein klassischer, linearer elektrischer Dipol Dlin = e r in der 51 Strahlungszone (d.h. im Abstand >> l) die folgende Feldverteilung der Amplituden aufweist rr r r r r wk r r B = m0 (11.20) (n ¥ Dlin )e i ( k ◊r -wt ) ; E = c B ¥ n . , 4 pr r r r wobei k der Wellenvektor und n = k / k ein Einheitsvektor in Ausbreitungsrichtung ist. Liegt der Dipol im Koordinatenursprung und weist in z-Richtung, so zeigt das B-Feld in der x-y-Ebene in die azimutale Richtung, während das E-Feld senkrecht zur Ebene steht (s. Abb. 11-1). Auf der zAchse verschwinden Die zeitlich gemittelte Leistungsflußdichte ist durch den r beide rFelder. r Poynting-Vektor N lin = 1/ 2 E ¥ B * / m0 gegeben. Er hat den Betrag
N lin =
2 w 4 Dlin sin 2 q 3 2 2c e 0 ( 4 pr )
(11.21)
r r mit dem Winkel q zwischen D und n. In Richtung des Dipols gibt es keine Ausstrahlung. Abb. 11-1: E-Feldverteilung um einen linear schwingenden Dipol.
Über die Kugel vom Radius r integriert, ergibt sich die gesamt 50 Es besteht eine gewisse Verwirrung hinsichtlich der Reihenfolge der Koeffizienten. Hier, wie allgemein in der modernen Literatur, bezieht sich der erste Index auf den Ausgangszustand, der zweite auf den Endzustand. A21 ist demnach der Koeffizient für die spontane Emission von 2 nach 1 usw. In der älteren Literatur und vielen Tabellenwerken ist die Reihenfolge umgekehrt. 51 Man denke zunächst an den mit der schwingenden Ladung verbundenen Strom. Dieser erzeugt ein Magnetfeld, das in der Symmetrie-Ebene den Dipol in konzentrischen Kreisen umgibt. Das E-Feld gewinnt man dann aus der Maxwell-Gleichung r r r r rotE = -∂B / ∂t , was in der Fernzone auf E = c B ¥ k / k hinausläuft. Es steht also senkrecht zum Ausbreitungsvektor und
zum Magnetfeld. G. Fussmann , Atomphysik SS 2002
152
Optische Strahlungsübergänge abgestrahlte Leistung zu I lin =
2 w 4 Dlin . 12 pc 3e 0
(11.22)
Rotierender Dipol Andere Verhältnisse ergeben sich, wenn man einen elektrischen Dipol in der x-y-Ebene mit der Kreisfrequenz w rotieren läßt. In diesem Fall ergibt sich für das zeitabhängige Fernfeld der magnetischen Induktion in Kugelkoordinaten (siehe W. R. Smythe, "Static and Dynamic Electricity", Hemisphere Publishing Corporation, N.Y., London)
m wkDrot cosq m0wkDrot sin(wt - kr - j ); Bj = 0 cos(wt - kr - j ) (11.23) 4 pr 4 pr r r r Das E-Feld erhält man hieraus wieder gemäß E = c B ¥ n . In der x-y-Ebene (q = p/2) steht diesmal das B-Feld senkrecht zu dieser und das E-Feld zeigt in azimutale Richtung, d.h. genau umgekehrt wie beim linearen Dipol. Auch für q = 0 und p gibt es nun zeitlich variierende B- und E-Felder. Sie stellen eine rechts bzw. links zirkular polarisierte Welle dar (s. Abb. 11-2). Für alle Zwischenwinkel (0 < |q| < p/2) handelt es sich um elliptisch polarisierte Wellen. Br = 0; Bq = -
y
z
x
Abb. 11-2: E-Felder eines in der x-y-Ebene rotierenden elektrischen Dipols, dargestellt für den Fall k r = 2p und w t = 0 bis 3p/2. Entlang der z-Achse rotieren die E-Vektoren auf Kreisen im gleichen Umlaufsinn wie der Dipol im Koordinatenursprung. Abseits von den Polen werden die Kreise zu flacher werdenden Ellipsen, die in der x-y-Ebene zu Geraden entarten. In der x-y-Ebene schwingt das Feld dann linear in der Ebene.
Für den zeitlich gemittelten Poynting-Vektor erhalten wir diesmal N rot =
2 w 4 Drot (1 + cos 2 q ). 3 2 2c e 0 ( 4 pr )
(11.24)
Integriert über eine Kugeloberfläche, ergibt das I rot
2 w 4 Drot = 6 pc 3e 0
(11.25)
Für Drot = Dlin (bzw. 1/2 D2rechts + 1/2 D2links = D2lin) ergibt die inkohärente Überlagerung von beiden Dipolanteilen ein isotropes und unpolarisiertes Strahlungsfeld. Die Ausstrahlungscharakteristiken sind für diesen Fall in der Abb. 11-3 dargestellt.
G. Fussmann , Atomphysik SS 2002
153
Optische Strahlungsübergänge Abb. 11-3: Abgestrahlte Leistung als Funktion des Winkels q für den linearen (innere liegende 8) und den rotierenden Dipol (Pfeil). Es ergibt sich eine isotrope Summenintensität (gestrichelter Kreis).
z
q x
11.3.2
QUANTENMECHANISCHE DIPOLE
Wir wollen nun die entsprechenden Beziehungen bzw. Besonderheiten für die Ausstrahlung eines quantenmechanischen Dipols kennenlernen. In der Gleichung (11.18) für die induzierte Übergangswahrscheinlichkeit trat das Matrixelement des elektrischen Dipols Dmk auf. Diese atomare Größe spielt offensichtlich bei der Absorption und Emission von Strahlung eine entscheidende Rolle. Im Gegensatz zur klassischen Mechanik, wo das Dipolelement nur dem stationären Zustand des Systems (d.h. dem maximalen Abstand der Ladungen bei der Schwingung) zugeordnet wird, also eine eindimensionale Mannigfaltigkeit darstellt, haben wir es hier mit Matrixelementen zu tun, die von zwei Indizes abhängen. Hierin kommt zum Ausdruck, daß es sowohl auf den Anfangs- wie auch auf den Endzustand ankommt, ob Strahlung absorbiert oder emittiert wird. In Wirklichkeit sind die Verhältnisse noch etwas komplizierter, da ein bestimmter Zustand nicht durch eine einzige Quantenzahl gekennzeichnet werden kann, sondern – wie wir bereits früher gesehen haben – durch einen Satz von Quantenzahlen. Bei einem Einelektronenatom müssen wir beispielsweise der obigen Zahl k die vier Zahlen n, l, ml, ms zuordnen. Da bei der Wechselwirkung mit einem elektrischen Feld der Spin (genauer das magnetische Spinmoment) keine Rolle spielt, können wir auf die Angabe der Spinquantenzahl ms verzichten und kehren zur Vereinfachung der Schreibweise wieder zu ml = m zurück. Die Dipolmatrixelemente berechnen sich dann aus Integralen der Form r r r * Dnlm , n ¢l ¢m ¢ = nlm|D|n¢ l¢ m¢ = Ú y nlm ( e r )y n ¢l ¢m ¢ d 3 r .
(11.26)
Um Integrale vom obigen Typ auswerten zu können, ist es angebracht, den Radiusvektor in geeigneten Koordinaten darzustellen. Da die Wellenfunktionen in Kugelkoordinaten beschrieben werden, erscheint auch eine Darstellung des Radiusvektors in diesen Koordinaten sinnvoll. Es zeigt sich jedoch, daß eine solche Wahl noch nicht ganz dem Problem angepaßt ist. Eine günstige Beschreibung ergibt sich durch Einführen von Einheitvektoren der Art r r r r r r 1 r 1 r ( ex + i e y ); e-1 = ( ex - i e y ), e0 = ez ; e+1 = 2 2
(11.27)
wobei die beiden letzteren zur Darstellung von links und rechts zirkular polarisierten Wellen dienen, während der erste linear polarisierte Wellen beschreibt. Hiermit schreibt sich der Ortsvektor r r r r 1 1 r= r sin qe - ij e+1 + r sin qe ij e-1 + r cos q e0 . 2 2
(11.28)
Schließlich können wir hierin noch die Vorfaktoren durch die Kugelflächenfunktionen ausdrücken und erhalten
G. Fussmann , Atomphysik SS 2002
154
Optische Strahlungsübergänge r r r r 4 p -1 r =r Y1 (q , j ) e+1 - Y1+1 (q , j ) e-1 + Y10 (q , j ) e0 . 3
[
]
(11.29)
Mit der Darstellung der Wasserstoffwellenfunktion (s. Kap.7)
y nlm = Yl m (q , j ) Rnl (r )
(11.30)
können wir dies schreiben als
n, l , m|Dq |n¢ l¢ m¢ = 1 • ~ ÈÍÚ Rnl Rn ¢l ¢ r3 dr ˘˙ ÈÍÚ Î0 ˚ Î -1
p 2p 4p • 3 R R r dr Ylm ) * Y1q Ylm¢ ¢ sin q dq dj ( nl n ¢l ¢ Ú Ú Ú 0 0 0 3 , 2p m q m¢ i (m ¢ -m +q )j ˘ È ˘ Pl (m ) P1 (m ) Pl ¢ (m ) dm ˙ ÍÚ e dj ˙ ˚ Î0 ˚
(11.31)
wobei q die drei Werte q = -1, 0,+1 annehmen kann. Dem Integral über den Winkel j entnehmen wir sofort, daß die Matrixelemente verschwinden, falls nicht m - m' + q = 0 befriedigt wird. Damit haben wir als erste Bedingung Dm = 0, ± 1 .
(11.32)
Bei der Integration über den Winkel q (hier m = cosq) ergibt sich aus der Eigenschaften der assoziierten Legendre-Polynome (bzw. den Gl. (10.37) und (10.38)), daß dieses Integral nur dann nicht null ist, wenn l - l' = ±1, also Dl = ±1.
(11.33)
Durch diese Bedingung wird im Einelektronenatom automatisch sichergestellt, daß die Parität der Wellenfunktion sich ändert, der Übergang also immer zwischen einer geraden und einer ungeraden Funktion erfolgt. Die Integration über die Radialfunktionen gestaltet sich erheblich schwieriger, liefert aber keine zusätzlichen Bedingungen. Es sind somit auch Dn = 0-Übergänge zugelassen, die insbesondere bei den Alkaliatomen von großer Bedeutung für die Aussendung von sichtbarem Licht sind (z.B. np Æ ns Übergänge). Die oben angegeben Relationen sind damit die Auswahlregeln für ein Einelektronenatom. Um die hiermit verbundenen Ausstrahlungscharakteristiken zu verstehen, berufen wir uns auf Bohrs Korrespondenzprinzip. Wir hatten bereits früher gesehen, daß abgestrahlte Frequenz und Umlauffrequenz des Elektrons im Grenzfall n >> 1, dann übereinstimmen, wenn eine Änderung der Hauptquantenzahl von n nach n - 1 stattfindet, was im Lichte unserer obigen Erkenntnisse eigentlich als lmax - lmax' = (n - 1) - (n' - 1) = 1 zu interpretieren ist. Mit der oszillatorischen Bewegung des Elektrons im klassischen Bild ist daher quantenmechanisch keine Ausstrahlung verbunden, wohl aber mit deren Änderung. Der klassischen Bahn des Elektrons ist ein Drehimpulsvektor l zugeordnet, der drei Komponenten im Raum besitzt. Der lz-Komponente entspricht eine Rotation in der x-y-Ebene, der lx-Komponente eine solche in der y-z-Ebene, ebenso ist mit der ly-Komponente eine Rotation in der x-z-Ebene verbunden. Quanten-mechanisch bleiben hiervon aber nur zwei Größen, der Betrag (l) und eine Komponente (lz), im zeitlichen Mittel konstant. Mit der Änderung der lz-Komponente, d.h. Dm = ±1, ist daher korrespondenzmäßig ein rechts bzw. links rotierender Dipol in der x-y-Ebene verbunden. Eine Änderung von l ohne Veränderung von lz (d.h. Dm = 0) entspricht dagegen einer linearen Schwingung in z-Richtung (als Mittel der Rotationen in der y-z und x-z-Ebene). Es stellt sich heraus, daß diese korrespondenzmäßigen Zuordnungen in allen Fällen die Intensitäts- und PolarisationsG. Fussmann , Atomphysik SS 2002
155
Optische Strahlungsübergänge charakteristika exakt beschreiben. Wir können also insbesondere die Gleichungen (11.22) und (11.25) für die Intensitäten verwenden, wenn wir hierin die Substitution 2
2 Dlin = nml|D0 |n¢ , l ± 1, m ±1
2 rot
D = nml|D |n¢ , l ± 1, m ± 1
2
(11.34)
vornehmen. Gl. (11.33) läßt sich nun so interpretieren, daß jedes Photon einen Drehimpuls der Größe 1 h davonträgt. Bei einem Dm = +1-Übergang erhöht sich der lz-Drehimpuls des Atoms um 1 h . Wegen der Erhaltung des Gesamtdrehimpulses muß dann ein parallel zur z-Richtung ausgestrahltes Photon einen Eigendrehimpuls (Spin) von sz = -1 h besitzen. Fliegt es in positiver z-Richtung davon, so sind Spin und k-Vektor antiparallel, und der E-Vektor seines Feldes läuft 52auf einer Linksschraube durch den Raum. Wir ordnen diesem Schraubensinn eine negative Helizität zu. Generell folgt die Existenz des Photonenspins s = 1 h aus der Beobachtung, daß in keinem Falle Photonen emittiert oder absorbiert werden können, wenn die Anfangs- und Endzustände des Atoms, Moleküls oder Atomkerns den Gesamtdrehimpuls null haben (0 ´ 0-Übergänge). Linear polarisiertes Licht ergibt sich, wenn die Wahrscheinlichkeit für die Emission von entgegengesetzt zirkular polarisierten Photonen gleich groß ist. Im Gegensatz zu anderen s = 1-Teilchen, deren Spin auch senkrecht zu ihrer Geschwindigkeit stehen kann, ist aber der entsprechende Eigenwert ms = 0 – wegen der fehlenden Ruhmasse – bei den Photonen nicht realisiert. Gleichwohl kann natürlich auch bei Photonenmessungen der Erwartungswert der senkrechten Spinkomponente zu null ausfallen. Kehren wir nach diesen allgemeinen Anmerkungen zu dem Übergang Dm = +1 zurück. Unter diesen Bedingungen kann das Photon in alle Richtungen abgestrahlt werden. In negativer zRichtung hat es immer positive Helizität. In der x-y-Ebene wird dagegen ein linear polarisiertes Photon abgestrahlt (das wir uns eigentlich als Kombination aus rechts und links drehenden Basisvektoren zusammengesetzt denken müssen). Mit seinem linearen Impuls pph= h w/c kann es gleichzeitig den Drehimpuls lz = r pj = r p ph davontragen, indem es bei einem endlichen Radius abgestrahlt wird. Auf die gleiche Weise kann auch unter den Bedingungen Dm = 0 ein xDrehimpuls in y-Richtung oder ein y-Drehimpuls in x-Richtung abgestrahlt werden. Wenn keine Richtung im Raum ausgezeichnet ist, muß die Strahlung isotrop und unpolarisiert sein53. Dies stellt Summenbedingungen an die Dipolmatrixelemente vom Typ 2 2 Dlin (total) = Drot (total) .
(11.35)
Für die Wasserstoffwellenfunktionen kann man sich hiervon explizit überzeugen. Es gilt 2
l
2 (total) = Dlin
Â
n, l , m|D0 |n¢ , l - 1, m
=
m =-l
2
l
2 rot
D (total) =
Â
1 l (R nnl¢l -1 )2 3
1
n, l , m|D |n¢ , l - 1, m + 1
m =-l
(11.36)
1 + n, l , m|D |n¢ , l - 1, m - 1 = l (R nnl¢l -1 )2 3 -1
mit dem Integral über die Radialwellenfunktionen 52 Anders als einige Elementarteilchen, wie z.B. Neutrinos, die zusätzlich zum Spin auch eine definierte Helizität besitzen, kann ein Photon sowohl positive als auch negative Helizität aufweisen. 53 Falls ein statisches B- oder E-Feld eine Richtung im Raum auszeichnet, gilt diese Forderung bei Summation über alle aufgespaltenen Zeeman- bzw. Stark-Komponenten.
G. Fussmann , Atomphysik SS 2002
156
Optische Strahlungsübergänge •
R nnl¢l ¢ : = Ú Rnl * r3 Rn ¢l ¢ dr .
(11.37)
0
Nur für gleiche Hauptquantenzahlen ergibt sich ein einfaches Ergebnis: Rnln,l-1 = Rnl-1nl = 3/2 n (n2 l2)1/2. Für die Lyman- und Balmer-Serien findet man die entsprechenden Formeln in H. A. Bethe and E.E.Salpeter, "Quantum Mechanics of One- and Two-Electron Atoms", Plenum Edition. Die für das Wasserstoffatom abgeleiteten Beziehungen können verallgemeinert werden und lassen sich generell als Bedingungen für die E r h a l t u n g d e s D r e h i m p u l s e s d e s G e s a m t s y s t e m s "Atom + Photon" verstehen. Man unterscheidet zwischen strengen und angenäherten Bedingungen, wobei letztere beispielsweise an die Gültigkeit der L-S-Kopplung gebunden sind. Für die elektrische Dipolstrahlung sind sie in der folgenden Tabelle zusammengestellt: D J = 0, ± 1 (nicht J = 0 nach J = 0) 1. streng D M J = 0, ± 1 2. streng (falls DJ = 0, nicht MJ = 0 nach MJ = 0) 3. Paritätswechsel streng Dl = ± 1 4. Einzelelektron 5. DS= 0 L-S-Kopplung ± 1 (nicht L = 0 nach L = 0), 6. DL = 0± L-S-Kopplung falls DL = 0 Æ DML π 0) 7. Dj = 0, ±1 für eines der Elektronen j-j-Kopplung Tabelle 11-1:Auswahlregeln bei Dipolstrahlung. Die Auswahlregel DS = 0 wird als Interkombinationsverbot bezeichnet. Sie besagt, daß nur Strahlungsübergänge innerhalb eines Multipletts (also Dublett nach Dublett oder Sextett nach Sextett usw.) unter LS-Kopplungsbedingungen erlaubt sind. Wie wir der Abb. 11-4 entnehmen können, ist diese Bedingung beim Helium streng erfüllt: Es gibt keine Linien vom Triplett- zum Singulettsystem oder umgekehrt. Man dachte daher früher, es handele sich um zwei verschiedene Heliumarten und nannte sie Para- (Singulett) und Ortho-Helium (Triplettsystem). Beim Quecksilber (Abb. 11-5), als schweres Atom mit zwei Elektronen in der äußeren n = 6 -Schale, bricht dieses DS=0-Verbot zusammen, und die Interkombinationslinie l = 2536 Å (6s 6p 3P 1 - 6s2 1S 0) ist eine der stärksten Linien im Spektrum. Nach wie vor ist jedoch der energetisch tiefer liegende Term 3 P 0 , wegen des strengen Verbots J = 0 ‹||fi J = 0, nicht durch Strahlung mit dem Grundzustand 1S 0 verbunden. Derartige Übergänge können nur durch die gleichzeitige Emission von zwei Photonen zustandekommen, was außerordenlich selten ist. Andererseits kann der gleiche Term 3P 0 durch Strahlung aus dem Niveau 3D1 und in schwächerem Maße auch von 3S 1 aus bevölkert werden – im Einklang mit den Bedingungen DS = 0, DL= ±1 und DJ = ±1. Fast ausnahmslos sind die Emissionsübergänge DL = +1 deutlich schwächer als die entsprechenden DL = -1 -Übergänge, was man im Falle des H-Atoms durch exakte Rechnungen belegen kann. Die Linie l = 4046 Å (6s 7s 3 S1 Æ 6s 6p 3P1) im Quecksilber ist ein Beispiel für den nicht verbotenen Übergang DJ = 0. Man beachte in diesem Zusammenhang, daß der Spin zwar seinem Betrage nach erhalten bleibt, sich im oberen und unteren Zustand aber unterschiedlich zum Bahndrehimpuls addieren kann, was über die zunächst erwartete Regel DJ = ±1 hinaus auch DJ = 0 ermöglicht. So haben wir im betrachteten Fall im oberen Term L = 0 und damit J = S = 1, während im unteren Zustand die drei Vektoren L = S = J = 1 ein gleichseitiges Dreieck aufspannen. Die Umgruppierung der Drehimpulse ist auch in den Abb. 11-7 und Abb. 11-8 am Beispiel des DJ = 0 Überganges 2D1 <-> 2P1 verdeutlicht54. 54 Bei der Erstellung derartiger Vektormodelle konstruiere man zunächst das entsprechende Dreieck aus der Kenntnis der drei
Seitenlängen ((Li(Li+1)1/2, i = 1,2,3). Sodann drehe man es um den Koordinatenursprung, so daß die z-Kompnente von J halb G. Fussmann , Atomphysik SS 2002
157
Optische Strahlungsübergänge In jedem der bisher diskutierten Fälle bleibt das 6s -Elektron an seinem Platz, so daß für das angeregte Elektron die Regel Dl = ±1 gültig bleibt.
Abb. 11-4: Übergänge im He-Atom. Abb. 11-5: Termschema und Übergänge im Hg-Atom.
Abb. 11-6: Terme und Übergänge im Ca-Atom einschließlich gestrichener Terme. Dies ändert sich, wenn wir einen Blick auf das in Abb. 11-6wiedergegebene Termschema vom Kalzium werfen. In diesem Diagramm eines mittelschweren Atoms mit zwei Elektronen in der n = 4-Schale sind auch die sogenannten gestrichenen Terme, bei denen g l e i c h z e i t i g b e i d e E l e k t r o n e n a n g e r e g t sind, eingezeichnet. Hier sieht man beispielsweise, daß auch ein oder ganzzahlig wird entsprechend MJ = -J, (-J+1),…,(J-1), J. G. Fussmann , Atomphysik SS 2002
158
Optische Strahlungsübergänge Übergang der Art 3d 6d 3P1 Æ 4s 4p 3P 1o vorkommt (mit mehreren Linien im Bereich l = 2565 2554 Å aufgrund der verschiedenen Ausgangsterme). Es handelt sich um einen erlaubten Übergang mit DL = DJ = 0 (aber Paritätswechsel: P1 = (-1)2 (-1)2 = +1, P2 = (-1)1 = -1). z
z
S
2
1.5
2
1.5
L
J
1
1 S
0.5
0.5
L
J 0.5
1
1.5
2
x
Abb. 11-7: Vektordiagramm des Terms 3D1 (J = 1, L = 2, S = 1/2, MJ = 3/2).
0.5
1
1.5
2
x
Abb. 11-8: Vektordiagramm des Terms 3P1, der aus 3D1 durch einen (DL = -1, DS = 0 ,DMJ = 1)-Übergang ensteht (J = 1, L = 1, S = 1/2, MJ = 1/2).
Ähnlich wie zuvor verschiedene L- und S-Drehimpulse zum gleichen Gesamtdrehimpuls J koppeln können, kommt hier der gleiche Bahndrehimpuls L durch unterschiedliche Kopplung der Drehimpulse der Einzelelektronen zustande. Die doppelt angeregten Terme des 3d nl-Systems oberhalb der Seriengrenze des 4s nl-Systems bilden sogenannte autoionisierende Zustände. Sie können verhältnismäßig leicht von allein in den ionisierten Zustand Ca+ + e übergehen. Auch der hierzu inverse Rekombinationsprozeß Ca+ + e Æ Ca** in den doppelt angeregten Zustand ist möglich. Er wird als dielektronische Rekombination bezeichnet und spielt insbesondere bei den höher geladenen Ionen in heißen Plasmen eine wichtige Rolle. 11.3.3
HÖHERE MULTIPOLSTRAHLUNG
Die zuvor angeführten Auswahlregeln gelten in der sogenannten elektrischen Dipolnäherung (E1Strahlung). Sie wurden abgeleitet unter der Annnahme, daß die Wellenlänge der Störung sehr groß im Vergleich zum Atomradius ist. Das ist bei der sichtbaren Strahlung der Fall, nicht jedoch im Röntgenbereich und erst recht nicht im Gebiet der noch härteren Gammastrahlung, die aus dem Atomkern emittiert wird. Entsprechend ist es hier oft nötig, die Inhomogenität der Störung über den Atomquerschnitt zu berücksichtigen (elektrische Quadrupolstrahlung: E2) und auch Strahlungsbeiträge, die nicht mit dem elektrischen, sondern mit dem magnetischen Dipolmoment (magnetische Dipolstrahlung: M1) zusammenhängen, in Betracht zu ziehen. Allgemein ist das Matrixelement |D|2 zu ersetzten durch r r r r 3 p 3 n 12 |D12 |2 fi |D12 |2 +|(r ¥ p)12 |2 + |( er ◊ r )12 |2 2 10 c
(11.38)
wobei die drei Terme der Reihe nach E1, M1und E2 repräsentieren. Die M1- und E2-Strahlungen sind im sichtbaren Bereich erheblich schwächer als die elektrische Dipolstrahlung (M1/E1 ª 10-5, E2/E1 ª 10-7). Die M1-Strahlung genügt den Auswahlregeln DJ = ±1, 0 und DMJ = 0 (p-Komp.) bzw. DMJ = ±1 (s-Komp.) bei gleicher Parität der beiden Terme. Derartige Übergänge können beispielsweise durch ein oszillierendes Magnetfeld zwischen den im statischen Magnetfeld aufgespaltenen Zeemankomponenten induziert werden. Ähnliche Bedingungen treten innerhalb der Feinstrukturterme auf (z.B. beim Natrium: 3P3/2 <-> 3P1/2). G. Fussmann , Atomphysik SS 2002
159
Optische Strahlungsübergänge
Bei der E2-Strahlung lauten dagegen die Auswahlregeln DJ = ±2 und DMJ = ±2 bei ungleicher Parität der Terme. Bei gleicher Parität sind dagegen DJ = ±1,0 und DMJ = ±1,0 möglich. Eine berühmte Quadrupollinie ist die grüne Linie des Polarlichtes (l = 557.7 nm), die vom Übergang 1 S0 ->1D2 des O-Atoms herrührt. In allen Fällen sind jedoch wiederum Übergänge vom Typ J = 0 nach J = 0 streng verboten. Noch höhere Strahlungsmomente (elektrische Oktupol- und magnetische Quadrupolstrahlung) sind nur im Rahmen der Kernphysik von Bedeutung. Bei sehr großen Strahlungsleistungen, wie sie nur mit Lasern erreicht werden, können auch Zwei-Photonenübergänge (unter der Bedingung DL = 0,±2) induziert werden. Beim H-Atom kann auf diese Weise besonders das metastabile 2s-Niveau aus dem Grundzustand bevölkert werden. Ein anderes Beispiel sind die Übergänge 3 2S 1/2 - 4 2 D 3/2,5/2 im Natriumatom. 11.4 Nachweis des Photonenspins Mit Hilfe von doppelbrechenden Kristallen (z.B. Quarz, Glimmer oder Kalzit) lassen sich sogenannte l/4-Plättchen bzw. l/2-Plättchen herstellen. Hierbei werden die Kristalle so gespalten, daß die optische Achse parallel zur Oberfläche liegt. Bei senkrechtem Einfall des Lichtes haben dann linear polarisierte Photonen mit Polarisationsrichtungen in Richtung dieser Achse und senkrecht hierzu unterschiedliche Phasengeschwindigkeiten. Strahlt man linear polarisiertes Licht unter einem Winkel q = 45° (s.Abb. 11-9) ein, so kann man sich dieses mit gleicher Wahrscheinlichkeit in die Parallel- und Senkrechtrichtung zerlegt denken. Bei geeigneter Dicke des Plättchens (bei Quarz etwa 0,01-0,02 mm) ergibt sich eine Phasendifferenz von p/2 (entsprechend l/4) zwischen den E-Feldern der beiden Teilwellen am Ende der Plättchens. Es tritt zirkular polarisiertes Licht aus. Während die einfallenden Photonen keine Drehimpulskomponente in Ausbreitungsrichtung hatten, haben die austretenden eine solche Spinkomponente der Größe + h (rechts zirkular). Natürlich erhält der Kristall pro Photon den entgegengesetzten Spin von - h . Ein doppelt so großer Drehimpulsübertrag pro Photon ergibt sich bei Einkopplung von zirkular polarisiertem Licht in ein l/2-Plättchen. Hier wird der ursprüngliche Phasenwinkel p/2 im Kristall um p also auf 3/2p vergrößert. Das entspricht aber einem Winkel -p/2. Aus rechts-zirkular polarisiertem Licht wird also links polarisiertes und auf das l/2-Plättchen wird der Drehimpuls 2 h übertragen. Diese Überlegungen liegen dem von R. Beth 1936 durchgeführten Experiment zum Nachweis des Drehimpulses der Photonen zugrunde. In seiner in Abb. 11-9 gezeigten Anordnung wird zunächst zirkular polarisiertes Licht aus linear polarisiertem mit Hilfe eines l/4-Plättchens (q = 45o) erzeugt. Dieses zirkulare Licht durchsetzt das l/2-Plättchen und wird danach zur Verstärkung des Effekts durch ein an der Oberseite verspiegeltes, zweites l/4-Plättchen zurückgeworfen. Durch intermittierende Beleuchtung bei der mechanischen Resonanzfrequenz wird das an einem Quarzfaden aufgehängte l/2-Plättchen zu Torsionsschwingungen angeregt. Durch Drehen des unteren l/4-Plättchens kann in den Stellungen q = 0 o und 90o auch linear polarisiertes Licht zugeführt werden. In diesen Fällen wird auf das l/2-Plättchen kein Drehimpuls übertragen. Dies ist im Einklang mit den Meßergebnissen für das Drehmoment, die in Abb. 11-10 als Funktion des Winkels dargestellt sind.
G. Fussmann , Atomphysik SS 2002
160
Optische Strahlungsübergänge Quarzfaden Spiegel Nm )
5.0 Fit: D = 4.39 sin 2 Q
Drehmoment ( 1 0
-16
l /4 -Plättchen
l /2 -Plättchen
q
l /4 -Plättchen Linear polarisiertes Licht
0.0
-5.0 -200
-150
-100
-50
0
50
100
Q
Abb. 11-9: Experimentieranordnung zum Nachweis des Photonendrehimpulses.
Abb. 11-10: Meßergebnisse n. Beth, Phys. Rev. 50,115 (1936)). Bei 45° und 135° wird das Drehmoment maximal; bei -45° tritt ein Minimum auf.
11.5 Schwarzkörperstrahlung und spontane Emission Die Schrödinger-Gleichung erlaubt nicht die Bestimmung der spontanen Übergangswahrscheinlichkeit, die ja ohne äußere Störung erfolgt. Um diese abzuleiten, gibt es zwei Wege: 1. QED-Rechnung und 2. die von A. Einstein 1917 eingeschlagene Ableitung unter Verwendung der Kirchhoff-Planck-Funktion. Wir wollen hier den zweiten Weg beschreiten, der auf thermodynamischen Betrachtungen aufbaut. Wir betrachten zwei Niveaus, die entsprechend Abb. 11-11 durch drei Prozesse miteinander verkoppelt sind: ∑
Induzierte Absorption
∑
Induzierte Emission
∑
Spontane Emission
Man beachte, daß die beiden ersten Prozesse der Strahlungsdichte u(n) proportional sind (s. Gl., (11.18)), u(n) dn = Energie im Frequenzbereich n…n + dn pro Volumeneinheit). E ,N 2 2
hn hn
hn
hn
E1 , N 1 spontane Emission
induzierte Emission
induzierte Absorption
Abb. 11-11: Veranschaulichung der Besetzungs- und Entvölkerungsprozesse. Die Übergangsraten für die drei Prozesse lauten G. Fussmann , Atomphysik SS 2002
161
Optische Strahlungsübergänge Ê dN 2 ˆ Ê dN 2 ˆ Ê dN1 ˆ = - A21N 2 ; = - B21N 2 u(n ); = - B12 N1u(n ) , Ë dt ¯ spon Ë dt ¯ ind Ë dt ¯ ind
(11.39)
wobei die hier auftauchenden Koeffizienten A 21, B 21 und B 12 die Einstein-Koeffizienten für spontane Emission, induzierte Emission und induzierte Absorption sind. Während wir die beiden letzteren mit Hilfe der Störungstheorie berechnen können, ist das für den ersteren nicht ohne weiteres möglich. Die folgenden Betrachtungen werden jedoch zeigen, daß diese Koeffizienten durch Beziehungen miteinander verknüpft sind. Die Besetzungen der beiden Niveaus sind durch folgende Ratengleichungen bestimmt dN1 = A21 N 2 + B21 u(n )N 2 - B12 u(n )N1 dt , dN 2 = - A21 N 2 - B21 u(n )N 2 + B12 u(n )N1 dt
(11.40)
die der Bedingung N 1 + N 2 = const. genügen. Im Gleichgewicht verschwinden die linken Seiten, und es muß gelten: 0 = A21N 2 + B21 u(n )N 2 - B12 u(n )N1.
(11.41)
N2 B12 u(n ) = . N1 A21 + B21u(n )
(11.42)
Dies führt uns auf
Andererseits muß dieses Verhältnis im thermodynamischen Gleichgewicht der Boltzmann-Relation N 2 g2 e = N1 g1
E 2 - E1 kT
=
hn g2 - kT e g1
genügen, worin g1 und g2 die statistischen Gewichte darstellen55 dichte liefert u(n ) =
A21 hn g1 B12 e kT - B21 g2
(11.43) 56Auflösen
nach der Strahlungs-
(11.44)
Für T Æ • ergibt sich erwartungsgemäß die Beziehung g1B12 = g2 B21 ,
(11.45)
55 Diese statistischen Gewichte haben wir bereits im Kap. 10 kennengelernt. Sie geben ganz allgemein die Zahl der nicht
aufgelösten (oder entarteten) Subniveaus an. BeimWasserstoff hat jedes Niveau zur Hauptquantenzahl n das statistische Gewicht gn = 2 n2. Ein Feinstrukturterm vom Typ 2S+1LJ hat (2J+1)-Subniveaus, die bei der Aufspaltung im Magnetfeld zutage treten; daher ist hier das statistische Gewicht gJ = 2J+1. 56
G. Fussmann , Atomphysik SS 2002
162
Optische Strahlungsübergänge die wir für g1 = g2 = 1 auch schon aus der Störungsrechnung erhalten hatten. Für kleine Frequenzen (hn << kT) hat man die Näherung u(n ) =
A21 kT . B21 hn
(11.46)
Dies muß mit dem bekannten Rayleigh-Jeans-Gesetz u(n ) =
8 pn 2 kT c3
(11.47)
zusammenpassen, das für eben diesen klassischen Grenzfall abgeleitet werden kann. Der Vergleich liefert die gesuchte Beziehung zwischen den Einstein-Koeffizienten für spontane und induzierte Emission A21 8 phn 3 = . B21 c3
(11.48)
Einsetzen der gefundenen Relationen ergibt schließlich die berühmte Plancksche Formel u(n ) =
8 phn 3 c3
1 e
hn kT
,
(11.49)
-1
die die Strahlungsdichte eines schwarzen Körpers (Hohlraumstrahlung s. Abb. 11-12) angibt. Kirchhoff-Planck-Funktion
- 3]
6
Abb. 11-12: Die Hohlraumstrahlers Photonenenergie.
Spektralverteilung als Funktion
eines der
5 T = 3000 K
u(h n ) [10
- 32
J/eV m
Hierzu noch folgende Anmerkungen: Bei der obigen Ableitung haben wir mit Gl. (11.41) angenommen, daß die von uns betrachteten 3 Atome im Gleichgewicht mit der Strahlung sind. Das ist in der Regel nicht erfüllt und man muß 2 besondere Vorkehrungen treffen, um dies zu T = 2000 K erreichen. In guter Näherung ist dies beispielsweise für einen geschwärzten 1 Hohlkörper (Abb. 11-13) gegeben, der noch eine T = 1000 K kleine Öffnung haben darf. Die fraglichen Atome 0 sind hier die Wandatome, die aufgrund der 0 0.5 1 1.5 2 2.5 3 3.5 dichten Packung im Wandmaterial eine h n (eV) quasikontinuierliche Niveaudichte aufweisen. Die von uns herausgegriffenen zwei Niveaus sind natürlich willkürlich, und die gewonnenen Beziehungen gelten somit für alle möglichen Niveaus (detailliertes Gleichgewicht). Die Gleichung (11.49) ist die Grundlage vieler Strahlungseichverfahren, bei denen entweder ein erhitzter Hohlzylinder mit einer kleinen Öffnung oder auch Wolframoberflächen (WolframBandlampen bei ca. 2000 - 2800 K) eingesetzt werden. Im letzten Fall handelt es sich um einen sogenannten grauen Strahler, der weniger Licht als ein schwarzer Körper abstrahlt (ca. nur 40%). Für höhere Temperaturen (3000 - 4000 K) benutzt man Kohlebogenlampen (UV-Eichungen); 4
G. Fussmann , Atomphysik SS 2002
163
Optische Strahlungsübergänge schließlich für Tª 10 000 - 30 000 K wandstabilisierte elektrische Bögen, die z.B. mit He oder Ar betrieben werden und denen zusätzlich kleinere Mengen an Kr und Xe zugesetzt werden können. Hier bildet sich in der Umgebung der Resonanzlinien (das sind Übergänge zum Grundniveau) ein Schwarzkörper-Strahlungsplateau aus. Dabei ist es wichtig, sich den Zusammenhang zwischen der Energiedichte u(n) (Einheit: Joule◊s◊m-3) und der abgestrahlten Intensität I(n) klarzumachen. Es gilt die Definition
u(n)
Blenden Abb. 11-13: Hohlraumstrahler.
I(n)
I(n ) =
Strahlungsleistung . Fläche ¥ Raumwinkel ¥ Frequenzintervall
(11.50)
Oft ist es wichtig auch die Polarisationsrichtung des Lichtes zu beachten. Es gilt dann bei zirkular polarisiertem Licht I = I+ + I- bzw. I = Ix + Iy bei der Zerlegung in linear polarisiertes Licht mit xund y-Richtung senkrecht zur Beobachtungsrichtung. Bei isotroper Strahlung – wie die Schwarzkörperstrahlung – hat man die Beziehung I (n ) dn dW =
c u(n )dn dW . 4p
(11.51)
Bei einem Flächenstrahler ergibt sich aufgrund der Verkleinerung der Fläche bei Projektion in Richtung des Strahls (An = A n◊k/k) eine zu cosq proportionale Abstrahlungscharakteristik, wobei q der Winkel zur Normalen der Oberfläche ist. Beachtet man dies, so erhält man durch Integration über den Halbraum (W = 2 p ) und über alle Frequenzen unter Verwendung der Planck-Funktion das Stefan-Boltzmannsche Gesetz F=Ú
•
0
p/2
Ú (I 0
schwarz
(n )cos q ) 2 p sin q dq dn = s T 4
(11.52)
mit der Konstante s = 2p5 kB4/(15 c2 h3) = 5,67 10 - 8 W m - 2 K- 4 sterad -1. Aus der Planck-Funktion läßt sich auch sofort das Wiensche Verschiebungsgesetz
lmax ◊ T = const. = 0, 29 cmK
(11.53)
ableiten, das die Lage derjenigen Wellenlänge angibt, für die bei gegebener Temperatur die Intensität ein Maximum aufweist (Bedingung du(l)/dl = 0), wie es auch aus der Abb. 11-12 ersichtlich ist. Schließlich müssen wir noch einmal auf die Relation (11.48) zurückkommen. Unter Verwendung der früher abgeleiteten Gleichung für den Einstein-Koeffizienten für die induzierte Absorption Gl. (11.19) erhalten wir allgemein für die spontane Übergangswahrscheinlichkeit von m nach k G. Fussmann , Atomphysik SS 2002
164
Optische Strahlungsübergänge 16p 3n 3 g k = |D mk |2 3 3e 0 hc g m
A mk
(11.54)
Die Übergangswahrscheinlichkeiten bestimmen gleichzeitig die Lebensdauer der Niveaus vermöge tm = S m (Amk)-1 – und damit die natürliche Verbreiterung der Spektrallinien. Zu beachten ist in Gl. (11.54) die starke Abhängigkeit mit n3; sie besagt, daß Übergänge mit kleinen Freqenzen (z.B. innerhalb eines Multipletts) sehr unwahrscheinlich sind. Unter Verwendung der in Kap. 3 eingeführten Oszillatorenstärken fmk (bei intensiven Linien typisch fmk ª 0.5) erhält man die einfache Relation 2
Amk
g Ê n ˆ = 8.0 ◊ 10 k Á fmk [s -1 ] ˜ gm Ë n Ryd ¯ 9
(11.55)
mit der Rydbergfrequenz nRyd = e2/(8pe0h a0) = 3.2898◊1015 Hz.
11.6 Weisskopf-Wigner Theorie der spontanen Emission Im letzten Abschnitt haben wir, Einstein folgend, über den Umweg der Thermodynamik, einen Ausdruck für die Übergangswahrscheinlichkeit für spontane Emission abgleitet. Obwohl der so erhaltene Ausdruck völlig korrekt ist, besteht doch der Bedarf nach einer quantenmechanischen Behandlung des Problems, die, so zumindest der Wunsch, auch einen tieferen Einblick in die physikalische Zusammenhänge liefern möge. Eine in dieser Hinsicht unübertroffene Näherung wurde bereits 1930 von V. Wigner und E. Weisskopf (Z. f. Physik 63, 54 (1930) und 65, 18 (1930)) vorgelegt, die zudem den Vorzug hat, keine störungstheoretische Lösung der Schrödingergleichung – und damit nur für kurze Zeiten brauchbar – zu sein, sondern auf für tÆ • ihre Gültigkeit behält. Für die entsprechende Wellenfunktion macht man dabei einen Produktansatz Y = y Atom f Vakuum, wobei der Anfangszustand dadurch gennzeichnet ist, dass das Atom im angeregten Zustand y Atom = y2 ist und noch kein Photon ans Vakuum abgegeben wurde f Vakuum = f 0. Nach sehr langer Zeit, wenn das Atom in den unteren Zustand zerfallen ist und ein Photon abgestrahlt hat, hat man dagegen y Atom = y1 und f Vakuum = f 1. Für die zeitabhängige Lösung der Schrödingergleichung benötigt man den Hamiltonoperator der Wechselwirkung. Dieser hat die Gestalt r r r r H¢ = - D( +1 ) ◊ E( -1 ) + D( -1 ) ◊ E( +1 ) .
(
)
(11.56)
Hierin ist D = -e r der schon bekannte Dipoloperator und E± der der elektrischen Feldstärke zugeordnete hermitesche Operator. Hierbei handelt es sich diesmal aber nicht um ein von außen angelegtes E-Feld, sondern um das vom Elektron selbst ausgesandte Strahlungsfeld. Die quantenmechanische Behandlung zeigt zunächst, daß die Abstrahlungscharakteristik genau mit der eines klassischen Dipols (linear schwingend oder rotierend) übereinstimmt. Für die zeitliche Entwicklung der Wellenfunktion ergibt sich schließlich das höchst aufschlußreiche Ergebnis -
gt
Y(t ) = e 2 y 2 f0 + (1 - e -gt )1/2 y 1 f1 ,
(11.57)
worin die Funktionen f und y keine zeitliche Abhängigkeit mehr aufweisen. Mit der Zerfallskonstanten g , die mit dem Einsteinkoeffizienten A21 identisch ist, ist auch ein Spektralprofil der ausgestrahlten Photonen verknüpft. Es ist ein sogenanntes Lorentz-Profil, das, auf 1 normiert und mit E2 - E1 = h w21, die folgende Form aufweist: G. Fussmann , Atomphysik SS 2002
165
Optische Strahlungsübergänge
L(w ) =
g 1 2 2 p (w - w21 ) + (g / 2)2
(11.58)
Für die volle Halbwertsbreite dieses Profils ergibt sich Dw1/2 = g . Nehmen wir zum Zeitpunkt t eine Messung am Atom vor, indem wir es z.B. einem kurzen Laserpuls aussetzen, der eine Frequenz aufweist, mit der wir das Atom aus dem angeregten Zustand 2 (nicht jedoch aus 1) ionisieren können, so erfahren wir, ob es sich noch im angeregten Zustand befunden hat oder bereits zerfallen war. Diese Messung bedeutet aber eine Ausreduktion der Wellenfunktion (11.57). Anschließend wissen wir, ob von ihr nur der erste Term y2 f0 oder der zweite y1 f1 übrig bleibt. Die Gl. (11.57) sagt uns aber mit welcher Wahrscheinlichkeit wir zur Zeit t das eine oder das andere Meßresultat erhalten werden. Die Wahrscheinlichkeit, das Atom noch im angeregten Zustand vorzufinden, ist durch das Betragsquadrat des ersten Terms gegeben und somit w2 = exp(-g t). Die durch den zweiten Term gegebene Gegenwahrscheinlichkeit w 1 = 1 exp(-g t) ist dann gleichzeitig die Wahrscheinlichkeit, daß bereits ein Photon emittiert wurde. Eine Messung des Photons macht also eine eindeutige Aussage über das Atom. Eine solchermaßen vollständige Korrelation zwischen den Teilchen bezeichnet man in der Quantenmechanik als Verschränkung. Bei der Interpretation der Wellenfunktion ist wieder Vorsicht geboten. Sie beschreibt zwar den Emissionsvorgang als kontinuierlichen Prozeß, doch ist hiermit keine faktische Aussage verbunden, etwa in dem Sinne: Nach einer Zeit t = 1/g ist bereits der Bruchteil (1-1/e) = 0,63 der Photonenenergie abgestrahlt worden. Zu diesem Zeitpunkt ist vielmehr das System Atom-Photon in einem Zustand der Superposition, in dem die beiden Meßergebnisse „Photon wurde abgestrahlt“ bzw. „nicht-abgestrahlt“ als Möglichkeit angelegt sind. Der hier erhaltene exponentielle Zerfall des angeregten Zustandes ist als Lösung der Schrödingergleichung höchst ungewöhnlich, beinhaltet er doch eine Irreversibilität des Prozesses, die gewöhnlich erst durch die Berücksichtigung stochastischer Einflüsse hereinkommt. Es ist eine Folge der Abstrahlung ins unendlich ausgedehnte Vakuum. Umgibt man das Atom mit einer reflektierenden Kugel, oder setzt man es in einen Resonator, so ändert sich auch die Zerfallskonstante. Bei sichtbarem Licht ist das zwar schwierig zu bewerkstelligen, da Wände mit Abständen im Bereich der Wellenlänge kaum herzustellen sind. Bei Mikrowellenstrahlung mit l ª 1 cm, ist das aber sehr leicht zu realisieren, und die experimentellen Ergebnisse bestätigen die Auffassung, daß in solchen Fällen das von den Wänden zurückgeworfene Photon auf seine Erzeugung Einfluß nimmt. Zunächst könnte man meinen, daß es in einem solchen Fall immer absorbiert wird. Dann müßte in jedem Fall eine Dehnung des Zerfalls auftreten. Es stellt sich aber heraus, daß auch drastische Verkürzung der Zerfallszeiten möglich sind. So beobachtet man im Falle des NH3-Moleküls bei dem der Wellenlänge l = 1,25 cm entsprechenden Übergang eine Verkürzung der Lebensdauer des angeregten Niveaus von 107 s auf 0,1 s, wenn man es in einen resonanten Hohlraumoszillator einbringt. In diesem Fall hat die von den Wänden reflektierte Welle eine solche Phasenbeziehung, daß es am Ort des Moleküls zur positiven Interferenz mit der abgestrahlten Welle kommt und der Emissionsprozeß somit verstärkt wird (induzierte Emission). 11.7 Der Laser Die von Einstein postulierte induzierte Emission spielt nicht nur bei der Hohlraumstrahlung eine große Rolle, sondern ist auch für die Funktionsweise des LASERs (Light Amplification by Stimulated Emission of Radiation) ausschlaggebend. Im Gegensatz zur Hohlraumstrahlung handelt es sich hierbei allerdings um einen extremen Nicht-Gleichgewichtszustand. Die besonderen Merkmale des Lasers beruhen auf folgenden Eigenschaften: 1) Hohe Monochromasie (im sichtbaren Bereich bis zu Dn /n £ 10 -15) 2) Hohe Parallelität der Strahlung (begrenzt durch Beugungseffekte an Linsen u.ä.) 3) Hohe Strahlungsintensität insbesondere im Impulsbetrieb ( bis zu 1013 W) 4) Möglichkeit ultrakurzer Lichtpulse ( < 10 -13 s) G. Fussmann , Atomphysik SS 2002
166
Optische Strahlungsübergänge
Der grundsätzliche Aufbau des Lasers ist in der Abb. 11-14 dargestellt. Pumplicht
Laserlicht
Spiegel
Abb. 11-14: Schematischer Aufbau eines Lasers.
durchlässiger Spiegel
aktives Lasermaterial
Über das Pumplicht wird die Energie in den Laser eingekoppelt. Hierdurch wird zunächst ein höher liegendes Niveau bevölkert, das dann in ein metastabiles Niveau zerfällt. Dieser metastabile Zustand hat eine lange Lebensdauer (typisch einige ms) und kann so durch den Pumpprozeß stark bevölkert werden. Schließlich wird er stärker besetzt als ein tiefer liegender Zustand (z.B. Grundzustand). Es liegt Inversion vor. Einige zerfallende Atome emittieren Photonen, die von den parallelen Spiegeln reflektiert werden. Sie durchlaufen das angeregte (aktive) Lasermaterial und produzieren vermöge induzierter Emission weitere Photonen. Es ist wichtig festzustellen, daß im Gegensatz zur spontanen Emission diese i n d u z i e r t e n P h o t o n e n n i c h t i n d e n gesamten Raumwinkel ausgestrahlt werden, sondern in Richtung der induzierenden P h o t o n e n . So kommt es zu einem Lawineneffekt. Bei einigen Lasertypen (Superstrahlungslaser) verzichtet man gänzlich auf den auskoppelnden Spiegel. Das Licht durchläuft dann nur in einem einzigen Puls das Material und räumt dabei die gespeicherte Energie ab. Gewöhnlich jedoch läuft das Licht mehrmals vor und zurück, so daß sich eine s t e h e n d e W e l l e ausbildet. 11.7.1
SCHWELLWERTBEDINGUNG
Die durch das Medium laufende Welle verändert ihre Intensität gemäß I (n , z) = I (n , 0)e -a (n ) z ,
(11.59)
wobei der frequenzabhängige Absorptionskoeffizient
a (n ) = [n1 -
g1 n2 ]s (n ) g2
(11.60)
positiv (n1 > g1/g2n2) > 0) oder negativ sein kann. Im letzteren Fall wird die Welle verstärkt. Nach einem Hin- und Rücklauf haben wir dann die Verstärkung I (n , 2L) := G(n ) = e -2a (n ) L . I (n , 0)
(11.61)
Der Wirkungsquerschnitt für Photoabsorption ist in diesem Fall eine Funktion der Frequenz. Sein Integralwert ist mit dem Einsteinkoeffizienten B 12 verknüpft und läßt sich wiederum durch die Oszillatorstärke f12 ausdrücken. Die entsprechende Beziehung
G. Fussmann , Atomphysik SS 2002
167
Optische Strahlungsübergänge •
s 12 = Ú s (n ) dn =
B12 hn 12
=
g2 l2 A21 g1 8 p
c 1 pe 2 = f12 = 2.654 ◊10 -6 f12 [m 2 / s] 4 pe 0 me c 0
(11.62)
wird als Ladenburg-Relation bezeichnet. Der Wirkungsquerschnitt läßt sich dann darstellen als
s (n ) = s 12 L(n ); mit
Ú
•
0
L(n ) dn = 1,
(11.63)
wobei die normierte Profilfunktion L(n) durch den maßgeblichen Verbreiterungsmechanismus (meist Doppler- oder Stoßverbreiterung, seltener "natürliche Verbreiterung") bestimmt ist. Für Abschätzungen ist es sehr sinnvoll die Äquivalenzbreite Dn der Linie gemäß der Definition s12 = s(0) Dn einzuführen (Approximation des Linienprofils durch ein Rechteck mit gleichem Flächeninhalt und Maximalwert s(0)). Mit Hilfe von Gl. (11.62) ergibt sich dann s(0) = s12/Dn . Eine besonders einfache Beziehung erhalten wir, wenn nur das obere Niveau durch endliche Lebensdauer verbreitert ist (natürliche Verbreiterung Dn = 1/t = A 21). In diesem Fall erhalten wir aus Gl. (11.62) unmittelbar s(0) = s12/A21 = g2/g1 l2/8p, was für sichtbares Licht (l = 500 nm und g1 = g2) auf den sehr großen Wert s(0) ª 10-14 m2 führt. Neben der Verstärkung gibt es auch Verluste durch Streuung, Beugung und Reflexionsverlusten an den Spiegeln, die man durch einen Dämpfungskoeffizienten g wie folgt beschreiben kann I ( 2 L) = e -g . I ( 0)
(11.64)
Damit ergibt sich die effektive Verstärkung Geff (n ) = e - ( 2a L + g ) .
(11.65)
Mit der Forderung G > 1 und der Form von a ergibt sich die Schwellwertbedingung n2
g1 g - n1 > = DnSchwelle g2 2s (n ) L
(11.66)
Es muß also eine hinreichend große Überbesetzung des höher liegenden Niveaus erreicht werden. 11.7.2
MODENSELEKTION
Mit der mehrmals hin- und zurücklaufenden Welle (typisch etwa 50 mal bei einem Reflexionsgrad des Austrittspiegel von 98%) ist gleichzeitig eine Moden-Selektion verbunden: Nur solche Wellenlängen werden verstärkt, für die n l/2 = L gilt (n = ganzzahlig, L = Abstand der Spiegel) und die gleichzeitig die Schwellwertbedingung erfüllen. Benachbarte Moden (Dn = 1) haben dann einen Wellenlängenabstand von Dl = l2/(2L). Innerhalb der Dopplerbreite der Linien fallen gewöhnlich sehr viele derartige Moden. Durch gezielte Maßnahmen (Einbringen eines drehbaren Etalons oder eines Prismas bzw. Spektralgitters in den Strahlengang) kann man es erreichen, daß nur noch eine Mode anschwingt. Dieser Ein-Moden-Laser besitzt dann die höchst-mögliche Monochromas ie. Neben den zuvor betrachteten longitudinalen Moden gibt es auch transversale Moden. In zylindrischen Volumina möchte man meist nur die fundamentale TEM00-Mode (Transversale G. Fussmann , Atomphysik SS 2002
168
Optische Strahlungsübergänge Elektro-Magnetische-Mode) zulassen, die ein gaußförmiges Strahlungsprofil ergibt. Dies kann u.U. durch Wahl der Spiegel (Reflexionsgrad, sphärische oder ebene Spiegel) und sorgfältige Justage erreicht werden. Unter diesen Umständen ist die Divergenz des austretenden Laserstrahls nur durch die Beugung an den Spiegeln bestimmt, und man erhält eine besonders hohe P a r a l l e l i t ä t der Strahlung. 11.7.3
RUBINLASER
Wir beschreiben das Prinzip noch etwas genauer anhand des ersten Lasers überhaupt. Dieser Rubinlaser wurde von Maiman 1960 in Betrieb genommen. Als Pumplicht wird eine Xenonblitzlampe benutzt, die die beiden in Abb. 11-15 dargestellten Niveaus 4F1und 4F 2 der im Rubin (Al2O3 ) anstelle der Al-Ionen eingebauten Cr3+-Ionen (typisch 0,5%) bevölkert. Wegen des starken elektrischen Kristallfeldes sind die Niveaus sehr stark verbreitert und bilden ein Absorptionsband. Die Energie in diesen Niveuas zerfällt sehr rasch in zwei metastabile Niveaus mit einer Lebensdauer von ca. 3 ms. Bei hinreichend großer Pumpleistung und kleinen Verlusten an den Spiegeln (Güte des optischen Resonators) tritt Lasertätigkeit ein mit induzierter Emission bei der Wellenlänge von l= 694,3 nm (rotes Licht). 410 nm 500 nm
Abb. 11-15 : Termschema zum Rubinlaser.
metastabil (3ms)
Wie aus der Abb. 11-16 ersichtlich ist, handelt es sich beim Rubinlaser um einen Drei-Niveau-Laser. PumpLaserDerartige Laser sind in der oben dargestellten Art strahlung Strahlung weder für den Dauerbetrieb noch für den Pulsbetrieb geeignet. Sie geben gewöhnlich das 694,3 Licht in kurzen, stochastischen Pulsen ab. Diese nm chaotische Eigenschaft der Drei-NiveauFestkörperlaser beruht auf seiner hochgradig nichtlinearen Eigenschaft (starke Verkopplung und hohe Verstärkung). Das Studium des chaotischen Verhaltens und der Selbstorganisation von nichtlinearen Systemen ist derzeit ein aktueller Forschungsgegenstand auf den verschiedensten Gebieten (Physik, Biologie, Wirtschaft usw.). Brewster-Fenster Pumplicht Pockels zelle
Laserlicht
Spiegel
G. Fussmann , Atomphysik SS 2002
aktives Lasermaterial
durchlässiger Spiegel
169
Optische Strahlungsübergänge Abb. 11-16: Laseranordnung mit Q-switch-Schaltung. Will man einen Rubinlaser als einen zuverlässigen Pulslaser betreiben, so muß man in den Strahlengang innerhalb der Spiegel einen schnellen Schalter (Q-switch) einbauen. Als solche verwendet man Kerr-Zellen (gefüllt mit einer optisch aktiven Flüssigkeit, z.B. Nitrobenzol, deren Dipolmomente im elektrischen Feld ausgerichtet werden) oder - heute bevorzugt - Pockels-Zellen (enthält einen Kristall, z.B. KDP, der durch Anlegen einer Spannung doppelbrechend wird). Beide können durch Anlegen einer Spannung von einigen kV die Polarisationsebene um 90o drehen und damit bei linear polarisisiertem Laserlicht von lichtdurchlässig auf lichtundurchlässig geschaltet werden. Solange der Schalter geschlossen ist (U π 0), tritt keine Lasertätigkeit ein. Nach Umschalten auf Durchlaßrichtung (U = 0 in ca. 1 ns) wird ein einzelner Laserpuls innerhalb weniger ns aufgebaut. Auf diesem Wege können sehr hohe Leistungen in sehr kurzer Zeit ausgekoppelt werden. 11.7.4
VIER-NIVEAU-LASER
Der Drei-Niveau-Laser ist heute weitgehend von dem Vier-Niveau-Laser verdrängt worden, der auch kontinuierlich betrieben werden kann. Ein solcher Laser ist der für Justierzwecke häufig eingesetzte He-Ne-Laser. Hierbei handelt es sich um einen Gaslaser, bei dem die metastabilen Niveaus des Neons (2P) durch Energietransfer-Stöße mit angeregten metastabilen Heliumatomen (Elektronenstoßanregung) gepumpt werden (Abb. 11-17). Diese, auch als "Stöße zweiter Art" bezeichneten Stöße, sind besonders effektiv bei Atomen mit näherungsweise gleichen Anregungsenergien (Resonanzstöße). Im vorliegenden Fall des He-Ne-Lasers kommt es zu einer Überbesetzung, da die metastabilen He-Atome eine sehr lange Lebensdauer haben. Außerdem wird die He-Dichte etwa zehnmal höher als die Ne-Dichte gewählt. Wie man der Abb. 11-17 entnimmt, kann der He-Ne-Laser auf zwei verschiedenen Wellenlängen (im roten und im infraroten Gebiet) betrieben werden. Durch geignete Filter kann man die Lasertätigkeit auf einer der beiden Wellenlängen unterdrücken. Die entgültige Energieabgabe der Ne-Atome vollzieht sich durch Stöße mit der Wand. Der Durchmesser der Glasröhre darf daher nicht zu groß sein (typisch einige mm), um diesen Entleerungsprozeß hinreichend wirksam zu gestalten. 11.7.5
FARBSTOFFLASER
Neben den zuvor besprochenen Rubin-Festkörper-Laser und He-Neon-Gas-Laser gibt es auch Flüssigkeits-Laser. Unter ihnen kommt den Farbstofflasern eine besondere Bedeutung zu, da sie in einem gewissen Frequenzbereich k o n t i n u i e r l i c h v e r s t i m m b a r sind. Die aktive Substanz ist hierbei ein aus großen Molekülen bestehender Farbstoff (engl. dye) wie Rhodamin oder Cumarin, der in einer geeigneten Flüssigkeit gelöst wird. Diese Farbstoffmoleküle besitzen eine sehr große Zahl von Rotations- und Schwingungsniveaus, die aufgrund der Stöße mit den
G. Fussmann , Atomphysik SS 2002
170
Optische Strahlungsübergänge Resonanzstöße 1 2 S 3 2 S
3S rot 632,8 nm 2S Laserstrahlung
infrarot 1150 nm 2p Anregung durch Elektronen Stoß
1S
Entleerung
Rekombination an der Wand
He
Ne
Abb. 11-17: Termschema des He-Ne-Lasers. Die Terme des Neons sind in der Paschen-Notation angegeben: 1s = 2p53s, 2s = 2p54s, 3s = 2p55s, 2p = 2p53p. Lösungsmolekülen zu einem Kontinuum verschmelzen. Mit Hilfe von Blitzlampen oder anderen Lasern wird im Farbstoffmolekül ein elektronischer Zustand angeregt, der durch Stöße sehr rasch (ª 10-11 s) in den tiefliegensten Schwingungszustand relaxiert. Von dort geht der eigentliche Laserübergang in den wesentlich tiefer liegenden elektronischen Grundzustand, der ebenfalls ein Rotations- und Schwingungskontinuum aufweist. Das Laserlicht ist in diesem Fall das Fluoreszenslicht (gegenüber dem Pumplicht rot-verschoben) in höhere Schwingungszustände des Grundniveaus, die unter Normalbedingungen nur schwach besetzt sind, so daß eine Inversion erreicht werden kann. Durch Verdrehen eines Spektralgitters im Strahlengang wird die Laserwellenlänge (oberhalb der Laserschwelle) eingestellt. 11.7.6
MASER UND KURZWELLIGE LASER
Ähnlich wie die Wirkungsweise des Lasers ist die des MASERs (Microwave Amplification through Stimulated Emission of Radiation). Er wurde bereits früher entdeckt und ist gewissermaßen ein Laser im Mikrowellenbereich. Allerdings wird der Maser weniger als Mikrowellenstrahlungsquelle benutzt, sondern als kohärenter Verstärker. Wichtige Maser sind Wasserstoffmaser (mit dem bereits erwähnten 1420 MHz Hyperfeinstrukturübergang) und der Ammoniakmaser. Sie werden insbesondere zur Herstellung von genauen Atomuhren verwendet. Röntgenlaser und VUV-Laser sind zur Zeit noch weitgehend im Entwicklungsstadium: Das hat seine Ursache im wesentlichen in der n3-Abhängigkeit der spontanen Übergangswahrscheinlichkeit. Es ist daher bei kurzen Wellenlängen sehr schwierig, die Pumpleistung so groß zu machen, daß die induzierte Emission gegenüber der spontanen überwiegt. Umgekehrt ist dies auch der Grund, weshalb Maser in der Regel einfacher aufzubauen sind als optische Laser. Große Bedeutung haben sogenannte EXIMER-Laser (excited dimers) erlangt, die besonders im nahen UV (200- 400 nm) hohe Laserleistungen erreichen und deshalb oft als Pumplaser für Farbstofflaser verwendet werden. Grundlegend ist bei diesen Gas-Lasern, daß der Laserübergang von einem Molekül ausgesandt wird, das nur im angeregten Zustand stabil ist. Typische Vertreter sind ArF- und XeCl-Laser (l = 308 nm). Während das XeCl-Molekül sehr instabil ist und sofort nach seiner Bildung zerfällt, hat das angeregte Xe*CL-Molekül eine wesentlich größere G. Fussmann , Atomphysik SS 2002
171
Optische Strahlungsübergänge Lebensdauer und weist auch Schwingungs- und Rotationsniveaus auf. Diese angeregten Moleküle entstehen in Gasentladungen und können leicht zum Lasern gebracht werden, da – wegen der fehlenden Moleküle im abgeregten Zustand – fast immer eine Inversion vorliegt. Wir fassen nochmal das Wichtigste über den Laser zusammen: Man benötigt eine Energiequelle, die ein metastabiles Niveau überbesetzt (Inversion). Die Zahl der aktivierten Atome muß hinreichend groß sein (Länge, Dichte, Pumpleistung usw.), so daß die Schwellwertbedingung erfüllt und die Strahlung durch induzierte Emission verstärkt wird. In der Regel wird ein Resonator aus zwei einander gegenüberliegenden Spiegeln verwendet. Durch Modenselektion kann eine hohe Monochromasie und Parallelität der Strahlung erreicht werden. 11.7.7
LASERANWENDUNGEN IN DER ATOMPHYSIK
Isotopentrennung und Laserkühlung Erste Versuche von O. R. Frisch im Jahr 1930 zeigten bereits, daß es möglich ist, einen Atomstrahl durch einen ihn kreuzenden Photonenstrahl abzulenken. Frisch benutzte hierzu einen thermischen Na-Atomstrahl, der der Strahlung einer gewöhnlichen Na-Lampe ausgesetzt war. Der Effekt beruht auf der Absorption des gerichteten Photonenpulses hn/c durch die Atome. Bei der nachfolgenden Fluoreszenz-Emission geht die Strahlung isotrop in alle Richtungen, so daß im Mittel hierbei kein Impuls übertragen wird. Mit den modernen Lasern steht wesentlich mehr Leistung als mit konventionellen Lichtquellen zur Verfügung, so daß erheblich größere Ablenkungen möglich werden. Wegen der Schmalbandigkeit der Laser ist es damit auch möglich, die einzelnen Isotope, die ja geringfügig unterschiedliche Resonanzfrequenzen aufweisen, voneinander zu trennen. Außerdem besteht auch die Möglichkeit, Atome zu kühlen. Dazu wählt man die Laserfrequenz etwas kleiner als die Resonanzfrequenz des ruhenden Atoms, wie in der Abb. 11-18 skizziert. Abb. 11-18: Linienprofile und Laserfrequenz bei der Laserkühlung.
nLaser
In Resonanz kommen dann nur Atome, die auf den Laser zufliegen. Durch Absorption der Photonen und nachfolgender isotroper Abstrahlung werden sie in der AnregungsDn Doppler richtung abgebremst. Sie verlieren auch insgesamt kinetische Energie, da sie bei der nres. Emission ein Photon höherer Energie (hn0 ± n Dn nat) abgeben, als sie zuvor absorbiert haben. Dieser Kühlungsprozeß sollte bis zur G r e n z t e m p e r a t u r kTmin = h G/2 = h Dnnat/2 möglich sein, wobei Dnnat die natürliche Linienbreite aufgrund der endlichen Lebensdauer des angeregten Zustands ist. Für Na wurden so Tmin = 240 mK erwartet. Gemessen wurden aber noch weitaus kleinere Temperaturen von etwa 40 mK und darunter. Diese unerwarteten Effekte lassen sich nur im Rahmen einer wesentlich allgemeineren Theorie erklären, die auch QED-Effekte berücksichtigt. Hierbei führt die sog. „light shift“ der Energieniveaus und das optisches Pumpen zum ständigen Energieverlust der Atome (Sisyphus cooling, Nobelpreis 1997: C. Cohen-Tannoudji, W. D. Phillips und S. Chu). Interessant ist, daß sich durch Verwendung von insgesamt sechs Lasern (je zwei antiparallel zu den drei Raumrichtungen) auch Wolken von neutralen Atomen einschließen lassen. Dnnat
G. Fussmann , Atomphysik SS 2002
172
Optische Strahlungsübergänge Bose-Einstein-Kondensation und Atomlaser Die Atome bewegen sich schließlich bei den derzeitigen Tiefstwerten von T ª 10-9 K mit einer Geschwindigkeit von etwa 1 mm/s. Bei deratig tiefen Temperaturen ist die de Broglie-Wellenlänge kleiner als der mittlere Abstand der Teilchen, und es kommt zum Überlapp der Wellenfunktionen. Haben die eingeschlossenen Teilchen halbzahligen Spin (Fermi-Teilchen), so gehen sie auf Abstand zueinander entsprechend der Pauliregel. Ist ihr Spin jedoch ganzzahlig (Bose-Teichen), so suchen sie geradezu die gegenseitige Nähe und vereinigen sich zu einem Ensemble, das durch eine einzige Wellenfunktion beschrieben werden kann. Man spricht von der Bose-EinsteinKondensation. Es treten jetzt neue sonderbare Phänomene wie die Suprafluidität auf. Die im BoseEinstein-Kondensat verschmolzenen Atome bilden eine reine Gesamtheit und zeichnen sich durch eine hohe Kohärenzlänge aus, ganz ähnlich, wie die in Lasern erzeugten Photonen. Man denkt daher daran, schon bald Atomlaser bauen zu können, in denen anstelle eines kohärenten Lichtstrahls ein analoger Atomstrahl aus der Apparatur austritt. Beim Licht ist dieser reine Quantenzustand relativ einfach herzustellen, da die Photonen mit der übrigen Welt nur sehr schwach wechselwirken. Bei Atomen und Molekülen bedarf es jedoch eines extremen Aufwandes, um diesen Zustand von der (klassischen) Außenwelt zu isolieren. Quantenmechanik am einzelnen Atom Die früher besprochene Paul-Falle erlaubt u.a. Untersuchungen an einzelnen Ionen. Beispielsweise kann man mit einem Laser nahe der Resonanzfrequenz ein eingeschlossenes Ba+-Ion bestrahlen und erhält dann pro Sekunde etwa 109 Fluoreszenz-Photonen infolge spontaner Emission, die mit einem Photomultiplier aus einer zum Laser verschiedenen Richtung gut zu beobachten sind (s. Abb. 11-20). Hierbei stellt sich wiederum ein Laserkühlungseffekt ein.
Resonanzzustand gepulstes Zusatzlicht metastabil Laser
Fluoreszenz Licht Grundzustand
Abb. 11-19: Photonenzählrate bei Variation der Laserfrequenz.
Abb. 11-20: Anregung und Zerfall beim Einzel-Ion-Experiment.
Wie man der Abb. 11-19 entnimmt, steigt die gemessene Photonenzählrate mit Annäherung von der niederfrequenten Seite an die Resonanzfrequenz steil an, um bei deren Überschreitung abrupt abzufallen. Dies erklärt sich aus dem Umstand, daß für Dn > 0 die Laserkühlung in eine Heizung umschlägt, so daß die Teilchen sich in einem größeren Volumen aufhalten bzw. verloren gehen. Strahlt man zusätzlich kurzzeitig eine niedrigere Frequenz ein, so kann man den Übergang zu einem metastabilen Zustand induzieren.
G. Fussmann , Atomphysik SS 2002
173
Optische Strahlungsübergänge
Abb. 11-21: Quantensprünge eines Einzelions. Abb. 11-22: Statistik der Verweildauern im Während der Verweilzeit im metastabilen metastabilen Zustand. Zustand verschwindet das Fluoreszenzlicht. Solange das Ion in diesem langlebigen Zustand (t ª 30 s) verweilt, kann es keine Resonanzphotonen absorbieren und damit auch kein Fluoreszenzlicht emittieren. Man beobachtet, daß die Strahlung nach einer statistischen Zeitspanne Dt wieder erscheint (Abb. 11-21). Trägt man die Häufigkeiten N(Dt) über Dt auf, so ergibt sich, wie in Abb. 11-22 zu sehen, eine Exponentialkurve N(Dt) ~ exp(-Dt/t) mit der gleichen Lebensdauer t, wie sie auch bei Untersuchungen an vielen Teilchen gemessen wird. Mit derartigen Studien konnte in den 80er Jahren H. Walther erstmalig den Nachweis erbringen, daß der statistische Charakter der Quantenmechanik bereits beim Einzelteilchen zutage tritt und nicht auf einer Ensemble-Statistik beruht.
Quanten-Schwebungen Werden zwei eng benachbarte Niveaus (DE = hn12) mit einem kurzen Laserpuls (Dt < 1/n12) aus dem Grundzustand (E0) gleichzeitig angeregt, so beobachtet man, daß das Fluoreszenzlicht nicht nach einem einfachen Exponentialgesetz mit einer Zerfallskonstanten zerfällt. Abb. 11-23: Abklingkurve eines Fluoreszenzsignals nach einem kurzen Laserpuls.
Es weist vielmehr, wie in Abb. 11-23, eine zusätzliche Schwebung mit der Differenzfrequenz n12 auf. Dieses Schwebungsphänomen ermöglicht somit die Messung von sehr kleinen Energieabständen, ohne den Aufwand einer hochauflösenden Spektroskopie treiben zu müssen. Die Deutung der Schwebungserscheinungen (engl.: quantum beats) beruht auf der WeißkopfWigner-Theorie für die spontane Emission, auf die wir weiter unten kurz eingehen werden. Interessant ist festzustellen, daß man in diesem Fall jedem ausgesandten Photon bereits eine Frequenzmodulation zuordnen muß. Um dies zu verstehen, erinnern wir zunächst daran, daß die bei einer Spektralmessung beobachtete natürliche Linienbreite durch die endliche Länge des Wellenzuges (Kohärenzlänge) eines jeden Photons bedingt ist. Hat man nun zwei nicht-kohärente Strahler mit den benachbarten Frequenzen w1 und w2 und den Lebensdauern t1 und t 2, so werden Photonen ausgesandt, deren Wellenzüge entweder die Frequenz w1 und Kohärenzlänge ct1 aufweisen, oder solche mit der Frequenz w2 und Kohärenzlänge ct2. In diesem Falle würde man G. Fussmann , Atomphysik SS 2002
174
Optische Strahlungsübergänge keine Quantenschwebung beobachten: Die Strahlung würde als Mischung von zwei Exponentialfunktionen monoton abfallen. Bei den Quantenschwebungen hingegen sind den einzelnen Photonen bereits beide Frequenzen aufgeprägt. Man kann sich den Wellenzug eines solchen Photons demnach als eine Überlagerung von zwei Sinusschwingungen – also ein Schwebungszug– endlicher Länge vorstellen. Im folgenden skizzieren wir die quantenmechanische Behandlung der Schwebung. Der angeregte Zustand besteht diesmal aus zwei benachbarten Zuständen, die, wie wir der Einfachheit halber annehmen wollen, beide mit der gleichen Zeitkonstanten zerfallen. In Anlehnung an die WignerWeißkopf-Theorie schreiben wir daher
y a = a1 e
gt -iw 1 t - 2
e
u1 + a2 e
gt -iw 2 t - 2
e
u2 ,
(11.67)
wobei die Zeitabhängigkeit der ungestörten (d. h. nichtzerfallenden) Terme gemäß exp(-i Ek/ h ) berücksichtigt wurde. Als Anfangsbedingung hat man |a1|2 + |a2|2 = 1. Die Gesamtwellenfunktion schreibt sich nun
y = a0 (t ) e -iw 0 t u0 + a1 e -iw 1 t e
-
gt 2
u1 + a2 e -iw 2 t e
-
gt 2
u2 ,
(11.68)
worin die Amplitude des Grundzustandes ebenfalls eine Zeitabhängigkeit aufweisen muß. Für den Fall, dass die beiden oberen Terme zusammenfallen, entnehmen wir der Wigner-Weißkopftheorie nach Gl. (11.57) a0 = [1 - exp(g)]1/2. In Verallgemeinerung dessen schreiben wir unter Beachtung der Gleichbehandlung der beiden angeregten Niveaus gt gt Ê -iw 1 t - g2t ˆ Ê ˆ Ê -iw 1 t - g2t ˆ Ê ˆ -iw 2 t - 2 -iw 2 t - 2 a0 = 1 - Á a1 e e ˜ * Á a2 e e ˜ + Á a1 e e ˜ Á a2 e e ˜* Ë ¯ Ë ¯ Ë ¯Ë ¯ .
(11.69)
= 1 - e -g t a1 * a2 ei (w 1 -w 2 ) t + a1 a2 * e -i (w 1 -w 2 )t Berücksichtigen wir nun, daß die Anregung der Niveaus durch einen Laserpuls erfolgt, so ist deren Anfangsbesetzung proportional zum Betragsquadrat der Dipolmomente, und es gilt |ai|2 ~ ||2 mit i = 1,2. Diese Dipolmomente bestimmen aber auch deren Zerfall, so daß gi ~ ||2 gelten muß. Die Forderung g1 = g2 führt uns daher auf |a1|2 = |a2|2 = 1/2. Die Wahrscheinlichkeit, das Atom nach der Zeit t im Grundzustand vorzufinden, ergibt sich damit zu 2
w0 (t ) = a0 = 1 - e -g t cos[(w1 - w2 )t ].
(11.70)
Die Photonenzählrate erhält man schließlich durch Differentiation zu I~
Ï ¸ dw0 (w - w2 ) = ge -g t Ìcos[(w1 - w2 )t ] - 1 sin[(w1 - w2 )t ]˝. dt g Ó ˛
G. Fussmann , Atomphysik SS 2002
(11.71)
175
Atome in statischen Feldern
12 ATOME IN STATISCHEN FELDERN 12.1 Termaufspaltung im Magnetfeld Mit den in den Kapiteln 9 und 10 abgeleiteten Beziehungen haben wir die Voraussetzungen, das Verhalten der Atome im Magnetfeld zu beschreiben. Der einfachste Fall ist ein statisches, homogenes Magnetfeld. Die Energieänderung des Atoms aufgrund des Magnetfelds ist gegeben durch das Skalarprodukt zwischen B und magnetischem Moment mJz r r DE = - m J ◊ B = M J g J mBB
(12.1)
Hier ist gJ der früher abgeleitete Lande´ Faktor und MJ die bereits bekannte magnetische Quantenzahl. Entsprechend den 2J+1 Werten von MJ spaltet also jeder Term in ebensoviele Energieniveaus auf. Die spektroskopisch beobachtbaren Linien sind aber immer Übergänge zwischen zwei Termen, so daß wir die Aufspaltungsdifferenzen zwischen oberem und unterem Term betrachten müssen. Ferner haben wir die Auswahlregeln DMJ = 0, ±1 zu beachten. Damit haben wir D ( hn ) = D ( M J g J ) m B B
(12.2)
Da die Übergänge mit DMJ = 0 linear polarisiert sind und der E-Vektor parallel zum B-Feld steht, nennt man die entsprechende Strahlung p-Strahlung. Entsprechend bezeichnet man die Übergänge mit DMJ = ±1 als s+- und s--Strahlung. Wie bereits in Kap. 11 ausführlich erläutert, handelt sich hierbei i.a. um elliptisch polarisierte Strahlung, die aber parallel zu B zirkular polarisiert und in der xy-Ebene linear polarisiert (mit E-Vektor senkrecht zu B) ist. Für die Frequenzen der Strahlung zwischen oberem (g) und unterem Term (g') ergibt sich ( hn ) p = ( hn0 ) + ( g - g ¢ ) M J mBB
[ = ( hn ) + [ gM
] - 1)]m B
( hn )s + = ( hn0 ) + gM J - g ¢ ( M J + 1) mBB ( hn )s -
0
J
- g¢(M J
(12.3)
B
Hier sind zwei Fälle zu unterscheiden: ∑
Die g-Faktoren für das obere und untere Niveau sind gleich. Dann fallen alle Übergänge mit DMJ = 1 zusammmen und ebenso diejenigen mit DMJ = -1 und DMJ = 0. Es gibt also eine Aufspaltung in drei Linien. Diese Erscheinung nennt man den normalen Zeeman-Effekt57 58. Die Bezeichnung ist historisch bedingt, denn in Wirklichkeit ist dieser Fall eher die Ausnahme (Übergänge in Singuletts).
12. Die g-Faktoren für das obere und untere Niveau sind unterschiedlich. Hier ergibt sich der anomale Zeeman-Effekt. In diesem Fall können sehr zahlreiche Linien in Erscheinung treten. Wir veranschaulichen die Verhältnisse in Abb. 12-1 am Beispiel des 2P- 2S-Übergangs des NaAtoms (D-Linie). 57 Benannt nach dem niederländischen Physiker P. Zeeman (sprich Seemann), der den Effekt 1896 entdeckte. 58
G. Fussmann , Atomphysik SS 2002
176
Atome in statischen Feldern
M
M J
J
3/2
3/2 2
1/2
P 3/2
-3/2
- 1/2
-1 +1/2 +1 -1/2
-1/2,+1/2 -1/2
0 -1/2
P
1/2
2
0 +1/2
1/2
+1/2 2
M M L S +1 +1/2
- 1/2
-1 -1/2
-3/2
0 +1/2
1/2
+1/2 S 1/2
- 1/2
0 -1/2
-1/2
sps s p s
s
p
s
n
Abb. 12-1: Zeeman-Aufspaltung des Na-Resonanzdubletts 2P <-> 2S (Mitte). Links: ohne Magnetfeld. Rechts: Baschen-Back-Effekt im hohen Magnetfeld (n. Hellwege). Die Aufspaltung ist proportional zur magnetischen Induktionsdichte B. Wir haben es daher mit dem linearen Zeeman-Effekt zu tun. Die in Abb. 12-2 und Abb. 12-3 wiedergebenen experimentellen Befunde bestätigen die oben dargelegte Theorie auf das Schönste.
Abb. 12-2: Photographische Aufnahme des Zeeman-Effektes beim Natrium. Oben ohne, unten mit angelegtem Magnetfeld (Vergleiche Abb. 12-1).
Abb. 12-3: Normaler Zeeman-Effekt beim Cadmium. Oben p-, unten s -Komponenten.
Der Zeeman-Effekt spielt bei der Identifizierung von Termen eine bedeutende Rolle. Durch Anlegen des magnetischen Feldes wird die Symmetrie gebrochen und die hierdurch bedingte energetische Entartung aufgehoben. Die Terme spalten auf, so daß wir nun anhand der Zahl der erscheinenden Spektrallinien die Gesamtdrehimpulsquantenzahl J erkennen können. Bei größeren Feldstärken müssen auch quadratische und höhere Potenzen von B berücksichtigt werden. Schließlich kommt es b e i s e h r g r o ß e n M a g n e t f e l d e r n zu einer völligen Entkopplung der Drehimpulse L und S. Sowohl L wie auch S wechselwirken dann getrennt mit B, und wir haben wieder sehr einfache Verhältnisse. Die Termaufspaltung beträgt nun
G. Fussmann , Atomphysik SS 2002
177
Atome in statischen Feldern D( hn ) = ( DML + 2 DMS ) mBB
(12.4)
Dieser Grenzfall wird als Paschen-Back-Effekt bezeichnet. Man beachte, daß hier - wegen der Auswahlregeln DML = ± 1, 0 und DMS = 0 - wie beim normalen Zeeman-Effekt wieder nur eine Aufspaltung in drei Linien stattfindet (s. Abb. 12-1). Die Frage, ob ein Magnetfeld stark oder schwach ist, läßt sich nicht generell beantworten, da der Übergang vom linearen Zeeman-Effekt zum Paschen-Back-Effekt von der Feinstrukturaufspaltung abhängt. So zeigt Wasserstoff infolge der äußerst geringen Feinstrukturaufspaltung bereits bei relativ kleinen Feldern (B < 1T) den Paschen-Back-Effekt. Ebenso wird der Kernspin bei der Hyperfeinstrukturaufspaltung durch sehr kleine Magnetfelder entkoppelt, so daß hier ebenfalls der Paschen-Back -Effekt in Erscheinung tritt. Generell ist aber der reine Paschen-Back-Effekt eher eine Ausnahme; meist ist er näherungsweise gültig. 12.1.1
LEVEL-CROSSING UND HANLE-EFFEKT
Mit steigender magnetischer Feldstärke kommt es schließlich zum Überlapp der aufspaltenden Zeeman-Komponenten. Unter diesen Umständen bricht der lineare Zeeman-Effekts zusammen und quadratische und höhere Terme werden bedeutsam. Den genauen Verlauf der einzelnen Zeemanterme erhält man aus einer Diagonalisierung des Hamilton-Operators, was auf die Lösung einer Eigenwertgleichung (Nullstellen eines Polynoms höhrene Grades) hinausläuft. Es zeigt sich dabei, daß viele Terme sich durchaus kreuzen können, während andere asymptotisch mitander verschmelzen. Eine derartige Situation ist in Abb. 12-4 wiedergegeben. Abb. 12-4: Hyperfeinstruktur LevelCrossing beim Übergang 2P3/2 - 2S1/2 des Cu-Atoms. Infolge der Wechselwirkung mit dem Kernspin (I = 3/2) gibt es die Terme mit dem Gesamtdrehimpuls F = |I-J|, …,I+J = 0, 1, 2, 3. An den eingekreisten Stellen entstehen bei Variation des Magnetfelds Kreuzungen vom Typ DM = 2. Hier kann eingestrahltes s+-Licht in s- -Licht umgewandelt werden. Gleichzeitig ändert sich die räumliche Intensitätsverteilung des Fluoreszenzlichtes IF. Im unteren Teil des Bildes ist dIF/dB aufgetragen. Der zu B = 0 gehörige Resonanzdurchgang ist der HanleEffekt (aus Haken-Wolf, nach Messungen von Bucka et al.). In den Kreuzungspunkten liegt eine Entartung vor, indem sich beim gleichen Energie-Eigenwert unterschiedliche Polarisationszustände mischen. Dies bemerkt man beim Auftreten einer anderen Polarisationsmode des Fluores-zenzlichtes, wenn Licht einer bestimmten Polarisation aus einer Richtung eingestrahlt wird. Hierbei kann es sich beispielsweise um linear polarisiertes Licht handeln, das in zirkular polarisiertes umgewandelt wird. Das anregende Licht kann dabei von einer gewöhnlichen, breitbandigen Lampe erzeugt werden; es wird in einer bestimmten Richtung unter Verwendung eines Polarisators auf die dem Magnetfeld ausgesetzte Probe (z.B. Gasentladung) eingestrahlt. Bei der Beobachtung des Streulichtes aus einer Richtung verwendet man gewöhnlich einen Photomultiplier mit vorgeschaltetem zweiten (gedrehten) Polarisator. Da sich mit der Zumischung des zweiten Polarisationszustandes jedoch auch die Ausstrahlungscharakteristik ändert, ist der zweite Polarisator nicht unbedingt für den Nachweis des Kreuzungspunktes erforderlich. Wie aus der Abb. 12-4 zu ersehen ist, ergeben sich beim Durchfahren der Kreuzungspunkte Intensitätsresonan-zen (als Funktionen von B). Ihre Breite entspricht nach G. Fussmann , Atomphysik SS 2002
178
Atome in statischen Feldern Umrechnung auf Energieeinheiten, der natürliche Linienbreite, die somit – ohne hochlauflösende Spektroskopie – meßbar wird. Ein besonderer Kreuzungspunkt liegt für B = 0 vor. Wird |B| hinreichend klein, fallen schließlich alle Zeeman-Komponenten zusammen. Die unter diesen speziellen Bedingungen zu beobachtenden Polarisationsmischungen wurden bereits 1924 von Hanle untersucht und werden als Hanle-Effekt bezeichnet. 12.2 Termaufspaltung in elektrischen Feldern und elektrische Dipole Während der Zeeman-Effekt bereits 1896 entdeckt wurde, konnte die analoge Aufspaltung der Spektrallinien durch ein elektrisches Feld erst 1913 durch J. Stark nachgewiesen werden. Der Grund liegt in der experimentellen Schwierigkeit. Die benötigten elektrischen Felder liegen in der Größenordnung von 107 V/m und darüber und verursachen sehr leicht Durchschläge (also elektrische Kurzschlüsse). Stark benutzte eine Kanalstrahlröhre, bei der die angeregten Atome oder Ionen in einem Zwischenraum hinter der gitterförmigen Kathode beobachtet werden können Abb. 12-5). Da in diesem Raum praktisch keine Elektronen vorkommen, können über Abstände von wenigen mm Spannungen von ca. 10 000 V angelegt werden. Im Vergleich zum Zeeman-Effekt treten jedoch beim Stark-Effekt zwei Besonderheiten auf. Die meisten Atome und Ionen zeigen mit wachsendem E- Feld keine lineare Aufspaltung, sondern eine wesentlich schwächere Zunahme (quadratischer Stark-Effekt). Der lineare Stark-Effekt wird p r a k t i s c h n u r b e i m W a s s e r s t o f f a t o m , den wasserstoffähnlichen Ionen und bei hoch angeregten Zuständen (die ebenfalls H-ähnlich sind) festgestellt (Abb. 12-6). Die Aufspaltung der Terme ist nicht vollständig wie im Magnetfeld, sondern die Entartung ist nur zur Hälfte aufgehoben. Die erste Besonderheit beruht darauf, daß ein Atom in der Regel kein statisches elektrisches Dipolmoment besitzt. Wir haben beispielsweise • • • z nlm
D
=
Ú Ú Úy
• * nml
-• -• -•
•
•
Ú Ú Ú
( ez)y nml dz dy dx = e dx dy |y nml |2 z dz = 0 -•
-•
(12.5)
-•
Abb. 12-6: Aufspaltung der Balmerlinien (Ha, Hb, Hg , Hd,). Die E-Feldstärke nimmt 8 Abb. 12-5 : Die Anordnung von Stark zur nach oben zu (Emax ª 1,14 10 V/m) und führt nach Durchlaufen einer quadratischen Messung der Aufspaltung von Spektrallinien im elektrischen Feld (n. Haken-Wolf) Aufspaltung zur Feldionisation (Abbrechen der Emission) (n. Hellwege). Das Integral ist Null, da der Integrand als Funktion von z eine ungerade Funktion darstellt. Da der Hamilton-Operator der Störung durch G. Fussmann , Atomphysik SS 2002
179
Atome in statischen Feldern r r H ¢ = - D ◊ E = - e D z E = -e zE
(12.6)
gegeben ist, ergibt sich in erster Näherung (DE(1) = < n l ml | H ´ | n l m l > = 0, d.h. linear zu E) keine Aufspaltung, sondern erst in zweiter Näherung, indem ein elektrisches Dipolmoment vom EFeld induziert wird (D µ E), was auf den quadratischen Stark-Effekt führt. Ursache für das Verschwinden von DE(1) ist die Parität eines definierten Zustands. Um den linearen Stark-Effekt zu erhalten, muß eine Entartung vorliegen, so daß eine Überlagerung von Zuständen unterschiedlicher Parität möglich ist. Dies ist beim Wasserstoff der Fall. So können z.B. für die Hauptquantenzahl n = 2 aus den vier Wellenfunktionen y 200, y 210 , y 211 , y 21-1 die gemischten Zustände 1 1 (y 200 + y 210 ); f 2 = (y 200 - y 210 ) 2 2 1 1 f3 = (y 211 + y 21- 1 ); f 3 = (y 211 - y 21- 1 ) 2 2
f1 =
(12.7)
gebildet werden, die in erster Ordnung die Eigenfunktionen zum Operator H = H 0 + H´ sind59 . Rechnet man hiermit analog zu Gl. (12.5) die Dipolmomente aus, so ergibt sich D1z = -3ea0 ; D2z = +3ea0 ; D3z = D4z = 0 .
(12.8)
Damit spaltet der n = 2-Term in drei Niveaus auf, wobei die unverschobene Komponente doppelt zu zählen ist. Von der vierfachen Entartung (ohne Spin) ist somit die Hälfte aufgehoben. Diese unvollständige Aufspaltung im E-Feld beruht auf der Unabhängigkeit der elektrischen Wechselwirkung vom Vorzeichen der ml - Quantenzahl, d.h. klassisch betrachtet vom Umlaufsinn des Elektrons. Wir können das Ergebnis auch so interpretieren, als hätte das H-Atom im Zustand n = 2 ein p e r m a n e n t e s e l e k t r i s c h e s D i p o l m e n t vom Betrage 3 e a0 ,, das sich auf drei verschiedene Weise in einem statischen E-Feld orientieren kann: parallel, antiparallel und senkrecht (mit doppeltem statistischen Gewicht) . Für den Grundzustand des Wasserstoffs allerdings bleibt das Dipolmoment null, da dieser ja nicht entartet ist. Die Lyman-a-Linie (Übergang 2 Æ 1) spaltet demnach in drei Linien auf60 . Die Aufhebung der Entartung durch das elektrische Feld beim H-Atom hat eine besondere Konsequenz für das metastabile 2s-Niveau. Durch die Mischung der Zustände y 200 (2s) und y 201 (2p) wird nun ein Übergang in den Grundzustand möglich. Hierfür sind relativ kleine Feldstärken von ª 300V/cm ausreichend. Auf ganz ähnliche Weise wie beim H-Atom erklären sich die permanenten Dipolmomente einiger Moleküle (z.B. HCl, H2O). Hier gibt es sehr eng benachbarte Rotationszustände verschiedener Parität. Ist die thermische Energie der Moleküle groß im Vergleich zu den Abständen dieser Niveaus, so liegt praktisch Entartung vor und die Zustände können sich mischen.
59Das bedeutet, daß die Matrix der Energieeigenwerte Ú f * H f d v = E b ab dab mit diesen Eigenfunktionen Diagonalgestalt a
annimmt (mit a,b = 1, 2, 3, 4). 60 Allgemein spaltet der Term zur Haupquantenzahl n in 2n-1-Niveaus auf. Bei der Linie H (n= 3Æ 2) ergeben sich damit a
bereits 15 Linien. Die Berechnung der Stark-Aufspaltung bei höheren Hauptquantenzahlen ist recht verwickelt; sie gestaltet sich in parabolischen Koordinaten besonders einfach. G. Fussmann , Atomphysik SS 2002
180
Atome in statischen Feldern
Der Stark-Effekt spielt in der Meßtechnik nicht so eine große Rolle wie der Zeeman-Effekt, da hinreichend große E-Felder, die zu meßbaren Aufspaltungen führen, selten sind. Er ist allerdings von Bedeutung in der Plasma- und Astrophysik. Hier verursachen die Elektronen und Ionen ein statistisch schwankendes Feld (das elektrische Mikrofeld), das zu einer erheblichen Verbreiterung der Linien führt. Diese sogenannte Stark-Verbreiterung der Balmerlinien ist proportional zur Ladungsträgerdichte und kann somit zur Bestimmung von E l e k t r o n e n d i c h t e n (beispielsweise von Sternatmosphären) herangezogen werden. Auch der quadratische Stark-Effekt muß bei astrophysikalischen Messungen oft beachtet werden, da er zu einer Verschiebung des Linienzentrums führt und somit – bei Fehldeutung als Dopplereffekt – eine Geschwindigkeit der Objekte vortäuschen kann. Schließlich sei noch erwähnt, daß ein Magnetfeld nicht immer zu einer Zeeman-Aufspaltung führt, sondern in gewissen Fällen auch eine Stark-Aufspaltung bzw. eine Kombination von beiden Effekten bedingt. Das ist z.B dann der Fall, wenn sich A t o m e m i t h o h e r G e s c h w i n d i g k e i t q u e r z u e i n e m M a g n e t f e l d bewegen. Entsprechend den Transformationsgleichungen der elektromagnetischen Felder (s. Kap. 9) tritt dann im Bezugsystem des Atoms sowohl ein Magnetfeld wie auch ein (häufig viel stärkeres) elektrisches Feld auf. Man spricht in diesen Fällen vom translatorischen Stark-Effekt.
G. Fussmann , Atomphysik SS 2002
181
Mehrelektronen-Atome
13 MEHRELEKTRONEN-ATOME 13.1 Das Pauli-Prinzip und die Symmetrie der Wellenfunktionen Im Kapitel 9 haben wir uns bereits mit einigen wichtigen Eigenschaften der Atome mit mehreren Elektronen befaßt. Es ist aber noch ein wichtiges Prinzip zu erläutern, das für das Verständnis des periodischen Aufbaus der Elemente und der möglichen Konfigurationen der Atome von grundlegender Bedeutung ist. Dieses Prinzip ist in seiner eigenlichen Natur nach ein Symmetrieprinzip, das sich aber durch Umformung in eine andere Form bringen läßt und als Paulisches Ausschließungsprinzip bekannt ist. Wir skizzieren hier zunächst den Zusammenhang zwischen den beiden Prinzipien. Für zwei nicht miteinander wechselwirkende Teilchen lautet der Hamilton-Operator È p12 r ˘ È p22 r ˘ H = H1 + H 2 = Í + V (r1 )˙ + Í + V (r2 )˙ Î 2m1 ˚ Î 2m2 ˚
(13.1)
Die Lösung der Schrödinger-Gleichung läßt sich dann als Produkt der Einzellösung schreiben: Y r1,r 2 = y1 r1 y2 r2
(13.2)
Hierbei bedeutet der untere Index die Quantenzahl bzw. den Satz der Quantenzahlen, die den Zustand des Teilchens kennzeichnen. In Kurzform schreiben wir statt (13.2)) einfach Y 1,2 = y1 1 y2 2
(13.3)
wobei sich die Zahlen in der Klammer auf die Koordinaten der Teilchen 1 und 2 beziehen. Wir betrachten nun im folgenden den wichtigen Fall, daß die Teilchen nicht unterscheidbar sind. Dann führt eine Vertauschung der Teilchen zur Wellenfunktion Y 2,1 = y1 2 y2 1
(13.4)
Die beiden Lösungen (13.3) und (13.4) sind wegen der Orthogonalität der Einzellösungen wieder orthogonal. Das sieht man aus Y* 2,1 Y 1,2 = y*1 1 y2 1 y*2 2 y1 2
(13.5)
Wir fragen jetzt nach der Wahrscheinlichkeit P(1,2), ein Teilchen bei der Koordinate 1 und das andere bei der Koordinate 2 zu finden. Offensichtlich muß wegen der Ununterscheidbarkeit P(1,2) = P(2,1) gelten. Wir erhalten aber P (1,2) = Y* 1,2 Y 1,2 = y1 1
2
y2 2
2
P (2,1) = Y* 2,1 Y 2,1 = y1 2
2
y2 1
2
(13.6)
was für r1 π r2 nicht dasselbe liefert. Um diesen Widerspruch zu beseitigen, können wir es mit einer Linearkombination der beiden Terme (13.3) und (13.4) versuchen, die ja ebenfalls Lösungen der G. Fussmann , Atomphysik SS 2002
182
Mehrelektronen-Atome linearen Schrödinger-Gleichung sind. In der Tat gibt es zwei Möglichkeiten, die zum Ziel führen, nämlich die Summe und die Differenz YS 1,2
= 1 Y 1,2 + Y 2,1
YA 1,2
= 1 Y 1,2 - Y 2,1
2
2
(13.7 a, b)
Im ersten Fall ist die Wellenfunktion symmetrisch, im zweiten Fall antisymmetrisch mit Bezug auf die Koordinaten r1 , r 2 . Es zeigt sich, daß in der Natur beide Möglichkeiten vorkommen. Die symmetrische Lösung ist bei den Teilchen mit ganzzahligem Spin realisiert (z.B. Photonen, pMesonen, Phononen, 4He); sie heißen Bosonen. Bei halbzahligem Spin (Elektronen, Myon, Proton, Neutron, 3He) genügen die Teilchen dagegen der antisymmetrischen Lösung; diese Teilchen heißen Fermionen. Das unterschiedliche Symmetrieverhalten hat enorme Konsequenzen für das Ensembleverhalten der Teilchen (beispielsweise hängen die Eigenschaften der Supraleitung oder Suprafluidität hiervon ab). Es wird in der statistischen Mechanik eingehend diskutiert. Im folgenden beschränken wir uns auf die antisymmetrischen Fermionen. Wir schreiben die Wellenfunktion noch einmal ausführlich hin YA 1,2
= 1 Y 1,2 - Y 2,1 = 1 y1(1)y2(2) - y1(2)y2(1) 2
2
(13.8)
Setzen wir hier die beiden Klammerindizes gleich, so verschwindet der Ausdruck. Das heißt: die Wahrscheinlichkeit, zwei Fermionen am gleichen Ort anzutreffen, ist Null (bei Bosonen ist sie dagegen besonders groß). Bei diesen Symmetriebetrachtungen ist grundsätzlich die Spinkoordinate mitzuberücksichtigen, also y1(1) = f1(r1) c 1 usw. Das führt zu wichtigen Folgerungen für die Symmetrie der Ortsfunktionen und damit für die elektrostatische Wechselwirkungsenergien in der Elektronenhülle. Wichtig ist die Feststellung, daß die als untere Indizes geschriebenen Quantenzahlen in Wirklichkeit aus einem Satz von vier bekannten Zahlen bestehen n, l , ml , ms.Wir sehen dem Ausdruck (13.8) unmittelbar an, daß bei Gleichheit aller dieser vier Zahlen für die beiden Teilchen die antisymmetrische Wellenfunktion identisch verschwindet. Ein derartiger Zustand ist also ausgeschlossen. Dies ist der Inhalt des Pauli-Verbots. Die Verallgemeinerung auf N Teilchen gelingt mit Hilfe der sogenannten Slater-Determinate y1(1) y2(1) YA (N) = 1 . N yN(1)
. . . .
. . . .
y1(N) y2(N) . yN(N)
(13.9)
Aufgrund der mathematischen Eigenschaft der Determinaten wird der antisymmetrische Charakter der Wellenfunktion automatisch gewährleistet. Der Faktor 1/÷N dient der Normierung. Besitzen zwei Teilchen den gleichen Satz an Quantenzahlen, so sind zwei Spalten gleich und die Determinate verschwindet. Dies ist wiederum das Pauli-Verbot, das wir abschließend als Regel formulieren: In einem abgeschlossenen System können keine zwei Fermionen existieren, die einen völlig gleichen Satz von Quantenzahlen haben.
G. Fussmann , Atomphysik SS 2002
183
Mehrelektronen-Atome 13.2 Das Periodensystem der Elemente Mit Hilfe des Pauli-Verbots kann man den Schalenaufbau der Atomhülle erklären. Wir machen uns zunächst das Grundsätzliche anhand der Tabelle 13-1 klar, in der die Zahl der möglichen Elektronen bis zur Hauptquantenzahl n = 3 eingetragen ist. n 1
l
2
0 1
3
0
0 1
2
ml 0
ms ±1/2
Zahl
0 1 0 -1
±1/2 ±1/2 ±1/2 ±1/2
1◊2
0 1 0 -1 2 1 0 -1 -2
±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2
1◊2
2
8 3◊2
Konfiguration 1 s2
Schalenname K
2 s2 p 6
L
3 s2 p6d10
M
3◊2 18
5◊2
Tabelle 13-1: Besetzung der drei niedrigsten Atomschalen. Die erste Schale n = 1 ist somit mit zwei Elektronen voll besetzt. Das ergibt die besonders stabile He-Konfiguration. Die L-Schale kann weitere acht Elektronen aufnehmen. Damit ergibt sich das Edelgas Neon mit insgesamt zehn Elektronen, welches ebenfalls sehr stabil ist. Man könnte vermuten, daß darauf als nächstes Edelgas ein Element mit Kernladungszahl Z = 10 + 18 = 28 folgen würde. Das ist aber nicht der Fall, denn das Element mit Z = 28 ist Ni. Die Edelgaskonfigurationen zeichnen sich dagegen durch einen anderen Umstand aus. Es sind diejenigen Konfigurationen, die weder Spin noch Bahndrehimpuls besitzen, d.h. Grundzustandsterme 1 S 0 . In diesem Fall ist die Wellenfunktion zu jeder Zeit (d.h. nicht nur im statistischen Mittel) kugelsymmetrisch. Diese Konfiguration liegt vor, wenn jede Unterschale voll besetzt ist; für die M-Schale also, wenn die Konfiguration 3 s2 p 6 vorliegt. Dies führt zum Argon mit Z = 18. Ebenso liegen die Verhältnisse beim Kr (3 d10 4 s2p6), Xe (4 d10 5 s2p6) und Ra (4 f14 5 d 10 6 s 2p 6). Die Edelgase haben demnach allesamt acht Elektronen in der äußeren Schale. Ihre besondere Stabilität zeigt sich insbesondere in der hohen Ionisierungsarbeit der Atome (s. Periodensystem-Tabelle).
G. Fussmann , Atomphysik SS 2002
184
Mehrelektronen-Atome
Abb. 13-1: Ionisierungsenergien der neutralen Atome als Funktion der Ordnungszahl.
Die übrigen Elemente streben diese besonders stabilen Edelgaskonfigurationen an, indem sie bei chemischen Reaktionen entweder Elektronen abgeben (z.B. die Alkalimetalle mit jeweils einem 1 s Elektron in der äußeren Schale) oder aufnehmen (z.B. die Halogene Cl, Br usw. mit sieben Elektronen). Einige Atome können sowohl Elektronen abgeben wie aufnehmen. Dieser Zusammenhang ist im Kosselschen Diagramm dargestellt, wo die vorkommenden Atome (helle Punkte) mit ihren möglichen positiven und negativen Ionen (dunkle Punkte) für alle Elemente aufgetragen sind. Neben den Edelgasen spielen offensichtlich nach Abb. 13-2 auch Ni und Pd eine Sonderrolle. Palladium hat übrigens ebenfalls voll besetzte Unterschalen (46Pd: 4 d 10 1S 0), ist aber chemisch aktiv, da eins der 4d-Elektronen leicht in das 5s-Niveau übergehen kann. Diese Besonderheiten beruhen darauf, daß die Schalen nicht sukzessive aufgefüllt werden. So ist es beispielsweise bei K und Ca energetisch günstiger, anstelle der erwarteten 3d-Elektronen erst zwei Elektronen in die nächst höhere 4s-Schale zu schaffen (s. Periodensystem-Tafeln). Danach werden bei den sogenannten 3d-Übergangselementen, der Eisengruppe (21Sc bis 28Ni) bis zu acht 3d-Elektronen angesammelt (mit einer weiteren Anomalie beim Cr). Ähnliche Verhältnisse ergeben sich später bei den 4d-Übergangselementen 39Y-46Pd und den 5d-Übergangselementen 71Lu-78Pt.
Abb. 13-2: Das Diagramm von Kossel: Die Elektronenzahl der Atome (Hohlkreise) und Ionen (Vollkreise) über der Kernladungszahl.(n. Hellwege).
G. Fussmann , Atomphysik SS 2002
185
Mehrelektronen-Atome Ebenfalls ähnlich, aber noch absonderlicher sind die Verhältnisse bei den seltenen Erden (57La 70 Yb) und bei den Aktiniden (91Pa -103La), wo die weiter innenliegende Schalen (4f bzw, 5f) aufgefüllt werden. Da die chemische Eigenschaft der Atome im wesentlichen von den äußeren Hüllenelektronen bestimmt wird, sind die Elemente dieser Gruppen chemisch sehr ähnlich. Auch die spektroskopischen Eigenschaften werden gewöhnlich von den äußeren Elektronen dominiert. Bei den 4f-Elektronen der seltenen Erden ist dies jedoch nicht der Fall. Da diese weit im Inneren des Atoms liegen und von den äußeren Elektronen der n= 5- und n= 6-Schale gut abgeschirmt werden, beobachtet man bei ihnen auch im Festkörperverbund scharfe Linienabsorption. Daher rührt die Sonderstellung der seltenen Erden in zahlreichen Versuchen und in der Anwendung zum Beispiel in der Lasertechnik (Neodym-Laser). Die vorausgehenden Bemerkungen erklären bereits im wesentlichen die im Periodensystem der Elemente auftretende Gesetzmäßigkeit. In dem ursprünglichen nach Mendelejew (1869) angeordneten Schema sind die Elemente hinsichlich ihrer chemischen Ähnlichkeit in acht Gruppen eingeteilt. Es bilden sich so sieben horizontale Perioden. An zwei Stellen ergeben sich dort Inkonsistenzen: alle 14 seltenen Erden stehen auf dem Platz Z = 58 und sämtliche Aktiniden bei Z = 90.
13.3 Termsystematik Mit Hilfe des Pauli-Prinzips lassen sich auch einige weitere experimentelle Befunde erklären. Zunächst sind in der Abb. 13-3 die Besetzungsverhältnisse bei den ersten elf Elementen angegeben. Beim Be und C sind auch die angeregten Konfigurationen Be* und C* dargestellt. In allen Fällen wir das Pauli-Prinzip eingehalten. Darüber hinaus genügen die Grundzustandsterme den Hundschen Regeln : Grundzustände sind Zustände höchstmöglicher Multiplizität. 1) Das heißt anders ausgedrückt: Im Grundzustand koppeln die Elektronen so, daß der größtmögliche Gesamtspin (S) entsteht. Als Folge dieser Regel sehen wir, daß die 2p-Elektronen zunächst mit parallelem Spin eingebaut werden (B, C, N). Beim Stickstoff ist mit drei derartiger Elektronen die maximale - mit dem Pauli-Prinzip verträgliche - Anzahl erreicht (l = 1, ml = -1, 0, +1). 2) Bei gleichem Spin S liegt der Zustand mit höherem L tiefer (z.B. ist beim N-Atom der Term 2D stärker gebunden als 2P) und 3) Ist die entsprechende Unterschale weniger (bzw. mehr) als halb gefüllt, so ist in einem Multiplett der Term mit J = Jmin (bzw. Jmax) der niedrigste. Ist dagegen die Schale gefüllt (1S0Terme der Edelgase) oder genau halb besetzt, so tritt keine Feinstrukturaufspaltung auf. Aufgrund dieser Regeln ergibt sich z.B. für C der Term 3P 0 als Grundzustand (besitzt 2 von maximal 6 p-Elektronen mit den nach dem Pauli-Prinzip erlaubten Termen 1D, 1 S, 3 P, s. Tabelle 13-2); analog ist bei N (drei p-Elektronen mit den Termen 2D, 2 P, 4S) der Term 4S 3/2 und bei O (vier p-Elektronen mit den möglichen Termen 1 S, 1D, 3P) 3P2 der Grundzustand (s. auch Tabelle 13-3). Die 1. Hundsche Regel läßt sich zumindest qualitativ aus der Antisymmetrie der Wellenfunktion ableiten, wenn wir diese als Produkt der Ortswellenfunktion und der Spinfunktion darstellen Y(r1,...r N ; s1,...sN ) = y(r1,...rN ) c(s1,...s N )
(13.10)
Betrachten wir einen Zustand, in dem alle Spins parallel stehen, so ist die Spinfunktion sicher symmetrisch, da Vertauschen von zwei Elektronen keine Veränderung bedeutet. Damit muß die Ortswellenfunktion aber völlig antisymmetrisch sein. Letzteres bedeutet, daß die Elektronen im Ortsraum den größtmöglichen Abstand voneinander halten (die Wahrscheinlichkeit, zwei am G. Fussmann , Atomphysik SS 2002
186
Mehrelektronen-Atome gleichen Ort zu finden, war null nach Gl. 13.8), was minimale Coulomb-Wechselwirkung der Elektronen untereinander bedeutet und größtmögliche Bindung durch das Kernpotential. In entsprechender Weise wirkt dieses Prinzip auch, wenn nicht alle Spins, aber doch so viele wie möglich parallel stehen. Abb. 13-3: Besetzung der Elemente Wasserstoff bis Natrium (n. Mayer-Kuckuk). Schließlich führen wir in der Tabelle 3 einige der möglichen Terme der lk-Elektronenkonfigurationen auf mit k äquivalenten Elektronen. Hierbei handelt es sich also um eine Anzahl von k Elektronen mit dem Bahndrehimpuls l bei der gleichen Hauptquantenzahl n. Auch hier zeigt sich die Bedeutung des PauliPrinzips. Zum Beispiel gibt es für die Konfiguration n p, n' p, n'' p insgesamt 21 Terme. Dagegen hat man für den Fall n p3 nur die drei Terme 2D, 2 P, 4 S. In der letzten Spalte in der Tabelle 13-2 ist die Gesamtzahl der möglichen Terme einer Konfiguration angegeben. Bei d- und f-Elektronen ergeben sich trotz der Einschränkungen durch das Pauli-Prinzip sehr große Zahlen (für f7 beispielsweise 3432), die den enormen Linienreichtum bei den höheren Drehimpulskonfigurationen widerspiegeln. Man beachte auch die Symmetrie hinsichtlich der Schalenbesetzung: ein pElektron ist bespielsweise äquivalent zu fünf pElektronen. Genauer kann man den Zustand p5 als ein fehlendes Elektron, d.h. als ein Loch mit der positiven Ladung +e (vergleichbar zu einem Positron), auffassen. Hieraus erklärt sich auch die 3. Hundsche Regel: Bei den positiven Löchern hat die Feinstrukturaufspaltung das entgegengesetzte Vorzeichen wie bei den Elektronen (daher Terminversion). Konfiguration
Terme 2
s s2 p3 d d2
S S 2 0 P 1 1 S D 2 2 0 P D 2 D 1 1 S D 1G 1
p5 p4
p p2
Zahl
d9 d8
3 4
3
P S0
P 3F
2 1 6 15 20 10 45
Tabelle 13-2: Terme der l k - Elektronenkonfigurationen.
G. Fussmann , Atomphysik SS 2002
187
Mehrelektronen-Atome
G. Fussmann , Atomphysik SS 2002
188
Mehrelektronen-Atome
Tabelle 13-3: Schalenstruktur der Elemente.
G. Fussmann , Atomphysik SS 2002
189
Röntgenstrahlung
14 RÖNTGENSTRAHLUNG 14.1 Erzeugung und Nachweis von Röntgenstrahlung Röntgenstrahlung61 ist hochenergetische elektromagnetische Strahlung. In den meisten Fällen entsteht sie durch Aufprall von Elektronen auf einen Festkörper (Metallplatte). So wurde sie auch in der von C. Röntgen (1895) benutzten Röhre hergestellt. In der Abb. 14-1 skizzieren wir den Aufbau. Aus einer (gewöhnlich indirekt) geheizten Kathode (häufig Wolfram) treten Elektronen aus. Sie werden durch eine angelegte Hochspannung von etwa 1 kV - 100 kV beschleunigt und treffen auf eine Anode - die man bei Röntgenröhren gemeinhin als Antikathoden bezeichnet - mit abgeschrägter Oberfläche. Kathode und Antikathode befinden sich in einer gut evakuierten Glasröhre. Ausgehend von einem meist kleinen Brennfleck auf der Antikathode, tritt die Röntgenstrahlung unter einem breiten Winkel zur Oberfläche aus und durchdringt die Glaswand. Heizung Kathode
Blende Film
-e
50 kV
Schwärzung + Röntgenstrahlung evakuierte Glasröhre
Antikathode
Probe
Abb. 14-1: Röntgenröhre und Schattenwurf der Röntgenstrahlung auf einer Photoplatte. Bei einer für die medizinische Anwendung typischen Spannung von etwa 50 000 V besitzt die austretende Röntgenstrahlung bereits eine hohe Durchdringungsfähigkeit und man benötigt etliche mm Blei, um eine Absorption von mehr als 90% zu erreichen. Entsprechend der angelegten Spannung U (1-100kV) ergibt sich eine maximale Energie der Röntgenphotonen von ( hn )max = e U. Die charakteristischen Energie- und Wellenlängenbereiche sind damit Röntgenbereich : 1keV < hn < 100 keV bzw. 0,01 nm < l < 1 nm Man unterteilt nochmals in ∑ weiche Röntgenstrahlung: hn < 10 keV ∑ harte Röntgenstrahlung: hn > 10 keV Nur die harte Strahlung hat die hohe Durchdringungsfähigkeit. Weiche Röntgenstrahlung wird bereits in einigen Metern Luft erheblich geschwächt und ist deshalb gewöhnlich nur unter Vakuumbedingungen zu beobachten. Für den Nachweis der Röntgenstrahlung steht eine ganze Palette von Möglichkeiten zur Verfügung. Qualitativ werden meist Röntgenfilme, photographische Platten und die 61 Zunächst als X-Strahlung bezeichnet. Diese Ausdrucksweise wurde in den meisten anderen Sprachen beibehalten (z.B. X-
rays im Englischen). G. Fussmann , Atomphysik SS 2002
190
Röntgenstrahlung verschiedensten Szintillatorschirme (Na-J, Barium-Platin-Zyanür und andere, z.T. organische Substanzen) eingesetzt. Letztere verwandeln Röntgenlicht in sichtbares Licht. Für quantitative, jedoch nicht spektral aufgelöste Messungen stehen Geiger-Zähler und Ionisationskammer zur Verfügung. Quantitative und spektral auflösende Messungen sind möglich mit Proportionalzählrohren, Szintillator-Detektoren sowie Germanium- (harte Strahlung) und Silizium(weiche Strahlung) Dioden. Für Messungen mit sehr hoher Spektralauflösung benutzt man einen der genannten Detektoren (meist Proportionalzählrohre) in Verbindung mit einem Kristallspektrometer. Die Wellenlängenauflösung ergibt sich aus der Bragg-Bedingung (s. Kap. 1.3.4 und 4.1). In sogenannten Johann-Spektrometern mit gekrümmten Kristallen (auf fokussierendem Rowland-Kreis) erreicht man ein extrem hohes Auflösungsvermögen von l/ D l ª 10 5. Da Kristallspekrometer aber aufwendig in der Herstellung und zudem relativ lichtschwach sind, benutzt man heute zumeist die erwähnten Halbleiterdioden (Ge-, Si- Detektoren), wenn ein Auflösungsvermögen von l/ D l ª 103 ausreichend ist. Ähnlich wie im Proportionalrohr werden hierin durch Röntgenstrahlung Ladungsträgerpaare erzeugt. Diese Ladungen werden durch ein elektrisches Feld getrennt und liefern nach Verstärkung einen Spannungspuls, dessen Höhe proportional zur Zahl der Ladungsträgerpaare ist. Im Proportionalzählrohr entstehen ElektronenIonenpaare, wobei pro Paar im Mittel eine Energie von etwa 30 eV aufgebracht werden muß. Anders in der Halbleiterdiode: hier bilden sich Elektronen-Lochpaare62. Pro Lochpaar ist allerdings nur eine Energie von ca. 3 eV vonnöten. Es entstehen daher bei gleicher Photonenenergie wesentlich mehr Ladungsträger in der Halbleiterdiode als im Proportionalzählrohr, was sich in einer erheblichen Verbesserung des Energieauflösungsvermögens bemerkbar macht. Wir merken noch an, daß im Gegensatz zu den wellenlängenauflösenden Kristallspektrometern Halbleiterdioden direkt energieauflösend sind, so daß die Mehrdeutigkeit aufgrund der verschiedenen Ordnungen hier nicht auftritt.
14.2 Bremsstrahlung und charakteristische Strahlung Die von einer Röntgenröhre emittierte Strahlung ist im wesentlichen durch drei Parameter festgelegt: Elektronenstrom, Hochspannung und Antikathodenmaterial. Während der Strom lediglich die Intensität der Röntgenstrahlung bestimmt, nehmen Spannung und Materialauswahl Einfluß auf die Form des Spektrums. Bei kleiner Spannung U wird zunächst nur ein kontinuierliches Spektrum ausgesandt. Es entsteht durch die Abbremsung der Elektronen im Antikathodenmaterial und wird demzufolge als Bremsstrahlung bezeichnet. Die eindringenden Elektronen werden an den Atomkernen gestreut, was mit hohen Beschleunigungskräften verbunden ist. Jede Beschleunigung von Ladungen führt aber zur Emmision von elektromagnetischer Strahlung63. Mit zunehmender Spannung treten bei Erreichen eines kritischen Wertes Uk zusätzlich Linien im Spektrum auf. Diese Linienstrahlung hängt vom verwendeten Antikathodenmaterial ab; man nennt sie deshalb charakteristische Strahlung. In der Abb. 14-2 sind die Bragg-Spektren einer RhodiumAntikathode (75Rh) dargestellt für drei verschiedene Spannungen. Erst mit Überschreiten von Uk ª 32 kV treten die charakteristischen Linien auf. Man sieht auch deutlich die Verschiebung des Kontinuums zu kleineren Glanzwinkeln, was mit der Grenzfrequenz nmax = e U /h erklärbar ist.
62 Als Loch bezeichnet man ein fehlendes Elektron im sogenannten Valenzband. Dieses Loch verhält sich hinsichtlich der elektrischen Leitfähigkeit wie ein Positron. 63 In Synchrotron-Beschleunigungsanlagen erfahren Elektronen eine Zentrifugalbeschleunigung, indem sie auf Kreisbahnen umlaufen. Bei Geschwindigkeiten nahe der Lichtgeschwindigkeit kann die so entstehende Synchrotronstrahlung sehr kurzwellig sein und bis in den extremen UV- und Röntgenbereich reichen.
G. Fussmann , Atomphysik SS 2002
191
Röntgenstrahlung
NPhoton
c b a Abb. 14-2: Bremsstrahlung und charakteristische Strahlung für eine 45RhAntikathode bei drei verschiedenen Beschleunigungsspannungen. Die charakteristische Strahlung der chemisch benachbarten 44Ru-Verunreinigung wird ebenfalls beobachtet (n. Hellwege).
nmax
n
Abb. 14-3: Bremsstrahlungsphotonenfluß als Funktion der Frequenz. a Æ b: Erhöhung der Spannung bei gleichem Material. b Æ c: schwereres Material, gleiche Spannung.
Die Form des Bremsstrahlungsspektrums ist nur schwach von der Ladungszahl des Antikathodenmaterials abhängig. Mißt man die pro Sekunde emittierte Photonenzahl als Funktion der Frequenz, so ergeben sich näherungsweise Geraden wie in Abb. 14-3 dargestellt. Bei gleichem Material verschieben sich die Geraden parallel zueinander mit steigender Spannung. Erhöht man dagegen bei gleicher Spannung die Kernladungszahl des Antikathodenmaterials, so erhöht sich die Steigungskonstante C näherungsweise proportional zu Z.
14.3 Die charakteristischen Röntgenspektren Die charakteristische Röntgenstrahlung besteht aus einer relativ geringen Anzahl von Linien, die es erlaubt, ohne großen Aufwand die chemische Zusammensetzung einer Probe zu ermitteln. Dieser Vorteil wird insbesondere bei der Röntgenfluoreszenz-Methode ausgenutzt, bei der die charakteristische Strahlung durch ein Röntgenkontinuum angeregt wird (s. Abb. 14-4). Röntgenröhre
Pulshöhenanalysator Spektrum Pulsverstärker
Probe
Halbleiterdetektor Abschirmung
Analog-Digitalwandler
Abb. 14-4: Röntgenfluoreszenzanregung einer Probe und Energiespektrum durch Pulshöhenanalyse. Die charakteristische Strahlung entsteht durch innere Anregung der Atome. Dies kann entweder durch Photonen hinreichender Energie (Röntgenfluoreszenz) oder durch Elektronen (z.B. im Antikathodenmaterial der Röntgenröhre) geschehen. In jedem Fall wird ein auf einer inneren Schale gebundenes Elektron herausgeschlagen. In dieses so entstandene Loch können nun Elektronen von höheren Schalen fallen, was mit der Aussendung der charakteristischen Strahlung verbunden ist. G. Fussmann , Atomphysik SS 2002
192
Röntgenstrahlung Ensteht ein Loch in der K-Schale (n = 1), so erhält man K-Strahlung. Analog spricht man von L-, M- und N- Strahlung bei Löchern in der L- (n = 2), M- (n = 3) und N- (n = 4) Schale. Diese Strahlungen treten in Serien auf, z.B K a , K b, K g usw., je nachdem, ob das Loch in der KSchale durch ein Elektron aus der L-, M- oder NSchale aufgefüllt wird. Dieser Sachverhalt erklärt sich aus der Abb. 14-5: Röntgenfluoreszenzspektrum einer Probe (n. Mayer-Kuckuk)).
Frequenz der Strahlung in Abhängigkeit von der Kernladungszahl. So läßt sich beispielsweise die Ka-Strahlung in Näherung durch das Moseleysche Gesetz (1913)
n K a = k (Z - 1)
(14.1)
beschreiben , wobei die Konstante den Wert k 2 = 0,248◊1016Hz hat. Diese Relation können wir aber leicht umformen und in die Gestalt
nKa =
3 EH 1ˆE Ê1 (Z - 1)2 = 2 - 2 H (Z - 1)2 Ë1 2 ¯ h 4 h
(14.2)
bringen (mit Eh = 13,6 eV). Es handelt sich um eine abgewandelte Bohrsche Formel, bei der die Kernladungszahl um eins verkleinert ist. Offensichtlich ist der Atomkern noch durch das zweite Elektron der K-Schale abgeschirmt. Allgemein erwartet man also eine Beziehung der Art 1 1 E n x = Ê 2 - 2 ˆ H ( Z - s )2 Ën m ¯ h
(14.3)
Bei den La-Linien mit n = 2 , m = 3 sind insgesamt neun abschirmende Elektronen auf der K- und L-Schale vorhanden , so daß man s = 9 vermuten würde. Experimentell ergibt s = 7,4 eine bessere Annäherung. Obwohl das Moseleysche Gesetz für Ka nur im Bereich 10 < Z < 30 wirklich gut stimmt, war es dennoch eine große Hilfe bei der systematischen Bestimmung der Kernladungszahlen der Elemente. Betrachtet man die charakteristische Strahlung in hoher Energieauflösung, so zeigt sich auch hier eine Feinstruktur. Bei den K-Linien beobachtet man enge Dubletts Ka1, Ka2 , Kb1, Kb2 usw. Wie bei den optischen Spektren der komplexeren Atome hat diese Feinstruktur zwei Gründe: Zum einen ist infolge der vorhandenen Rumpfelektronen die l-Entartung aufgehoben, so daß beispielsweise sund p- Elektronen unterschiedlich stark gebunden sind. Dazu kommt natürlich wieder die L-SWechselwirkung, die namentlich bei den schweren Atomen wegen der Z4-Abhängigkeit erheblich wird (Gl.8.13). Die Feinstruktur erklärt sich dann aus den Energiezuständen eines Einelektronensystems mit nicht-coulombschem Potential. Ein Loch in einer ansonsten gefüllten Schale ist nämlich äquivalent zu einem Elektron in einer leeren Schale. Wir haben es mit den Quantenzahlen n, l , j zu tun , wobei j die beiden Werte j = l ± 1/2 annehmen kann. Dazu kommen die Auswahlregeln D l = ± 1 und D j = 0, ± 1. Aus historischen Gründen werden die G. Fussmann , Atomphysik SS 2002
193
Röntgenstrahlung Unterschalen mit verschiedenem Bahn- und Gesamtdrehimpuls durch römische Indizes gekennzeichnet. Die L-Schale zerfällt demnach in LI, LII und LIII entsprechend (2, 0,1/2), (2, 1,1/2) und (2, 1,3/2). Für Platin sind die Übergänge der K- und L-Serie sowie die später zu besprechenden Absorptionskanten (Pfeile nach oben) in Abb. 14-6 eingezeichnet. 64 Die Analyse der komplexen Feinstruktur ergibt wenig Anhalt über die chemische Bindung eines Atoms, liefert aber wichtige Informationen über den Aufbau der inneren Schalen.
Abb. 14-6 : Röntgenfeinstruktur des Platins (n. Haken-Wolf). Nicht immer wird die bei einem Lochübergang freiwerdende Energie auch tatsächlich abgestrahlt. Insbesondere bei den leichten Atomen wird sie stattdessen einem Elektron in einer äußeren Schale übertragen, welches dann frei wird. Abb. 14-7: Fluoreszenzausbeute für die K- und LStrahlung in Abhängigkeit von der Ladungszahl(n. Kalvius et al. )
1 0.8
hK
Dieser Vorgang, bei dem ein sogenanntes AugerElektron entsteht, wird als innere Konversion 0.4 bezeichnet. Wird beispielsweise ein Loch in der KSchale erzeugt, so kann dieses durch ein Elektron in der hL 0.2 L-Schale aufgefüllt werden. Die freiwerdende Energie kann dann auf ein anderes L-Elektron übertragen 0 werden. Dieses Auger-Elektron besitzt nach Entfernen Z aus dem Atomverband die kinetische Energie Ekin = EK - 2 EL. Es entstehen auf diese Weise zwei Löcher in der L-Schale, die wiederum durch Aussendung von L-Strahlung oder durch Bildung von weiteren Auger-Elektronen gefüllt werden. Das Verhältnis h
0.6
0
20
40
60
80
100
64 Leider werden bei der Indizierung der L, M,...Feinstrukturen unterschiedliche Notationen verwendet.
G. Fussmann , Atomphysik SS 2002
194
Röntgenstrahlung h=
Zahl der emittierten Röntgenphotonen Zahl der erzeugten Lochzustände
(14.4)
bezeichnet man als Fluoreszenzausbeute; sie ist in Abb. 14-7 für die K- und L-Strahlung als Funktion der Ladungszahl dargestellt. 14.4 Röntgenabsorption und Streuung Im Gegensatz zu den optischen Übergängen, wo die Linien sowohl in Emission wie in Absorption auftreten können, gibt es praktisch keine Röntgenabsorptionslinien. Dies erklärt sich damit, daß die oberen Schalen in der Regel besetzt sind und daher nach dem Pauli-Prinzip für einen Übergang nicht zur Verfügung stehen. Absorptionsübergänge können daher nur ins Kontinuum führen. Dementsprechend treten Absorptionskanten auf, wenn die Photonenenergie ausreicht, um ein Elektron aus der K-Schale (K-Kante), L-Schale (L-Kante) etc. zu entfernen. Unmittelbar bei Erreichen der Grenzfrequenz hat die Absorptionswahrscheinlichkeit ein relatives Maximum und fällt mit weiter ansteigender Photonenenergie rasch ab. Die Absorption ist mit einer Ionisierung verbunden und demgemäß liegen die Absorptionskanten energetisch höher als die jeweiligen Emissionslinien (z.B. hnKa < EK). Diese Verhälnisse sind in der Abb. 14-8 für Pt wiedergegeben. Abb. 14-8: Absorption und Emissions-Spektren für Platin (schematisch). a) Absorptionskoeffizient; b) bis c) Emissionsspektren bei verschiedenen Kathoden-Antikatodenspannungen (n. HakenWolf) Wiederum ergibt sich bei den L- und M-Kanten eine Feinstruktur, die sich anhand der Abb. 14-8 verstehen läßt. Man beachte den Unterschied: Die Energiedifferenz der LII- und LIII-Kanten beruht auf der L-S-Wechselwirkung; die der LI- und LIIKanten dagegen auf der unterschiedlichen Abschirmung des Kernpotentials für s- und pElektronen. Aus der unterschiedlichen Energie zwischen Kanten und Linien ergibt sich auch, daß ein Material seine eigene Strahlung nur schlecht absorbiert. Zur Abschirmung der charakteristischen Strahlung ist ein Material mit einer etwas kleineren Ordnungszahl besser geeignet. Auf diese Weise lassen sich auch Filter herstellen. In der Abb. 14-9 ist dies für die Molybdän-Ka -Strahlung demonstriert. Die Absorption in einer relativ dünnen Zirkon-Folie (7,8 g/m2) unterdrückt die Kb-Strahlung und den Bremsstrahlungsuntergrund, so daß nahezu monochromatische Röntgenstrahlung entsteht.
G. Fussmann , Atomphysik SS 2002
195
Röntgenstrahlung
Abb. 14-9: Monochromatisierung der Strahlung einer 42Mo-Antikathode durch einen 40Zr -Filter. a) Spektrum ohne Filter, b) Filterabsorptionskurve, c) Spektrum mit Filter (n. Kalvius et al. )
l (nm)
Die Absorption eines parallelen Röntgenstrahls läßt sich durch ein Exponentialgesetz beschreiben (s. Kap. 3). I = I0 e - m d
(14.5)
Anstelle des Wirkungsquerschnitts benutzt man in der Praxis meist den Absorptionskoeffizienten m = n s. In Gl.(14.15) ist d die Absorberdicke und I0 die auftreffende Photonenzahl pro sec und m 2. m ist eine Funktion der Photonenenergie und setzt sich aus drei Anteilen zusammen. m = m Photo + m Compton + m elastisch
(14.6)
Bei der im vorangehenden besprochenen Absorption der Röntgenstrahlung handelt es sich genauer um den Prozeß der Photoabsorption. Hierbei wird gebündeltes Röntgenlicht in niederenergetische Fluoreszenzstrahlung umgewandelt, die dann weitgehend isotrop abgestrahlt wird. Da Impuls- und Energieerhaltung bei der Wechselwirkung zwischen einem Photon (Ruhmasse = 0) und einem freien Elektron nicht möglich ist, ist ein Impulsübertrag auf das Atom bei der Photoabsorption notwendig. Aus diesem Grund ist die Photoabsorption der K-Schale am größten. Sie nimmt zudem stark mit der Ladungszahl zu ( mPhoto µ Z5 l3 ). Neben diesem Schwächungsmechanismus treten noch zwei weitere auf: die elastische Streuung und die Compton-Streuung65. Bei der elastischen Streuung (Rayleigh-Streuung) wird ein Quant ohne Frequenzveränderung aus dem Strahl gestreut. Dieser mit Hilfe der klassischen Elektrodynamik erklärbare Prozeß spielt nur bei kleinen Photonenenergien eine Rolle. Neben der Photoabsorption ist die Compton-Streuung in der Regel von Bedeutung. Bei hohen Energien ( h n ª 50 keV) und leichten Elementen (z. B. C, O) ist der Compton-Effekt sogar allein wesentlich. Da er darüber hinaus von großem grundsätzlichen Interesse ist, wollen wir ihn im folgenden eingehender beschreiben. 65 Bei Photonenenergien oberhalb von 2 m c2 = 1,02 MeV kommt noch die Schwächung durch e--e+ -Paarbildung hinzu. e
Dieser Absorptionsprozeß ist bei der hochenergetischen g-Strahlung von Bedeutung. G. Fussmann , Atomphysik SS 2002
196
Röntgenstrahlung 14.5 Der Compton-Effekt Im Jahre 1923 machte A. Compton die Feststellung, daß die an einer Graphitschicht gestreute MoK-Strahlung einen zu größeren Wellenlängen verschobenen Beitrag enthält. Die Meßanordnung und die beobachteten Streuspektren sind in Abb. 14-10 und Abb. 14-11 skizziert. Als Funktion des Streuwinkels q ließ sich die Wellenlängenverschiebung einfach angeben als Dl = lC 1 - cos q
(14.7)
mit der Konstanten lC = 2,4262 10-12 m = 0,024 Å . Es stellte sich heraus, daß dieses Gesetz unabhängig von der Photonenenergie und vom Absorbermaterial war. Wegen des letzteren Befunds konnte der Effekt nichts mit dem Atomkern oder mit stark gebundenen Elektronen zu tun haben. Es mußte sich vielmehr um inelastische Streuung an freien oder quasifreien Elektronen der äußeren Schale handeln. Die wellentheoretische Behandlung des Problems konnte aber eine inelastische Streuung nicht erklären, sondern führte immer zur elastischen Rayleigh-Streuung. Compton konnte den Effekt exakt deuten, indem er - in Analogie zum Photoeffekt - den Strahlungsquanten (Photonen) Impuls und Energie zuordnete und sie wie Teilchen behandelte. I (l) q=0 0 Röntgenlicht Proportionalzählrohr
q
l
I (l)
Sreukörper
q = 90
Kollimator
Bragg-Spektrometer
Kristall
0
l
I (l)
q = 180 0
Dl
Abb. 14-10: Messung des Röntgenstreuspektrums.
l
Abb. 14-11: Meßergebnis. Neben der elastischen Streustrahlung beobachtet man den verschobenen Compton-Streubeitrag. Unter Verwendung von Impuls und Energiesatz ergibt sich mit Hilfe der Abb. 14-12 die ComptonRelation (14.17) aus folgender Rechnung
y E=hn n p =h c
E = m c2 p=mv
Abb. 14-12: Energien und Impulse beim Compton-Effekt. f
x
q E= h n n p= h c
G. Fussmann , Atomphysik SS 2002
197
Röntgenstrahlung Energiesatz vor und nach dem Stoß: h n + m0 c2 = h n' + m c2
(14.8)
Impulskomponenten in y- und x-Richtung: 0 = - h cn' sin q + m v sin j
(14.9)
h n = h n' cos q + m v cosj c c
(14.10)
Mit m = m0 ( 1 - v2/ c2) -1/2 liefert Quadrieren und Umformen von Gl. (14.8) 2
h2 Dn + 2 m0 c2 h Dn = m20 c4
c2
v2 - v2
(14.11)
Aus (14.9) und (14.10) elimieren wir j vermöge sin2j + cos2j = 1 und erhalten: 2
h2 Dn + 2 n n - Dn 1 - cos j = m20 c4
c2
v2 - v2
(14.12)
Gleichsetzen von (14.11) und (14.12) ergibt m0 c2 h Dn = h2 n n - Dn 1 - cos q
(14.13)
Umrechnung in Wellenlängendifferenzen gemäß Dl= c- c = cD n n n - Dn n n - Dn
(14.14)
D l = mh c 1 - cos q 0
(14.15)
führt auf das Ergebnis
Der Vergleich mit (14.7) ergibt für die Compton-Wellenlänge lC = mh c 0
(14.16)
Es ist die der Ruhenergie - gemäß 511keV = m0 c2 = h n = h c / l C - zugeordnete De BroglieWellenlänge. Wegen der Kleinheit von lC (2,46 pm) ist der Verschiebungseffekt nur bei relativ kurzen Wellenlängen, d.h. harter Röntgenstrahlung, von Bedeutung.
G. Fussmann , Atomphysik SS 2002
198
Einführung in die Physik der Moleküle
15 EINFÜHRUNG IN DIE PHYSIK DER MOLEKÜLE 15.1 Was sind Moleküle? Es gibt verschiedene Möglichkeiten, Moleküle zu beschreiben. Zwei, in gewissem Sinne entgegengesetzte Auffassungen, lassen sich wie folgt formulieren: ∑ ∑
Moleküle sind eine Gruppe von Atomen, die d u r c h e i n e A n z i e h u n g s k r a f t a n e i n a n d e r g e b u n d e n ist. Moleküle sind eine Gruppe von Atomkernen, die d u r c h e i n e g e m e i n s a m e E l e k t r o n e n k o n f i g u r a t i o n a n e i n a n d e r g e b u n d e n ist.
Die zutreffendste Beschreibung ist eine Mischung aus diesen beiden Definitionen: ∑ In einer molekularen Verbindung sind die i n n e r e n E l e k t r o n e n a n d i e jeweiligen Atomkerne gebunden. An der molekularen Bindung sind nur die äußersten Elektronen auf nicht a b g e s c h l o s s e n e n S c h a l e n ( V a l e n z e l e k t r o n e n ) b e t e i l i g t . Diese Elektronen unterliegen der resultierenden Anziehungskraft der vorhandenen Atomkerne. Die inneren Elektronen sind dagegen durch den molekularen Bildungsprozeß nur sehr schwach beeinflußt.
15.2 Diatomare Moleküle Einen wichtigen Einblick in die molekulare Bindung und den komplizierten Aufbau der Molekülspektren geben uns bereits die Zweiatom-Moleküle. Man unterscheidet in dieser einfachsten Molekülgruppe die homonuklearen Moleküle wie H 2, N 2, O2 etc. von den heteronuklearen Molekülen, die zahlreiche Gase, Säuren und Salze bilden wie NO, HCl, NaI. Ausgehend vom einfachsten Molekül H +2 werden wir uns mit diesen Molekülen näher befassen. Die komplizierteren vielatomaren Systeme würden den Rahmen dieser Einführung sprengen und werden deshalb nur im Kap. 15.7 gestreift. Auch die diatomaren Systeme sind bereits so kompliziert, daß nicht alle Aspekte erörtert werden können. Es ist hier vielmehr das Ziel, eine erste Orientierung zu geben, die durch weitergehende Studien vertieft werden muß. Das gilt insbesondere für die quantitative Auswertung der Molekülspektren, die oft eine verfeinerte Betrachtung erfordern (z. B. die Abhängigkeit des Trägheitsmoments von der Vibrationsquantenzahl oder die verschiedenen Kopplungen der Drehimpulskomponenten). 15.3 Das H+ 2 -Molekül Dieses einfachste Molekülion besteht aus zwei Protonen und einem Elektron. Die Lösung der Schrödinger-Gleichung ist für dieses System bereits recht kompliziert und nicht mehr in analytischer Form angebbar. Wir werden uns daher mit einer qualitativen Betrachtung begnügen, die aber dennoch einige wesentliche Aspekte beleuchtet. In der Abb. 15-1 machen wir uns zunächst den Verlauf des elektrischen Potentials für das Elektron entlang der Verbindungslinie der beiden Protonen klar. Bei großem Abstand der beiden Protonen kann das Elektron entweder an das erste oder das zweite Proton gebunden sein. Es befindet sich dann gewöhnlich im 1s-Grundzustand des jeweiligen Wasserstoffatoms (n = 1, l = 0), so daß r r |r - r1| a0
r y 1 (r ) = 2 ao-3/2 e
G. Fussmann , Atomphysik SS 2002
r r |r - r2| a0
r ; y 2 (r ) = 2 ao-3/2 e
(15.1)
199
Einführung in die Physik der Moleküle mögliche Lösungen rder Schrödinger-Gleichung sind. Hierbei beziehen sich die Indizes 1, 2 auf die Protonen, während r der Ortsvektor des Elektrons ist. Abb. 15-1 : Der Potentialverlauf entlang der ProtonenVerbindungslinie im H2+-Ionenmolekül. Aufgrund des Tunneleffekts kann das Elektron den zentralen Potentialwall überwinden. Proton1
Proton2
V(x)
o
Mit Verkleinerung des Abstandes der Protonen baut sich der mittlere Potentialwall ab, so daß das Elektron diesen schließlich leicht "durchtunneln" kann, wie es in der E Abbildung angedeutet ist. Das Elektron erhält dann eine 1 Aufenthaltswahrscheinlichkeit, die symmetrisch zu den beiden Protonenpositionen ist, da der Ausgangszustand (Bindung des Elektrons an Proton 1 oder 2) nach kurzer Zeit völlig unbedeutend wird. Die entsprechende x (unnormierte) Wellenfunktion können wir näherungsweise durch Superposition aus den obigen Wasserstoffwellenfunktionen y1 und y2 erhalten. Mit diesen zwei Wellenfunktionen lassen sich aber zwei Kombinationen angeben, nämlich
y g = y1 + y 2 ; y u = y1 - y 2,
(15.2)
die beide die zu fordernde Eigenschaft haben, daß die Aufenthaltswahrscheinlichkeit W(r) = |y| 2 des Elektrons in der Umgebung des Protons 1 gleich groß ist wie in der Umgebung des Protons 2. Während yg(r) aber eine gerade Funktion hinsichtlich der Spiegelung am Ursprung r = 0 ist, ändert yu(r) bei dieser Operation das Vorzeichen, ist also eine ungerade Funktion. Die Aufenthaltswahrscheinlichkeits-Verteilungen Wg und Wu sind jedoch für diese beiden Funktionen sehr verschieden, wie aus der Abb. 15-2 hervorgeht.
Abb. 15-2: Die Aufenthaltswahrscheinlichkeits-Verteilung (in der z-y-Ebene) des Elektrons im H2+Ionenmolekül für die gerade (links) und ungerade (rechts) Gesamtwellenfunktion. Die beiden Protonen befinden sich in den Positionen z = ± 1ao (Abszisse). Bei der geraden Gesamtwellenfunktion yg hat das Elektron eine relativ hohe Wahrscheinlichkeit, sich zwischen den beiden Protonen aufzuhalten. Damit vermindert es die gegenseitige ColoumbAbstoßung der Protonen und zieht sie gleichzeitig in diesen Zwischenraum. Im ungeraden Fall yu verhält es sich umgekehrt: Hier hält sich das Elektron bevorzugt in den äußeren Bereichen auf, so G. Fussmann , Atomphysik SS 2002
200
Einführung in die Physik der Moleküle daß die Protonenabstoßung unvermindert stark ist. Diese Betrachtungen machen es verständlich, daß es nur im Falle der geraden Wellenfunktion zu einer Molekülbildung kommen kann. Daß es tatsächlich zu einer stabilen Bindung kommt, geht aus der Abb. 15-3 hervor, wo die potentielle Energie des Systems als Funktion des Protonenabstandes dargestellt ist. Derartige Potentialkurven ergeben sich aus der Schrödinger-Gleichung, wenn man mit dem Näherungsansatz nach Gl.15.1 eine Störungsrechnung vornimmt. Der zuvor besprochene Zustand mit gerader Wellenfunktion ist hierbei durch die Symbolik sg1s gekennzeichnet. Er zeichnet sich durch eine Potentialmulde aus, was bedeutet, daß im Bereich r > rmin mit F = - dV/dr < 0 eine Anziehungskraft vorliegt. Im Gegensatz dazu hat man beim ungeraden Zustand su1s im gesamten Bereich nur eine Abstoßungskraft, die mit abnehmendem Abstand monoton größer wird. Abb. 15-3: Einige elektronische Potentiale als Funktion des Protonenabstands im H2+- Ion (n. Bond, Watson, Welch) Die hier benutzte Notation ist von der Art : l n l wobei sich die beiden letzten Buchstaben auf die Hauptquantenzahl n und den Bahndrehimpuls l des su 3p H-Atoms beziehen, aus denen die Geamtsg 2s wellenfunktion zusammengesetzt wird. Letzterer wird wie üblich durch die Buchstaben s, p, d, f, p u 2p g...für l = 0, 1, 2, 3, 4 ... angegeben. In Anlehnung hieran kennzeichnet der vorangestellte s g 3d griechische Buchstabe s, p, d, f, g die zKomponente des elektronischen Drehimpulses des Moleküls. So bedeutet s Æ ml = 0, p Æ ml = ± 1, g Æ ml = ± 2 usw. Hierzu ist zunächst anzumerken, daß – anders als im Atom – wegen der * fehlenden Kugelsymmetrie der Gesamtdrehimpuls 1s su des Elektrons bei den Molekülen keine Erhaltungsgröße ist. Bei den diatomaren Molekülen existiert jedoch noch eine Symmetrieachse in sg 1s Richtung der Verbindungslinie der beiden Nukleonen (z-Richtung), so daß die entsprechende Drehimpulskomponente eine gequantelte Erhaltungsgröße ist. Allerdings ist das Vorzeichen dieser Drehimpulskomponente (rechter oder linker Drehsinn) zunächst bedeutungslos, da die jeweiligen Energieniveaus – im Gegensatz zu den Verhältnissen bei der Zeeman-Aufspaltung der Atomniveaus in magnetischen Feldern – zusammenfallen. Bei den diatomaren Molekülen existiert jedoch noch eine Symmetrieachse in Richtung der Verbindungslinie der beiden Nukleonen (z-Richtung), so daß die entsprechende Drehimpulskomponente eine gequantelte Erhaltungsgröße ist. Allerdings ist das Vorzeichen dieser Drehimpulskomponente (rechter oder linker Drehsinn) zunächst bedeutungslos, da die jeweiligen Energieniveaus – im Gegensatz zu den Verhältnissen bei der Zeeman-Aufspaltung der Atomniveaus in magnetischen Feldern – zusammenfallen. Nach diesen Erläuterungen zur Notation sind wir in der Lage, auch die übrigen Potentialkurven des H2+-Ions in der Abb. 15-3 zu verstehen. Sie beziehen sich auf die Wechselwirkung, wenn das HAtom bei der Annäherung an das Proton bereits in einem angeregten Zustand ist. Offensichtlich ist nur in einigen wenigen Fällen eine stabile Molekülbildung möglich. Dies ist wiederum im Gegensatz zu den Atomen, wo man eine unendliche Zahl von gebundenen Zuständen bis zur Seriengrenze findet. In diesem Zusammenhang mache man sich bewußt, daß die intermolekularen elektrischen Felder mit E ª 1010 - 1011 V/m eine Stärke haben, die die maximalen G. Fussmann , Atomphysik SS 2002
201
Einführung in die Physik der Moleküle Laborfeldstärken von etwa 108 V/m bei weitem übersteigen und damit nicht mehr als kleine Störung, sondern als eine extrem starke Brechung der Kugelsymmetrie aufgefaßt werden müssen. 15.4 Molekulare Bindungen 15.4.1
KOVALENTE BINDUNG IN HOMONUKLEAREN MOLEKÜLEN
Die vorausgehenden Betrachtungen am H2+ -Ionenmolekül haben uns gezeigt, daß nur bestimmte Elektronen – dort solche mit der geraden Wellenfunktion yg – zur Bindung beitragen. Man nennt derartige Elektronen "bindende" Elektronen (bounding electrons) im Gegensatz zu den "lockernden" Elektronen (unbounding electrons), die man in der Notation durch einen hochgestellten Stern (*) kennzeichnet66. Bei den Molekülen mit mehreren Elektronen ist es nun wesentlich, ob die Bindungselektronen in der Überzahl sind oder nicht. Hierbei kommt das im Kapitel 13 näher beschriebene Pauli-Prinzip zum Tragen, welches besagt, daß die Gesamtwellenfunktion unter Einbeziehung der Spinwellenfunktion ungerade sein muß und nicht zwei Elektronen den gleichen Satz von Quantenzahlen (n, l, m l, ms) haben dürfen. Hiermit sind zwei sg1s-Elektronen verträglich mit entgegengesetzten Spinkomponenten sz = ±1/2 h (spin "up" und spin "down"), wie sie tatsächlich im stabilen H2-Molekül vorkommen. Beim He2+-Molekülion mit drei Elektronen muß dagegen das dritte Elektron vom unbounding Typ sein, um dem PauliPrinzip zu genügen; dennoch ist dieses Molekül stabil wie aus der Tabelle 15-1 ersichtlich ist. Im hypothetischen He2-Molekül hingegen mit vier Elektronen (sg 1s)2 (su 1s)2 benötigen wir bereits zwei unbounding Elektronen, die eine stabile Konfiguration unterbinden. Allerdings sind angeregte He2* -Moleküle vom Typ (sg 1s)2 (su 1s) (sg 2s) möglich, da dann drei Bindungselektronen vorliegen können. Molekül
Konfiguration
sg1s H2+
≠
su*1s
sg2s
su*2s
p u 2p
sg2p
p g * 2p
H2
≠Ø
He2+
≠Ø
≠
He2
≠Ø
≠Ø
Li2
≠Ø
≠Ø
≠Ø
Be2
≠Ø
≠Ø
≠Ø
≠≠
B2
≠Ø
≠Ø
≠Ø
≠Ø
≠Ø
C2
≠Ø
≠Ø
≠Ø
≠Ø
≠Ø≠Ø
N2
≠Ø
≠Ø
≠Ø
≠Ø
≠Ø≠Ø
≠Ø
O2
≠Ø
≠Ø
≠Ø
≠Ø
≠Ø≠Ø
≠Ø
F2
≠Ø
≠Ø
≠Ø
≠Ø
≠Ø≠Ø
≠Ø
Ne2
≠Ø
≠Ø
≠Ø
≠Ø
≠Ø≠Ø
≠Ø
≠Ø≠Ø
D (ev)
Kernabstand (Å)
2,65
1,06
4,48
0,74
3,1
1,08
su*2p
-
instabil
1,03
2,67
-
instabil
3,6
1,59
3,6
1,31
7,37
1,09
≠≠
5,08
1,21
≠Ø≠Ø
2,8
1,44
-
instabil
≠Ø
Tabelle 15-1: Stabile und instabile Verbindungen Die verschiedenen Möglichkeiten der homonuklearen Molekülbindung der leichten Atome gehen aus der Tabelle 15-1 hervor. Als Maß für die Festigkeit der Bindung ist die Dissoziationsenergie D angegeben. Im allgemeinen haben Moleküle mit hoher Bindungsenergie auch relativ kleine internukleare Abstände. Als allgemeines Prinzip merke man sich, daß diese sogenannte kovalente Bindung durch B i n d u n g s e l e k t r o n e n m i t e n t g e g e n g e s e t z t e m S p i n zustande kommt, 66 In der Molekültheorie werden die entsprechenden Wellenfunktionen auch als bindende bzw. nichtbindende Orbitale
bezeichnet G. Fussmann , Atomphysik SS 2002
202
Einführung in die Physik der Moleküle wobei sich diese Elektronen zwischen den gleichartigen Atomkernen konzentrieren. Die Bezeichnung kovalent soll die Abwesenheit von elektrischen Asymmetrien zum Ausdruck bringen, die im Gegensatz hierzu bei der im folgenden zu besprechenden ionischen Bindung wesentlich sind. 15.4.2
IONISCHE BINDUNG IN HETERONUKLEAREN MOLEKÜLEN
Wie wir gesehen haben, kommt die Bindung bei den homonuklearen Molekülen dadurch zustande, daß sich Elektronen in den Zwischenraum der Atomkerne setzen. Dabei bleibt die Ladungssymmetrie um den Massenschwerpunkt erhalten, so daß diese Moleküle nicht polarisiert sind und demzufolge kein elektrisches Dipolmoment aufweisen. Bei den heteronuklearen Molekülen liegt diese Symmetrie nicht vor, da das Valenzelektron (seltener mehrere Elektronen) bevorzugt zu einem der beiden Atomkerne hingezogen wird. Dies ist beispielsweise beim NaClMolekül der Fall. Das Na-Atom besitzt insgesamt 11 Elektronen, wobei das äußere 3s-Elektron als einziges Elektron in der n = 3-Schale das Valenzelektron bildet. Das Cl-Atom weist 17 Elektronen auf, wobei hier die n = 3-Schale mit insgesamt 7 Elektronen (3s2 3p5) fast vollständig besetzt ist. Es fehlt lediglich ein weiteres 3p-Elektron, um die kugelsymmetrische Elektronenkonfiguration des Edelgases Argon zu erreichen. Das 3s-Elektron des Na besitzt daher eine große "Neigung", sich in der Nähe des Cl-Atoms aufzuhalten. Dadurch geht das Na-Atom in das Na+-Ion mit Neonähnlicher Konfiguration über und das Cl-Atom in das Cl- -Ion mit Ar-ähnlicher Konfiguration. Demzufolge spricht man von ionischer Bindung67. Daß diese Bezeichnung tatsächlich berechtigt ist, erkennt man anhand des gemessenen Dipolmomentes D = 3,0 ◊ 10-29 Cm. Berechnet man nämlich das maximale Dipolmoment Dmax = e r0, wobei r0 = 2,51 Å der Kernabstand im NaCl Molekül ist, so erhält man Dmax = 4,0◊ 10-29 Cm. Das Verhältnis D/Dmax = 0,75 können wir so deuten, als wenn sich das Valenzelektron mit 75%-iger Wahrscheinlichkeit beim Cl-Atom aufhält. Nicht alle heteronuklearen Moleküle weisen eine derartig starke Ionenbindung auf. Bei den Molekülen CO und NO beispielsweise findet man bei einem Abstand von r0 ª 1,15 Å nur ein Dipolmoment von D ª 0,13 ◊ 10-29 Cm, d.h. D/Dmax ª 7%, so daß hier die asymmetrische Verteilung nur sehr schwach ausgeprägt ist. Andererseits ist die Dissoziationsenergie bei CO mit 11,1 eV wesentlich höher als bei NaCl mit 3,58 eV. Das zeigt uns, daß beim CO neben der ionischen Bindung auch kovalente Beiträge vorliegen, die in diesem Fall die wesentlicheren sind. Neben den Fällen von rein kovalenter und ionischer Bindung gibt es also auch Mischformen. Wir haben bisher noch nicht erläutert, wie der Bindungsprozess tatsächlich abläuft. Dazu betrachten wir die Potentialkurven für NaCl und Na+Cl- in der Abb. 15-4. Bei Annäherung der neutralen Na und Cl Atome ergibt sich bei Abständen < 5 Å eine Abstoßungskraft. Andererseits schneidet sich diese NaCl-Potentialkurve mit der Na+Cl- -Kurve bei etwa 6 Å und letztere weist eine anziehende Charakteristik bis zum Minimum der Kurve bei 2,51 Å auf. Es stellt sich die Frage, ob die Zweideutigkeit der Potentialkurven im Kreuzungspunkt (level crossing) so gedeutet werden kann, daß dort das System von dem einen in den anderen Zustand übergehen kann.68 Die generelle Antwort hierauf ist nein! Um nämlich vom freien NaCl Zustand in den gebunden Na+Cl- -Zustand übergehen zu können, muß das System die Dissoziationsenergie abgeben können. Dazu benötigt man bei kovalenter Bindung einen dritten Stoßpartner (oder eine Wand). B e i i o n i s c h e r Bindung gibt es jedoch auch die Möglichkeit der S t r a h l u n g s r e k o m b i n a t i o n . Hierbei kann man sich vorstellen, daß das NaCl-System sich über den Kreuzungspunkt hinaus annähert und dann durch Emission von Strahlung (in diesem Fall sichtbarer) in einen der möglichen Schwingungszustände der Na+Cl--Kurve übergeht. 67 Man bezeichnet die ionische Bindung häufig auch als heteropolare und die kovalente als homöopolare Bindung. 68 Level crossing ist für das Verständnis der chemischen Prozesse von großer Bedeutung. Man beachte hierbei aber
folgendes: Bei der näherungsweisen Beschreibung der Molekülwellenfunktion durch Atomwellenfunktionen wie in Gl. 15.1 ergeben sich häufig Kreuzungen der Niveaus, die jedoch reine Artefakte dieser Approximation sind und bei genauerer Rechnung verschwinden, indem sich die Kurven gleichsam abstoßen Das ist immer dann der Fall, wenn die beiden Potentialfunktionen die gleiche Symmetrie aufweisen. Man spricht deshalb vom Abstoßen gleicher Zustände. G. Fussmann , Atomphysik SS 2002
203
8
10
Einführung in die Physik der Moleküle
6 4 2 -2
0
V(r) (eV)
Abb. 15-4 : Potentialverlauf für NaCl und Na+Cl- als Funktion des Kernabstands
Na + Cl
+
-
-4
Na + Cl 0
4
8
12
16
20
r (Å)
15.4.3
ANDERE BINDUNGEN
Van- der- Waals -Bindungen Bei internuklearen Abständen, die größer als die Atomabstände r0 im stabilen Molekül sind, liegt häufig ein anziehendes Potential vor, das aufgrund einer Dipol-Dipol-Wechselwirkung entsteht. Im Kap. 9.2 ist die klassische Wechselwirkungsenergie für zwei magnetische Dipole angegeben. Diejenige für zwei elektrische hat ganz ähnliche Gestalt 1 E12 = 4 pe 0
r r r r r r È D1 ◊ D2 (D1 ◊ r )(D2 ◊ r ) ˘ -3 Í ˙. 3 5 r r Î ˚
(15.3)
Als Funktion des Atomabstandes fällt diese Wechselwirkungsenergie proportional zu r-3. Allerdings hatten wir uns bereits im Kap. 12.2 davon überzeugt, daß für ein Atom in einem nichtentarteten Energiezustand der Erwartungswert des Dipolmoments null ist. Diese Aussage bezieht sich auf das permanente Dipolmoment, das bei solchen Atomen nicht existiert. Als kurzzeitige Fluktuation kann aber sehr wohl ein Atom ein Dipolmoment besitzen. Das von ihm erzeugte E-Feld bewirkt dann eine elektrische Polarisierung des zweiten Atoms, das somit ein induziertes Dipolmoment D2 = aE erhält. Quantenmechanisch bedeutet dies, daß zwar in einer Störungsrechnung erster Ordnung der der Gl. (15.3) entsprechende Hamilton-Operator H12 keinen Beitrag liefert, wohl aber in zweiter Ordnung. Übrig bleibt damit eine Wechselwirkungsenergie, die mit der Potenz (r-3)2 = r-6 abfällt. Die entsprechende Anziehungskraft (~ r-5) wird als Van-derWaals-Kraft bezeichnet. Sie kennzeichnet den Potentialverlauf im Bereich r > r0 in vielen diatomaren Molekülen. In der unmittelbaren Umgebung der mittleren Gleichgewichtslage r0 bricht aber die Dipolnähung zusammen, und es ist in den Berechnungen der vollständige HamiltonOperator in der Schrödinger-Gleichung zu verwenden. Wasserstoffbrückenbindung Bei großen organischen Verbindungen trifft man häufig noch eine weitere Bindungsform an, die dadurch entsteht, daß sich ein Proton in die Mitte von zwei größeren Atomen bzw. Molekülkomplexen setzt. Aufgrund seines elektrischen Feldes induziert es in diesen ein entgegengesetztes Dipolmoment, das eine Anziehung der Komplexe bewirkt. Formal betrachtet, hat hier das Proton eine ähnliche Wirkung wie das Elektron bei der kovalenten Bindung. Die Wasserstoffbrückenbindung spielt beim DNA-Molekül, aber auch bei sogenannten Dimeren eine Rolle. Zu den letzteren zählen beispielsweise Verbindungen wie das "Doppelwassermolekül" (H2O)2.
G. Fussmann , Atomphysik SS 2002
204
Einführung in die Physik der Moleküle 15.5 Schwingungs - und Rotationszustände Die Potentialkurven der gebundenen Zustände diatomarer Moleküle lassen sich in vielen Fällen mit hinreichender Genauigkeit durch ein sogenanntes Morsepotential V (r ) = Ee + ED [1 - e - a( r - r0 ) ]2
(15.4)
beschreiben. Dabei ist Ee die Energie des elektronischen Zustands im Minimum der Mulde bei r = r0. Wie man der Abb. 15-5 entnimmt, ist ED näherungsweise die aufzuwendende Energie, um ein gebundenes Molekül aus dieser Minimumposition zu trennen, d.h. für den internuklearen Abstand r Æ • ; damit fällt – abgesehen von der kleinen Nullpunktschwingungsenergie – ED mit der Dissoziationsenergie D zusammen. a ist ein Parameter, der die Krümmung der Mulde im Minimum beschreibt und mit den weiter unten angegebenen Größen wie folgt zusammenhängt: a = wo (mAB/2D)1/2. Im Minimum der Kurve können wir eine Parabel anpassen und erhalten dann den in Kap. 6 untersuchten harmonischen Oszillator. Er beschreibt die harmonische Schwingung der beiden Atomkerne in Bezug auf den gemeinsamen Schwerpunkt. Dabei hatten wir festgestellt, daß diese Schwingungen oder Vibrationen nicht mit beliebigen Frequenzen bzw. Vibrationsenergien Ev = hw v ablaufen können, sondern entsprechend Ev = (v + 1 / 2)hw 0 ; v = 0, 1, 2, 3º
(15.5)
gequantelt sind. Die Kreisfrequenz w00 hängt mit den internuklearen Kräften F(r) = - k (r - r0) und der reduzierten Masse mAB = mA mB /(mA + mB) gemäß w 0 = (k/mAB)1/2 zusammen. Nach der Beziehung (15.5) sind die Energieabstände im Tal der Mulde äquidistant DEv = h w0 und der tiefste Zustand liegt h w0/2 oberhalb des Minimums der Potentialkurve. Entsprechend dieser Nullpunktenergie ist eine Vibration des Moleküls um die Ruhlage r = r0 unvermeidlich. Mit zunehmendem Abstand zum Minimum wird die Parabelnäherung schlechter und schließlich völlig unbrauchbar. Die Schwingungen in diesem oberen Bereich sind nicht mehr die des harmonischen, sondern des anharmonischen Oszillators. Damit verändern sich die Eigenwerte und anstelle der Gleichung (15.5) tritt im Falle des Morsepotentials die Näherungsrelation Ev = (v + 1 / 2)hw 0 -
( v + 1 / 2)2 (hw 0 )2 ; 4D
v = 0, 1, 2, 3º,
(15.6)
die man aus einer Störungsrechnung erhält. Die Energieabstände verringern sich damit mit wachsender Vibrationsquantenzahl v, doch ist die Zahl der möglichen Vibrationszustände endlich. Wir schätzen den Energieabstand zwischen zwei Schwingungsniveaus wie folgt ab:
2 10 1 10
Abb. 15-5: Schwingungsniveaus des HCl-Moleküls69.
harm. Oszillator
4
-1
V(r) ( c m )
3 10
4
Diss. Energie
4 10
4
HCl
4
Morsepotential Vibrationsniveaus
0 10
0
0
0.5
1
1.5 2 r (Å)
2.5
3
Für die Konstante k gilt näherungsweise 2k a02 ª Ry = 13,6 eV, wenn a0 der Bohrsche Radius ist. Damit ergibt sich DEv = h w0 = (me/mAB)1/2 Ry. Die Energiedifferenzen sind also etwa um den Faktor (me/mAB)1/2 ª 1/100 kleiner als die charakteristischen Energieabstände im Atom.
3.5
69 In der Molekülphysik ist die Angabe von Energien in cm-1 besonders gebräuchlich. Für die Umrechnung gilt 1 eV =
8065,5 cm -1 . G. Fussmann , Atomphysik SS 2002
205
Einführung in die Physik der Moleküle Außer Schwingungen können die Moleküle auch Rotationen ausführen, wobei die Rotationsenergie natürlich wieder gequantelt ist. Beim Wasserstoffatom haben wir die Quantisierungsvorschrift L2klassisch Æ h 2 l (l + 1) kennengelernt. Wir werden also zunächst die klassische Rotationsenergie als Funktion des klassischen Drehimpulses ausdrücken. Hierfür ergibt sich Er = 1/2 L2klassisch/I mit Lklassisch = mAB w r2 und dem Trägheitsmoment I = mAB r02. Damit erhalten wir den quantenmechanischen Ausdruck für die Rotationsenergie Er =
l(l + 1) 2 h ; l = 0, 1, 2, 3º 2I
(15.7)
Der Energieabstand zwischen zwei benachbarten Quantenzahlen l + 1 und l beträgt demnach DEr =
l+1 2 h , I
(15.8)
wird also mit wachsender Rotationsdrehimpuls-Quantenzahl l größer. Man beachte, daß dieser Ausdruck umgekehrt proportional zum Trägheitsmoment und damit zur reduzierten Masse ist. Bei der Rotation um die Verbindungsachse eines diatomaren Moleküls sind nur die Elektronen mit ihrer leichten Masse beteiligt. Die entsprechende quantenmechanische Rotationsenergie des ersten angeregten Zustandes ist dann aber schon so groß, daß dieser bei gewöhnlichen thermischen Bedingungen (k T ª 1/40 eV) nicht mehr angeregt werden kann. Daraus erklärt sich der Umstand, daß derartige Moleküle nur fünf thermodynamische F r e i h e i t s g r a d e (2 der Rotation um die beiden übrigen Achsen und 3 der Translation) besitzen. Im übrigen ist die reduzierte Masse bei den Molekülen von wesentlich größerer Bedeutung als bei den Atomen. Während beispielsweise bei den Atomspektren nur ein winziger Unterschied zwischen der Linienstrahlung von H und D vorliegt (meH ª meDª me), sind die Rotationsspektren der beiden Wasserstoffisotope erheblich verschieden (mDD= 2 mHH). 15.6 Die molekularen Spektren Wir haben bereits gesehen, daß man bei den Molekülen drei Energiezustände unterscheiden kann: 1. Der elektronische Zustand 2. Der Schwingungszustand, charakterisiert durch die Quantenzahl v. 3. Der Rotationszustand, charakterisiert durch die Quantenzahl l. Diese drei Zustände sind weitgehend voneinander entkoppelt, so daß sich in erster Näherung die Gesamtwellenfunktion als Produkt Y = ye yv yr darstellen läßt. Demzufolge schreibt sich die Gesamtenergie als eine Summe E = Ee + Ev + Er
(15.9)
mit den Größenrelationen DEe >> DEv>> DEr. Wir müssen zunächst noch einmal auf die Bedeutung und Beschreibung des elektronischen Zustands zurückkommen. Bei den Atomen ist die Wellenfunktion eines Energiezustandes wohl definiert und zeitlich konstant. Bei den Molekülen ist diese Zuordnung nicht so einfach, da sowohl die Wellenfunktion als auch die Energie der Elektronen noch vom Abstand der Nukleonen abhängen. Dementsprechend werden bei den Molekülen die elektronischen Zustände, d.h. die Potentialkurven, in erster Linie durch die vom internuklearen Abstand unabhängigen Symmetrieeigenschaften der Wellenfunktion und den konstanten Drehimpulskomponenten charakterisiert. G. Fussmann , Atomphysik SS 2002
206
Einführung in die Physik der Moleküle Bei den Mehrelektronenmolekülen verwendet man eine zu den Atomen analoge Notation (s. Kap. 10). An die Stelle der kleinen Buchstaben l = s, p ... treten L = S, P ... zur Bezeichnung der Gesamtdrehimpulskomponente in Achsenrichtung (z-Richtung). Dazu kommt als linke Hochzahl 2S +1 mit S als Gesamtspin des Moleküls. Die z-Komponente des Spins wird mit S bezeichnet (nicht zu verwechseln mit dem obigen S für L = 0). Die Summe L + S wird als rechter unterer Index angegeben. Man beachte, daß dies nicht identisch ist mit dem Betrag der z-Komponente des Gesamtdrehimpulses W = | L + S | , der ansonsten die entscheidene Rolle spielt. Der elektronische Zustand wird durch einen vorangestellten lateinischen Buchstaben X = Grundzustand, A, B, usw. für die nächst höheren Niveaus gekennzeichnet. Man verwendet große Buchstaben, wenn L und S wie beim Grundzustand sind, anderenfalls kleine lateinische Buchstaben a, b, c usw. Falls bekannt, wird die wirkliche Konfiguration der Einzelelektronen mit angegeben. Die Notation (1s s)2 1S0 im H2-Molekül bedeutet demnach: es gibt zwei 1s s Elektronen mit S = 0 , L = 0 und W = 0. Ebenso bedeutet 3D2 : L = 2, S = 1, S = 0, W = 2 oder 4P-1/2/ : L = 1, S = 3/2, S = -3/2, W = +1/2 Schließlich werden noch die folgenden drei Symmetrieeigenschaften zum Ausdruck gebracht: ∑ Bei homonuklearen Molekülen: Die Parität der elektronischen Wellenfunktion ye hinsichtlich Spiegelung am Zentrum mit dem Index g und u für gerade und ungerade. ∑ Die Parität der Gesamtwellenfunktion hinsichtlich Vertauschung der Nukleonen durch s (symmetrisch) und a (antisymmetrisch). ∑ L = 0 , d.h S-Zustände werden mit einem hochgestellten - oder + gekennzeichnet, je nachdem die Wellenfunktion bei Spiegelung am Ursprung ihr Vorzeichen ändert oder nicht (z.B. X 3Sgals Grundzustand bei O2). Die drei Terme in Gl. (15.9) lassen sich näherungsweise wie folgt spezifizieren: Ee ª E0 + A( L ◊ S )
(15.10)
mit einer positiven (regulär, Index r) oder negativen (irregulär, Index i) Konstanten A (von ª 10 eV bei BeH bis etwa 0,45 eV bei HgH). Falls S π 0 und L π 0 führt diese Spin-BahnWechselwirkung zu einer Aufspaltung der elektronischen Zustände, ergibt also benachbarte Potentialkurven. (Als Beispiel für die in Wirklichkeit sehr komplexen Potentialverläufe betrachte man die Abb. 15-7, die auch die Notation am Beispiel des NO verdeutlicht.) 4
Für die Vibrationsenergien haben wir die bekannte Näherung des harmonischen Oszillators Gl. (15.5) bzw. mit anharmonischen Korrekturen Gl. (15.6). Ebenso hatten wir für die Rotationsenergien Gl. (15.7) abgeleitet. Greifen wir nur zwei elektronische Zustände eines Moleküls heraus, so ergeben sich die in Abb. 15-6 skizzierten Verhältnisse. Zwischen den verschiedenen Niveaus sind nun Übergänge möglich, die entweder mit der Absorption oder Emission von elektromagnetischer Strahlung verbunden sind. Allerdings sind nur Übergänge mit nennenswerter Intensität möglich, die mit den im Kap. 11 behandelten Auswahlregeln für elektrische Dipolstrahlung verträglich sind.
G. Fussmann , Atomphysik SS 2002
207
Einführung in die Physik der Moleküle
Abb. 15-6 : Die Energiezustände der Moleküle. Der größte Energieabstand liegt zwischen den elektronischen Zuständen (zwei Potentialkurven). In diesen liegen die Vibrationszustände mit den Quantenzahlen v' und v''. Zwischen jeweils zwei Vibrationszuständen befinden sich zahlreiche Rotations-zustände mit den Quantenzahlen l' und l''. (n. Alonso Finn)
Abb. 15-7:Die Potentialkurven des NO-Moleküls (n. Bond, Watson, Welch)
G. Fussmann , Atomphysik SS 2002
208
Einführung in die Physik der Moleküle 15.6.1
ROTATIONSSPEKTREN:
Die kleinsten Photonenenergien ergeben sich sich bei den reinen Rotationsübergängen bei gleicher Vibrationsquantenzahl. Die hierbei ausgesandte Strahlung liegt im fernen Infrarot (FIR) bei l ª 100 - 1000 mm bzw. hn ª 10-3 - 10-2 eV. Die Auswahlregel lautet hier: D l = ± 1. Damit entstehen nach Gl. (15.8) die Übergänge
w=
DE l + 1 = h h I
(15.11)
mit einem konstanten Linienabstand Dw = h /I (typischerweise ª 10-4 eV). Ein Beispiel zeigt die Abb. 15-8 für das HCl-Molekül. Aus dem gemessenen Abstand der Linien kann man somit das Trägheitsmoment und damit bei bekannten Massen den Gleichgewichtsabstand ro bestimmen.70 An dieser Stelle ist es wichtig auf eine besondere Einschränkung hinzuweisen. Die Aussendung von Dipolstrahlung71 ist nur möglich, wenn sich das Dipolmoment des Moleküls ändern kann. Bei den homonuklearen Molekülen haben wir dagegen bereits festgestellt, daß diese aus Symmetriegründen kein Dipolmoment besitzen können. Hier tritt ein Dipolmoment nur auf, wenn eine Änderung des elektronischen Zustands erfolgt. Aus diesem Grunde ist bei den homonuklearen Molekülen w e d e r ein Rotationsspektrum n o c h das im folgende zu besprechende VibrationsRotationsspektrum zu beobachten; man nennt sie deshalb optisch inaktiv.
Abb. 15-8 : Rotationsspekrum von HCl in Absorption (n. Alonso Finn) Diese optische Inaktivität im Infraroten ist von entscheidender Bedeutung für unsere Atmosphäre. Hier sind die homonuklearen Moleküle N2 und O2 die Hauptbestandteile. Wegen der besprochenen Eigenschaften absorbieren sie kaum die von der Erde im Infraroten in den Weltraum abgestrahlte Leistung. Andere Moleküle wie CO2 oder CH4 sind dagegen starke Absorber und können als atmosphärische Verunreinigungen den Strahlungshaushalt der Erde (von der Sonne eingestrahlte Leistung = abgestrahlter Leistung) in der Weise beeinflussen, daß zur Erfüllung der Bilanz eine höhere Oberflächentemperatur erforderlich wird (Treibhauseffekt).
15.6.2
VIBRATIONS-ROTATIONSSPEKTREN
Mit der Auswahlregel Dv = ± 1 sind innerhalb eines elektronischen Zustands Übergänge zwischen zwei benachbarten Vibrationsniveaus möglich72. Ein häufig beobachtbarer Übergang ist v = 0 ´ v 70 Obige Beziehungen gelten auch für Vielatom-Moleküle. Deren Trägheitsmoment ist gewöhnlich erheblich größer, so daß
die Linienabstände hierbei noch viel kleiner sind. Bei diesen Molekülen gibt es in der Regel mehrere Schwingungsmoden, so daß die Spektren noch wesentlich reicher an Linien sind. 71 Bei verbotener Dipolstrahlung können die Moleküle noch Quadrupolstrahlung aussenden. Diese ist aber wesentlich weniger intensiv und in der Regel nicht beobachtbar. 72 Diese Auswahlregel gilt streng für den harmonischen Oszillator. Wegen der anharmonischen Anteile eines realen G. Fussmann , Atomphysik SS 2002
209
Einführung in die Physik der Moleküle = 1. Wir haben aber bereits gesehen, daß diese Schwingungszustände noch von den wesentlich kleineren Rotationszuständen überlagert sind. Daher wird bei einem solchen Übergang nicht nur eine Linie ausgestrahlt, sondern eine Serie von Linien, die einerseits der Besetzung der Niveaus entsprechen und zudem mit der schon bekannten Auswahlregel Dl = ± 1 verträglich sind. Entsprechend der Abb. 15-9 entstehen somit zwei Linienserien, links (P-Zweig) und rechts (RZweig) von der Frequenz no, die dem verbotenen Übergang l = 0 Æ 0 entsprechen würde. Man beobachtet also wiederum den Abstand Dw = h /I der Rotationsniveaus, aber jetzt nicht mehr im fernen sondern im nahen Infrarotgebiet bei h wo ª 10-1 eV. Ein Beispiel für eine Absorptionsmessung in diesem Spektralgebiet an einem HCl -Dampf ist in der Abb. 15-10 wiedergegeben. Die Intensität der Linien in Absorption oder Emission ist proportional zur Besetzungsdichte der unteren bzw. oberen Niveaus. Diese ist im thermodynamischen Gleichgewicht durch eine Boltzmannrelation mit dem charakteristischen Faktor exp(- E / kT) gegeben (Boltzmannkonstante k = 1,38 ◊ 10 - 23 J/K). Damit bietet sich die Möglichkeit, aus r e l a t i v e n Intensitätsverhältnissen die absolute Temperatur eines Gases z u m e s s e n . Bei der Anregung der Rotationsniveaus gilt beispielsweise -
nl ~ gl e
l =3 2 1 0
}
v=1
l =3 2 1 0
}
v=0
Dl = -1
n0
h 2 l ( l + 1) 2 I kT
= (2l + 1)e
-
Qr l ( l + 1) T
,
(15.12)
D l = +1
nÆ
Abb. 15-9: Vibrations-Rotations-Übergänge mit den Linien des P-Zweiges (Dl = - 1) und des R-Zweiges (Dl = + 1).
Abb. 15-10: Vibration-Rotation Spektrum von HCl in Absorption. Die Doppelstruktur der Linien wird von den beiden Isotopen 35Cl und 37Cl verursacht (n. Alonso Finn).
dabei ist gl = 2l +1 der statistische Gewicht des Niveaus l und Qr = h 2/2I die sogenannte Rotationstemperatur. Trägt man den Logarithmus der durch g l dividierten Intensität als Funktion von l (l + 1) auf, so ergibt sich (näherungsweise73) eine Gerade mit der Steigung - Qr /T. Abgesehen Potentials werden bei höheren v-Werten auch Übergänge vom Typ Dv = ± 2, 3... möglich, die aber in der Regel wesentlich schwächer sind. 73 Für die genauere Auswertung muß man auch die Variation der Anregungsfunktion (Hönl-London Faktoren)
berücksichtigen. G. Fussmann , Atomphysik SS 2002
210
Einführung in die Physik der Moleküle von H2O (85 K) und einigen anderen Molekülen sind bei den meisten Molekülen die Qr -Werte recht klein (typisch ª 3K) und daher für Messungen höherer Temperaturen ungeeignet. Man verwendet in diesen Fällen dann die Intensitätsverhältnisse der Schwingungsübergänge mit entsprechenden Qv -Temperaturen von etwa 500 - 2000 K. 15.6.3
MOLEKÜLBANDEN IN ELEKTRONISCHEN ÜBERGÄNGEN
Auch zwischen den elektronischen Potentialniveaus sind Übergänge möglich, die – entsprechend den charakteristischen Energiedifferenzen von einigen eV – mit der Absorption bzw. Ausstrahlung von sichtbarem oder UV-Licht verbunden sind. Es entstehen Spektren, die sich durch einen besonderen Linienreichtum auszeichnen und auch bei den homonuklearen Molekülen zu beobachten sind. Betrachten wir einen erlaubten Übergang zwischen dem oberen und unteren elektronischen Niveaus a' und a'' mit den festen Vibrationsquantenzahlen v' und v'' und den variablen Rotationsquantenzahlen l' und l'', so erhalten die Photonen nach Gl. (15.9) und (15.7) die Energie DE = DE0 +
h2 È l¢ (l¢ + 1) l¢¢ (l¢ + 1) ˘ . I ¢¢ ˙˚ 2 ÍÎ I ¢
(15.13)
Hierbei ist DEo = DEe + DEv die Energie des sogenannten Bandenursprungs. Da die Trägheitmomente im oberen und unteren elektronischen Niveau I' und I'' in der Regel nicht gleich sind, ergeben die Übergänge zwischen den Rotationsniveaus in Verbindung mit den Auswahlregeln l ' - l '' = ± 1, 0 (ausgenommen l ' = 0 <-> l '' = 0) 74 eine komplizierte Bandenstruktur. Man beachte, daß die Auswahlregel gegenüber den reinen Rotations- und Rotationsvibrationsspektren erweitert ist, da jetzt auch Dl = 0 zugelassen ist. Wir erhalten damit drei Zweige: den P-Zweig (Dl = -1), den R-Zweig (Dl = +1) und den neu hinzugekommenen Q-Zweig (Dl = 0). In Wellenzahlen ausgedrückt sind die entsprechenden Photonenenergien
nP = n0 - (Bv ¢ + Bv ¢¢ )l¢¢ + (Bv ¢ - Bv ¢¢ )l¢¢ 2 nQ = n0 + (Bv ¢ - Bv ¢¢ )l¢¢ + (Bv ¢ - Bv ¢¢ )l¢¢ 2
(15.14)
nR = n0 + 2Bv ¢ + ( 3Bv ¢ + Bv ¢¢ )l¢¢ + (Bv ¢ - Bv ¢¢ )l¢¢ 2 mit l'' = 0, 1, 2, 3... Zur Abkürzung haben wir die Größe h /2p I' c = Bv' gesetzt. Für den Fall gleicher Trägheitsmomente im oberen und unteren Niveau (Bv' = Bv'') entfallen die quadratischen Terme un dder Q-Zweig, und wir erhalten ein Linienspektrum mit äquidistanten Linien, wie es bei den Vibrations-Rotationsspektren der Fall war. Im allgemeinen sind aber die Spektren wegen der quadratischen Terme komplizierter. Insbesondere bildet sich ein Bandenkopf aus, und es können sich die drei Z w e i g e t e i l w e i s e ü b e r l a p p e n . Die Entstehung des Bandenkopfes wird in der Abb. 15-11 anhand eines sogenannten Fortrat-Diagramms veranschaulicht. Es handelt sich um einen Häufungspunkt der Linien, wobei allerdings die Zahl der Linien endlich bleibt. Je nachdem, ob das Trägheitsmoment (und damit der mittlere Kernabstand im Schwingungsniveau ) im oberen oder unteren elektronischen Niveau das kleinere ist, entsteht der Bandenkopf im P-Zweig (Bv' > Bv'') oder im R-Zweig (Bv' < B v''). Ein Beispiel für einen R-Bandenkopf bei l = 421,1 nm mit einer entsprechenden Abschattierung zum roten Wellenlängenbereich zeigt das Spektrum von AlH in der Abb. 15-12. 15.6.4
DAS FRANCK-CONDON PRINZIP
Die oben besprochene Bandenstruktur ergab sich für einen Vibrationsübergang v' Æ v'' eines bestimmten elektronischen Übergangs C' Æ C''. In einem Molekül gibt es aber viele derartige 74 Diese Einschränkung führt dazu, daß in 1S -1S Übergängen der Q-Zweig nicht in Erscheinung tritt.
G. Fussmann , Atomphysik SS 2002
211
Einführung in die Physik der Moleküle Vibrationsübergänge zu ein und dem gleichen elektronischen Übergang. Welche Vibrationsübergänge sind nun besonders intensiv ? Zunächst ist darauf hinzuweisen, daß die Auswahlregel Dv = ± 1 bei diesen elektronischen Übergängen bedeutungslos wird. An ihre Stelle tritt das FranckCondon-Prinzip, das von Franck 1925 aufgrund von klassischen Überlegungen abgeleitet und von Condon 1928 quantenmechanisch begründet wurde. Ausgangspunkt dieser Überlegung ist eine Zeitbetrachtung: Die charakteristischen Zeiten für den Schwingungsvorgang der Nukleonen liegen in der Größenordnung von 10-13 s. Verglichen hiermit sind die elektronischen Übergänge, die nur etwa 10-16 s benötigen, praktisch instantan. Ein elektronischer Übergang wird deshalb in einem Potentialdiagramm, wie es in der Abb. 15-13 zkizziert ist, als senkrechter Strich wiedergegeben. Da sich also der Schwingungszustand der Nukleonen innerhalb der kurzen Zeitspanne des elektronischen Übergangs nicht ändern kann, sind nur solche Übergänge möglich, bei denen die Relativgeschwindigkeit der Nukleonen im oberen und unteren elektronischen Zustand gleich ist.
l ''
Abb. 15-11: Fortrat-Diagramm zur Erklärung der Bandenstruktur bei elektronischen Molekül-übergängen (n. Marr).
Abb. 15-12:: Bandenstruktur im sichtbaren Spektrum von AlH. Der Bandenkopf liegt im roten R-Zweig (oberer Bildrand). Bei Q(1) liegt der Bandenursprung (n. H. Schlüter)
Das ist bei hohen Vibrationsquantenzahlen insbesondere in den klassischen Umkehrpunkten der Fall, wo die Relativgeschwindigkeit null ist. Ist beispielsweise das Molekül im Zustand v' = 5 wie in der Abb. 15-13 angedeutet, so ist in Absorption nur der Übergang in das Niveau v'' = 1 (Übergang a) oder in den dissoziierten Zustand (Übergang b) möglich. Für kleine Quantenzahlen, also insbesondere für v' = 0, erfolgt die Absorption – in Übereinstimmung mit der quantenmechanischen Aufenthaltswahrscheinlichkeit beim harmonischen Oszillator – vom Zentrum des unteren Niveaus aus in den Zustand v'' = 4 (Übergang c). Ebenso ist der Übergang (d) v' = 2 Æ v'' = 0 in der Abbildung zu verstehen.
G. Fussmann , Atomphysik SS 2002
212
Einführung in die Physik der Moleküle Abb. 15-13 : Nach dem Franck-Condon Prinzip erlaubte elektronische Übergänge. Als letztes Beispiel zeigen wir in der Abb. 15-14 das Emissionsspektrum der CO-und CO+-Moleküle aus einer Plasmaentladung mit einer Temperatur von etwa 105 K. Es sind zahlreiche Banden vom UV- bis in den nahen Infrarot-Bereich zu beobachten. Daneben erscheinen die Übergänge des beigefügten Heliums (He I = He0, He II = He+) als separierte Linien. Aus der Analyse derartiger Spektren ergeben sich wertvolle Erkenntnisse über den molekularen Aufbau wie auch über die Beschaffenheit des Gases bzw. Plasmas in dem sich die Teilchen befinden.
Abb. 15-14 : Molekülbanden in Emission aus einer Plasmaentladung (n. Pospieszczyk)
15.7 Hybridisierung in mehratomigen Molekülen Viele der zuvor an diatomaren Molekülen diskutierten Erscheinungen haben eine direkte Entsprechung bei den drei- und mehratomigen Molekülen. Mit der sogenannten Hybridisierung kommt jedoch ein wichtiger Gesichtspunkt hinzu, der für das Verständnis dieser komplizierteren Gebilde wesentlich ist.
G. Fussmann , Atomphysik SS 2002
213
Einführung in die Physik der Moleküle Bereits bei der Diskussion der Wasserstoffwellenfunktionen in Kap. 7 haben wir festgestellt, daß diese sowohl hinsichtlich der Energie als auch zum Drehimpuls entartet sind. Die verschiedenen Kugelflächenfunktionen zu einer bestimmten Drehimpulsquantenzahl l kann man daher auch in beliebigen Linearkombinationen zusammenfassen75; sie genügen auch dann noch der SchrödingerGleichung. Wichtig sind vor allem die Winkelabhängigkeiten der s- und p-Elektronen. Während die s-Elektronen eine kugelsymmetrische Verteilung aufweisen, hatten wir für die p-Elektronen unterschiedliche Winkelverteilungen gefunden, die sich durch die drei Kugelflächenfunktionen Y11, Y1-1 und Y10 beschreiben lassen. Aus den letzteren lassen sich – wie wir schon im Kapitel 7 erfahren haben – die drei Kombinationen 3 -1 1 (Y1 - Y1-1 ) = sin q cos j 4p 2 3 -1 1 py : = (Y1 - Y1-1 ) = sin q cos j 4p i 2 3 pz : = Y10 = cos q 4p px : =
(15.15)
bilden, deren räumliche Aufenthaltswahrscheinlichkeiten (also die Betragsquadrate |px|2 usw.) zusammen mit der istotropen Verteilung s: = (4p)-1/2 eines s-Elektrons in den Abb. 15-15 und Abb. 15-16 dargestellt sind. In der Molekülphysik werden diese Zustände als Orbitale bezeichnet, was etwas irreführend ist, denn von einer Umlaufbahn des Elektrons kann ja eigentlich keine Rede sein.
Abb. 15-16: Die drei p-Orbitale px, py, pz
Abb. 15-15: s-Orbital
Für die Molekülbildung sind nun gerade die Mischungen76 von s- und p-Orbitalen bedeutsam, die man als Hybridzustände bezeichnet. Hiermit lassen sich die Elektronen räumlich so verteilen, daß Vorzugsrichtungen entlang der Koordinatenachsen entstehen. Als einfachsten Fall betrachten wir die Mischung eines s-Zustandes mit einem p-Zustand. Hier erhalten wir die beiden normierten spHybridzustände
y 1, 2 =
1 ( s ± pz ) = 2
1 (1 ± 3 cos q ), 8p
(15.16)
deren Betragsquadrate in der Abb. 15-17 dargestellt sind (man beachte, daß die Funktionen p x , py und pz in manchen Gebieten negativ werden.
75 Die Methode, durch Linearkombination der Wasssrstoffwellenfunktionen eine dem jeweiligen Problem angepaßte Lösung zu erzeugen, bezeichnet man als LCAO-Methode (Linear Combination of Atomic Orbitals). 76 hybrid: zwitterhaft, aus zwei verschiedenen Dingen zusammengesetzt.
G. Fussmann , Atomphysik SS 2002
214
Einführung in die Physik der Moleküle
Abb. 15-17: Elektronenverteilung in den zwei linearen sp-Hybridzuständen entlang der z-Achse. Für die chemischen Bindungen sind nun zwei Kombinationen besonders wichtig: die sp2- und die sp3-Hybride. Im ersten Fall kombiniert man einen sZustand mit zwei p-Zuständen vom Typ px und p y , im zweiten Fall hat man es mit einem s und den drei Zuständen p x , py und pz zu tun. Die orthonormalen Wellenfunktionen der sp2-Hybridisierung lauten
y1 =
1 2 1 1 1 1 1 1 s+ px ; y 2 = spx + py ; y 3 = spx py . (15.17) 3 3 3 6 2 3 6 2
Die Winkelverteilung ergibt sich durch Einsetzen von (15.15). Die Betragsquadrate dieser Funktionen haben ihre Maxima bei 0, 120˚ und 240˚. Es handelt sich um eine planare Hybridisierung, wie man auch der Abb. 15-18 entnimmt.
Abb. 15-18:
sp2-Hybrid
in der x-y-Ebene.
Abb. 15-19: sp3-Hybrid mit Ausrichtung auf die Eckpunkte eines Tetraeders.
Eine dreidimensionale Ausrichtung ergibt sich im Falle der sp3-Hybride. Hier lauten die Wellenfunktionen 1 1 y 1 = ( s + px + py + pz ); y 2 = ( s + px - py - pz ) 2 2 1 1 y 3 = ( s - px + py - pz ); y 4 = ( s - px - py + pz ) 2 2
(15.18)
Sie liefern Aufenthaltswahrscheinlichkeiten mit Maxima, die zu den vier Eckpunkten eines regulären Tetraeders weisen. Die plastische Darstellung der Elektronen-Aufenthaltswahrscheinlichkeit ist in der Abb. 15-19 wiedergegeben. Ein einfaches Beispiel für eine spx- spy-Hybridisierung liefert das Wassermolekül H2O. Hier haben wir bei den beiden H-Atomen nur zwei 1s-Elektronen, beim O-Atom dagegen in der n = 2-Schale die sechs Elektronen 2 s2 2p 4, wobei nach Abb. 13.2 zwei der p-Elektronen die gleiche Spinrichtung haben. Um dem Pauli-Prinzip zu genügen, müssen sie sich in ihrer räumlichen Wellenfunktion unterscheiden und sind daher durch die Orbitale px und py zu beschreiben. Wir haben es somit beim O-Atom mit der Konfiguration 2s2 2px 2py 2pz2 zu tun. Insbesondere die G. Fussmann , Atomphysik SS 2002
215
Einführung in die Physik der Moleküle beiden ungepaarten px- und py-Orbitale sind wesentlich; sie koppeln (d.h. beim Überlapp der Wellenfunktionen tritt eine Energieabsenkung auf) jeweils mit einem der Wasserstoff-s-Elektronen und bewerkstelligen so die molekulare Bindung. Ist das O-Atom im Koordinatenursprung, so müssen sich die Protonen wegen der räumlichen Verteilung der px- bzw. py-Elektronen auf der xbzw. y-Achse aufhalten, wie in der Abb. 15-20 zu sehen ist. Wegen der elektrostatischen Abstoßung der Protonen ist der wirkliche Winkel zwischen ihnen aber nicht 90˚, sondern auf 104,5˚ vergrößert. Abb. 15-20: Elektronenverteilung im Wassermolekül. Bei dieser Bindung werden die s-Elektronen des Wasserstoffs erheblich zu dem höher geladenen O-Kern hingezogen. Dadurch tritt eine Ladungsverschiebung auf, die das hohe elektrische Dipolmoment des Wasssers (D = 6,2·10-30 Cm) bedingt. Dieses Dipolmoment wiederum ist die Ursache für die hohe Löslichkeit vieler Substanzen in Wasser. Ein etwas anderer Fall liegt beim Ammoniak (NH3) vor. Wiederum entnehmen wir der Abb. 13.2, daß in diesem Fall alle drei 2p-Elektronen des N-Atoms die gleiche Spinrichtung haben. Abb. 15-21: Elektronenverteilung im NH3-Molekül. Sie besetzen demnach die unterschiedlichen Orbitale p x , p y , p z, die in die drei Achsenrichtungen zeigen. Auf diesen sollten demnach die drei H-Atome sitzen, wenn das N-Atom im Koordinatenursprung ruht. Die H-Atome werden durch den Überlapp der s-Elektronen mit den p-Elektronen des NAtoms gebunden, indem sich insgesamt eine Erniedrigung der potentiellen Energie ergibt. Tatsächlich bildet - wie in Abb. 15-21 zu sehen - das NH3-Molekül die erwartete Pyramidenstruktur, doch ist auch hier - wegen der elektrostatischen Abstoßung - der Winkel zwischen den H-Atomen nicht 90˚, sondern 107,3˚. Bei den organischen Kohlenstoffverbindungen spielt die sp3-Hybridisierung eine bedeutende Rolle. Im Grundzustand hat das C-Atom zwar die Konfiguration 1s2 2s2 2p2, so daß gar keine drei p-Elektronen zur Verfügung stehen, doch kann es relativ leicht in den energetischen benachbarten Zustand 1s2 2s 2p3 übergehen. Diese Möglichkeit, durch den Übergang 2s Æ 2p in den angeregten Zustand zu gelangen, ist von entscheidender Bedeutung für die zahlreichen Verbindungen des Kohlenstoff. Für das einzelne C-Atom bedeutet dieser Vorgang zwar eine geringfügige Energieerhöhung und wird deshalb spontan nicht auftreten, doch kann es im Atomverbund anders aussehen. In der Tat ist es dann häufig so, daß der Wechsel 2s Æ 2p ohne Energieaufwand möglich wird, so daß die beiden Zustände energetisch entartet sind. Diese durch Annäherung anderer Atome aufgeprägte Entartung ist die eigentliche Ursache für den Hybridisierungsprozeß. Die in der Folge vorhandenen drei p-Elektronen in der n = 2-Schale haben - wie beim Stickstoff alle den gleichen Spin und müssen sich daher in ihren Ortswellenfunktionen unterscheiden. Zusammen mit dem 2s-Elektron bilden sie die in Gl. (15.18) angegebenen vier Orbitale. Beim Methan (CH4) findet man die erwartete Tetraederkonfiguration (Abb. 15-22). Hier sitzt an jedem Eckpunkt des Tetraeders ein H-Atom, dessen 1s-Elektron mit jeweils einem der vier C-Elektronen zum Überlapp kommt. Die Wellenfunktion für jedes der beiden an der Bindung beteiligten Elektronen ist dann wiederum als Linearkombination
y=
G. Fussmann , Atomphysik SS 2002
1 1+|a |2
(y C + ay H )
(15.19)
216
Einführung in die Physik der Moleküle aus einem 1s-Elektron des H-Atoms und einem der vier p-Elektronen nach Gl. (15.18) anzusetzen (z.B. y1 für die erste Ecke des Tetraeders). Der freie Koeffizient a wird so angepaßt, daß die Gesamtenergie Etot des Moleküls minimal wird. Ist die so minimierte Energie Etot niedriger als die Summenenergie der Einzelatome, so liegt eine stabile Molekülbindung vor. Abb. 15-22: Tetraeder-Anordnung der H-Atome beim CH4 durch sp3-Hybridisierung.
Die sp3-Hybridisierung erklärt auch die Möglichkeit der Kettenmolekülbildung der Kohlenwasserstoffe. Als einfaches Beispiel dieser Art ist in der Abb. 15-23 das Äthan-Molekül (H3C-CH3) dargestellt. Hierbei werden jeweils drei der vier sp3-Orbitale eines C-Atoms benötigt, um drei H-Atome zu binden; das vierte dagegen stellt die Bindung zum anderen CAtom her. Die so entstehenden Moleküle vom Typ
| | | | ± C ± C ± C ± C ± | | | | sind besonders stabil und bilden die Basis für viele Kunststoffe (Polymere). Abb. 15-23: sp3-Hybridisierung im Äthan (C 2H 6).
Schließlich begegnet uns auch die Hybridisierung im ringförmigen Benzolmolekül. (Abb. 15-24). Hier haben wir eine Kombination aus sp2Orbitalen und pz-Elektronen. Jeweils eins der drei sp2-Elektronen wird für die Bindung eines HAtoms benötigt. Die restlichen zwei Elektronen stellen die Bindung zwischen den C-Atomen her. Die pz-Elektronen dagegen werden für die Bindung überhaupt nicht benötigt; sie können sich demzufolge frei bewegen im periodischen Feld des Sechserrings. Diese sogenannten p-Elektronen bilden somit ein P a r a d i g m a f ü r d i e B e w e g u n g v o n f r e i e n E l e k t r o n e n i n e i n e m p e r i o d i s c h e n F e l d , wie es im Festkörper durch das Kristallfeld hervorgerufen wird.
G. Fussmann , Atomphysik SS 2002
217
Einführung in die Physik der Moleküle
Abb. 15-24: Elektronenvertteilung im Benzolmolekül (ohne p-Elektronen). Als letztes Beispiel eines schon großen Moleküls sehen wir in Abb. 15-25 das Modell eines Fulleren-Moleküls. Diese reinen Kohlenstoffverbindungen vom Typ Cn mit n bis zu etwa 200 wurden erst 1985 von R.E. Smalley entdeckt. In dem gezeigten Molekül C60 bilden die C-Atome in der Regel Sechsecke auf einer Kugeloberfläche. Dazwischen jedoch liegen auch Fünfecke merkwürdigerweise sind es bei allen Fullerenen genau 12.
Abb. 15-25: Kugelförmiger Aufbau des C60-Fulleren-Moleküls. Die Fullerene sind die Moleküle mit der höchsten Kugelsymmetrie. Jeweils eines der C-Atome kann auch ein H-Atom aufnehmen, wodurch sich das Kugelmolekül in ein igelförmiges Gebilde mit der Summenformel C60 H60 verwandelt.
G. Fussmann , Atomphysik SS 2002
218
Einführung in die Physik der Moleküle
16 LITERATUR Populärwissenschaftliche Schriften ∑ „PHYSIK: Themen, Bedeutungen und Perspektiven der physikalischen Forschung“ Ein Bericht an Gesellschaft, Politik und Wirtschaft der Deutschen Physikalischen Gesellschaft e.V., 2001, Druck- und Gewerbegesellschaft m.b.H., Bonn (www.dpg-physik.de) ∑ Tony Hey und Patrick Walters, „Das Quantenuniversum“, Spektrum Akademischer Verlag 1998 Grundlagen der Atom- und Molekülphysik ∑ T. Mayer-Kuckuk, "Atomphysik", Teubner Studienbücher (1985) ∑ W. Demtröder, Experimentalphysik III, SpringerVerlag (1996) ∑ H. Haken und H.L. Wolf, "Atom- und Quantenphysik", Springer Verlag (1987) ∑ H. Haken, H.L. Wolf, "Molekülphysik und Quantenchemie", Springer Verlag (1993) ∑ Heckmann, Träbert, " Einführung in die Spektroskopie der Atomhülle", Vieweg Verlag ∑ K.H. Hellwege, "Einführung in die Physik der Atome", Springer- Verlag (1964) ∑ G. M. Kalvius, K. Lurchner, H. Vonach "Physik IV", R. Oldenburg Verlag münchen, Wien (1985) ∑ W. Finkelnburg,"Einführung in die Atomphysik", Springer ∑ P. Zimmermann, "Einführung in die Atom-Molekülphysik", Akademische Verlagsgesellschaft Wiesbaden (1978) Allgemeinere Lehrbücher ∑ M. Alonso and E. J. Finn, "Physics", Addison-Wesley Publishing Company (1992) ∑ H. Wichmann, Berkeley Physik Kurs, Bd. IV, Mac Graw -Hill (1967) ∑ M. Karpus and R. Porter, "Atoms and Molecules", Benjamin Inc., London (1970) ∑ R. P. Feynman, R. B. Leighton: Vorlesungen über Physik, Bd. 3 , Oldenbourg, München (1991) Quantentheorie und Philosophie ∑ R.P. Feynman "QED - The Strange Theory of Light and Matter", Princeton University Press (1985) ∑ J. Audretsch, K. Mainzer, Wieviele Leben hat Schrödingers Katze?, BI, Wissenschaftsverlag (1990) ∑ Quantenphilosophie, Beiträge aus Spektrum der Wissenschaft, Spektrum Akademischer Verlag (1994) Spektroskopie und atomare Daten ∑ A. Corney, "Atomic and Laser Spectroscopy", Oxford Science Publications, Oxford University Press (1977) ∑ G. Marr "Plasma Spectroscopy", Elsevier Publishing Company (1968) ∑ C. Candler, "Atomic Spectra", Hilger and Watts, London (1964) ∑ W. Grotrian, "Graphische Darstellung der Spektren", Band I und II, Julius Springer, Berlin (1928) ∑ N.A. Dyson, "X-rays in Atomic and Nuclear Physics", Longman Group limited, London (1973) ∑ R.K. Janev, L.P. Presnyakov, V.P. Shevelko, "Physics of Highly Ionized Atoms", Springer Series in Electrophys. 13 (1984) ∑ INTERNET INFORMATIONEN: Databases for Atomic and Plasma Physics: http://plasmagate.weizmann.ac.il/DBfAPP.html Atomtheorie ∑ A. Sommerfeld, "Atombau und Spektrallinien", Band I und II, Vieweg, Braunschweig (1960), als Taschenbuch neu bei Verlag Harri Deutsch, Frankfurt ∑ I.I. Sobelman, "Atomic Spectra and Radiative Transitions" Springer Series in Chemical Physics 1, Springer-Verlag (1979) ∑ I.I. Sobelman, L.A. Vainstein, E.A. Yukow, "Excitation of Atoms and Broadening of Spectral Lines", Springer Series in Chemical Physics 7, Springer-Verlag (1981) ∑ H. Bethe and E. E. Salpeter, "Quantum Mechanics of One and Two Electron Atoms", Springer-Verlag (1957), als Taschenbuch neu bei Plenum / Rosetta Computational Physics ∑ J.M. Feagin, Methoden der Quantenmechanik mit Mathematica, Springer Verlag (1994) ∑ K. Bartschat, Computational Atomic Physics, Springer Verlag (1996) G. Fussmann , Atomphysik SS 2002
219