Springer-Lehrbuch
Für weitere Bände: http://www.springer.com/series/1183
Karl-Heinz Goldhorn · Hans-Peter Heinz Margarita Kraus
Moderne mathematische Methoden der Physik Band 2: Operator- und Spektraltheorie – Gruppen und Darstellungen
123
Dr. Karl-Heinz Goldhorn Johannes Gutenberg-Univ. Mainz FB 17 Mathematik Staudingerweg 9 55099 Mainz Deutschland
[email protected]
Prof. Dr. Hans-Peter Heinz Universität Mainz Institut f. Mathematik Staudingerweg 9 55099 Mainz Deutschland
[email protected]
PD Dr. Margarita Kraus Universität Mainz FB 8 Physik, Mathematik und Informatik Staudingerweg 9 55099 Mainz Deutschland
[email protected]
ISSN 0937-7433 ISBN 978-3-642-05184-5 e-ISBN 978-3-642-05185-2 DOI 10.1007/978-3-642-05185-2 Springer Heidelberg Dordrecht London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. c Springer-Verlag Berlin Heidelberg 2010 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Vorwort
In der Literatur über das mathematische Handwerkszeug des theoretischen Physikers scheint eine Lücke zu klaffen: Einerseits gibt es eine Reihe von hervorragenden Lehrbüchern zum Thema „Mathematik für Physiker“ für das Grundstudium, andererseits gibt es eine Fülle von ausgezeichneten Monographien über die mathematischen Grundlagen diverser physikalischer Theorien, meist verfasst von bekannten Fachvertretern aus der mathematischen Physik. Wir denken hier an Werke wie etwa [7, 10, 11, 14, 18, 26–28, 32, 35, 45, 59, 60, 62, 66–69, 78, 79, 85, 88] oder auch Klassiker wie [56, 90] oder [93]. Was uns aber zu fehlen scheint, ist ein Verbindungsstück zwischen diesen beiden Extremen, also ein Aufbaukurs, der es Studierenden im Hauptstudium oder graduierten Theoretikern erlaubt, mit begrenztem Aufwand einen fundierten Einstieg in die mathematischen Grundlagen der fortgeschrittenen Theorien zu gewinnen. Das zweibändige Werk, dessen zweiter Band hier vorliegt, versucht, diese Lücke zu schließen. Es beruht zum größten Teil auf Vorlesungen, die die Autoren in Mainz und Regensburg für Studierende der Physik im Hauptstudium gehalten haben. Als potentiellen Leserkreis haben wir aber nicht nur diese im Auge, sondern auch Studierende von Master-, Aufbau-, Graduierten- und Promotionsstudiengängen im Bereich der Physik, außerdem angehende mathematische Physiker, die von der Physik herkommen und möglichst zügig den Einstieg in die rigoros mathematische Behandlung der Probleme gewinnen möchten, und nicht zuletzt alle diejenigen unter den aktiven theoretischen Physikern, die das Bedürfnis verspüren, ein tieferes und klareres Verständnis ihrer mathematischen Werkzeuge zu gewinnen, dabei aber (verständlicherweise!) weder Zeit noch Muße finden, sich mit der mathematischen Fachliteratur und all ihren Beweisdetails ausführlich auseinanderzusetzen. Bei der großen und ständig wachsenden Vielfalt mathematischer Hilfsmittel, die in der modernen Physik Verwendung finden, war es natürlich nicht möglich, alle wichtigen Themen vollständig abzudecken, und, wie immer, bleibt die Stoffauswahl etwas subjektiv geprägt und ist von den Interessen und der wissenschaftlichen Ausrichtung der Autoren mitbestimmt. So wurden z. B. die statistische Physik und die nichtlineare Dynamik zugegebenermaßen stiefmütterlich behandelt. Im ersten Teil geben wir eine Einführung in die Differentialgeometrie – und damit auch in die moderne Formulierung der Tensorrechnung – als mathematische Grundlage für die klassische Mechanik, die klassische Feldtheorie und vor allem für die Relativiv
vi
Vorwort
tätstheorie. Die Präsentation ist hier insofern elementar gehalten, als dass affine Zusammenhänge nur in Gestalt ihrer kovarianten Ableitungsoperatoren auftreten und dass allgemeine Bündeltheorie und Prinzipalzusammenhänge gänzlich außen vor bleiben. Trotzdem reicht diese Einführung aus, um darauf aufbauend einen zwanglosen Einstieg in die moderne Gravitationsphysik oder die aktuellen Eichtheorien zu ermöglichen. Der zweite Teil von Band 1 befasst sich mit mathematischen Grundlagen der Quantenmechanik, die der Funktionalanalysis, der Integrationstheorie und der Distributionstheorie entstammen. Wiederum sind wir überzeugt, dass die Beschäftigung mit den vorgestellten Grundlagen einen leichten Zugang zu verschiedenen weiterführenden Themen ermöglicht, z. B. zur algebraischen Quantenfeldtheorie, zur Theorie der Pfadintegrale oder zur Verwendung von C ∗ -Algebren in der statistischen Physik. In diesem Band werden zwei der wichtigsten funktionalanalytischen Themen behandelt, nämlich die unbeschränkten Operatoren und die Spektralzerlegung von H ERMITEschen Operatoren. Den Abschluss dieses Bandes wird dann eine gründliche, doch recht elementare Diskussion von Gruppen und ihren Darstellungen im Hinblick auf ihre Rolle als mathematische Beschreibung von Symmetrien und Invarianzen in der Quantenphysik bilden. Den Schluss des ersten Bandes bildet ein Anhang, den Prof. V. Bach (Mainz) dankenswerterweise beigesteuert hat und in dem an einem konkreten Beispiel aufgezeigt wird, wie gewisse weiterführende Konzepte der allgemeinen Maß- und Integrationstheorie in der statistischen Physik Verwendung finden. Ferner behandeln wir im ersten Teil als Anwendung des dort entwickelten differentialgeometrischen Kalküls koordinatenfreie Formulierungen der klassischen Mechanik, der M AX WELL gleichungen und der E INSTEIN schen Feldgleichungen. In den Teilen II bis IV verzichten wir jedoch weitgehend auf konkrete physikalische Beispiele, abgesehen von einigen Bemerkungen über die statistische Interpretation der Quantenmechanik in Teil III und über die Entartung von Energieniveaus infolge von Symmetrien des H AMILTONoperators in Teil IV, beschränken uns aber ansonsten auf Andeutungen. Wir gehen davon aus, dass die behandelten mathematischen Themen dem Leser schon in irgendeiner Form bei seiner Beschäftigung mit Physik untergekommen sind (oder noch unterkommen werden) und betrachten es als unsere Aufgabe, die uns Mathematikern antrainierte rigorose Denkweise dazu zu nutzen, von den entsprechenden Begriffen und Resultaten ein klares, unzweideutiges Bild zu geben. Der Bezug zur Physik spiegelt sich hier vorwiegend in der Stoffauswahl wieder – so stehen z. B. bei unserer Einführung in die Funktionalanalysis die H ILBERTräume deutlich im Vordergrund, da sie in der Physik eine ungleich größere Rolle spielen als andere topologische Vektorräume, und in Teil IV werden wir uns selbstverständlich auf diejenigen konkreten Gruppen konzentrieren, die für die Betrachtung von Symmetrien und Invarianzen in der Physik relevant sind. Die gerade angesprochene streng mathematische Denkweise darf natürlich nicht dazu verleiten, alles detailliert beweisen zu wollen, wie man das bei einem Lehrbuch für angehende Mathematiker tun würde. Vielmehr haben wir uns – ähnlich wie bei unserem Grundkurs [34], in dem das hier vorliegende Buch auch schon angekündigt
Vorwort
vii
wurde – von dem Gedanken leiten lassen, dass ein mathematischer Beweis nur dann angebracht ist, wenn er gleichzeitig eine Rechentechnik demonstriert und einüben hilft, die bei den physikalischen Anwendungen wirklich vorkommt. Häufig ist die Beweistechnik, die für ein tieferliegendes mathematisches Resultat benötigt wird, jedoch von ganz anderem Charakter als die Technik seiner Anwendung, und in solchen Fällen beschränken wir uns auf eine bloße Skizze der maßgeblichen Ideen oder sogar auf ein Literaturzitat, das als Quellennachweis zu verstehen ist und nicht unbedingt als eine Aufforderung, sich mit der betreffenden Literatur aktiv auseinanderzusetzen. Auch im Übrigen verfolgen wir ähnliche didaktische Prinzipien wie sie schon in [34] zugrunde gelegt wurden, versuchen also, uns auf das Wesentliche zu konzentrieren, Langatmigkeit zu vermeiden und in wenigen wohlgesetzten Worten ein klares Bild von den Dingen zu vermitteln. Unterstützt wird dieses Bemühen durch eine große Zahl von Übungsaufgaben. Sie dienen teilweise dem Einüben von Rechentechniken, der Gewöhnung an abstrakte Begriffe, indem man diese an konkreten Beispielen diskutiert, und hier und da auch der kurzgefassten Behandlung von zusätzlichem Stoff. Zahlreiche Hinweise unterstützen die Lösung der Übungsaufgaben, so dass die erfolgreiche Behandlung einer Aufgabe nicht daran scheitern sollte, dass einem ein bestimmter raffinierter Trick gerade nicht eingefallen ist. Trotz der vielen verschiedenen mathematischen Sachgebiete (und trotz dreier verschiedener Autoren) haben wir versucht, generell einheitliche Notationen durchzuhalten, und die meisten dieser Bezeichnungen sind in einem vorbereitenden Abschnitt zusammengefasst und mit kurzen Erläuterungen versehen. Dies hat uns auch Gelegenheit gegeben, einige der benötigten Vorkenntnisse anzusprechen. Grundsätzlich sollte das Buch für alle zugänglich sein, die einen dreisemestrigen mathematischen Grundkurs für Physiker absolviert haben, wie er in Deutschland weitgehend üblich ist. Man wird uns nachsehen, dass wir bei Verweisen auf solche Vorkenntnisse unser eigenes Lehrbuch [34] zitieren, und wir sind überzeugt, dass niemandem, der seine Vorkenntnisse aus anderer Quelle bezieht, hieraus ein Nachteil erwächst. Schließlich möchten wir Professor Volker Bach unseren gebührenden Dank aussprechen, nicht nur für den von ihm beigesteuerten Artikel über unendliche Produkte von Maßen und statistische Mechanik, sondern auch für viele hilfreiche, interessante und bereichernde Gespräche. Unser Dank gilt überdies Professor Florian Scheck, der die Entstehung auch dieses Werkes mit Unterstützung und Ermutigung begleitet hat. Martin Huber hat kompetent und zuverlässig die Zeichnungen angefertigt, und das Umsetzen der Manuskripte in LaTeX-Quelltext wurde in ebenso kompetenter und zuverlässiger Weise von Renate Emerenziani und Ulrike Jacobi besorgt. Ihnen allen gilt unser aufrichtiger Dank.
Mainz, Mai 2010
Karl-Heinz Goldhorn Hans-Peter Heinz Margarita Kraus
Inhaltsverzeichnis
Teil III Unbeschränkte Operatoren und Spektralzerlegung 14 Unbeschränkte Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 A Abgeschlossene lineare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 B Beispiele: Multiplikations- und Differentialoperatoren . . . . . . . . . . . . 7 C Resolvente und Spektrum bei unbeschränkten Operatoren . . . . . . . . . 13 D Der adjungierte Operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 E Symmetrische und selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . 25 15 Spektralmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Motivierende Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Spektralmaße und Spektralintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . C Die C ∗ -Algebra der beschränkten messbaren Funktionen . . . . . . . . . . D Spektralintegrale von unbeschränkten messbaren Funktionen . . . . . . 16 Der Spektralsatz für selbstadjungierte Operatoren und die quantenmechanische Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Der stetige Funktionalkalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Der messbare Funktionalkalkül und die Spektralzerlegung für beschränkte selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . . . . . . . C Unbeschränkte selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . . . . D Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung .
37 37 42 53 59
67 68 76 89 96
Teil IV Gruppen und Darstellungen 17 Grundsätzliches über Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 A Gruppen und Homomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 B Symmetrie als Invarianz unter einer Gruppenoperation . . . . . . . . . . . . 126 18 Drehgruppe und L ORENTZgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 A Die Gruppe SO(3) der räumlichen Drehungen . . . . . . . . . . . . . . . . . . . 147 ix
x
Inhaltsverzeichnis
B C D E F
Die L ORENTZgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Parametrisierung der L ORENTZgruppe . . . . . . . . . . . . . . . . . . . . . . . . . 153 Die Gruppen SU(2) und SL(2, C) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Die Überlagerungsabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Quaternionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
19 L IE-Gruppen und L IE-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 A Exponentialfunktion und Logarithmus von Matrizen . . . . . . . . . . . . . . 175 B Lineare L IE-Gruppen und allgemeine L IE-Gruppen . . . . . . . . . . . . . . 177 C Die L IE-Algebra einer L IE-Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 D Einige spezielle L IE-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 20 Grundbegriffe der Darstellungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 A Definition und einfache Eigenschaften einer Darstellung . . . . . . . . . . 208 B Irreduzible und vollreduzible Darstellungen . . . . . . . . . . . . . . . . . . . . . 215 C Symmetrien des H AMILTONoperators . . . . . . . . . . . . . . . . . . . . . . . . . . 219 21 Darstellungstheorie kompakter Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . 229 A Das H AAR-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 B Unendlich-dimensionale Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 239 C Irreduzible Darstellungen kompakter Gruppen . . . . . . . . . . . . . . . . . . . 243 D Orthogonalitätsrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 E Vollständigkeit des Orthonormalsystems der Matrixelemente . . . . . . . 251 F Ein Vollständigkeitskriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 22 Die infinitesimale Methode in der Darstellungstheorie . . . . . . . . . . . . . 271 A Darstellungen von L IE-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 B Weitere Eigenschaften der Exponentialfunktion . . . . . . . . . . . . . . . . . . 274 C Beziehungen zwischen den Darstellungen von G und L(G) . . . . . . . . 277 D Lokale und globale Homomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . 280 23 Die irreduziblen Darstellungen von SU(2) und SO(3) . . . . . . . . . . . . . . . 293 A Realisierung der irreduziblen Darstellungen . . . . . . . . . . . . . . . . . . . . . 294 B C LEBSCH -G ORDAN-Zerlegung und Vollständigkeit . . . . . . . . . . . . . . 298 C Die irreduziblen Darstellungen der L IE-Algebren von SU(2) und SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 D Die kanonische Basis einer irreduziblen Darstellung von su(2) . . . . . 301 E Ausreduktion einer gegebenen Darstellung . . . . . . . . . . . . . . . . . . . . . . 307 24 Einige Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 A Kugelfunktionen und infinitesimale Drehungen . . . . . . . . . . . . . . . . . . 315 B Rotationssymmetrie eines Zwei-Teilchen-Systems . . . . . . . . . . . . . . . 323
Inhaltsverzeichnis
C D
xi
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem 325 Axialsymmetrische Störungen eines kugelsymmetrischen Potentials . 330
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
Teil III
Unbeschränkte Operatoren und Spektralzerlegung
Kapitel 14
Unbeschränkte Operatoren
Die Grundlagen der Funktionalanalysis, die wir in den Kap. 7, 8 und 9 besprochen haben, sind zwar unverzichtbar – eben weil sie Grundlagen darstellen – aber sie reichen für viele Situationen, die in den physikalischen Anwendungen auftreten, nicht aus. Ein Beispiel von zentraler Bedeutung sind die Observablen in der Quantenmechanik, die meist durch unbeschränkte H ERMITEsche Operatoren dargestellt werden. Unbeschränkte Operatoren treten auch bei der mathematischen Behandlung von partiellen Differentialgleichungen aus den verschiedensten Bereichen der klassischen und der modernen Physik auf, und so kommen wir nicht umhin, uns mit diesem – zunächst etwas unnatürlich anmutenden – Typ von Operatoren näher zu befassen. Nun könnte man meinen, die Unbeschränktheit eines Operators rühre nur davon her, dass man auf den betrachteten Räumen die falschen Normen gewählt hat. Sind nämlich E, F normierte lineare Räume und ist A : E → F ein linearer Operator, so kann man auf E die neue Norm x A := x + Ax (die sog. Graphennorm) einführen, und dann ist A beschränkt, denn offenbar ist Ax ≤ x A für alle x ∈ E. Ist H ein Prähilbertraum und A : H → H , so wählt man die modifizierte Graphennorm 1/2 x A := x2 + Ax2 und erhält so einen neuen Prähilbertraum, von dem aus gerechnet A ebenfalls beschränkt ist. Die neue Norm rührt ja von dem Skalarprodukt x|y A := x|y + Ax|Ay her. Tatsächlich kann man mit diesem einfachen Trick einige der Resultate über beschränkte Operatoren auf unbeschränkte übertragen, aber die wirklich wichtigen Probleme bekommt man so nicht in den Griff. Es zeigt sich, dass man für K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_14, C Springer-Verlag Berlin Heidelberg 2010
3
4
14 Unbeschränkte Operatoren
eine erfolgreiche Behandlung von unbeschränkten Operatoren diejenigen in den Vordergrund stellen sollte, die einen abgeschlossenen Graphen haben. Dies geschieht in Abschn. A, und in B illustrieren wir die eingeführten Grundbegriffe durch konkrete Beispiele von der Art, wie sie in Anwendungen auftreten. In Abschn. C verallgemeinern wir die elementare Spektraltheorie aus Kap. 9 soweit wie möglich auf unbeschränkte Operatoren, und ab Abschn. D konzentrieren wir uns auf die Situation, die für die Quantenphysik bei weitem die wichtigste ist, nämlich auf unbeschränkte Operatoren im H ILBERTraum. Hier ist entscheidend, dass man den adjungierten Operator sinnvoll definieren und von H ERMITEschen Operatoren sprechen kann. Wir diskutieren insbesondere die Unterscheidung zwischen symmetrischen und selbstadjungierten Operatoren, die zwar in der Praxis meist ignoriert, jedoch von theoretischen Physikern auch immer wieder angemahnt wird, und wir versuchen, diesen Unterschied und seine Bedeutung durch präzise Definitionen und erhellende Beispiele völlig klar zu machen. Von den – oft schwierigen und tiefschürfenden – Untersuchungen, die in der modernen mathematischen Physik in diesem Zusammenhang angestellt wurden und werden, berichten wir am Schluss einige Resultate.
A Abgeschlossene lineare Operatoren Eine Verallgemeinerung der beschränkten Operatoren sind die abgeschlossenen Operatoren. Seien E, F BANACHräume, A : E ⊃ D(A) −→ F ein linearer Operator. Dann ist der Graph von A G(A) = {(x, Ax) | x ∈ D(A)}
(14.1)
eine Teilmenge des kartesischen Produktes E × F. Dieses wird durch (x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 )
(14.2)
λ(x, y) := (λx, λy) 1/2 (x, y) := x2E + y2F
(14.3) (14.4)
für x, x1 , x2 ∈ E, y, y1 , y2 ∈ F, λ ∈ C, zu einem BANACHraum. Definitionen 14.1 Ein linearer Operator A : E ⊃ D(A) −→ F heißt ein abgeschlossener Operator, wenn eine der folgenden äquivalenten Bedingungen erfüllt ist. a. Der Graph G(A) ist ein abgeschlossener Teilraum von E × F. b. Ist (xn ) eine Folge mit xn ∈ D(A), xn −→ x ∈ E, Axn −→ y ∈ F , so gilt x ∈ D(A) und y = Ax.
A
Abgeschlossene lineare Operatoren
5
Es ist eine leichte Übung, die Äquivalenz der beiden Bedingungen zu zeigen. Beispiel: Sei E = F = C([a, b]) der Raum der stetigen Funktionen auf dem Intervall [a, b] (vgl. Beispiel 7.6a). Der Operator A := d/dx mit dem Definitionsbereich D(A) := C 1 ([a, b]) ist bekanntlich nicht beschränkt (Aufgabe 8.4a). Aber er ist abgeschlossen, denn wenn (u k ) ⊆ C 1 ([a, b]) eine Folge ist, für die u k → u und Au k = u k → v gleichmäßig auf [a, b], so ist v stetig, u differenzierbar und u = v nach wohlbekannten Resultaten aus der elementaren Analysis (etwa aus [34], Kap. 14). Also ist u ∈ C 1 ([a, b]) = D(A) und Au = v, wie verlangt. Einen Zusammenhang zwischen den abgeschlossenen und den beschränkten Operatoren liefert der folgende Satz: Theorem 14.2 (Satz vom abgeschlossenen Graphen) Seien E, F BANACHräume, A : E ⊇ D(A) −→ F ein linearer Operator. Dann gilt: a. Ist A abgeschlossen und ist D(A) abgeschlossen, so ist A beschränkt. b. Ist A beschränkt, so ist A genau dann abgeschlossen, wenn D(A) abgeschlossen ist. Beweis a. Wenn G(A) und D(A) abgeschlossen sind, dann sind beide nach Satz 7.10 BANACHräume. Die beiden linearen Operatoren P : G(A) −→ D(A)
mit
P(x, Ax) = x,
Q : G(A) −→ F
mit
Q(x, Ax) = Ax
sind offenbar stetig. Ferner ist P bijektiv. Daher ist P −1 nach dem sog. Satz von der offenen Abbildung beschränkt. (Dieser fundamentale Satz wird in jedem Lehrbuch der Funktionalanalysis bewiesen.) Folglich ist A = Q P −1 ebenfalls stetig. b. Sei jetzt A stetig. Die Menge D(A) ist genau dann abgeschlossen, wenn für jede konvergente Folge (xn ) ⊆ D(A) auch der Limes zu D(A) gehört. Sind aber xn ∈ D(A) so, dass xn −→ x, so gilt Axn −→ y ∈ F, da F vollständig ist. Daher ist die Abgeschlossenheit von D(A) äquivalent zu Bedingung b. aus 14.1. Nun versuchen wir, einen beliebigen linearen Operator A : E ⊇ D(A) −→ F zu einem abgeschlossenen Operator fortzusetzen. Zunächst definieren wir: Definitionen 14.3 a. Für zwei lineare Operatoren A, B mit D(A), D(B) ⊆ E und R(A), R(B) ⊆ F schreiben wir A⊂B:
⇐⇒ ⇐⇒
G(A) ⊆ G(B) D(A) ⊆ D(B) und Ax = Bx ∀ x ∈ D(A).
(14.5)
6
14 Unbeschränkte Operatoren
Das bedeutet also, dass A eine Einschränkung von B bzw. B eine Fortsetzung (= Erweiterung) von A ist. b. Der Operator A heißt abschließbar, wenn er eine abgeschlossene Fortsetzung B ⊃ A besitzt. Um eine abgeschlossene Erweiterung von A zu finden, betrachten wir Folgen xn ∈ D(A)
mit
xn −→ x, Axn −→ y.
Man könnte dann einen Operator A ⊃ A definieren, indem man setzt Ax := y = lim Axn . n−→∞
Der Operator A wäre dann nach Bedingung 14.1b automatisch abgeschlossen. Das Problem jedoch ist, dass es Operatoren A gibt mit D(A) xn −→ x , D(A) xn −→ x ,
aber lim Axn = y = y = lim Axn . n→∞
n→∞
Für solche Operatoren funktioniert der oben beschriebene Prozess nicht. Er funktioniert aber, sobald die nachstehend in 14.4a formulierte Zusatzbedingung erfüllt ist (man wende sie auf vn = xn − xn an!), und dann kann man die kleinste abgeschlossene Fortsetzung einführen: Satz 14.4 a. Ein linearer Operator A : E ⊇ D(A) −→ F ist genau dann abschließbar, wenn aus vn ∈ D(A), vn −→ 0 und Avn −→ w immer folgt w = 0. b. Für einen abschließbaren Operator A existiert genau ein Operator A mit G(A) = G(A), der sogenannte Abschluss. Für ihn gilt: D(A) = {x ∈ E | ∃ (xn ) ⊆ D(A) : xn −→ x, (Axn ) konvergent in F} , (14.6) Ax := y := lim Axn , n−→∞
falls xn −→ x.
(14.7)
Beweis Nur die Notwendigkeit der Bedingung aus a. ist noch zu zeigen. Sei also vn → 0 , Avn → w, und sei B ⊃ A abgeschlossen. Dann folgt w = lim Avn = lim Bvn = B0 = 0. n→∞
n→∞
Bemerkung Der Raum E ist außerhalb von D(A) für den linearen Operator A eigentlich uninteressant. Deshalb betrachtet man meist nur dicht definierte Operatoren:
B
Beispiele: Multiplikations- und Differentialoperatoren
7
Definition 14.5 Der lineare Operator A : E ⊃ D(A) −→ F heißt dicht definiert, falls D(A) = E. Z. B. ist der Operator A = d/dx aus dem auf 14.1 folgenden Beispiel dicht definiert, denn nach dem W EIERSTRASSschen Approximationssatz ([34], Kap. 29) ist sogar C ∞ ([a, b]) dicht in C([a, b]).
B Beispiele: Multiplikations- und Differentialoperatoren Wegen ihrer grundsätzlichen Bedeutung diskutieren wir zwei Typen von Beispielen etwas ausführlicher, nämlich die Multiplikationsoperatoren und die Differentialoperatoren. Wir beginnen mit den Multiplikationsoperatoren: Satz 14.6 Sei 1 ≤ p < ∞ und E = L p (X, A, μ), wo (X, A, μ) ein Maßraum ist (vgl. Abschn. 10.34). Sei f : X −→ K eine beliebige A-messbare Funktion. Der Operator M f : D(M f ) −→ E mit D(M f ) := {u ∈ E | f u ∈ E} ,
(M f u)(x) := f (x)u(x)
ist dann abgeschlossen und dicht definiert. Beweis (i) Um zu zeigen, dass M f abgeschlossen ist, betrachten wir eine Folge (u k ) ⊆ D(M f ) mit u k → u , M f u k = f u k → v in E. Nach Übergang zu einer Teilfolge können wir dann annehmen, dass u k (x) → u(x) und f (x)u k (x) → v(x) μ-f.ü. (Dies wird im Zusammenhang mit dem Satz von R IESZ -F ISCHER bewiesen – vgl. Abschn. 10.34 und die in Beispiel 7.6c angegebene Literatur.) Nun folgt v(x) = f (x)u(x) μ-f.ü., also f u = v ∈ E und damit u ∈ D(M f ) , v = M f u. (ii) Um zu zeigen, dass D(M f ) in E dicht ist, betrachten wir die messbaren Mengen Am := {x | | f (x)| ≤ m} , Dann ist X =
∞
m=1
m ∈ N.
Am . Wir betrachten
D0 := {u ∈ E | ∃m : u ≡ 0 f.ü. in X \ Am }. Für u ∈ D0 ist dann mit geeignetem m ∈ N p p | f u| dμ ≤ m |u| p dμ < ∞, X
also f u ∈ E und damit u ∈ D(M f ). Wir haben also D(M f ) ⊇ D0 und brauchen daher nur zu zeigen, dass D0 dicht ist. Jedes v ∈ E ist aber der punktweise Limes der Funktionen vχ Am ∈ D0 , also genügt es, zu zeigen, dass lim v − vχ Am p = 0.
m→∞
8
14 Unbeschränkte Operatoren
Dies folgt jedoch direkt aus dem Satz von der dominierten Konvergenz, denn |v − vχ Am | p = (1 − χ Am ) p |v| p ≤ |v| p
∀ m.
Bemerkung Meist wird der Multiplikationsoperator M f einfach mit f bezeichnet, und man überlässt es dem Leser, an Hand des Kontexts zu entscheiden, ob die Funktion f selbst gemeint ist oder der von ihr in irgendeinem gerade betrachteten Raum E definierte Multiplikationsoperator. Wird z. B. ein quantenmechanisches System von N Teilchen durch Wellenfunktionen aus L 2 (R3N ) beschrieben, so haben diese Teilchen insgesamt 3N Ortskoordinaten x1 , . . . , x3N , und der Ortsoperator xi ist dann nichts anderes als der Multiplikationsoperator M f in E = L 2 (R3N ) für die Funktion f (x1 , . . . , x3N ) := xi . Er hat den Definitionsbereich
D(xi ) = ψ ∈ L 2 (R3N ) xi2 |ψ(x)|2 d3N x < ∞ ,
(14.8)
und er ist nach obigem Satz abgeschlossen und dicht definiert. Sei nun Ω ⊆ Rn ein Gebiet. Wie in Definition 13.13 betrachten wir einen linearen Differentialoperator L(x, D) :=
aα (x)D α ,
|α|≤m
D=
∂ ∂ ,..., ∂ x1 ∂ xn
.
(14.9)
mit Koeffizienten aα ∈ C ∞ (Ω) sowie den transponierten Operator
L T (x, D)ϕ :=
(−1)|α| D α (aα ϕ)
(14.10)
|α|≤m
Sowohl für die moderne Theorie der partiellen Differentialgleichungen als auch für die Quantenmechanik ist es von zentraler Bedeutung, solche Operatoren als dicht definierte lineare Operatoren in Räumen vom Typ E = L p (Ω) , 1 ≤ p < ∞, aufzufassen, vor allem für p = 2. Die Distributionstheorie macht es uns leicht, dies zu tun, denn wegen L p (Ω) ⊆ L 1loc (Ω) kann man jedes Element u ∈ L p (Ω) mit der entsprechenden regulären Distribution [u] ∈ D (Ω) identifizieren und so L p (Ω) als linearen Teilraum von D (Ω) auffassen. Mit dieser Vereinbarung definieren wir: Definitionen 14.7 Sei 1 ≤ p < ∞, und sei L(x, D) ein Differentialoperator mit in Ω. Eine L p -Realisierung von L(x, D) ist eine Einschränkung C ∞ -Koeffizienten L = L(x, D) auf einen dichten Teilraum D(L) von L p (Ω) so, dass D(L)
u ∈ D(L)
⇒
L(x, D)u ∈ L p (Ω).
B
Beispiele: Multiplikations- und Differentialoperatoren
9
Die maximale L p -Realisierung L max ist die mit dem Definitionsbereich D(L max ) = {u ∈ L p (Ω) | L(x, D)u ∈ L p (Ω)}, und die minimale L p -Realisierung L min ist die mit dem Definitionsbereich D(L min ) = D(Ω). Offenbar ist L min ⊂ L max , und wegen Theorem 11.9 ist klar, dass L min – also erst recht L max – dicht definiert ist, wie wir es von einer Realisierung verlangen. Wir haben: Satz 14.8 Für jeden linearen Differentialoperator mit C ∞ -Koeffizienten in Ω und jedes p ∈ [1, ∞[ gilt: L max ist abgeschlossen, und L min ist abschließbar in L p (Ω). Beweis Sei (u k ) ⊆ D(L max ) eine Folge mit u k → u und L max u k = vk → v in L p (Ω). Für jede Testfunktion ϕ ∈ D(Ω) ist dann auch L T (x, D)ϕ ∈ D(Ω) und somit L(x, D)u, ϕ = u, L T (x, D)ϕ = lim u k , L T (x, D)ϕ = lim vk , ϕ = v, ϕ , k→∞
k→∞
d. h. die Distributionen v und L(x, D)u stimmen überein. Wegen v ∈ L p (Ω) bedeutet dies: u ∈ D(L max ) und L max u = v. Daher ist L max abgeschlossen, und dann muss L min abschließbar sein, denn es hat ja die abgeschlossene Erweiterung L max . Den Abschluss von L min bezeichnen wir mit L 0 , schreiben also L 0 := L min ,
(14.11)
wobei natürlich aus dem Kontext heraus klar sein muss, auf welchen Raum L p (Ω) und auf welchen Differentialoperator L = L(x, D) sich dies bezieht. Im Allgemeinen ist es schwierig, die Definitionsbereiche D(L max ) und D(L 0 ) explizit zu bestimmen. Wir tun dies daher auch nur im allereinfachsten Beispiel, nämlich für ein beschränktes Intervall Ω =]a, b[⊆ R1 und den Differentialoperator L(x, D) := d/dx. Dazu führen wir die folgenden Funktionenräume ein: Definition 14.9 Sei a < b , 1 ≤ p ≤ ∞. Mit H 1, p [a, b] bezeichnen wir den KVektorraum aller Funktionen u : [a, b] −→ K, die als gleichmäßiger Limes u = limm→∞ u m einer Folge (u m ) ⊆ C ∞ ([a, b]) geschrieben werden können, für die gilt: u m ∈ D(]a, b[) für alle m, und die Folge (u m ) konvergiert in L p (]a, b[). Damit ist klar, dass alle Funktionen u ∈ H 1, p [a, b] stetig sind, d. h. H 1, p [a, b] ist ein linearer Teilraum von C[a, b]. Bemerkung Mit der Norm u1, p := a
b
(|u(x)| p + |u (x)| p ) dx
1/ p
10
14 Unbeschränkte Operatoren
wird H 1, p [a, b] zu einem BANACHraum, und dieser ist ein einfaches Beispiel für einen sog. S OBOLEWraum. Diese und ähnliche Funktionenräume spielen für die moderne Theorie der partiellen Differentialgleichungen eine zentrale Rolle, doch können wir hierauf nicht näher eingehen. Vgl. etwa [3, 52, 65, 66, 73, 92, 95]. Satz 14.10 Sei a < b und 1 ≤ p < ∞. Für die L p -Realisierungen des Differentialoperators L(x, D) = d/dx auf Ω =]a, b[ gilt: a. D(L max ) = H 1, p [a, b] und 1, p b. D(L 0 ) = H0 [a, b] := {u ∈ H 1, p [a, b] | u(a) = u(b) = 0}.
Beweis a. Wir erinnern daran, dass C ∞ ([a, b]) der Vektorraum aller derjenigen C ∞ Funktionen u auf ]a, b[ ist, bei denen sich u selbst sowie alle seine Ableitungen stetig auf ganz [a, b] fortsetzen lassen. Insbesondere ist also C ∞ ([a, b]) ⊆ D(L max ). Ist nun u = limm→∞ u m gleichmäßig auf [a, b], wobei die Folge (u m ) ⊆ C ∞ ([a, b]) die in der Definition von H 1, p [a, b] genannten Eigenschaften hat, und ist v der L p -Limes der u m , so ist (u, v) ∈ G(L max ), denn u − u m p ≤ (b − a)1/ p u − u m ∞ −→ 0. Da L max abgeschlossen ist, folgt u ∈ D(L max ) und v = L max u ist die schwache (= distributionelle) Ableitung von u. Nun sei umgekehrt u ∈ D(L max ), und u = L max u ∈ L p (]a, b[) sei seine schwache Ableitung. Nach Theorem 11.9 ist u der L p -Limes einer Folge (ϕm ) ⊆ D(Ω), und wir definieren
x
vm (x) :=
ϕm (t) dt ,
a≤x ≤b
a
für m ∈ N. Diese Funktionen bilden im BANACHraum C([a, b]) eine C AUCHYfolge. Denn mittels der H ÖLDERschen Ungleichung erkennt man, dass für alle x ∈ [a, b] |vm (x) − vn (x)| ≤
x
|ϕm (t) − ϕn (t)| dt
a
≤ (x − a)1/q
x
1/ p |ϕm (t) − ϕn (t)| p dt
a
≤ (b − a)1/q ϕm − ϕn p mit 1/q = 1 − 1/ p. Das ergibt
B
Beispiele: Multiplikations- und Differentialoperatoren
11
vm − vn ∞ ≤ (b − a)1/q ϕ m − ϕn p
≤ (b − a)1/q ϕm − u p + u − ϕn p
→0
für m, n → ∞, also die C AUCHY-Eigenschaft. Es existiert daher der gleichmäßige Limes v := limm→∞ vm , und er ist auch der L p -Limes. Nun haben wir = ϕ , also vm m lim vm − v p = 0 ,
m→∞
lim vm − u p = 0.
m→∞
Da L max abgeschlossen ist, folgt v ∈ D(L max ) und v = u , also (v − u) = 0 im Sinne der Distributionen. Aber nach Aufgabe 11.16d folgt hieraus, dass u−v eine konstante Funktion c ist. Für die C ∞ -Funktionen u m := c + vm haben wir daher in L p , d. h. u ∈ H 1, p [a, b]. u = limm→∞ gleichmäßig und u = limm→∞ vm b. Sei u ∈ D(L 0 ). Wegen L 0 ⊂ L max , also D(L 0 ) ⊆ D(L max ) = H 1, p [a, b] genügt es, zu zeigen, dass u(a) = u(b) = 0. Nach (14.6), (14.7) gibt es eine Folge (ψm ) ⊆ D(L min ) = D(]a, b[) mit ψm −→ u ,
ϕm := ψm −→ u
in L p (]a, b[). Dann ist ψm (x) =
x
ϕm (t) dt
für a ≤ x ≤ b,
a
und damit können wir für die ψm so argumentieren wie in Teil a. für die vm , finden also, dass die Folge (ψm ) gleichmäßig gegen ein ψ ∈ C([a, b]) konvergiert. Aber die gleichmäßige Konvergenz impliziert die L p -Konvergenz, und der L p -Limes ist eindeutig bestimmt. Also ist ψ = u, und damit ist u(a) = limm→∞ ψm (a) = 0 und ebenso für u(b). 1, p Nun sei umgekehrt u ∈ H0 [a, b] vorausgesetzt, und sei (u m ) eine entsprechende Folge wie in der Definition von H 1, p [a, b], also u − u m ∞ , u − u m p −→ 0 für m → ∞. Insbesondere ist lim u m (a) = u(a) = 0 ,
m→∞
lim u m (b) = u(b) = 0.
m→∞
Wähle eine Testfunktion η ∈ D(]a, b[) mit
b
η dt = 1 und setze
a
ψm (x) := u m (x) − u m (a) − (u m (b) − u m (a)) a
x
η dt
12
14 Unbeschränkte Operatoren
für a ≤ x ≤ b , m ∈ N. Dann ist ψm = u m − (u m (b) − u m (a))η, also ψm ∈ D(]a, b[) und außerdem u − ψm ∞ , u − ψm p −→ 0 für m → ∞. Schließlich ist ψm (a) = ψm (b) = 0 nach Definition, und wenn wir δm > 0 so klein wählen, dass Tr u m ∪ Tr η ⊆]a + δm , b − δm [, so muss ψm auf den Intervallen [a, a + δm ] und [b − δm , b] konstant sein, also verschwinden. Daher ist ψm ∈ D(]a, b[) = D(L min ), und nun zeigt (14.6), dass u ∈ D(L 0 ). Für die Bedürfnisse der Quantenmechanik reicht es allerdings nicht aus, nur Differentialoperatoren mit C ∞ -Koeffizienten zu betrachten. Schon der H AMILTONoperator eines Teilchens im C OULOMB-Potential, also H ψ = −Δψ −
2 ψ, |x|
x ∈ R3
hat seine Koeffizienten nicht mehr in C ∞ (R3 ), sondern nur in C ∞ (R3 \{0}), und etwa bei Systemen von N Teilchen hat man sogar höherdimensionale Untermannigfaltigkeiten von R3N als Träger von Singularitäten der Koeffizienten des H A MILTON operators. Die Definition einer maximalen L 2 -Realisierung stößt dann auf Schwierigkeiten, doch eine minimale abgeschlossene L 2 -Realisierung L 0 kann immer noch gebildet werden, und, wie sich noch zeigen wird, ist dies für die Quantenmechanik i. A. auch die günstige Wahl. Zur näheren Erläuterung kehren wir wieder zu unserem allgemeineren Rahmen zurück und betrachten L p -Realisierungen des durch (14.9) gegebenen Differentialoperators, jetzt aber unter den Voraussetzungen aα ∈ C |α| (Ω) für |α| > 0 ,
a0 ∈ L 1loc (Ω).
(14.12)
Unter diesen Voraussetzungen ist der transponierte Operator durch (14.10) wohldefiniert als ein Operator L T (x, D) : D(Ω) −→ L 1loc (Ω) ⊆ D (Ω), und man bestätigt mittels Produktintegration die erwartete Beziehung Ω
L(x, D)ϕ (x)ψ(x) dx =
ϕ(x) L (x, D)ψ (x) dx T
Ω
∀ ϕ, ψ ∈ D(Ω). (14.13)
C
Resolvente und Spektrum bei unbeschränkten Operatoren
13
Damit kann man nun leicht folgendes beweisen: Satz 14.11 Sei 1 ≤ p < ∞. Wenn L(x, D) die Voraussetzungen (14.12) erfüllt, so ist die minimale L p -Realisierung L min mit dem Definitionsbereich D(L min ) = D(Ω) abschließbar. Es existiert also L 0 := L min als abgeschlossener Operator in L p (Ω). Beweis Wir prüfen die Abschließbarkeit mittels Satz 14.4a. Sei also (vk ) eine L p Nullfolge mit wk := L(x, D)vk −→ w in L p (Ω). Für jedes feste ψ ∈ D(Ω) haben wir dann nach der H ÖLDERschen Ungleichung einerseits wψ dx − ≤ w ψ dx |w − wk | · |ψ| dx ≤ C0 w − wk p −→ 0 k Ω
Ω
Ω
und andererseits wk ψ dx = vk L T (x, D)ψ dx ≤ C1 vk p −→ 0 Ω
Ω
mit Konstanten C0 , C1 , die nur von ψ abhängen. Also ist w, ψ = 0 für alle ψ ∈ D(Ω) und damit nach Theorem 11.17 w ≡ 0 f.ü., wie gewünscht.
C Resolvente und Spektrum bei unbeschränkten Operatoren Die Definitionen und Sätze aus Abschn. 9A können mit geringfügigen Änderungen auf unbeschränkte Operatoren übertragen werden. Um unnötigen technischen Schwierigkeiten aus dem Weg zu gehen, beschränken wir uns dabei auf abgeschlossene Operatoren A : E ⊇ D(A) −→ E in einem komplexen BANACHraum E. Für solch einen Operator übernehmen wir alle Definitionen und Bezeichnungen aus 9.1 wörtlich, wobei natürlich D(A − λI ) = D(A) zu setzen ist (λ ∈ C). Wieder sind in der dort gegebenen Liste alle Fälle abgedeckt, denn wenn A abgeschlossen ist, so ist es auch B := A − λI , und im Fall der Injektivität folgt hieraus, dass R A (λ) = B −1 abgeschlossen ist, denn G(B −1 ) = {(y, x) | (x, y) ∈ G(B)}. Auf B −1 kann man also Theorem 14.2 anwenden, und dies zeigt: λ ∈ ρ(A)
⇐⇒ ⇐⇒
N (A − λI ) = {0}, R(A − λI ) dicht, (A − λI )−1 beschränkt N (A − λI ) = {0} , R(A − λI ) = E. (14.14)
14
14 Unbeschränkte Operatoren
Den Ausgangspunkt für die weitere Diskussion bildet nun die folgende triviale Verallgemeinerung von Satz 9.4: Satz 14.12 Sei S ∈ B(E), sei L : E ⊇ D(L) −→ E linear und bijektiv mit beschränkter Inverse L −1 ∈ B(E), und es gelte S L −1 < 1
und
L −1 S < 1.
(14.15)
Dann ist L + S ein bijektiver linearer Operator D(L) −→ E, und es gilt (L + S)−1 =
∞
(−1)n L −1 (S L −1 )n
n=0
=
∞
(−1)n (L −1 S)n L −1 .
(14.16)
n=0
Nun kann man leicht die folgenden Aussagen beweisen, indem man die Beweise der entsprechenden Aussagen aus 9A imitiert: Theorem 14.13 Für jeden abgeschlossenen Operator A in E gilt: a. Die Resolventenmenge ρ(A) ist offen. Mit λ0 ∈ ρ(A) gehört die Kreisscheibe der λ ∈ C mit |λ − λ0 | <
1 R A (λ0 )
(14.17)
zu ρ(A), und in dieser Kreisscheibe gilt R A (λ) =
∞ (λ − λ0 )n R A (λ0 )n+1 .
(14.18)
n=0
b. Für λ, μ ∈ ρ(A) gilt die erste Resolventengleichung R A (λ) − R A (μ) = (λ − μ)R A (λ)R A (μ) = (λ − μ)R A (μ)R A (λ). c. Das Spektrum σ (A) ist abgeschlossen in C. Das Spektrum muss aber weder kompakt noch nichtleer sein. Wie wir sehen werden, kommt für σ (A) sogar jede abgeschlossene Teilmenge der Ebene C in Frage, also auch die leere Menge und C selbst (vgl. Aufgabe. 14.2 und Beispiel 14.15c). Um die Diskussion von Beispielen zu erleichtern, notieren wir noch die folgenden Tatsachen, deren Beweise leichte Übungen sind:
C
Resolvente und Spektrum bei unbeschränkten Operatoren
15
Satz 14.14 Seien E und E˜ BANACHräume und U : E → E˜ ein Isomorphismus (also eine lineare Bijektion, für die U und U −1 beschränkt sind). Sei A ein linearer ˜ = U (D(A)). Operator in E und A˜ := U AU −1 mit dem Definitionsbereich D( A) Dann gilt: a. Der Operator A˜ ist abgeschlossen (bzw. dicht definiert bzw. abschließbar) genau dann, wenn A abgeschlossen (bzw. dicht definiert bzw. abschließbar) ist. ˜ = σ (A), ebenso für σ P , σC und σ R . b. σ ( A) Beispiele 14.15 a. Sei ∅ = Ω ⊆ Rn eine offene Teilmenge, μ ein R ADONmaß auf Ω, das Bedingung (T) aus Abschn. 10F erfüllt (z. B. das L EBESGUE-Maß), und sei 1 ≤ p < ∞. Für eine stetige Funktion f : Ω → C betrachten wir den Multiplikationsoperator M f in E = L p (Ω, dμ), der nach Satz 14.6 abgeschlossen und dicht definiert ist. Dieses Beispiel kann ähnlich wie Beispiel 9.2b diskutiert werden, und man erhält: Behauptung σ (M f ) = f (Ω). 1 auf Ω stetig und Beweis Ist λ ∈ f (Ω), so ist die Funktion g(x) := f (x)−λ beschränkt, erzeugt also einen beschränkten Multiplikationsoperator Mg . Man bestätigt durch eine leichte Rechnung, dass Mg = (M f − λI )−1 . Also ist λ ∈ σ (M f ). Ist umgekehrt λ ∈ ρ(M f ), so haben wir
u p = R M f (λ)(M f − λI )u p ≤ R M f (λ) · ( f − λ)u p für alle u ∈ E, also ( f −λ)u p ≥ cu p mit der Konstanten c := R M f (λ)−1 . Wäre nun λ ∈ f (Ω), so gäbe es x0 ∈ Ω mit | f (x0 ) − λ| < c/4, und wegen der Stetigkeit von f gibt es dann δ > 0 so, dass | f (x) − λ| < c/2 für x ∈ Uδ (x0 ) ⊆ Ω. Wegen Bedingung (T) ist m := μ(Uδ (x0 )) > 0, und weil es sich um ein R ADONmaß handelt, ist m ≤ μ(Bδ (x0 )) < ∞. Daher ist u := χUδ (x0 ) ∈ L p (Ω, dμ) und u p = m 1/ p > 0, also p
p
c p u p ≤ ( f − λ)u p =
Uδ (x0 )
| f (x) − λ| p dμ ≤
mit der absurden Konsequenz c ≤ c/2. Also ist λ ∈ f (Ω).
c p 2
p
u p
Auch die Beschreibungen von σC (M f ) und σ P (M f ) aus Beispiel 9.2b kann man leicht auf die gegenwärtige Situation verallgemeinern (Übung!)
16
14 Unbeschränkte Operatoren
b. Die L 2 -Realisierungen von Differentialoperatoren mit konstanten Koeffizienauf Multiplikationsoperatoten lassen sich mittels der F OURIERtransformation ren zurückführen. Sei also L(ξ ) = cα ξ α ein Polynom in den Variablen |α|≤m cα D α der entsprechende Differentialξ = (ξ1 , . . . , ξn ), und sei L(D) = |α|≤m
operator. Mit Theorem 11.33c errechnet man sofort, dass für jede temperierte Distribution T ∈ Sn gilt F[L(D)T ] = L(iξ )F[T ] .
(14.19)
(vgl. auch den Beweis von Satz 13.17). Fasst man nun Elemente von L 2 (Rn ) als temperierte Distributionen auf, so ergibt die F OURIERtransformation F : Sn → Sn , wie wir hinter Theorem 11.33 erläutert haben, gerade den F OURIER P LANCHEREL-Operator U : L 2 (Rn ) → L 2 (Rn ), ebenso für F −1 und U −1 . Für u ∈ L 2 (Rn ) schreiben wir uˆ = U u = F[u] und haben dann L(D)u ∈ L 2
⇐⇒
F[L(D)u] ∈ L 2
⇐⇒
L(iξ )uˆ ∈ L 2
sowie L(iξ )u(ξ ˆ ) = [U L(D)u](ξ ), und das bedeutet U L(D)max U −1 = M f
mit f (ξ ) := L(iξ ).
(14.20)
Das Spektrum der maximalen L 2 -Realisierung von L(D) kann daher mittels Satz 14.14 sofort aus dem vorigen Beispiel abgeleitet werden, und man erhält σ (L max ) = f (Rn )
mit f (ξ ) := L(iξ ) .
(14.21)
Bemerkung Die wichtigsten Spezialfälle sind der L APLACE-Operator L = −Δ, der in der Quantenmechanik die kinetische Energie vertritt, und die Komponenten pi := −i∂/∂ xi des Impulsoperators. Man bekommt: σ (−Δ) = [0, ∞[ ,
σ ( pi ) = R.
(14.22)
Systeme von linearen partiellen Differentialgleichungen mit konstanten Koeffizienten können durch vektorwertige Polynome wiedergegeben werden, und hierfür kann man ähnliche Überlegungen anstellen. In der Physik ist dies vor allem für die D IRACgleichung wichtig (vgl. [87]). c. Wir demonstrieren nun noch an einem einfachen Beispiel, dass das Spektrum stark vom Definitionsbereich abhängt. Dazu betrachten wir den „Impulsoperator“ Lu := −iu auf dem kompakten Intervall I = [a, b] im Raum E = C(I ).
D
Der adjungierte Operator
17
Wählen wir den maximalen Definitionsbereich D(L max ) = C 1 (I ), so haben wir für jedes λ ∈ C den Eigenvektor u(x) = eiλx , also ist σ (L max ) = σ P (L max ) = C. Aber auch auf den Definitionsbereichen D(L 1 ) = {u ∈ C 1 (I ) | u(a) = 0} , D(L 0 ) = {u ∈ C 1 (I ) | u(a) = u(b) = 0} entstehen abgeschlossene Operatoren, wie man sich leicht überzeugt. Für jedes f ∈ C(I ) , λ ∈ C hat die Anfangswertaufgabe −iu − λu = f ,
u(a) = 0
aber die eindeutige Lösung (Variation der Konstanten!) u(x) = i
x
eiλ(x−s) f (s) ds .
a
Die Zuordnung f −→ u ist offenbar ein beschränkter linearer Operator S : E → E, und wir haben S(L − λI ) f = (L − λI )S f = f für alle f ∈ E. d. h. S ist die Resolvente S = R L 1 (λ), und so zeigt es sich, dass σ (L 1 ) leer ist. Schließlich gehört u = S f genau dann zu D(L 0 ), wenn u(b) = 0, also wenn
b
eiλ(x−s) f (s) ds = 0,
a
und diese Bedingung definiert für jedes λ ∈ C einen echten linearen Teilraum von E. Also ist L 0 − λI niemals surjektiv, somit σ (L 0 ) = σ R (L 0 ) = C. Bemerkung Mit etwas mehr analytischem Aufwand kann man dieselben Überlegungen auch für die Räume L p (I ) , 1 ≤ p < ∞ und insbesondere für den H ILBERTraum L 2 (I ) anstellen, wobei statt C 1 (I ) der S OBOLEW-Raum H 1, p (I ) aus Satz 14.10 zu nehmen ist. Das liegt daran, dass gewöhnliche lineare Differentialgleichungen im Bereich der Distributionen nur die klassischen Lösungen haben (Aufgabe 11.17).
D Der adjungierte Operator Im Folgenden sei H immer ein komplexer H ILBERTraum. Ist dann T ∈ B(H ) ein beschränkter Operator, so existiert nach Theorem 8.19 ein eindeutiger adjungierter Operator T ∗ ∈ B(H ) mit x | T y = T ∗ x | y
für alle x, y ∈ H ,
(14.23)
wobei gilt: T ∗ = T .
(14.24)
18
14 Unbeschränkte Operatoren
Wesentlich haben wir dabei den verallgemeinerten R IESZschen Darstellungssatz 8.18 benutzt, den wir auf die beschränkte Sesquilinearform h(x, y) := T y | x
(14.25)
angewandt haben. Ist nun A : D(A) −→ H
mit D(A) ⊆ H
kein beschränkter Operator, so ist Ay | x keine beschränkte Sesquilinearform, so dass man etwas sorgfältiger vorgehen muss, um einen adjungierten Operator A∗ zu definieren. Satz und Definition 14.16 Sei A : H ⊇ D(A) −→ H
mit D(A) = H
(14.26)
ein dicht definierter linearer Operator. Sei D ∗ die Menge der y ∈ H , zu denen es z ∈ H gibt mit y | Ax = z | x
für alle x ∈ D(A).
(14.27)
Dann gilt: a. D ∗ ist ein linearer Teilraum von H und zu jedem y ∈ D ∗ gibt es genau ein z ∈ H , für das (14.27) gilt. b. Setzt man z := A∗ y
für y ∈ D ∗
(14.28)
so ist A∗ ein linearer Operator in H mit D(A∗ ) = D ∗ , der sogenannte adjungierte Operator zu A. c. Es gilt y | Ax = A∗ y | x
(14.29)
für alle x ∈ D(A), y ∈ D(A∗ ). Beweis a. Wir zeigen zunächst die Eindeutigkeit von z in (14.27). Angenommen es gibt z 1 , z 2 ∈ H mit z 1 | x = y | Ax = z 2 | x
D
Der adjungierte Operator
19
für ein y ∈ D ∗ und alle x ∈ D(A). Dann folgt z 1 − z 2 | x = 0
∀ x ∈ D(A),
d. h. z 1 − z 2 ∈ D(A)⊥ . Nach Satz 7.14a ist aber D(A)⊥ = {0}. Um zu zeigen, dass D ∗ ein linearer Teilraum ist, seien y1 , y2 ∈ D ∗ , α, β ∈ C gewählt. Dann gibt es eindeutige z 1 , z 2 ∈ H , so dass yi | Ax = z i | x
für alle x ∈ D(A)
und i = 1, 2. Damit folgt αy1 + βy2 | Ax = αy1 | Ax + βy2 | Ax = αz 1 | x + βz 2 | x = αz 1 + βz 2 | x für alle x ∈ D(A), d. h. zu y := αy1 + βy2 gehört das z = αz 1 + βz 2 , das (14.27) erfüllt. Daher ist αy1 + βy2 ∈ D ∗ . b. Wegen der Eindeutigkeit von z in (14.27) ist A∗ y := z als Abbildung wohldefiniert und, wie in a. gerade gezeigt, gilt αy1 + βy2 −→ αz 1 + βz 2 = α A∗ y1 + β A∗ y2 , was die Linearität von A∗ zeigt. c. (14.29) ist die Kombination von (14.27) und (14.28). Wir stellen nun einige einfache Eigenschaften des adjungierten Operators zusammen: Satz 14.17 Seien A, B dicht definierte Operatoren in H . a. b. c. d.
Ist A ⊂ B, so ist B ∗ ⊂ A∗ . Ist D(A∗ ) = H , so gilt A ⊂ A∗∗ . N (A∗ ) = R(A)⊥ . Ist A injektiv und R(A) = H , so ist A∗ injektiv mit (A∗ )−1 = (A−1 )∗ .
e. Ist D(AB) = {x ∈ D(B) | Bx ∈ D(A)} dicht in H , so gilt: B ∗ A∗ ⊂ (AB)∗ .
20
14 Unbeschränkte Operatoren
˜ = U (D(A)), so ist A˜ ∗ = f. Ist U ∈ B(H ) unitär und A˜ := U AU −1 mit D( A) ∗ −1 UA U . g. Ist B ∈ B(H ), so ist (A+ B)∗ = A∗ + B ∗ . Dabei ist D(A+ B) = D(A) , D(A∗ + B ∗ ) = D(A∗ ). Beweis a. Gelte A ⊂ B, d. h. (14.5). Nach (14.29) gilt dann für y ∈ D(B ∗ ) , x ∈ D(A) ⊆ D(B) B ∗ y | x = y | Bx = y | Ax , d. h. jedes y ∈ D(B ∗ ) gehört zu D(A∗ ), und es gilt A∗ y = B ∗ y
für y ∈ D(B ∗ ).
b. Ist A∗ dicht definiert, so existiert A∗∗ und D(A∗∗ ) besteht aus allen y ∈ H , zu denen ein z ∈ H existiert mit z | x = y | A∗ x
(14.30)
für alle x ∈ D(A∗ ). Für jedes y ∈ D(A) trifft dies nach (14.29) aber zu, und zwar mit z = Ay. D. h. jedes y ∈ D(A) gehört zu D(A∗∗ ) und Ay = A∗∗ y
für y ∈ D(A).
c. y ∈ R(A)⊥ bedeutet, dass z = 0 die Bedingung (14.27) erfüllt. d. Ist A injektiv und R(A) dicht in H , so existiert A−1 und ist dicht definiert. Daher existiert (A−1 )∗ . Ferner ist N (A∗ ) = R(A)⊥ = {0}, also existiert auch (A∗ )−1 . Die Übereinstimmung der beiden Operatoren prüft man am bequemsten mittels Graphen nach: Nach Definition ist G((A−1 )∗ ) = {(y, z) | y | A−1 v = z | v ∀ v ∈ R(A)} und G((A∗ )−1 ) = {(y, z) | z | Ax = y | x ∀ x ∈ D(A)}. Da A eine Bijektion von D(A) auf R(A) ist, stimmen diese beiden Mengen überein. e. Sei nun D(AB) dicht in H , so dass (AB)∗ existiert. Für x ∈ D(AB) und y ∈ D(B ∗ A∗ ) folgt dann B ∗ A∗ y | x = y | ABx ,
D
Der adjungierte Operator
21
d. h. also y ∈ D((AB)∗ ) und (AB)∗ y = B ∗ A∗ y. f. Nach e. ist A˜ ∗ = (U AU −1 )∗ ⊃ U A∗ U −1 (man beachte U −1 = U ∗ ). Aber A = ˜ −1 mit dem unitären Operator V := U −1 , also ist auch A∗ ⊃ V A˜ ∗ V −1 ⊃ V AV V U A∗ U −1 V −1 = A∗ , und damit herrscht Gleichheit. g. Ist y ∈ D(A∗ + B ∗ ) = D(A∗ ), so ist für jedes x ∈ D(A + B) = D(A) y | (A + B)x = y | Ax + y | Bx = A∗ y + B ∗ y | x , also y ∈ D((A + B)∗ ) und (A + B)∗ y = A∗ y + B ∗ y. Dies zeigt, dass A∗ + B ∗ ⊂ (A + B)∗ . Anwendung dieses Arguments auf A1 := A + B und B1 := −B zeigt dann aber, dass D((A + B)∗ ) = D(A∗1 ) = D(A∗1 + B1∗ ) ⊆ D((A1 + B1 )∗ ) = D(A∗ ) = D(A∗ + B ∗ ) und damit die Behauptung. Entscheidend für die H ILBERTraumtheorie der unbeschränkten Operatoren sind die im folgenden Satz angegebenen Zusammenhänge zwischen dem adjungierten Operator und dem Abschluss eines dicht definierten Operators. Vor allem Teil c. des Satzes verdient Beachtung: Satz 14.18 Sei A in H dicht definiert. Dann gilt: a. A∗ ist ein abgeschlossener Operator. b. Ist A abschließbar, so ist (A)∗ = A∗ .
(14.31)
c. D(A∗ ) ist genau dann dicht in H , wenn A abschließbar ist. In diesem Fall ist A = A∗∗ .
(14.32)
Beweis a. Seien yn ∈ D(A∗ ) und gelte yn −→ y, A∗ yn −→ z. Für alle x ∈ D(A) ist yn | Ax = A∗ yn | x . Grenzübergang n −→ ∞ liefert dann
22
14 Unbeschränkte Operatoren
y | Ax = z | x
für alle x ∈ D(A),
d. h. y ∈ D(A∗ ) und A∗ y = z. Also ist A∗ abgeschlossen nach Definition 14.1. b. Aus A ⊂ A¯ folgt A¯ ∗ ⊂ A∗ (Satz 14.17a). Betrachte also y ∈ D(A∗ ) und x ∈ ¯ = limn→∞ Axn . Dann ¯ etwa x = limn→∞ xn mit (xn ) ⊆ D(A) und Ax D( A), ist ¯ A∗ y | x = lim A∗ y | xn = lim y | Axn = y | Ax n→∞
n→∞
und damit y ∈ D( A¯ ∗ ) sowie A¯ ∗ y = A∗ y. c. Sei zunächst D(A∗ ) dicht in H . Dann existiert A∗∗ und A ⊂ A∗∗ nach Satz 14.17b. Ferner ist A∗∗ abgeschlossen nach Teil a. Somit besitzt A die abgeschlossene Erweiterung A∗∗ . Nun sei A als abschließbar vorausgesetzt und T := A. Betrachte die Menge C := {(x, y) ∈ H × H | x | T ∗ v = y | v ∀ v ∈ D(T ∗ )}. Aus der Definition von T ∗ folgt sofort, dass G(T ) ⊆ C. Wir versehen den Vektorraum H × H mit dem Skalarprodukt (x, y) | (u, v) := x | u + y | v ,
(14.33)
wodurch er ebenfalls ein H ILBERTraum wird. Außerdem ist C bezüglich der entsprechenden Norm abgeschlossen in H × H , also selbst ein H ILBERTraum. Da G(T ) abgeschlossen ist, gilt nach Theorem 7.13b. C = G(T ) ⊕ (G(T )⊥ ∩ C) . Betrachte nun ein (ξ, η) ∈ G(T )⊥ ∩ C. Für alle x ∈ D(T ) ist dann nach (14.33): 0 = ξ | x + η | T x , also η | T x = −ξ | x . Das aber bedeutet, dass η ∈ D(T ∗ ) , T ∗ η = −ξ . In der Definition von C können wir daher v = η wählen. Da (ξ, η) ∈ C ist, folgt −ξ | ξ = η | η , also ξ 2 = η2 = 0. Wir haben somit G(T )⊥ ∩ C = {(0, 0)}, also C = G(T ). Nun betrachte w ∈ D(T ∗ )⊥ . Dann ist w | v = 0 = 0 | T ∗ v , also (0, w) ∈ C = G(T ) und damit w = T 0 = 0. Somit ist D(T ∗ )⊥ = {0}, also D(T ∗ ) = H . Insbesondere existiert T ∗∗ , und es ist C = G(T ∗∗ ) nach Definition von C. Nun folgt T = T ∗∗ , also nach Teil b. auch A = T = A∗∗ .
D
Der adjungierte Operator
23
Beispiele 14.19 a. Wir betrachten einen beliebigen Maßraum (X, A, μ), eine messbare Funktion f : X → C und die Multiplikationsoperatoren M f , M f¯ mit f bzw. f im H ILBERTraum H = L 2 (X, A, μ) (vgl. Satz 14.6). Wegen | f | = | f | ist
2 2 D := D(M f ) = u ∈ H | f | |u| dμ < ∞ = D(M f¯ ), und für u, v ∈ D ergibt sich f¯uv dμ = M f¯ u | v , u | M f v = u¯ f v dμ = d. h. M ∗f ⊃ M f¯ . Es gilt aber sogar: Behauptung M ∗f = M f¯ . Beweis Nur noch M ∗f ⊂ M f¯ ist zu zeigen. Sei also u ∈ D(M ∗f ) und w := M ∗f u , w1 := f¯u. Dann ist w ∈ H , aber von w1 weiß man zunächst nur, dass es eine messbare Funktion ist. Setze Am := {x | | f (x)| ≤ m} für m ∈ N wie im Beweis von Satz 14.6. Wegen |χ Am f | ≤ m ist dann χ Am u ∈ D und χ Am w1 = χ Am f¯u ∈ H für alle m. Daher kann man für jedes v ∈ D folgendermaßen rechnen: u¯ f v dμ = u | M f (χ Am v) = M ∗f u | χ Am v χ Am w1 | v = Am = wv ¯ dμ = χ Am w | v , Am
also χ Am w1 − χ Am w | v = 0 für alle v ∈ D. Da D dicht ist, folgt hieraus, von H = L 2 (X, A, μ), d. h. w1 = w μ-f.ü. χ Am w1 = χ Am w als Elemente ∞ auf Am . Wegen X = m=1 Am folgt nun w1 = w ∈ H , und das bedeutet u ∈ D , M ∗f u = f¯u = M f¯ u. b. Sei L(x, D) der durch (14.9) gegebene Differentialoperator in der offenen Menge Ω ⊆ Rn . Für ϕ, ψ ∈ D(Ω) ist dann ϕ | L(x, D)ψ = L + (x, D)ϕ | ψ
(14.34)
mit dem formal adjungierten Differentialoperator L + (x, D)ϕ :=
|α|≤m
(−1)|α| D α (aα ϕ).
(14.35)
24
14 Unbeschränkte Operatoren
Sind die Koeffizienten reell, so stimmt er natürlich mit dem transponierten Operator (14.10) überein. Außerdem gilt stets L ++ = L ,
(14.36)
wie man direkt nachrechnet (z. B. wie in Aufgabe 13.10). Wir betrachten nun die L 2 -Realisierungen dieser beiden Differentialoperatoren und versuchen, die dazu adjungierten Operatoren zu berechnen. Wir beginnen mit der minimalen Realisierung L min von L(x, D). Die Bedingung (u, v) ∈ G((L min )∗ ) bedeutet, dass u, v ∈ H := L 2 (Ω) sind und v | ψ = u | L(x, D)ψ Wegen w | ψ = umformulieren in
Ω
∀ ψ ∈ D(L min ) = D(Ω).
wψ ¯ dx = w, ¯ ψ für w ∈ H , ψ ∈ D(Ω) kann man dies
¯ ψ = L + (x, D)u, ψ v, ¯ ψ = u, ¯ L(x, D)ψ = L T (x, D)u, für alle ψ. D. h. (u, v) ∈ G((L min )∗ ) bedeutet, dass u ∈ H und dass die Distribution L + (x, D)u = v ∈ H ist. Nach Definition der maximalen Realisierung bedeutet dies aber, dass (u, v) ∈ G((L + )max ), und wir bekommen (L min )∗ = (L + )max .
(14.37)
(L 0 )∗ = (L + )max ,
(14.38)
Mit (14.31) folgt daraus auch
∗ ∗∗ = L . Wendet man dies auf L + und mit (14.32) folgt weiter (L + 0 max ) = (L 0 ) statt L an und beachtet (14.36), so ergibt sich
(L max )∗ = (L + )0 .
(14.39)
Beim Adjungieren wird also zwischen der maximalen und der minimalen abgeschlossenen Realisierung gewechselt, und diese sind i. A. durchaus verschieden, wie wir schon in Satz 14.10 an einem Beispiel gesehen haben. c. Hat der Differentialoperator L = L(D) konstante Koeffizienten, so können wir seine maximale Realisierung in L 2 (Rn ) wie in Beispiel 14.15b mit einem Multiplikationsoperator in Verbindung bringen und so die Adjungierte berechnen. Nach (14.20), Satz 14.17f und der Behauptung aus a. ist nämlich (L max )∗ = (U −1 M f U )∗ = U −1 M f¯U mit f (ξ ) = L(iξ ). Offenbar ist aber
E
Symmetrische und selbstadjungierte Operatoren
L(iξ ) =
25
cα (−iξ )α = L + (iξ ),
|α|≤m
also U −1 M f¯U = (L + )max und schließlich (L max )∗ = (L + )max .
(14.40)
Vergleich mit (14.39) liefert (L + )max = (L + )0 , und da man diese Überlegung auch auf L + statt L anwenden kann, ergibt sich die Folgerung. Für die Realisierungen eines Differentialoperators mit konstanten Koeffizienten im H ILBERTraum L 2 (Rn ) gilt: L max = L 0 . Bemerkung Diese Folgerung unterstützt die Vorstellung, dass der Unterschied zwischen L 0 und L max nur vom Verhalten am Rand von Ω herrührt. Da Rn selbst keinen Rand hat, entsteht eben kein Unterschied. Dies ist jedoch nicht ganz korrekt, denn bei variablen Koeffizienten können sich auch in L 2 (Rn ) die verschiedenen Realisierungen durchaus unterscheiden, wenn die Koeffizienten im Unendlichen stark anwachsen oder schwanken. In solchen Fällen macht das Unendliche sich sozusagen als virtueller Rand bemerkbar.
E Symmetrische und selbstadjungierte Operatoren Für einen beschränkten Operator T : H −→ H bedeuten die Bezeichnungen symmetrisch und selbstadjungiert ein und dasselbe. Bei unbeschränkten Operatoren muss man diese Begriffe jedoch unterscheiden. Definitionen 14.20 Sei A ein dicht definierter Operator in H . a. A heißt symmetrisch oder H ERMITEsch, wenn A ⊂ A∗ , d. h. D(A) ⊆ ∗ ∗ D(A ) , A = A. D(A)
b. A heißt selbstadjungiert, wenn A = A∗ ,
d. h. D(A) = D(A∗ ), Ax = A∗ x, x ∈ D(A) .
(14.41)
c. Der Operator A heißt wesentlich selbstadjungiert,1 wenn er symmetrisch – und ∗ damit auch abschließbar! – ist mit A = A. Offenbar ist jeder selbstadjungierte Operator symmetrisch, aber nicht umgekehrt. Es folgt auch sofort aus den Definitionen, dass Symmetrie von A äquivalent ist zu der folgenden expliziten Bedingung: 1 Eigentlich sollte es „im wesentlichen selbstadjungiert“ heißen, aber die missbräuchliche Bezeichnung „wesentlich selbstadjungiert“ hat sich eingebürgert.
26
14 Unbeschränkte Operatoren
Ax | y = x | Ay
∀ x, y ∈ D(A).
(14.42)
Beispiele 14.21 Wir greifen die Beispiele aus 14.19 wieder auf. a. Der Multiplikationsoperator M f ist selbstadjungiert in L 2 (X, A, μ), wenn die messbare Funktion f reellwertig ist, denn dann ist f¯ = f . Insbesondere sind die Ortsoperatoren der Quantenmechanik selbstadjungiert. (Dies bezieht sich natürlich auf die in (14.8) angegebenen Definitionsbereiche.) b. Ein Differentialoperator L = L(x, D) im Gebiet Ω ⊆ Rn heißt formal selbstadjungiert, wenn L + = L ist. Für seine L 2 -Realisierungen ergeben (14.37), (14.38) und (14.39) dann L ∗min = L ∗0 = L max ,
L ∗max = L 0 .
(14.43)
Die Operatoren L min und L 0 sind also symmetrisch, aber L max ist es i. A. nicht. Genauer gesagt, ist L max genau dann symmetrisch, wenn L max = L 0 ist, und dann ist dieser Operator auch selbstadjungiert. c. Nun sei speziell Ω = Rn und L = L(D) ein formal selbstadjungierter Differentialoperator mit konstanten Koeffizienten. Wie wir in Beispiel 14.19c. gesehen haben, ist dann L max = L 0 , und dieser Operator ist also selbstadjungiert. Die minimale Realisierung L min ist damit wesentlich selbstadjungiert. Für die Physik ist entscheidend, dass dies insbesondere auf die Impulsoperatoren −i∂/∂ x j und auf den Operator der kinetischen Energie T = − 12 Δ in L 2 (R3N ) zutrifft. Bei den Operatoren aus der Quantenmechanik, die der Physiker als H ERMITEsch anspricht, ist es meist so, dass die minimale Realisierung trivialerweise symmetrisch ist, wobei der eigentlich für die Physik benötigte Operator eine selbstadjungierte Erweiterung darstellt. Daher ist eine gewisse theoretische Einsicht in die Zusammenhänge zwischen symmetrischen und selbstadjungierten Operatoren wichtig. Insbesondere muss man der Frage nach selbstadjungierten Erweiterungen eines gegebenen symmetrischen Operators nachgehen. Dieser Thematik ist der Rest des Abschnitts gewidmet. Wir beginnen mit einem einfachen Fall: Satz 14.22 Sei A symmetrisch, und für ein gewisses μ ∈ R sei A − μI surjektiv. Dann ist A selbstadjungiert und μ ∈ ρ(A), insbesondere (A − μI )−1 beschränkt. Beweis Wegen (A−μI )∗ = A∗ −μI genügt es, den Fall μ = 0 zu betrachten. Dann ist N (A∗ ) = R(A)⊥ = {0}, wegen der Symmetrie also erst recht N (A) = {0}. Also sind A und A∗ Bijektionen von D(A) bzw. D(A∗ ) auf R(A) = H = R(A∗ ). Damit ist A−1 = (A−1 )∗ = (A∗ )−1 (Satz 14.17d) und folglich A = A∗ . Ferner ist A−1 = (A−1 )∗ ein abgeschlossener Operator, also nach dem Satz vom abgeschlossenen Graphen (Theorem 14.2a) auch beschränkt. Die Forderung R(A − μI ) = H ist aber eine starke Lösbarkeitsaussage und daher meist schwer nachzuprüfen. Man kommt weiter, wenn man μ rein-imaginär wählt:
E
Symmetrische und selbstadjungierte Operatoren
27
Satz 14.23 Für jeden symmetrischen Operator A in H und jede reelle Zahl β = 0 gilt a. A + iβ I ist injektiv, und es gilt (A + iβ I )x2 = Ax2 + β 2 x2
für x ∈ D(A).
(14.44)
b. A ist genau dann abgeschlossen, wenn R(A + iβ I ) abgeschlossen ist. Beweis a. Die Formel (14.44) ergibt sich mittels (14.42) durch Rechnung, und daraus folgt auch direkt die Injektivität von A + βiI . b. Durch (x, y)2β := β 2 x2 + y2 ist auf H × H offenbar eine äquivalente Norm gegeben. Nach (14.44) ist die Zuordnung T : R(A + βiI ) (A + βiI )x −→ (x, Ax) ∈ G(A) bezüglich dieser Norm eine isometrische Abbildung, so dass G(A) genau dann vollständig ist, wenn R(A + βiI ) vollständig ist. Die Vollständigkeit wiederum ist äquivalent zur Abgeschlossenheit. Im nächsten Satz führen wir auch einige wichtige Begriffe über symmetrische Operatoren ein: Satz und Definition 14.24 Sei A ein abgeschlossener symmetrischer Operator. Dann existiert die C AYLEY-Transformierte U := (A − iI )(A + iI )−1 : R(A + iI ) −→ R(A − iI )
(14.45)
und ist eine isometrische Abbildung. Dabei ist A = i(I + U )(I − U )−1 .
(14.46)
K ± (A) = R(A ± iI )⊥ = N (A∗ ∓ iI )
(14.47)
Man nennt
die Defekträume von A, und n ± (A) = dim K ± (A) die Defektindizes von A.
(14.48)
28
14 Unbeschränkte Operatoren
Beweis Nach Satz 14.23b ist R(A ± iI ) abgeschlossen, da A abgeschlossen ist. Nach 14.23a existiert (A + iI )−1 und daher auch U mit D(U ) = R(A + iI ) ,
R(U ) = R(A − iI ) .
Für x ∈ D(u) und y = (A + iI )−1 x folgt dann U x2 = (A − iI )y2 = Ay2 + y2 = (A + iI )y2 = x2 , was die Isometrie beweist. Die Gleichungen x = Ay + iy ,
U x = Ay − iy
lassen sich äquivalent umformen zu y=
1 (x − U x), 2i
Ay =
1 (x + U x). 2
Daraus folgert man leicht, dass I − U eine Bijektion von D(U ) = R(A + iI ) auf D(A) ist und dass A(I − U ) = i(I + U )
gilt, also (14.46).
Um die Selbstadjungiertheit eines symmetrischen Operators zu überprüfen, muss im Wesentlichen D(A) = D(A∗ ) gezeigt werden, was in der Praxis auf große Schwierigkeiten stößt. Daher sind die folgenden äquivalenten Bedingungen sehr wichtig. Theorem 14.25 Für einen symmetrischen Operator A in H sind folgende Aussagen äquivalent: a. b. c. d. e.
A ist selbstadjungiert. A ist abgeschlossen und N (A∗ ± iI ) = {0}. R(A ± iI ) = H . A ist abgeschlossen und die C AYLEY-Transformierte U ist unitär. A ist abgeschlossen, und für die Defektindizes gilt: n − (A) = n + (A) = 0
Beweis Nach Satz 8.24a ist ein isometrischer Operator genau dann unitär, wenn er surjektiv ist. Aus den Sätzen 14.17c, 14.24 und 14.23b folgt daher (Details als Übung!)
E
Symmetrische und selbstadjungierte Operatoren
c.
⇐⇒
d.
29
⇐⇒
e.
Es sind also nur noch die ersten drei Äquivalenzen zu zeigen: a.
⇒ b.: Gelte A = A∗ . Dann ist A abgeschlossen, weil A∗ nach Satz 14.18a abgeschlossen ist. Ferner ist A∗ ±iI injektiv nach Satz 14.23a, d. h. N (A∗ ±iI ) = {0}. Es gilt also b.
b.
⇒ c.: Sei A abgeschlossen und N (A∗ ± iI ) = {0}. Nach Satz 14.23b ist dann R(A ± iI ) abgeschlossen und somit H = {0}⊥ = N (A∗ ∓ iI )⊥ = R(A ± iI ) , d. h. es gilt c.
c.
⇒ a.: Gelte R(A ± iI ) = H , also auch N (A∗ ∓ iI ) = {0}. Wir haben nur D(A∗ ) ⊆ D(A) zu zeigen. Sei also x ∈ D(A∗ ). Nach Voraussetzung gibt es u ∈ D(A) mit (A − iI )u = (A∗ − iI )x. Wegen A ⊂ A∗ ist dann auch u ∈ D(A∗ ) und (A∗ − iI )u = (A∗ − iI )x, also x − u ∈ N (A∗ − iI ) = {0} und somit x = u ∈ D(A), wie gewünscht.
Als Folgerung ergibt sich ein naheliegender Zusammenhang zwischen Selbstadjungiertheit und Spektrum: Korollar 14.26 Ist A selbstadjungiert, so ist σ (A) ⊆ R. Ist A symmetrisch und σ (A) ⊆ R, so ist A selbstadjungiert. Beweis Sei A symmetrisch. Ist σ (A) ⊆ R, so ist insbesondere ±i ∈ ρ(A), also auch R(A ± iI ) = H , also A = A∗ nach Theorem 14.25. Für einen selbstadjungierten Operator A und λ = α + iβ , β = 0, haben wir N (A − λI ) = {0} und R(A − λI ) = R(A − λI ) nach Satz 14.23, angewandt auf den abgeschlossenen symmetrischen ¯ zu, also insbesondere {0} = N (A − Operator A − α I . Dasselbe trifft auf A − λI ¯λ I ) = N (A∗ − λ¯ I ) = N ((A − λI )∗ ) = R(A − λI )⊥ . Es folgt R(A − λI ) = H , und damit existiert (A − λI )−1 und ist ein überall definierter abgeschlossener Operator. Nach Theorem 14.2 ist er auch beschränkt, also λ ∈ ρ(A). Bemerkung Die Auszeichnung der Punkte λ = ±i in den letzten Sätzen ist reine Konvention. Man kann nämlich beweisen, dass für einen symmetrischen Operator A die Größe dim N (A∗ − λI ) in jeder der beiden Halbebenen H ± := {λ ∈ C | ±Im λ > 0}
30
14 Unbeschränkte Operatoren
konstant ist (vgl. etwa [1] oder [66]). Für beliebiges λ ∈ H ± gilt also n ± (A) = dim N (A∗ − λI ) für die durch (14.48) definierten Defektindizes. Man kann das auch spektraltheoretisch interpretieren: Ist A abgeschlossen und symmetrisch, aber nicht selbstadjungiert, so ist (mindestens) einer der Defektindizes positiv, etwa n + (A) > 0, und dann ist H + ⊆ σ P (A∗ ) und H − ⊆ σ R (A) wegen N (A∗ − λI ) = R(A − λ¯ I )⊥ . Da das Spektrum immer abgeschlossen ist, folgt nun H − ⊆ σ (A). Für das Spektrum eines abgeschlossenen symmetrischen Operators, der nicht selbstadjungiert ist, gibt es daher nur die drei Möglichkeiten H − , H + und C. Aber die nichtreellen Spektralwerte haben keine physikalische Signifikanz und zeigen eigentlich nur, dass man den falschen Definitionsbereich gewählt hat. Wir illustrieren die Anwendung von Theorem 14.25 am Beispiel eines S CHRÖ DINGER-Operators mit reellen C ∞ -Koeffizienten: Satz 14.27 Sei V : Rn → R eine nach unten beschränkte C ∞ -Funktion. Die minimale L 2 -Realisierung des Differentialoperators L := −Δ + V ist dann wesentlich selbstadjungiert. Beweis Zu zeigen ist L ∗0 = L 0 , und wegen (L 0 + μI )∗ = L ∗0 + μI für μ ∈ R können wir o. B. d. A. annehmen, dass V ≥ 0 ist. Die Behauptung folgt aus dem vorigen Satz, wenn wir nachgewiesen haben, dass N (L ∗0 ± iI ) = {0} ist. Da der Differentialoperator formal selbstadjungiert ist, ist L ∗0 = L max nach (14.43). Wir haben also zu zeigen, dass jede schwache Lösung ψ ∈ L 2 (Rn ) der Differentialgleichung −Δψ + V ψ = ±iψ verschwinden muss. Sei also ψ = u + iv (u, v reellwertig) solch eine Lösung. Zunächst einmal weiß man aus der elliptischen Regularitätstheorie (vgl. etwa [66, 73] oder [65]), dass ψ ∈ C ∞ , also sogar eine klassische Lösung der Differentialgleichung ist. Wir untersuchen nun die nichtnegative Funktion f (r ) := r n−1
Sn−1
|ψ(r ω)|2 dσn−1 (ω) ,
0 ≤ r < ∞,
wo dσn−1 das Flächenelement auf der Einheitssphäre ist. Mit Hilfe des G AUSSschen Integralsatzes errechnet man
E
Symmetrische und selbstadjungierte Operatoren
n−1 r n−1 = r n−1 = r n−1 = r
f (r ) =
f (r ) + r n−1 S
n−1
31
∂ (u(r ω)2 + v(r ω)2 ) dσn−1 (ω) ∂r
f (r ) + r n−1 ∇(u 2 + v 2 )(r ω) · ω dσn−1 (ω) Sn−1 x f (r ) + ∇(u 2 + v 2 )(x) · dσn−1 (x) r |x|=r Δ(u 2 + v 2 )(x) dx . f (r ) + Br (0)
Die Gültigkeit der Differentialgleichung Δψ = V ψ∓iψ bedeutet nach Aufspaltung in Real- und Imaginärteil aber Δu = V u ± v ,
Δv = V v ∓ u .
Das ergibt Δ(u 2 + v 2 ) = 2div (u∇u + v∇v) = 2(|∇u|2 + |∇v|2 ) + 2(uΔu + vΔv) = 2(|∇u|2 + |∇v|2 ) + 2V (u 2 + v 2 ) ≥ 0. Insgesamt finden wir f (r ) ≥ 0, also ist f (r ) monoton wachsend. Andererseits ist aber nach der Transformationsformel für Polarkoordinaten 0
∞
f (r ) dr =
Rn
|ψ(x)|2 dx = ψ2 < ∞.
und wegen der Monotonie ist das nur möglich, wenn f (r ) ≡ 0. Also ist ψ = 0 und damit ψ = 0, wie gewünscht.
Selbstadjungierte Erweiterungen Sei S eine selbstadjungierte Erweiterung des symmetrischen Operators A. Dann ist A ⊂ S = S ∗ ⊂ A∗ sowie A¯ = A∗∗ ⊂ S ⊂ A∗ = A¯ ∗ . Also kann man o. B. d. A. annehmen, dass A abgeschlossen ist, und etwaige selbstadjungierte Erweiterungen kann man als Einschränkungen von A∗ auf geeignet gewählte Definitionsbereiche realisieren. Mit Hilfe der C AYLEY-Transformierten kann man sogar alle abgeschlossenen symmetrischen Erweiterungen von A angeben und darunter die selbstadjungierten identifizieren (vgl. etwa [1, 66, 73, 91, 92] oder [95]). Dabei zeigt sich insbesondere, dass für jede abgeschlossene symmetrische Erweiterung B von A für die Defektindizes n + (A) − n + (B) = n − (A) − n − (B) =: k
32
14 Unbeschränkte Operatoren
gilt und dass für 0 ≤ k ≤ min(n + (A), n − (A)) auch stets mindestens eine abgeschlossene symmetrische Erweiterung B mit n ± (B) = n ± (A) − k existiert. Der Operator A hat also genau dann selbstadjungierte Erweiterungen, wenn n + (A) = n − (A) ist (man beachte Theorem 14.25!). Diese sog. V. N EUMANNsche Erweiterungstheorie ist zwar für den Mathematiker sehr befriedigend, in der Praxis jedoch wenig brauchbar, denn sie beschreibt die Definitionsbereiche der fraglichen Erweiterungen nur in recht indirekter Weise. Für formal selbstadjungierte Differentialoperatoren L(x, D) = L + (x, D) in einem Gebiet Ω ⊆ Rn ist die Situation etwas günstiger, denn die selbstadjungierten Erweiterungen von L 0 sind Einschränkungen von L ∗0 = L max , und daher sind ihre Definitionsbereiche durch Randbedingungen gegeben, wobei im Falle eines unbeschränkten Gebiets auch „Randbedingungen im Unendlichen“ zu berücksichtigen sind, die die Gestalt von Forderungen an das Abklingverhalten der betreffenden Funktionen im Unendlichen annehmen. Wir können dies hier nicht rigoros formulieren und noch weniger beweisen und sagen dazu nur soviel: Ist L 0 ⊂ L ⊂ L max und u ∈ D(L), so ist u + ϕ ∈ D(L) für alle Testfunktionen ϕ ∈ D(Ω), denn D(Ω) = D(L min ) ⊆ D(L). Die Funktionen aus D(L) können also auf kompakten Teilmengen von Ω beliebig abgeändert werden, ohne dass D(L) verlassen wird, und daher muss D(L) durch Bedingungen am Rand oder im Unendlichen festgelegt sein. In hinreichend einfachen Situationen kann man die Randbedingungen, die zu selbstadjungierten Erweiterungen führen, explizit bestimmen, und dabei stellt sich heraus, dass ein formal selbstadjungierter Differentialoperator mehrere verschiedene selbstadjungierte Realisierungen haben kann. Wir demonstrieren dies am einfachsten denkbaren Beispiel: Beispiel 14.28 Auf dem Intervall I := [a, b] betrachten wir die L 2 -Realisierungen des formal selbstadjungierten Differentialoperators Lu = −iu . Dann ist L 0 symmetrisch, und alle seine selbstadjungierten Erweiterungen sind Einschränkungen von L ∗0 = L max . Aus Satz 14.10 kennen wir die Definitionsbereiche D(L max ) = H 1,2 (I ) und D(L 0 ) = H01,2 (I ). Für jedes ζ ∈ C mit |ζ | = 1 definieren wir L ζ := L max
mit Dζ := {u ∈ H 1,2 (I ) | u(b) = ζ u(a)} Dζ
und behaupten: Behauptung Die Operatoren L ζ sind genau die sämtlichen selbstadjungierten Erweiterungen von L 0 . Beweis Die G REENsche Formel für L hat die Gestalt Lu|v − u|Lv = i u(b)v(b) − u(a)v(a) ,
(14.49)
E
Symmetrische und selbstadjungierte Operatoren
33
und sie gilt für alle u, v ∈ H 1,2 (I ). Zum Beweis schreibt man u = limm→∞ u m , v = limm→∞ vm wie in Definition 14.9 und beachtet, dass die Formel sich für u m , vm statt u, v trivial nachrechnen lässt und dass sie sich beim Grenzübergang m → ∞ dann auf u, v ∈ H 1,2 (I ) überträgt. Nun betrachte ζ ∈ S1 := {z ∈ C : |z| = 1}. Dann ist L ∗ζ ⊃ L ζ , denn für alle u, v ∈ Dζ ist u(b)v(b) = ζ ζ u(a)v(a) = u(a)v(a) , also Lu|v − u|Lv = 0 nach (14.49). Ist andererseits u ∈ D(L ∗ζ ) ⊆ D(L ∗0 ) = D(L max ) = H 1,2 (I ), so ist L ζ u = L max u = Lu im Sinne der Distributionen, also hat man für alle v ∈ Dζ 0 = Lu|v − u|Lv = i(u(b)ζ − u(a))v(a), und da v(a) = 0 gewählt werden kann, folgt u(b) = ζ u(a), also u ∈ Dζ . Damit ist L ∗ζ = L ζ . Sei nun umgekehrt L 0 ⊂ S = S ∗ ⊂ L max . Nach Satz 14.10 haben L 0 und L max unterschiedliche Definitionsbereiche, also ist L 0 nicht selbstadjungiert, und damit existiert w ∈ D(S)\D L 0 . Wegen w|Sw = Sw|w liefert die G REENsche Formel 0 = w(b)w(b) − w(a)w(a) , also |w(b)| = |w(a)|, und dieser Wert ist = 0, denn anderenfalls wäre w ∈ H01,2 (I ) = D(L 0 ). Für ζ := w(b)/w(a) haben wir also |ζ | = 1 und w ∈ Dζ . Für jedes u ∈ D(S) ergibt (14.49) 0 = Su|w − u|Sw = i(u(b)ζ − u(a))w(a), also u ∈ Dζ . Damit ist S ⊂ L ζ , und da beide Operatoren selbstadjungiert sind, folgt auch S = S ∗ ⊃ L ∗ζ = L ζ , also S = L ζ . In [66] (Ch. X.1 mit Anhang) ist ausführlich erläutert, inwiefern die verschiedenen selbstadjungierten Erweiterungen in diesem und ähnlichen Beispielen tatsächlich unterschiedliches physikalisches Verhalten von gewissen quantenmechanischen Systemen beschreiben. Jedoch lässt sich diese Komplikation vermeiden, wenn L min wesentlich selbstadjungiert ist. Das liegt an dem folgenden Satz: Satz 14.29 Der symmetrische Operator A ist genau dann wesentlich selbstadjungiert, wenn er eine eindeutige selbstadjungierte Erweiterung besitzt. Diese ist dann ¯ A∗∗ = A. Beweis Sei A wesentlich selbstadjungiert, also A¯ selbstadjungiert, und sei S eine ¯ weitere selbstadjungierte Erweiterung von A. Dann ist A¯ ⊂ S = S ∗ ⊂ A¯ ∗ = A, ¯ Die umgekehrte Implikation folgt aus der V. N EUMANNschen Erweitealso S = A. rungstheorie (vgl. die o. a. Literatur).
34
14
Unbeschränkte Operatoren
Bei quantenmechanischen Systemen mit dem Konfigurationsraum Ω = R3N kann in den physikalisch vernünftigen Fällen rigoros bewiesen werden, dass der H AMILTONoperator wesentlich selbstadjungiert ist. Hierzu gibt es eine umfangreiche Fachliteratur (vgl. etwa [21, 35, 41, 47, 66, 67, 91]). Wir erwähnen zwei wichtige Resultate: Satz 14.30 Die minimale Realisierung des S CHRÖDINGERschen Differentialoperators L = −Δ + V in L 2 (Rn ) ist wesentlich selbstadjungiert, wenn a. V ≥ 0 und V ∈ L 2loc (Rn ) oder b. n = 3 und V = V1 + V2 mit V1 ∈ L 2 (R3 ) und V2 ∈ L ∞ (R3 ). Einen Beweis für Teil a. findet man z. B. in [41], einen für b. in jedem der angegebenen Bücher. Die Aussage aus Teil b. erscheint zwar sehr speziell, erfasst jedoch grundlegende physikalische Beispiele wie das C OULOMB-Potential, und die verwendete Beweismethode ist Ausgangspunkt für viele physikalisch relevante Verallgemeinerungen.
Aufgaben zu Kap. 14 14.1 Im Raum E = L p ([a, b]) (mit a < b , 1 ≤ p < ∞) betrachten wir den linearen Operator A mit D(A) = C([a, b]) ,
Au := u(x0 )1 ,
wobei x0 ∈]a, b[ ein fest gewählter Punkt ist. Man zeige, dass A dicht definiert, aber nicht abschließbar ist. (Hinweis: Man betrachte eine Folge von „Zackenfunktionen“, wobei die Breite der Zacken gegen Null geht, die Zacken aber bei x0 eine feste maximale Höhe erreichen.) 14.2 Sei ∅ = X ⊆ Rn eine beliebige Teilmenge (oder allgemeiner (X, d) ein metrischer Raum), und sei E := BC(X ) der komplexe BANACHraum der stetigen beschränkten Funktionen auf X . Für eine stetige Funktion f : X → C definieren wir den Multiplikationsoperator M f wieder durch D(M f ) = {u ∈ E | f u ∈ E} ,
M f u := f u ,
wobei f u im Sinne der punktweisen Multiplikation zu verstehen ist. Man zeige: a. M f ist abgeschlossen. b. σ (M f ) = f (X ). (Hinweis: Man gehe vor wie in Beispiel 14.15a, verwende jedoch Hilfsfunktionen der Form u(x) = max(0, 1 − δ −1 |x − x0 |).) c. Man folgere, dass jede nichtleere abgeschlossene Teilmenge Z ⊆ C Spektrum eines linearen Operators ist. (Hinweis: Man wähle X = Z und f (z) = z.)
Aufgaben
35
14.3 Der Definitionsbereich eines Operatorprodukts AB wird stets so gewählt wie in Satz 14.17e angegeben. Hier betrachten wir Multiplikationsoperatoren M f , Mg in L p (X, A, μ) wie in Satz 14.6. a. Man zeige: D(M f Mg ) = D(Mg ) ∩ D(M f g ). b. Man gebe ein Beispiel an, wo M f Mg und Mg M f verschiedene Definitionsbereiche haben. 14.4 Sei A ein dicht definierter Operator in einem H ILBERTraum. Man zeige: A ist genau dann wesentlich selbstadjungiert, wenn A und A∗ beide symmetrisch (insbesondere dicht definiert!) sind. 14.5 Der Definitionsbereich der n-ten Potenz An eines Operators A ist rekursiv durch D(An ) := {x ∈ D(A) | Ax ∈ D(An−1 )},
n≥1
festgelegt, wobei A0 = I natürlich überall definiert ist. Man zeige: Ist A ein selbstadjungierter Operator in einem H ILBERTraum, so ist An für jedes n ∈ N0 dicht definiert. (Hinweis: Man nutze aus, dass A − iI eine überall definierte beschränkte Inverse hat.) 14.6 Sei A selbstadjungiert, und für ein gewisses γ ∈ R gelte x|Ax ≥ γ x2
für alle x ∈ D(A).
Man zeige: Dann ist ] − ∞, γ [⊆ ρ(A), und für jedes ε > 0 gilt (A − (γ − ε)I )−1 ≤ 1/ε. (Hinweis: Für λ < γ betrachte man S := A − λI und gehe ähnlich vor wie in Aufgabe 8.11.) 14.7 Sei Ω ⊆ Rn ein Gebiet und v = (v1 , . . . , vn ) ein C ∞ -Vektorfeld in Ω. Mit Hilfe der in Satz 1.28 eingeführten Richtungsableitung definieren wir den Differentialoperator 1 ∂f 1 vf = vk . i i ∂ xk n
L v (x, D) f :=
k=1
36
14
Unbeschränkte Operatoren
a. Man zeige: L v (x, D) ist genau dann formal selbstadjungiert, wenn div v ≡ 0 ist. b. Nun sei S eine reelle n × n-Matrix mit Spur Null, und v sei das entsprechende lineare Vektorfeld, also v(x) := Sx für x ∈ Ω = Rn . Man zeige: Dann ist L v (x, D) auf dem Definitionsbereich D(Rn ) wesentlich selbstadjungiert, ebenso auf dem Definitionsbereich Sn . c. Die Drehimpulsoperatoren der Quantenmechanik sind Spezialfälle der in b. beschriebenen Situation. Wieso? 14.8 Man zeige, dass das C OULOMB-Potential V (x, y, z) := −
2 x2
die Voraussetzungen von Satz 14.30b erfüllt.
+ y2 + z2
Kapitel 15
Spektralmaße
Schon in der elementaren linearen Algebra ist es wichtig, zu begreifen, dass die Eigenwerttheorie es ermöglicht, die Struktur eines linearen Operators zu analysieren und dadurch die Beantwortung von konkreten Fragen zu erleichtern, die mit Hilfe dieses Operators formuliert wurden (vgl. etwa [34], Ergänzungen zu Kap. 7). Bei den selbstadjungierten Operatoren, die die Observablen der Quantenmechanik beschreiben, – und auch bei Systemen von kommutierenden Observablen – steht diese Strukturanalyse in unmittelbarem Zusammenhang mit der statistischen Interpretation der Quantenmechanik, und dieser Zusammenhang wird durch projektorwertige Maße, die sog. Spektralmaße hergestellt, wie wir im einführenden Abschn. A an Beispielen erläutern werden. In Abschn. B definieren und untersuchen wir dann Spektralmaße in möglichst allgemeinem Rahmen und zeigen insbesondere, wie beschränkte messbare Funktionen in Bezug auf ein Spektralmaß integriert werden können. Die entstehenden Spektralintegrale liefern, wie sich zeigen wird, eine Darstellung einer C ∗ -Algebra, und da die Theorie der C ∗ -Algebren und ihrer Darstellungen heute in der statistischen Quantenmechanik und Quantenfeldtheorie von wachsender Bedeutung ist, nehmen wir die Gelegenheit wahr, hier wenigstens einige Grundbegriffe dieser Theorie einzuführen (Abschn. C), so dass wir die entsprechende Terminologie und Sichtweise in diesem und dem nächsten Kapitel verwenden können. In Abschn. D verallgemeinern wir dann die Integrationstheorie auf unbeschränkte messbare Funktionen, wobei als Spektralintegrale auch unbeschränkte Operatoren entstehen. Diese Verallgemeinerung wird im nächsten Kapitel für die Spektralzerlegung von unbeschränkten selbstadjungierten Operatoren benötigt.
A Motivierende Vorbemerkungen Wir betrachten zunächst ein quantenmechanisches System, das nur endlich viele Konfigurationen annehmen kann, z. B ein System von N Teilchen vom Spin 12 , die an den Gitterpunkten eines Kristalls fixiert sind, so dass die n = 2 N Spineinstellungen die einzig möglichen Konfigurationen darstellen. Derartige Systeme werden (etwa in der Theorie der Quantencomputer) tatsächlich diskutiert, aber für
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_15, C Springer-Verlag Berlin Heidelberg 2010
37
38
15 Spektralmaße
uns dienen sie nur als einfaches Modell, an dem wir uns orientieren können. Der Zustandsraum eines solchen Systems ist der H ILBERTraum H = Cn , und seine Observablen sind die H ERMITEschen Operatoren in Cn . Zu jedem derartigen Operator A gibt es bekanntlich eine Orthonormalbasis von Eigenvektoren (vgl. z. B. [34], Kap. 7), etwa B = {b1 , . . . , bn }, und dann ist für alle ψ ∈ Cn ψ=
n b j |ψ b j
und
n
Aψ =
j=1
μ j b j |ψ b j ,
(15.1)
j=1
wobei μ j der Eigenwert zum Eigenvektor b j ist. Diese Eigenwerte sind die einzig möglichen Messwerte für die durch A repräsentierte Observable, und ihre Vielfachheiten – also, was der Physiker „Entartung“ nennt – spielen dabei zunächst keine Rolle. Daher führen wir die verschiedenen Eigenwerte λ1 , . . . , λs von A ein, wobei λi mit der Vielfachheit m i auftritt. Die Menge {λ1 , . . . , λs } ⊆ R ist dann das Spektrum σ (A) von A (vgl. Beispiel 9.2a), und wir schreiben (15.1) in der Form ψ=
m s i i=1
bi,k |ψ bi,k
und Aψ =
k=1
s
m i λi bi,k |ψ bi,k ,
i=1
(15.2)
k=1
wobei wir die Eigenvektoren aus B neu nummeriert haben, so dass jeweils {bi,1 , . . . , bi,m i } eine Orthonormalbasis des Eigenraums Ni := N (A − λi I ) ist (i = 1, . . . , s). Die innere Klammer ist hier aber nichts anderes als Pi ψ, wo Pi : Cn → Ni die orthogonale Projektion auf Ni bezeichnet (vgl. Abschn. 8E). Damit erhält (15.2) die übersichtliche Form ψ=
s
Pi ψ
und
Aψ =
i=1
s
λi Pi ψ ,
i=1
und da dies für alle ψ ∈ Cn gilt, kann man noch kürzer schreiben: I =
s
Pi
und
A=
i=1
s
λi Pi .
(15.3)
i=1
Nun sei ψ = 1, so dass ψ einen physikalischen Zustand des Systems beschreibt. Die statistische Interpretation der Quantenmechanik besagt dann, dass die Größe wi := Pi ψ = ψ|Pi ψ = 2
mi
|bi,k |ψ |2
k=1
die Wahrscheinlichkeit dafür ist, bei einer Messung der Observablen in dem durch ψ bezeichneten Zustand den Wert λi zu finden. (Bei der Umrechnung wurde
A
Motivierende Vorbemerkungen
39
(8.39) benutzt, was wir im weiteren Verlauf noch oft tun werden!) Der Erwartungswert im Zustand ψ ist daher A =
s
λi wi =
i=1
s
λi ψ|Pi ψ = ψ|Aψ .
i=1
Die Angaben der Wahrscheinlichkeiten wi kann man zu einer echten Wahrscheinlichkeitsverteilung auf σ (A) ausbauen, indem man für S ⊆ σ (A) setzt: w(S) :=
wi .
λi ∈S
Diese Verteilungen hängen natürlich vom Zustand ψ ab, aber man kann die Abhängigkeit in der einfachen Form w(S) = ψ|E(S)ψ anschreiben, wenn man die Operatoren E(S) :=
Pi
(15.4)
λi ∈S
benutzt. Da für i = j stets Ni ∩ N j = {0}, also Pi P j = P j Pi = 0 ist, folgert man mittels Satz 8.27 sofort, dass E(S) ebenfalls ein orthogonaler Projektor ist, und zwar mit dem Bild Ni , R(E(S)) = λi ∈S
d. h. R(E(S)) ist die lineare Hülle der Eigenvektoren zu den Eigenwerten aus S. Für zwei Teilmengen S1 , S2 ⊆ σ (A) folgt überdies E(S1 )E(S2 ) = E(S2 )E(S1 ), und daher ergibt eine erneute Anwendung von Satz 8.27 (Übung!), dass E(S1 ∩ S2 ) = E(S1 )E(S2 )
(15.5)
und S1 ∩ S2 = ∅
⇒
E(S1 ∪ S2 ) = E(S1 ) + E(S2 ).
(15.6)
Man nennt die Abbildung, die jedem S ⊆ σ (A) den Projektor E(S) zuordnet, das Spektralmaß von A. Unter Verwendung des Spektralmaßes kann (15.3) offenbar wie folgt formuliert werden: I = E(σ (A)) ,
A=
λ∈σ (A)
λE({λ}).
(15.7)
40
15 Spektralmaße
Bemerkung Manchmal wird das Spektralmaß sogar für beliebige Teilmengen S ⊆ C definiert, indem man setzt: E(S) := E(S ∩ σ (A)). Ist S ⊆ ρ(A), so folgt dann E(S) = E(∅) = 0. Der Anwendungsbereich dieses Formalismus geht aber weit hierüber hinaus. Wir betrachten als weiteres Beispiel zwei kommutierende H ERMITEsche Operatoren A, B in Cn , so dass die entsprechenden Observablen also simultan beliebig genau gemessen werden können. Wieder schreiben wir σ (A) = {λ1 , . . . , λs } mit den Eigenräumen NiA := N (A − λi I ), ferner σ (B) = {μ1 , . . . , μt } mit N jB := N (B − μ j I ). Für ψ ∈ NiA ist dann A(Bψ) = B Aψ = λi Bψ , also auch Bψ ∈ NiA . Die Einschränkung von B auf NiA ist daher ein H ERMITEscher Operator im H ILBERTraum NiA , also besitzt dieser eine Orthonormalbasis aus Eigenvektoren von B. Wegen Cn = N1A ⊕ · · · ⊕ NsA können alle diese Basen zu einer Orthonormalbasis von ganz Cn zusammengefasst werden, und die Vektoren dieser Basis sind gleichzeitig Eigenvektoren von A und B. Daher ist Cn =
Ni j
mit Ni j := NiA ∩ N jB .
i, j
Bezeichnen wir nun mit Pi j den orthogonalen Projektor mit dem Bild Ni j , so ergeben sich ähnlich wie zuvor die Beziehungen I = A= ψ|Aψ =
i, j
Pi j ,
i, j
λi Pi j ,
i, j
λi wi j , ψ|Bψ =
B=
i, j
μ j Pi j ,
i, j
μ j wi j
mit wi j := ψ|Pi j ψ . Ist ψ ein Einheitsvektor, so ist wi j die Wahrscheinlichkeit dafür, dass eine simultane Messung der beiden Observablen in dem durch ψ beschriebenen Zustand das Wertepaar (λi , μ j ) liefern wird. Die Wahrscheinlichkeit dafür, dass die Messung ein Wertepaar aus einer gegebenen Menge S ⊆ σ (A) × σ (B) liefern wird, ist also Pi j , (15.8) w(S) = ψ|E(S)ψ mit E(S) := (λi ,μ j )∈S
und es ist eine leichte Übung, zu zeigen, dass die E(S) auch jetzt orthogonale Projektoren sind, die den Rechenregeln (15.5), (15.6) genügen. In diesem Sinne erzeugt das Paar A, B von kommutierenden H ERMITEschen Operatoren ein Spektralmaß auf σ (A) × σ (B), und es ist klar, dass man diese ganze Überlegung auch auf beliebige (endliche) Systeme von kommutierenden H ERMITEschen Operatoren ausdehnen kann.
A
Motivierende Vorbemerkungen
41
Zum Schluss dieser Einführung diskutieren wir noch ein möglichst einfaches System, das ein Kontinuum von Konfigurationen zulässt, nämlich ein Teilchen, das sich im R3 frei bewegen kann. Der Zustandsraum ist dann L 2 (R3 ), und wir betrachten die drei kommutierenden Observablen Q 1 , Q 2 , Q 3 , die die Komponenten x1 , x2 , x3 der Position des Teilchens messen. (Da diese Ortsoperatoren nicht überall in L 2 (R3 ) definiert sind, müsste die Aussage, dass sie kommutieren, eigentlich präzisiert werden, doch ist die Sache hier unproblematisch, da alle auftretenden Operatorprodukte den gemeinsamen dichten Definitionsbereich D(R3 ) haben und auf diesem wesentlich selbstadjungiert sind.) Nun sei ψ ∈ L 2 (R3 ) und ψ = 1. Die Wahrscheinlichkeit, dass die Position des Teilchens im Zustand ψ den bestimmten Wert (x1 , x2 , x3 ) ∈ R3 hat, ist natürlich Null, und man muss sich daher von vornherein auf die Betrachtung von größeren Mengen einlassen. Sei also S ⊆ R3 eine B ORELmenge. Die Wahrscheinlichkeit, das Teilchen innerhalb von S zu finden, ist dann bekanntlich
w(S) =
|ψ(x)| d x = 2
3
χ S |ψ|2 d3 x,
S
und auch dies kann man in der Form w(S) = ψ|E(S)ψ darstellen, nämlich indem man für E(S) den Multiplikationsoperator mit der charakteristischen Funktion χ S wählt. Es ist auch klar, dass für B ORELmengen S1 , S2 die Regeln (15.5), (15.6) gelten. Wie immer in der Maßtheorie erwartet man aber sogar eine Form der σ -Additivität, d. h. wenn S die Vereinigung von abzählbar vielen disjunkten B ORELmengen S1 , S2 , . . . ist, so sollte (in irgendeinem Sinne) gelten: E(S) =
∞
E(Sk ).
k=1
In Bezug auf die Operatornorm kann dies aber kaum je zutreffen, denn ein Projektor P = 0 hat immer die Norm 1, also können die Glieder der Reihe nicht gegen Null gehen, außer wenn die Reihe abbricht. Aber für jedes ψ ∈ L 2 (R3 ) ist wegen |ψ|2 d3 x konvergent, also ist |ψ|2 d3 x < ∞ die Reihe k
Sk
2 n ∞ 3 lim χ Sk ψ d x = lim |ψ|2 d3 x = 0, χ S ψ − n→∞ n→∞ Sk k=1
k=n+1
und dies bedeutet, dass E(S)ψ =
∞ k=1
E(Sk )ψ
∀ ψ ∈ L 2 (R3 )
(15.9)
42
15 Spektralmaße
in der Norm von L 2 (R3 ). In diesem Sinne ist die Abbildung S −→ E(S) also σ -additiv. Wir wissen, dass Q i der Multiplikationsoperator mit der Komponentenfunktion xi ist. Nach Beispiel 14.15a ist folglich σ (Q i ) = R, also σ (Q 1 )×σ (Q 2 )×σ (Q 3 ) = R3 , und somit entspricht die triviale Beziehung I = E(R3 ) der ersten Gleichung aus (15.7). Wie aber die zweite Gleichung zu verallgemeinern wäre, ist an dieser Stelle nicht klar, und tatsächlich benötigt man hierzu die Theorie der Spektralintegrale, die wir im folgenden entwickeln werden.
B Spektralmaße und Spektralintegrale Zunächst führen wir Spektralmaße in möglichst allgemeinem Kontext ein, nämlich für eine σ -Algebra A auf einer beliebigen nichtleeren Menge X . Das Paar (X, A) wird dann mitunter auch als messbarer Raum bezeichnet. Definition 15.1 Sei H ein H ILBERT raum, (X, A) ein messbarer Raum. Eine Abbildung A S −→ E(S) ∈ B(H ), die jeder Menge S ∈ A einen orthogonalen Projektor E(S) : H −→ H zuordnet, heißt ein Spektralmaß auf X , wenn gilt a. E(X ) = I.
(15.10)
b. Für jede disjunkte Folge (Sn ) in A ist E
∞ n=1
Sn x =
∞
E(Sn )x := lim
n=1
n−→∞
n
E(Sn )x
(15.11)
k=1
für alle x ∈ H . Setzt man in (15.11) Sn = ∅ für alle n ∈ N, so folgt E(∅) = 0. Setzt man in (15.11) Sn = ∅ für n > 2, so folgt E(S1 ∪ S2 ) = E(S1 ) + E(S2 )
für S1 ∩ S2 = ∅.
Da links ein orthogonaler Projektor steht, steht auch rechts ein orthogonaler Projektor. Für die Summe von Projektoren ist dies nach Satz 8.27b genau dann der
B
Spektralmaße und Spektralintegrale
43
Fall, wenn R(E(S1 )) ⊥ R(E(S2 )), also wenn E(S1 )E(S2 ) = 0. Für beliebige S1 , S2 ∈ A ist S1 (bzw. S2 ) die disjunkte Vereinigung von S1 \S2 und S1 ∩ S2 (bzw. von S2 \S1 und S1 ∩ S2 ), also ist E(S1 ) = E(S1 \S2 ) + E(S1 ∩ S2 ), E(S2 ) = E(S2 \S1 ) + E(S1 ∩ S2 ). Multipliziert man diese beiden Gleichungen, so fallen drei der vier Terme, die beim Ausdistribuieren entstehen, weg, da die entsprechenden Mengen disjunkt sind. Daher ergibt sich E(S1 )E(S2 ) = E(S1 ∩ S2 ) . Fassen wir zusammen: Satz 15.2 Zusätzlich zu (15.10) und (15.11) hat ein Spektralmaß E(S) auf (X, A) noch folgende Eigenschaften: E(∅) = 0, E(S1 )E(S2 ) = 0 ,
(15.12)
falls S1 ∩ S2 = ∅,
E(S\R) = E(S) − E(R)
(15.13)
falls R ⊆ S,
(15.14)
E(R)E(S) = E(R ∩ S) = E(S)E(R),
(15.15)
E(X \S) = I − E(S).
(15.16)
Es ist wichtig, sich klarzumachen, was das für die Bildräume der Projektoren E(S) bedeutet: Korollar 15.3 Ist S −→ E(S) ein Spektralmaß auf A, so gilt für die abgeschlossenen linearen Teilräume U(S) := R(E(S)) ⊆ H : a. U(X \S) = U(S)⊥ , b. S1 ∩ S2 = ∅ ⇒ U(S1 ) ⊥ U(S2 ). c. Ist S die disjunkte Vereinigung der messbaren Mengen Sn , n ∈ N, so hat jeder Vektor x ∈ U(S) eine eindeutige Reihenentwicklung x=
∞
xn
mit xn ∈ U(Sn ),
n=1
die in H konvergent ist. Es ist nämlich xn = E(Sn )x für alle n. Man sagt hierfür, U(S) sei die orthogonale direkte Summe (oder H ILBERTsche Summe) der U(Sn ) und schreibt
44
15 Spektralmaße
U(S) =
∞
⊥
U(Sn ) .
n=1
Sei im Folgenden ein Spektralmaß E(S), S ∈ A, in H gegeben. Für festes x ∈ H betrachten wir die Mengenfunktion μx (S) := x | E(S)x = E(S)x2 . Dann folgt aus (15.10), (15.11), (15.12), (15.13), (15.14), (15.15), und (15.16) sofort: Satz 15.4 Ist (X, A) ein messbarer Raum, E(S), S ∈ A, ein Spektralmaß in H , so ist für jedes x ∈ H durch μx (S) := x | E(S)x
(15.17)
ein endliches Maß auf A definiert. Wählt man verschiedene x, y ∈ H , so ist μx,y (S) := x | E(S)y natürlich kein Maß, weil die rechte Seite i. A. eine komplexe Zahl ist. Aus diesem Grund führt man die folgenden Begriffe ein: Definitionen 15.5 a. Sei (X, A) ein messbarer Raum. Eine C-wertige Mengenfunktion μ(S), S ∈ A, heißt komplexes Maß auf (X, A), wenn es endliche Maße μ1 , . . . , μ N auf (X, A) und Zahlen c1 , . . . , c N ∈ C gibt, so dass μ(S) =
N
cn μn (S).
(15.18)
n=1
Die bisher betrachteten Maße werden im Gegensatz dazu als positive Maße bezeichnet, wenn Verwechslungen zu befürchten sind. b. Eine Funktion f : X −→ C heißt μ-summierbar, wenn f bezüglich μ1 , . . . , μ N summierbar ist. Man setzt dann f dμ := S
N n=1
f dμn .
cn
(15.19)
S
Bemerkungen (i) Die Darstellung eines komplexen Maßes in der Form (15.18) ist natürlich nicht eindeutig, und man muss daher nachprüfen, dass Summierbarkeit und das
B
Spektralmaße und Spektralintegrale
45
Integral einer Funktion f nicht von der gewählten Darstellung abhängen. Das ist jedoch eine leichte Übung. (ii) Die hier (nach [64]) angegebene Definition von komplexen Maßen ist für unsere Zwecke besonders praktisch, ist aber nicht die in der mathematischen Literatur übliche. Eine gründlichere Einführung in die Theorie der komplexen Maße wird z. B. in [72] gegeben. Dort wird auch die sog. Polarzerlegung von komplexen Maßen hergeleitet, aus der sich die Äquivalenz der beiden Definitionen leicht folgern lässt. Rechenregeln für die Integrale bezüglich komplexer Maße ergeben sich trivial aus den entsprechenden Regeln für positive Maße. Klar ist auch, dass z. B. jede beschränkte A-messbare Funktion in Bezug auf jedes auf A definierte komplexe Maß summierbar ist. Bevor wir nun einen Zusammenhang zwischen komplexen Maßen und Spektralmaßen herstellen, wollen wir uns auf die (beschränkten) Sesquilinearformen auf H × H besinnen (vgl. Definition 8.17), die gemäß Theorem 8.18 in bijektiver Korrespondenz zu den beschränkten linearen Operatoren in H stehen. Dieses Theorem bedeutet, dass jeder Operator T ∈ B(H ) durch seine Matrixelemente x|T y , x, y ∈ H beschrieben werden kann. Hier und auch im weiteren Verlauf werden wir öfters ausnutzen, dass für K = C jede Sesquilinearform h : H × H −→ C – und damit auch jeder beschränkte lineare Operator T ∈ B(H ) – schon durch die entsprechende quadratische Form q(x) := h(x, x) eindeutig festgelegt ist: Lemma 15.6 Sei H ein komplexer H ILBERTraum. a. Für jede Sesquilinearform h auf H und die entsprechende quadratische Form q(x) := h(x, x) gilt die Polarisationsgleichung h(x, y) =
i 1−i 1 q(x + y) − q(x + iy) − (q(x) + q(y)) 2 2 2
für alle x, y ∈ H . b. Jedes T ∈ B(H ) ist durch die entsprechende quadratische Form qT (x) := x|T x eindeutig bestimmt. Beweis a. Wegen der Sesquilinearität (Gln. (8.21) und (8.22)) ergibt sich durch Ausdistribuieren q(x + y) = q(x) + q(y) + h(x, y) + h(y, x) , −1
i
q(x + iy) = i−1 (q(x) + q(y)) + h(x, y) − h(y, x).
46
15 Spektralmaße
Addieren dieser beiden Gleichungen und Auflösen nach h(x, y) ergibt die Polarisationsgleichung. b. Seien T1 , T2 ∈ B(H ) so, dass qT1 ≡ qT2 . Aus der Polarisationsgleichung folgt dann x|T1 y = x|T2 y für alle x, y ∈ H , also T1 = T2 nach Theorem 8.18. Bemerkung Hier ist wesentlich, dass K = C. Auf dem reellen H ILBERTraum H = R2 etwa hat man die Sesquilinearform h(x, y) = x1 y2 −x2 y1 mit der quadratischen Form q ≡ 0. Der zu h gehörige Operator ist die Drehung um den Winkel π/2. Satz 15.7 Eine Abbildung E : A −→ B(H ) auf einem messbaren Raum (X, A), deren Werte orthogonale Projektionen sind, mit E(X ) = I
(15.10)
ist genau dann ein Spektralmaß, wenn für je zwei Vektoren x, y ∈ H μx,y (S) := x | E(S)y
(15.20)
ein komplexes Maß ist. Beweis a. Sei zunächst E(S) ein Spektralmaß auf (X, A). Für x, y ∈ H gilt nach Lemma 15.6 μx,y (S) = x | E(S)y 1−i 1−i x | E(S)x − y | E(S)y (15.21) =− 2 2 1 i + x + y | E(S)(x + y) − x + iy | E(S)(x + iy) . 2 2 Nach Satz 15.4 steht auf der rechten Seite eine komplexe Linearkombination von 4 endlichen Maßen, was beweist, dass durch (15.20) ein komplexes Maß definiert ist. b. Sei nun umgekehrt μx,y stets ein komplexes Maß. Dann ist μx,y insbesondere endlich-additiv, d. h. für eine endliche disjunkte Mengenfolge (S1 , . . . , Sn ) in n A mit S := Sk gilt k=1
x|E(S)y = μx,y (S) =
n k=1
nach Theorem 8.18 also
n μx,y (Sk ) = x E(Sk )y , k=1
B
Spektralmaße und Spektralintegrale
47
E(S) =
n
E(Sk ) .
(∗)
k=1
Nun sei (Sk )k≥1 eine unendliche Folge von disjunkten Mengen aus A und S := ∞ n Sk . Mit Rn := Sk haben wir dann nach (∗) k=1
k=1
E(S) −
n
E(Sk ) = E(S\Rn ) .
k=1
Für jedes x ∈ H ist also 2 n E(Sk )x = E(S\Rn )x2 = x|E(S\Rn )x = μx (S\Rn ), E(S)x − k=1
und nach Satz 10.3d. verschwindet dies für n → ∞, denn μx ist ein endliches ∞ positives Maß und (S\Rn ) = ∅. Also folgt n=1
E(S)x =
∞
E(Sk )x
k=1
im Sinne der Norm von H , was nach Definition 15.1 zu zeigen ist. Nun besprechen wir, wie beschränkte messbare Funktionen auf X bezüglich eines gegebenen Spektralmaßes integriert werden können.
Notationen Wir bezeichnen mit M∞ ≡ M∞ (X, A) den normierten linearen Raum der beschränkten A-messbaren (komplexwertigen) Funktionen auf X , versehen mit der Supremumsnorm · ∞ . (Wegen Satz 10.16b ist er sogar ein BANACHraum, aber das benötigen wir nicht.) Weiter setzen wir M∞ e := LH(χ S | S ∈ A) . Die Elemente von M∞ e nennt man einfache messbare Funktionen. Es handelt sich offenbar um die messbaren Funktionen, die nur endlich viele Wertte annehmen. Sei nun E : A −→ B(H ) ein Spektralmaß, und seien μx die durch (15.17) gegebenen endlichen positiven Maße. Jedes f ∈ M∞ (X, A) ist dann μx -summierbar,
48
15 Spektralmaße
also auch μx,y -summierbar für die durch (15.20) gegebenen komplexen Maße μx,y , x, y ∈ H . Von einem sinnvollen Integral T = f dE wäre zu erwarten, dass gilt: ∀ x, y ∈ H, (15.22) x|T y = f dμx,y und nach Theorem 8.18 ist T durch diese Forderung jedenfalls eindeutig bestimmt. Für g ∈ M∞ e , etwa g=
m
a j χS j
(15.23)
j=1
ist auch klar, wie solch ein Integral zu definieren wäre, nämlich g dE :=
m
a j E(S j ) .
(15.24)
j=1
Dann ist (15.22) offenbar erfüllt. Die Darstellung einer einfachen messbaren Funktion in der Form (15.23) ist zwar nicht eindeutig, aber die gerade festgestellte Eindeutigkeit sichert, dass verschiedene derartige Darstellungen immer denselben Operator (15.24) liefern werden. Also ist durch (15.24) eine Abbildung Ψe : M∞ e −→ B(H ) wohldefiniert, und es ist auch klar, dass es sich um eine lineare Abbildung handelt. Diese hat die bemerkenswerte Eigenschaft Ψe (gh) = Ψe (g)Ψe (h) ,
g, h ∈ M∞ e .
Schreiben wir nämlich g=
a j χS j ,
j
h=
bk χ Rk ,
k
so ist wegen χ S χ R = χ S∩R einerseits a j bk χ S j ∩Rk gh = j,k
und wegen (15.15) andererseits Ψe (g)Ψe (h) =
j,k
a j bk χ S j ∩Rk = Ψe (gh) .
(15.25)
B
Spektralmaße und Spektralintegrale
49
Die orthogonalen Projektionen E(S) sind nach Satz 8.26 selbstadjungiert, also ergibt (15.24) sofort ¯ = Ψe (g)∗ . Ψe (g)
(15.26)
Nun folgt Ψe (|g|2 ) = Ψe (g)∗ Ψe (g), also für alle x ∈ H
|g|2 dμx = x|Ψe (g)∗ Ψe (g)x = Ψe (g)x2 ,
d. h. wir haben Ψe (g)x =
1/2 |g|2 dμx
für alle x ∈ H, g ∈ M∞ e .
(15.27)
Wegen (15.10) ist μx (X ) = x2 , also folgt weiter Ψe (g)x ≤ g∞ · x.
(15.28)
Insbesondere ist Ψe (g) ≤ g∞ für alle g ∈ M∞ e , und das zeigt, dass die lineare 8.3a). Abbildung Ψe auch stetig ist (vgl. Satz Dies ermöglicht es, das Integral f dE für allgemeines f ∈ M∞ durch Approximation zu definieren. Es gilt nämlich ∞ Lemma 15.8 M∞ e ist dicht in M .
Beweis Da man Real- und Imaginärteil getrennt approximieren kann, genügt es, eine reellwertige Funktion f ∈ M∞ (X, A) zu betrachten. Sei also etwa f (X ) ⊆ [−C, C]. Für m ∈ N und k ∈ Z |k| ≤ m setzen wir Sm,k := f −1
k−1 k C, C m m
und dann gm :=
m kC χS . m m,k
k=−m
Da f messbar ist, sind Sm,k ∈ A, also gm ∈ M∞ e . Ferner überprüft man leicht: f − gm ∞ ≤
C −→ 0 für m → ∞. m
Nach dem BLE-Theorem (Theorem 8.7) kann man Ψe also zu einem eindeutigen beschränkten linearen Operator Ψ : M∞ → B(H ) fortsetzen (man beachte auch
50
15 Spektralmaße
Satz 8.8), der durch (8.6) definiert ist. Damit übertragen sich auch die Beziehungen (15.22) sowie (15.25), (15.26), (15.27) und (15.28) auf Ψ , und wir bekommen: Satz und Definition 15.9 Sei (X, A) ein messbarer Raum, E : A −→ B(H ) ein Spektralmaß, und seien μx , μx,y für x, y ∈ H die durch (15.17) bzw. (15.20) gegebenen positiven bzw. komplexen Maße. Zu jedem f ∈ M∞ gibt es dann genau einen Operator T = Ψ ( f ) ∈ B(H ) mit x|T y =
∀ x, y ∈ H .
f dμx,y
(15.22)
Die hierdurch definierte Abbildung Ψ : M∞ −→ B(H ) ist ein stetiger linearer Operator. Man nennt Ψ ( f ) das Spektralintegral von f und schreibt Ψ(f) =
f dE =
f (t) dE(t). X
Es hat die folgenden zusätzlichen Eigenschaften:
f g dE =
f¯ dE =
g dE ,
f dE
∗ f dE
,
(15.25)
(15.26)
2 f dE x = | f |2 dμx ,
(15.27)
f dE ≤ f ∞
(15.28)
für f, g ∈ M∞ und x ∈ H . Bemerkung Wenn man ein gegebenes f ∈ M∞ nach Lemma 15.8 durch g = a1 χ S1 + . . . + am χ Sm approximiert, etwa mit f − g∞ < ε, so folgt mit (15.24) und (15.28) m f dE − a E(S ) j j < ε. j=1 Dies zeigt, dass man das Spektralintegral einer beschränkten messbaren Funktion in der Operatornorm durch so etwas wie „R IEMANNsche Summen“ approximieren kann.
B
Spektralmaße und Spektralintegrale
51
Man benötigt noch eine Eigenschaft der Spektralintegrale, die sich auf die Vertauschbarkeit mit weiteren Operatoren bezieht, und diese hat wichtige Konsequenzen für invariante Teilräume. Wie in der linearen Algebra üblich (vgl. etwa [34], Kap. 7), bezeichnen wir dabei einen linearen Teilraum U ⊆ H als T -invariant, wenn T (U) ⊆ U (T ∈ B(H ) gegeben). Um diese Konsequenzen zu diskutieren, betrachten wir eine orthogonale Zerlegung H = U ⊕ U ⊥, wo U ein abgeschlossener linearer Teilraum ist. Sei P die orthogonale Projektion auf U und Q = I − P die auf U ⊥ . Für beliebige Operatoren T ∈ B(H ) gilt dann T (U) ⊆ U
⇐⇒
QT P = 0 ,
T (U ⊥ ) ⊆ U ⊥
⇐⇒
P T Q = 0, (15.29)
wie man leicht nachrechnet (Übung!). Wegen (QT P)∗ = P T ∗ Q folgt hieraus sofort T (U) ⊆ U
⇒
T ∗ (U ⊥ ) ⊆ U ⊥ .
(15.30)
Sind U und U ⊥ beide T -invariant, so haben wir 0 = QT P = (I − P)T P = T P − P T P und auch 0 = P T Q = P T (I − P) = P T − P T P, also P T = P T P = T P. Ist umgekehrt T P = P T vorausgesetzt, so folgt QT P = Q P T = 0 und P T Q = T P Q = 0. Somit gilt auch T (U) ⊆ U und T (U ⊥ ) ⊆ U ⊥
⇐⇒
T P = PT
⇐⇒
T Q = QT. (15.31)
Satz 15.10 Sei E ein∞Spektralmaß auf dem messbaren Raum (X, A) , Ψ ( f ) := f dE für f ∈ M (X, A), und sei B ∈ B(H ) ein weiterer Operator. Dann sind äquivalent: (i) BΨ ( f ) = Ψ ( f )B für alle f , (ii) B E(S) = E(S)B für alle S ∈ A, (iii) für jedes S ∈ A sind die Teilräume R(E(S)) und N (E(S)) B-invariant, d. h. sie werden von B in sich abgebildet. Beweis Die Äquivalenz (i) ⇐⇒ (ii) folgt sofort aus (15.24) und der Stetigkeit von Ψ . Die Äquivalenz (ii) ⇐⇒ (iii) gilt nach (15.31).
Spektralscharen Für viele Zwecke ist es ausreichend, Spektralmaße auf dem messbaren Raum (R, B 1 ) zu betrachten, wo B 1 die B ORELalgebra der reellen Geraden ist (Defini-
52
15 Spektralmaße
tion 10.8b). Diese Spektralmaße kann man durch einfachere Projektorscharen beschreiben, nämlich durch E λ := E(] − ∞, λ]) ,
λ ∈ R.
(15.32)
Satz und Definition 15.11 Sei E ein Spektralmaß auf (R, B 1 ) und (E λ )λ∈R die durch (15.32) gegebene Projektionenschar. a. Es gilt: (i) Für λ ≤ μ ist E λ E μ = E μ E λ = E λ . (ii) lim E λ x = 0 und lim E λ x = x für alle x ∈ H . (iii)
λ→−∞
λ→+∞
lim E λ+δ x = E λ x für alle x ∈ H, λ ∈ R.
δ→0+
b. Jede Schar (E λ , λ ∈ R) von orthogonalen Projektionen in H , für die die drei Bedingungen aus Teil a. gelten, nennt man eine Spektralschar. c. Die durch (15.32) gegebene Spektralschar legt das Spektralmaß E eindeutig fest. Beweis Eigenschaft (i) folgt direkt aus (15.15) und (15.32), die beiden anderen aus der σ -Additivität des Spektralmaßes. Für (iii) z. B. betrachtet man eine Nullfolge (δn ) von positiven Zahlen und beachtet E λ+δn = E λ + E(]λ, λ + δn ]), also E λ+δn x − E λ x2 = E(]λ, λ + δn ])x2 = μx (]λ, λ + δn ]), und gemäß 10.3d geht das nach Null für n → ∞, da
∞
]λ, λ+δn ] = ∅. Eigenschaft
n=1
(ii) wird ganz ähnlich bewiesen (Übung!). Da das System der Intervalle ] − ∞, λ] die B ORELalgebra B 1 erzeugt, sind die Maße μx schon durch die Werte vx (λ) := μx (] − ∞, λ]) = x|E λ x eindeutig festgelegt (Aufgabe 10.7). Mit Lemma 15.6b folgt hieraus Teil c des Satzes. Das Spektralintegral einer stetigen Funktion mit kompaktem Träger kann mit Hilfe der Spektralschar als eine Art S TIELTJES-Integral mit projektorwertigem Integrator aufgefasst werden (vgl. Beispiel 10.12). Um dies einzusehen, betrachten wir ein f ∈ Cc (R), etwa mit Tr f ⊆ [a, b]. Wegen der gleichmäßigen Stetigkeit von f haben wir dann zu jedem ε > 0 eine Zerlegung a = t0 < t1 < · · · < tm = b, bei der die Durchmesser der Mengen f (]tk−1 , tk ]) für k = 1, . . . , m stets < ε sind. Wählt man nun irgendwelche Stützstellen sk ∈]tk−1 , tk ] und setzt
C
Die C ∗ -Algebra der beschränkten messbaren Funktionen
g :=
m
53
f (sk )χ]tk−1 ,tk ] ,
k=1
so ist offenbar g ∈ Mi∞ und f − g∞ < ε, also nach (15.24), (15.28) und (15.32) m f (sk )(E tk − E tk−1 ) < ε. f dE − k=1
Also ist f dE tatsächlich (in der Operatornorm!) der Limes von R IEMANN S TIELTJES-Summen, bei denen die Spektralschar die Rolle des Integrators spielt. Für x ∈ H ist natürlich
f dμx = x |
f dE x =
b
f (λ) dvx (λ)
a
mit dem monoton nichtfallenden Integrator vx (λ) := x|E λ x , d. h. μx ist das L EBESGUE -S TIELTJES-Maß, das vom Integrator vx erzeugt wird. Bemerkung Jede Spektralschar (E λ )λ∈R entsteht durch (15.32) aus einem geeigneten Spektralmaß auf B 1 . Dieses Spektralmaß kann konstruiert werden, indem man für λ ≤ μ E(]λ, μ]) := E μ − E λ setzt und die Abbildung E dann, ähnlich wie bei skalaren Maßen, auf immer allgemeinere Mengen ausdehnt (vgl. etwa [64]).
C Die C ∗ -Algebra der beschränkten messbaren Funktionen Wir führen nun eine neue Terminologie ein, in der sich Satz 15.9 bequem formulieren lässt. Sie ist der Ausgangspunkt einer umfangreichen Theorie, die für die Quantenmechanik von Systemen mit vielen Freiheitsgraden von eminenter Bedeutung ist, für deren weiteren Ausbau wir jedoch auf die entsprechende Fachliteratur verweisen müssen, etwa auf [11, 26, 27, 36, 78, 79]. Wir erinnern daran, dass eine bilineare Abbildung dadurch gekennzeichnet ist, dass sie sich in jedem ihrer beiden Argumente linear verhält (vgl. Definition 2.8 und Abschn. 7E). Definitionen 15.12 a. Sei (A, · ) ein normierter linearer Raum (über K). Eine Multiplikation auf A ist eine bilineare Abbildung
54
15 Spektralmaße
m : A × A −→ A , (x, y) −→ x y, für die das Assoziativgesetz x(yz) = (x y)z
∀ x, y, z ∈ A
gilt. Der NLR A zusammen mit einer gegebenen Multiplikation heißt normierte Algebra, falls noch x y ≤ x · y
∀ x, y ∈ A
gilt. Eine vollständige normierte Algebra heißt BANACHalgebra. b. Eine normierte Algebra A heißt kommutativ, wenn x y = yx
∀ x, y ∈ A.
c. Ein Einselement (kurz: eine Eins) der normierten Algebra A ist ein e ∈ A, für das gilt: ex = xe = x
∀ x ∈ A.
Hat A ein Einselement e und gilt dabei e = 1, so nennt man A eine normierte Algebra mit Eins bzw. eine BANACHalgebra mit Eins. d. Nun sei A eine normierte Algebra über K = C. Eine Involution in A ist eine Abbildung A −→ A : x −→ x ∗ mit den Eigenschaften (x + y)∗ = x ∗ + y ∗ , (αx)∗ = αx ¯ ∗, (x y)∗ = y ∗ x ∗ ,
x ∗∗ = x
für alle x, y ∈ A , α ∈ C. Hat A eine Eins e, so verlangt man zusätzlich e∗ = e. Eine C ∗ -Algebra ist eine komplexe BANACHalgebra mit Eins und einer Involution, für die außerdem noch gilt: (C ∗ )
x ∗ x = x2
∀x ∈ A.
Zwei Kommentare sind angebracht: (i) Das Einselement ist stets eindeutig bestimmt. Sind nämlich e, e Einselemente in A, so ist ee = e , weil e eine Eins ist, aber auch ee = e, weil e eine Eins ist. Es folgt e = e , und daher kann man von dem Einselement reden. (ii) Warum Bedingung (C ∗ ) von ausschlaggebender Bedeutung ist, kann hier nicht zwingend begründet werden, und man sollte es als Erfahrungstatsache akzeptieren. Einerseits ist sie in vielen wichtigen Fällen erfüllt, und andererseits hat sie Konsequenzen von großer Tragweite, die die C ∗ -Algebren – vor allem für
C
Die C ∗ -Algebra der beschränkten messbaren Funktionen
55
die Physik – deutlich über andere BANACHalgebren hinausheben. Wir wollen hier nur eine ganz einfache Folgerung herleiten, nämlich x ∗ = x
∀ x ∈ A.
(15.33)
Es ist nämlich x2 = x ∗ x ≤ x ∗ · x, also x ∗ ≤ x für alle x (für x = 0 ist (15.33) trivial!). Da dies auch für x ∗ gilt, haben wir auch x = x ∗∗ ≤ x ∗ , insgesamt also (15.33). Beispiele 15.13 a. Ist E ein normierter Raum, so ist A := B(E) eine normierte Algebra mit Eins. Die Multiplikation ist hier die übliche Multiplikation (= Verkettung) von linearen Operatoren, die Eins ist der identische Operator I , und die Norm ist die Operatornorm (beachte Korollar 8.6!). Nach Satz 8.8 ist B(E) sogar eine BANACHalgebra, wenn E ein BANACHraum ist. b. Ist H ein komplexer H ILBERTraum, so hat man in der komplexen BANACHalgebra A := B(H ) eine Involution, nämlich die Bildung des adjungierten Operators. Diese erfüllt auch Bedingung (C ∗ ) (vgl. Satz 8.20), und daher ist B(H ) eine C ∗ -Algebra. c. Beschränkte skalare Funktionen auf einer festen Menge M kann man punktweise multiplizieren, und für die Supremumsnorm gilt dabei f g∞ ≤ f ∞ · g∞ , d. h. der BANACHraum aller beschränkten skalaren Funktionen auf M ist sogar eine (kommutative) BANACHalgebra mit Eins. (Das Einselement ist die Funktion, die konstant den Wert 1 hat.) Im Fall K = C hat man ferner die Involution f ∗ := f¯, also die Bildung der konjugiert komplexen Funktion, und damit handelt es sich um eine C ∗ -Algebra, denn
∗
f f ∞ = sup | f (x)| = 2
x∈M
2 sup | f (x)| x∈M
= f 2∞ .
d. Nun sei M ein topologischer Raum, z. B. eine Teilmenge von Rn oder eine differenzierbare Mannigfaltigkeit. Das punktweise Produkt von stetigen Funktionen ist stetig, und der gleichmäßige Limes einer Folge von stetigen Funktionen ist ebenfalls stetig. Daher bilden die beschränkten stetigen komplexwertigen Funktionen auf M mit der punktweisen Multiplikation, der Supremumsnorm und der Involution f ∗ = f¯ wieder eine kommutative C ∗ -Algebra. Ist M kompakt, so besteht diese aus allen stetigen Funktionen und wird meist mit C(M) bezeichnet. e. Sei (X, A) ein messbarer Raum. Der im vorigen Abschnitt eingeführte BANACHraum M∞ (X, A) bildet mit der punktweisen Multiplikation und der Involution f ∗ = f¯ offenbar ebenfalls eine kommutative C ∗ -Algebra.
56
15 Spektralmaße
f. Bei einem Maßraum (X, A, μ) ändert sich das punktweise Produkt zweier messbarer Funktionen f, g nur auf einer μ-Nullmenge, wenn f und g auf μ-Nullmengen abgeändert werden. Daher induziert die punktweise Multiplikation auch auf dem BANACHraum L ∞ (X, μ) (vgl. 10.34 sowie Abschn. 7A) eine Multiplikation, und mit dieser Multiplikation sowie der Involution f ∗ = f¯ bildet auch L ∞ (X, μ) eine kommutative C ∗ -Algebra. g. Ein linearer Teilraum B einer normierten Algebra A wird als Teilalgebra bezeichnet, wenn gilt x, y ∈ B
⇒
xy ∈ B .
Ist A eine BANACHalgebra und B eine abgeschlossene Teilalgebra, so ist offenbar auch B eine BANACHalgebra. Eine abgeschlossene Teilalgebra B einer C ∗ -Algebra ist wieder eine C ∗ -Algebra, wenn sie selbstadjungiert ist, d. h. wenn gilt: x∈B
⇒
x ∗ ∈ B.
Zum Beispiel ist für eine kompakte Teilmenge X ⊆ Rn die Algebra C(X ) eine selbstadjungierte abgeschlossene Teilalgebra von M∞ (X, A), wobei A := {S ∩ X | S ∈ B n } die B ORELalgebra von X ist. Denn für stetiges f : X → R sind die Mengen (10.18) ja offen in X und damit auch B ORELmengen, und daher ist jede stetige Funktion B OREL-messbar. Für allgemeinere kompakte Räume gilt Analoges, wenn der Begriff der B ORELmenge in geeigneter Weise verallgemeinert wird (vgl. etwa [6]). Ein wesentlicher Punkt in dieser Theorie besteht darin, die Elemente einer gegebenen Algebra als lineare Operatoren auf einem Vektorraum „darzustellen“. Hierzu definieren wir: Definitionen 15.14 a. Sei A eine BANACH algebra und E ein BANACH raum. Eine Darstellung von A auf E ist eine stetige lineare Abbildung Ψ : A → B(E), die zugleich ein Algebrenhomomorphismus ist, d. h. für die gilt: Ψ (x y) = Ψ (x)Ψ (y)
∀ x, y ∈ A
sowie Ψ (e) = I , wenn A eine Eins e hat. b. Sei A eine C ∗ -Algebra und H ein komplexer H ILBERTraum. Eine Darstellung Ψ : A → B(H ) wird als ∗-Darstellung bezeichnet, wenn zusätzlich gilt: Ψ (x ∗ ) = (Ψ (x))∗
∀x ∈ A.
C
Die C ∗ -Algebra der beschränkten messbaren Funktionen
57
Bemerkung In der Physik spricht man oft von Darstellungen irgendwelcher Relationen (z. B. der kanonischen Vertauschungsrelationen) durch Operatoren im H ILBERTraum. Damit ist eigentlich nur die Angabe von konkreten Operatoren gemeint, die diese Relationen erfüllen. Die Terminologie ist jedoch mit der hier eingeführten kompatibel, denn man kann immer eine (abstrakte) Algebra angeben, in der die betrachteten Relationen gelten und sonst keine, und die Darstellung der Relationen durch Operatoren aus B(H ) entspricht dann einer Darstellung dieser Algebra auf H im hier definierten Sinne. Der Grund, warum all dies ins Umfeld der Spektralmaße gehört, liegt nun in dem folgenden fundamentalen Satz: Theorem 15.15 Sei (X, A) ein messbarer Raum, und sei H ein komplexer H ILBERTraum. a. Jedes Spektralmaß E : A −→ B(H ) definiert eine ∗-Darstellung der C ∗ Algebra M∞ (X, A) auf H durch Ψ ( f ) := f dE , f ∈ M∞ . (15.34) Diese erfüllt die Stetigkeitsbedingung (W) Ist ( f k ) eine beschränkte Folge in M∞ und f (t) = lim f k (t) für alle k→∞
t ∈ X , so gilt x | Ψ ( f )y = lim x | Ψ ( f k )y k→∞
∀ x, y ∈ H.
b. Jede ∗-Darstellung Ψ von M∞ (X, A) auf H , die die Bedingung (W) erfüllt, rührt auf diese Weise von einem eindeutigen Spektralmaß auf (X, A) her. Dieses Spektralmaß ist gegeben durch E(S) := Ψ (χ S ) ,
S ∈ A.
(15.35)
Beweis a. Nur Bedingung (W) ist noch zu zeigen, denn alles andere steht schon in Satz 15.9. Sei also ( f k ) eine beschränkte Folge in M∞ mit punktweisem Limes f . Dann ist f messbar nach Satz 10.16b, und wenn etwa f k ∞ ≤ C für alle k ist, so folgt auch supt∈X | f (t)| ≤ C < ∞, d. h. wir haben f ∈ M∞ . Für x ∈ H folgt nun f k (t) dμx (t) f (t) dμx (t) = lim k→∞
aus dem Satz über die dominierte Konvergenz, denn wegen μx (X ) < ∞ kann man eine konstante Funktion als integrierbare Majorante verwenden. Das bedeu-
58
15 Spektralmaße
tet aber schon die Behauptung für x = y, und für beliebige x, y ∈ H folgt sie dann aus der Polarisationsgleichung (Lemma 15.6a). b. Ist Ψ durch (15.34) gegeben und ist S ∈ A, so ist für jedes x ∈ H x|Ψ (χ S )x =
χ S dμx = μx (S) = x|E(S)x ,
also E(S) = Ψ (χ S ) nach Lemma 15.6b. Das Spektralmaß, von dem Ψ herrührt, ist also eindeutig bestimmt und durch (15.35) gegeben. Wir haben daher nur noch nachzuprüfen, dass (15.35) tatsächlich ein Spektralmaß definiert und dass dieses durch (15.34) die gegebene Darstellung Ψ liefert. Für S ∈ A ist χ S = χ S = χ S2 , und da Ψ eine ∗-Darstellung ist, folgt hieraus Ψ (χ S )∗ = Ψ (χ S ) = Ψ (χ S )2 , also E(S)∗ = E(S) = E(S)2 . Die E(S) sind nach Satz 8.26 also jedenfalls orthogonale Projektoren. Wegen Ψ (1) = I gilt dabei auch (15.10). Wir können also Satz 15.7 anwenden, und wegen der Polarisationsgleichung genügt es hierfür, nachzuweisen, dass die Mengenfunktionen μx (S) = x|E(S)x = x|Ψ (χ S )x für x ∈ H Maße auf der σ -Algebra A sind (Definition 10.1). Wegen (8.39) ist μx (S) = E(S)x2 ≥ 0, und μx (∅) = x|Ψ (0)x = 0 ist klar. Für zwei disjunkte Mengen S1 , S2 ∈ A ist χ S1 ∪S2 = χ S1 + χ S2 , also auch Ψ (χ S1 ∪S2 ) = Ψ (χ S1 ) + Ψ (χ S2 ) und somit μx (S1 ∪ S2 ) = μx (S1 ) + μx (S2 ). Dies überträgt sich durch Induktion sofort auf endliche Vereinigungen. Ist nun S die Vereinigung einer unendlichen Folge (S1 , S2 , . . .) von disjunkten Mengen aus A, so setzen n Sk und erhalten wir Rn := k=1
μx (Rn ) =
n
μx (Sk )
für alle n ∈ N .
k=1
Aber (χ Rn )n∈N ist eine beschränkte Folge in M∞ , die punktweise gegen χ S konvergiert. Bedingung (W) liefert daher μx (S) = lim μx (Rn ) = n→∞
∞
μx (Sk ),
k=1
also die σ -Additivität der μx . Somit ist E ein Spektralmaß und erzeugt gemäß (15.34) eine ∗-Darstellung Ψ , etwa g = a χ + · · · + a χ haben wir von M∞ . Aber für g ∈ M∞ 1 S1 m Sm e (g) = Ψ
m j=1
a j E(S j ) =
m
⎛ ⎞ m a j Ψ (χ S j ) = Ψ ⎝ a j χ S j ⎠ = Ψ (g).
j=1
j=1
D
Spektralintegrale von unbeschränkten messbaren Funktionen
59
(g) = g dE, und dann die Linearität von (Hier wurde zunächst benutzt, dass Ψ Ψ .) Auf dem dichten Teilraum M∞ e stimmen Ψ und Ψ also überein, und da sie beide stetig sind, folgt nun Ψ = Ψ . Korollar 15.16 Für jede ∗-Darstellung von M∞ (x, A), die Bedingung (W) erfüllt, gilt Ψ ( f ) ≤ f ∞
(15.36)
für alle f ∈ M∞ (X, A). Beweis Das folgt direkt aus Theorem 15.15b und Satz 15.9, insbesondere Gl. (15.28).
D Spektralintegrale von unbeschränkten messbaren Funktionen In diesem Abschnitt sei stets (X, A) ein messbarer Raum, E : A −→ B(H ) ein festes Spektralmaß, und es seien μx , μx,y für x, y ∈ H die durch (15.17) bzw. (15.20) gegebenen positiven bzw. komplexen Maße. Wir wollen auch für unbeschränktes messbares f das Spektralintegral f dE definieren und untersuchen. Dieses Spektralintegral ist dann allerdings i. A. auch nur ein unbeschränkter – und dementsprechend auch nicht überall in H definierter – linearer Operator. Satz und Definition 15.17 Sei M ≡ M(X, A) die Menge aller A-messbaren Funktionen f : X −→ C. a. Zu jedem f ∈ M gibt es genau einen dicht definierten Operator T in H mit dem Definitionsbereich D(T ) = {x ∈ H | | f |2 dμx < ∞}, bei dem für jedes x ∈ D(T ) gilt: T x = lim
f n dE x ,
n→∞
(15.37)
sobald die Folge ( f n ) ⊆ M∞ (X, A) in L 2 (X, dμx ) gegen f konvergiert. Diesen Operator nennt man das Spektralintegral von f bezüglich des gegebenen Spektralmaßes, und man schreibt wieder T = f dE = X f (t) dE(t). b. Für f ∈ M , T = f dE und x ∈ D(T ) gilt stets x|T x = und
f dμx
(15.38)
60
15 Spektralmaße
T x2 =
| f |2 dμx .
(15.39)
Beweis a. D(T ) ist ein linearer Teilraum. Denn für z = x + y , x, y ∈ D(T ) haben wir nach der Parallelogrammgleichung (7.3) μz (S) = E(S)x + E(S)y2 ≤ 2E(S)x2 + 2E(S)y2 = 2μx (S) + 2μ y (S) für alle S ∈ A, also nach Definition des Integrals
| f |2 dμz ≤ 2
| f |2 dμx + 2
| f |2 dμ y < ∞
und damit x + y ∈ D(T ). Die Implikation x ∈ D(T ) ⇒ cx ∈ D(T ) für c ∈ C ergibt sich analog, denn man errechnet sofort μcx = |c|2 μx . b. Wir zeigen, dass D(T ) dicht in H ist, und setzen dazu Yn := {t ∈ X | | f (t)| ≤ n} ,
n ∈N.
(15.40)
Zu gegebenem v ∈ H betrachten wir die Folge der xn := E(Yn )v. Ist Z ∈ A , Z ∩ Yn = ∅, so ist E(Z )E(Yn ) = 0, also μxn (Z ) = xn |E(Z )E(Yn )v = 0. Daher ist 2 | f |2 dμxn ≤ n 2 μxn (Yn ) = n 2 xn 2 < ∞, | f | dμxn = Yn
also xn ∈ D(T ) für alle n. Andererseits ist X die disjunkte Vereinigung der Mengen Yk \Yk−1 (mit Y0 := ∅), also v = E(X )v =
∞ k=1
E(Yk \Yk−1 )v = lim E(Yn )v = lim xn . n→∞
n→∞
c. Sei nun x ∈ D(T ) fest gewählt. Wir zeigen zunächst, dass M∞ (X, A) in L 2 (X, dμx ) dicht ist.1 Zu beliebigem g ∈ L 2 (X, dμx ) betrachten wir die Folge der beschränkten messbaren Funktionen gn := gχ Z n
mit Z n := {t ∈ X | |g(t)| ≤ n}.
(15.41)
Genau genommen geht es nicht um M∞ selbst, sondern um den Teilraum von L 2 (X, dμx ), der entsteht, wenn man Funktionen aus M∞ identifiziert, die auf einer μx -Nullmenge übereinstimmen. Diese kleine Ungenauigkeit tut aber dem Beweis keinen Abbruch.
1
D
Spektralintegrale von unbeschränkten messbaren Funktionen
61
Dann ist g(t) = limn→∞ gn (t) punktweise sowie |g − gn |2 = |g|2 (1 − χ Z n )2 ≤ |g|2 , also limn→∞ g − gn 22 = 0 nach dem Satz über die dominierte Konvergenz (wobei mit · 2 die L 2 (X, dμx )-Norm gemeint ist). Nun ist durch Sx0 : M∞ −→ H , g −→ g dE x ein beschränkter linearer Operator definiert, denn Sx0 g = g2 nach (15.27) aus Satz 15.9. Man kann diesen Operator nach Theorem 8.7 also eindeutig zu einem beschränkten linearen Operator Sx : L 2 (X, dμx ) → H fortsetzen, und wir setzen T x := Sx f. Wegen (8.6) ist T x dann tatsächlich durch (15.37) gegeben. d. Nun wählen wir f n := f χYn mit den Yn aus (15.40). Dann ist f = limn→∞ f n in L 2 (X, dμx ) für jedes x ∈ D(T ), und somit ist T x auf ganz D(T ) durch (15.37) mit dieser festen Funktionenfolge ( f n ) gegeben. Daher ist T ein eindeutig bestimmter linearer Operator D(T ) → H , und (15.39) folgt aus (15.27) durch Grenzübergang n → ∞. Wegen 1/2
|g| dμx ≤
|g|2 dμx
μx (X )1/2
für g ∈ L 2 (X, dμx )
ist außerdem f ∈ L 1 (X, dμx ) für jedes x ∈ D(T ), und damit folgt auch (15.38) aus (15.22) durch Grenzübergang. Bemerkung Wählt man in (15.37) die f n als einfache messbare Funktionen, so erhält man T = f dE wieder als Grenzwert von einer Art R IEMANNscher Summen. Im Unterschied zu dem in Satz 15.9 beschriebenen Spektralintegral einer beschränkten Funktion ist dieser Limes aber nur noch im Sinne der starken Operatorkonvergenz zu verstehen, d. h. für jedes x ∈ H schreibt sich f dE x als ein Limes von endlichen Summen in H . Nun stellen wir die wichtigsten Eigenschaften dieser unbeschränkten Spektralintegrale zusammen. Dabei sind die Schreibweisen und Konventionen über Definitionsbereiche aus dem vorigen Kapitel zu beachten (vgl. Definition 14.3a und Satz 14.17, ferner D(S + T ) := D(S) ∩ D(T )). Theorem 15.18 Mit der Abkürzung Ψ ( f ) := f dE haben wir für alle f, g ∈ M(X, A). a. b. c. d.
Ψ ( f ) + Ψ (g) ⊂ Ψ ( f + g), Ψ ( f )Ψ (g) ⊂ Ψ ( f g). Dabei ist D(Ψ ( f )Ψ (g)) = D(Ψ(g)) ∩ D(Ψ ( f g)). Ψ ( f )∗ = Ψ ( f¯) und Ψ ( f )∗ Ψ ( f ) = Ψ ( f )Ψ ( f )∗ = Ψ | f |2 . Ψ ( f ) ist stets ein abgeschlossener Operator.
62
15 Spektralmaße
Beweis Teil a ist eine leichte Übung, und die Teile b und c folgen mittels der Approximationsformel (15.37) aus den entsprechenden Eigenschaften der Spektralintegrale von beschränkten Funktionen. Die Einzelheiten dieser etwas technischen Beweisführung übergehen wir – man findet sie z. B. in [57]. Teil d schließlich folgt sofort aus Satz 14.18a, denn nach c ist Ψ ( f ) = Ψ ( f¯)∗ . Zum Schluss besprechen wir noch eine Anwendung auf Eigenwerte, die sowohl für beschränkte als auch für unbeschränkte Funktionen f interessant ist: Korollar 15.19 Sei f ∈ M(X, A) , T := f dE und S := f −1 (λ0 ) für ein gegebenes λ0 ∈ C. Dann ist E(S) der orthogonale Projektor auf den Eigenraum N (T − λ0 I ). Insbesondere ist λ0 ein Eigenwert von T genau dann, wenn E(S) = 0. Beweis Wir setzen g(t) := f (t) − λ0 . Dann ist g dE = f dE − λ0 dE = T − λ0 I . Nach (15.39) ist also 2 2 T y − λ0 y = |g| dμ y = |g|2 dμ y , X \S
da g auf S verschwindet. Aber |g|2 > 0 auf X \S, also ist |g|2 dμ y = 0 ⇐⇒ y ∈ N (T − λ0 I ) ⇐⇒ X \S
μ y (X \S) = 0.
Aber wegen E(X ) = I ist μ y (X \S) = E(X \S)y2 = y − E(S)y2 und somit μ y (X \S) = 0
⇐⇒
y = E(S)y
⇐⇒
y ∈ R(E(S)).
Insgesamt folgt die Behauptung.
Aufgaben zu Kap. 15 15.1 a. Man zeige, dass durch (15.4) ein Spektralmaß im Sinne von Definition 15.1 auf A := P(σ (A)) gegeben ist (vgl. Beispiele 10.2) und dass λk dE(λ) = Ak für alle k ∈ N0 und sogar für alle k ∈ Z, falls 0 ∈ σ (A).
Aufgaben
63
b. Man zeige, dass durch (15.8) ein Spektralmaß auf A := P(σ (A) × σ (B)) gegeben ist und dass
λk μ dE(λ, μ) = Ak B
für k, ∈ N0 . c. Man zeige, dass auf der B ORELalgebra B n ein Spektralmaß durch E(S) := Mχ S definiert ist und dass f dE = M f ist für alle f ∈ M∞ (Rn , B n ). Hierbei bezeichnet M f den Multiplikationsoperator mit der Funktion f im H ILBERTraum H = L 2 (Rn ). 15.2 Sei E : A → B(H ) ein Spektralmaß und U ∈ B(H ) ein unitärer Operator. Man zeige: Durch E(S) = U −1 E(S)U = U ∗ E(S)U ist dann ebenfalls ein Spektralmaß definiert. 15.3 Sei a : H × H → C eine Sesquilinearform auf dem komplexen H ILBERTraum H , und sei q(x) := a(x, x) die entsprechende quadratische Form. Man beweise die „alternative Polarisationgleichung“ a(x, y) =
i 1 (q(x + y) − q(x − y)) − (q(x + iy) − q(x − iy)). 4 4
15.4 Man definiert eine Relation „≤“ zwischen den selbstadjungierten Operatoren aus B(H ) durch A≤B
def
⇐⇒
x|Ax ≤ x|Bx
∀ x ∈ H.
(15.42)
Man zeige: a. Es handelt sich um eine Ordnungsrelation, d. h. es gilt (i) (ii)
A ≤ B und B ≤ C A ≤ B und B ≤ A
⇒ ⇒
A ≤ C, A = B.
b. Sei (E λ )λ eine Spektralschar. Dann gilt κ≤λ
⇒
Eκ ≤ Eλ.
Was bedeutet das für die Bildräume R(E κ ), R(E λ )? (Hinweis: Man beachte Aufgabe 8.23).
64
15 Spektralmaße
15.5 Man beweise, dass in jeder C ∗ -Algebra A gilt: x x ∗ = x2
∀ x ∈ A.
15.6 Ein Zustand auf der C ∗ -Algebra A ist ein lineares Funktional ψ : A → C mit den Eigenschaften (Z 1)
ψ(x ∗ x) ≥ 0
∀x ∈ A
und (Z 2)
ψ(e) = 1 .
(Physikalisch ist das so zu interpretieren, dass A aus Observablen eines Systems besteht und dass ψ( f ) der Erwartungswert der Observablen f in dem durch ψ beschriebenen physikalischen Zustand ist.) Nun sei Ψ : A → B(H ) eine ∗Darstellung von A auf dem komplexen H ILBERTraum H . Man zeige: a. Ist x ∈ H ein Einheitsvektor, so ist durch ψ( f ) := x|Ψ ( f )x ein Zustand auf A definiert (Vektorzustand). b. Ein weiterer Zustand ist gegeben durch ψ( f ) :=
∞
ρk ek |Ψ ( f )ek .
k=1
Dabei ist ein kompakter, selbstadjungierter und injektiver Operator ρ ∈ B(H ) zugrunde gelegt, dessen Eigenwerte ρk die Bedingungen ρk > 0 ,
∞
ρk = 1
k=1
erfüllen (eine sog. Dichtematrix). Die Vektoren ek bilden eine Orthonormalbasis für H , und jedes ek ist ein Eigenvektor zum Eigenwert ρk (Theorem 9.19). 15.7 Sei (X, A, P) ein Wahrscheinlichkeitsraum (vgl. 10.35). Man zeige: Durch ψ( f ) :=
f dP = f
ist ein Zustand auf der C ∗ -Algebra A = M∞ (X, A) gegeben. Bemerkung Dies entspricht einem klassischen System aus vielen Komponenten, das mit Mitteln der statistischen Physik beschrieben wird. Die C ∗ -Algebren von Ob-
Aufgaben
65
servablen, die in der Quantenmechanik eine Rolle spielen, sind im Allgemeinen nichtkommutativ. 15.8 Man erweitere das Resultat von Aufgabe 15.1c auf alle Funktionen f ∈ M(Rn , B n ). (Hinweis: Für den Nachweis der Übereinstimmung der Definitionsbereiche ist Beispiel 10.31b nützlich.) 15.9 Man zeige: In der Situation aus Aufgabe 15.2 ist
= U −1 f dE
f dE
U
für alle f ∈ M(X, A). 15.10 Es sei U : L 2 (Rn ) −→ L 2 (Rn ) : ψ −→ ψ die F OURIER -P LANCHERELTransformation (Theorem 8.30). Man zeige: a. Durch F(S)ψ := U −1 [χ S ψ] ist auf der B ORELalgebra von Rn ein Spektralmaß F gegeben. b. Es sei P j die (nach Beispiel 14.19c eindeutig bestimmte) L 2 (Rn )-Realisierung des Differentialoperators −i∂/∂ x j . Dann ist Pj =
ξ j dF(ξ ) ,
j = 1, . . . , n .
15.11 Unter den Voraussetzungen und mit den Bezeichnungen aus Korollar 15.19 betrachten wir für ε ≥ 0 die Menge Sε := {t ∈ X | | f (t) − λ0 | ≤ ε}. Man zeige: Jedes y ∈ R(E(Sε )) ist ein „Eigenvektor bis auf ε“ in dem Sinne, dass T y − λ0 y ≤ εy.
Kapitel 16
Der Spektralsatz für selbstadjungierte Operatoren und die quantenmechanische Dynamik
In diesem Kapitel beweisen wir den berühmten Spektralsatz, der besagt, dass jeder selbstadjungierte Operator A im H ILBERTraum H in der Form A = λ dE(λ) (16.1) geschrieben werden kann, wobei E ein eindeutiges Spektralmaß auf (R, B 1 ) ist. Das Integral kann dabei über ganz R erstreckt werden oder auch nur über das Spektrum σ (A), denn Teilmengen von ρ(A) liefern keinen Beitrag. Dieser Satz bildet die mathematische Grundlage für die statistische Interpretation der Quantenmechanik, denn für jeden Einheitsvektor x ∈ H ist μx (S) := x|E(S)x das Wahrscheinlichkeitsmaß für die Verteilung der Meßwerte von A im Zustand x. Darüber hinaus gestattet es der Spektralsatz, Funktionen von Observablen zu betrachten, denn die Vorschrift f (A) := f (λ) dE(λ) (16.2) gibt eine sinnvolle Definition dafür, was es heißt, den Operator A in die Funktion f ∈ M∞ (R, B 1 ) „einzusetzen“. Solche Einsetzungsprozeduren nennt man Funktionalkalküle, und man erwartet von ihnen die Gültigkeit der folgenden Rechenregeln: (α f + βg)(A) = α f (A) + βg(A) ,
( f g)(A) = f (A)g(A) ,
f¯(A) = f (A)∗ (16.3)
(α, β ∈ C) sowie j0 (A) = I ,
j1 (A) = A
für j0 (λ) ≡ 1 , j1 (λ) ≡ λ .
(16.4)
Tatsächlich gelten diese Rechenregeln, wenn man von (16.2) als Definition ausgeht, und sie bedeuten, dass Ψ ( f ) = f (A) eine ∗-Darstellung der betrachteten C ∗ Algebra M∞ liefert. Umgekehrt ergibt sich das gesuchte Spektralmaß aus (15.35), sobald man einen geeigneten Funktionalkalkül für die Algebra M∞ hat. In diesem K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_16, C Springer-Verlag Berlin Heidelberg 2010
67
68
16 Spektralsatz und quantenmechanische Dynamik
Sinne kann man sagen, dass der Spektralsatz äquivalent zur Existenz eines geeigneten M∞ -Funktionalkalküls für den gegebenen Operator A ist. Moderne Beweise des Spektralsatzes gehen zumeist den hier angedeuteten Weg über die Funktionalkalküle, und auch wir wollen dies tun. Dabei betrachten wir zunächst nur beschränkte selbstadjungierte Operatoren, denn für diese ist zumindest das Einsetzen in Polynomfunktionen absolut unproblematisch. Den so entstehenden Funktionalkalkül für die Algebra der Polynome erweitern wir dann in Abschn. A zu einem Funktionalkalkül für stetige Funktionen und dann in B zu einem M∞ Kalkül, der es gestattet, für beschränktes selbstadjungiertes A den Spektralsatz zu beweisen. In Abschn. C werden wir aufzeigen, wie sich ein unbeschränkter selbstadjungierter Operator als Funktion eines beschränkten darstellen lässt, und hierdurch den Spektralsatz auch im unbeschränkten Fall erhalten. Im abschließenden Abschn. D betrachten wir Anfangswertaufgaben der Form 1 d x(t) = Ax(t) , i dt
x(0) = x0 ,
(16.5)
wo x0 ∈ H ein gegebener Vektor und A ein gegebener selbstadjungierter Operator ist. Formal lautet die Lösung dieses Problems natürlich x(t) = eiAt , und wir werden die Spektralzerlegung bzw. den Funktionalkalkül dazu benutzen, diesem Ausdruck einen exakten mathematischen Sinn zu verleihen und zu zeigen, dass er wirklich das Gewünschte leistet. Die wichtigste Anwendung hiervon bezieht sich auf die Situation, wo A der H AMILTONoperator eines quantenmechanischen Systems ist. Dann ist durch die Operatorenschar Ut := eiAt die Dynamik des Systems gegeben, d. h. wenn das System sich zur Zeit t = 0 im Zustand x0 befindet, so befindet es sich zur Zeit t im Zustand x(t) := Ut x0 .
A Der stetige Funktionalkalkül Als Vorbemerkung betrachten wir einen beliebigen Vektorraum V und einen linean ck λk ein Polynom, so definiert man f (A) ren Operator A : V → V . Ist f (λ) = k=0
durch f (A) :=
n
ck Ak .
(16.6)
k=0
Dann sind alle Rechenregeln (16.3), (16.4) erfüllt und darüber hinaus noch (g ◦ f )(A) = g( f (A))
(16.7)
für Polynome f, g. Sind V und A von besonderem Typus, so kann dieser „triviale“ Funktionalkalkül auf größere Algebren von Funktionen ausgedehnt werden. Wir diskutieren dies für
A
Der stetige Funktionalkalkül
69
den Fall, wo V = H ein komplexer H ILBERTraum ist und A ∈ B(H ) ein beschränkter selbstadjungierter (= H ERMITEscher) Operator, und die Symbole H und A sollen für den Rest dieses Abschnitts stets diese Bedeutung haben. Ausgangspunkt aller weiteren Überlegungen ist nun das folgende Lemma: Lemma 16.1 Für jedes komplexe Polynom f gilt σ ( f (A)) = f (σ (A))
(16.8)
f (A) = max | f (λ)|.
(16.9)
und λ∈σ (A)
Beweis a. Wir leiten die zu (16.8) äquivalente Aussage μ ∈ ρ( f (A))
⇐⇒
μ ∈ f (σ (A))
(∗)
her. Zu μ ∈ C betrachten wir die Nullstellen λ1 , . . . , λn des Polynoms f (λ) − μ, jede in ihrer Vielfachheit gezählt. Bekanntlich ist dann (vgl. z. B. [34], Kap. 1) f (λ) − μ = a
n !
(λ − λ j )
mit a = 0.
j=1
Wegen (16.3), (16.4) führt dies auf f (A) − μI = a
n !
(A − λ j I ),
j=1
wobei die Faktoren rechts offenbar miteinander kommutieren. Ist nun μ ∈ f (σ (A)), so ist λ j ∈ σ (A) für alle j, also sind beide Seiten der letzten Gleichung invertierbar, und das bedeutet, dass μ ∈ ρ(A). Ist umgekehrt μ ∈ ρ(A), so hat A − λi I den inversen Operator a( f (A) − μI )−1
!
(A − λ j I ),
j=i
denn da die A − λ j I mit f (A) − μI kommutieren, kommutieren sie auch mit ( f (A) − μI )−1 . Also gehört keines der λi , i = 1, . . . , n , zu σ (A), und daher ist μ ∈ f (σ (A)). Damit ist (∗) gezeigt. b. Wir zeigen (16.9) zunächst für ein reelles Polynom f . Dann ist nämlich B := f (A) ebenfalls H ERMITEsch, also B = maxμ∈σ (B) |μ| nach Theorem 9.10d. Nun folgt (16.9) aus (16.8).
70
16 Spektralsatz und quantenmechanische Dynamik
c. Nun sei B = f (A) mit einem beliebigen komplexen Polynom f . Dann ist g := | f |2 = f¯ f ein reelles Polynom, und g(A) = f¯(A) f (A) = B ∗ B. Wie gerade bewiesen, folgt also
∗
B B = max |g(λ)| = λ∈σ (A)
2 max | f (λ)|
λ∈σ (A)
,
und wegen Satz 8.20c folgt wieder (16.9). Das Spektrum σ (A) ist bekanntlich eine kompakte Teilmenge von R (Theorem 9.10), und wir betrachten ein kompaktes Interall [a, b] ⊇ σ (A). Nach dem klassischen W EIERSTRASSschen Approximationssatz (vgl. etwa [34], Kap. 29) ist jede stetige Funktion auf [a, b] der gleichmäßige Limes einer Folge von Polynomfunktionen. Dies ermöglicht es, den Funktionalkalkül auf die Algebra C([a, b]) fortzusetzen: Satz und Definition 16.2 a. Sei σ (A) ⊆ [a, b]. Dann gibt es genau eine stetige ∗-Darstellung Ψ der C ∗ -Algebra C([a, b]) in H , für die gilt: Ψ ( j0 ) = I ,
Ψ ( j1 ) = A
für j0 (λ) ≡ 1 , j1 (λ) ≡ λ. Diese heißt der stetige Funktionalkalkül zu A auf dem Intervall [a, b], und man schreibt f (A) statt Ψ ( f ) für f ∈ C([a, b]). b. Für alle f ∈ C([a, b]) ist f (A) = max | f (λ)| ≤ f ∞ . λ∈σ (A)
Beweis Wir beginnen mit der Eindeutigkeit. Sei also Ψ : C[(a, b)] −→ B(H ) eine ∗-Darstellung, für die Ψ ( j0 ) = I und Ψ ( j1 ) = A gilt, und sei C P die Teilalgebra der Polynomfunktionen auf [a, b]. Ein Polynom f (λ) = nk=0 ck λk ist als Element der Algebra C([a, b]) dann gegeben durch f =
n
ck j1k ,
k=0
wobei j10 = j0 ist. Die Rechenregeln für eine Darstellung ergeben daher Ψ(f) =
n
ck Ak ,
k=0
d. h. Ψ ( f ) = f (A) im Sinne von (16.6). Da Ψ stetig ist und C P nach dem W EIER STRASS schen Approximationssatz in C([a, b]) dicht liegt, muss Ψ durch die Formel
A
Der stetige Funktionalkalkül
71
Ψ ( f ) = lim gm (A) m→∞
(16.10)
gegeben sein, wo (gm ) eine Folge von Polynomen ist, die gleichmäßig auf [a, b] gegen f konvergiert. Andererseits ist die durch (16.6) definierte ∗-Darstellung Ψ0 : C P −→ B(H ) : f −→ f (A) stetig, denn nach (16.9) ist Ψ0 ( f ) ≤ f ∞ für alle f ∈ C P . Nach dem BLE-Theorem (Theorem 8.7) hat Ψ0 also eine eindeutige, durch (16.10) gegebene Fortsetzung Ψ auf ganz C([a, b]). Durch Grenzübergang übertragen sich dann auch (16.3), (16.4) und (16.9) von Ψ0 auf Ψ , womit alles gezeigt ist. Anmerkung 16.3 Wenn zwei Funktionen f, g ∈ C([a, b]) auf σ (A) übereinstimmen, so ist f (A) = g(A), denn nach Teil b des letzten Satzes haben wir f (A) − g(A) = ( f − g)(A) = max | f (λ) − g(λ)| = 0. λ∈σ (A)
Der Operator f (A) hängt also eigentlich nur von der Einschränkung der Funktion f auf das Spektrum von A ab. Insbesondere spielt die genaue Wahl des Intervalls [a, b] ⊇ σ (A) keine Rolle: Ist f 1 eine stetige Fortsetzung von f ∈ C([a, b]) auf ein Intervall [a1 , b1 ] ⊇ [a, b], so ist f 1 (A) = f (A). Dies eröffnet auch die Möglichkeit, den Funktionalkalkül als Abbildung C(σ (A)) −→ B(H ) aufzufassen. Dazu wählt man ein beliebiges kompaktes Intervall [a, b] ⊇ σ (A) und beachtet, dass sich jede stetige Funktion g auf σ (A) zu einer stetigen Funktion f auf [a, b] fortsetzen lässt (z. B. indem man den Graphen von g über den Intervallen, aus denen [a, b]\σ (A) besteht, durch gerade Strecken ergänzt – vgl. Abb. 16.1). Wie gerade erörtert, hängt f (A) dann weder vom Intervall [a, b] noch von der gewählten Fortsetzung f ab, und man kann g(A) := f (A) setzen. Wir notieren einige Eigenschaften des stetigen Funktionalkalküls, die sich entweder aus den Rechenregeln für eine ∗-Darstellung oder (im Falle von Teil e) direkt aus der Definition ergeben: Korollar 16.4 Sei wieder [a, b] ⊇ σ (A). Für f, g ∈ C([a, b]) haben wir a. f (A)g(A) = g(A) f (A). b. f (A) ist normaler Operator (Definition 8.22). c. f reellwertig auf σ (A) ⇒ f (A) ist selbstadjungiert.
Abb. 16.1 Fortsetzung einer stetigen Funktion von σ (A) auf [a, b]
[
]
a
b
72
16 Spektralsatz und quantenmechanische Dynamik
d. | f (λ)| = 1 für alle λ ∈ σ (A) ⇒ f (A) ist unitär. e. B ∈ B(H ) , B A = AB ⇒ B f (A) = f (A)B. Teil e dieses Korollars hat wichtige Auswirkungen auf invariante Teilräume. Für unseren selbstadjungierten Operator A ergibt (15.30) ja insbesondere A(U) ⊆ U
⇒
A(U ⊥ ) ⊆ U ⊥ .
(16.11)
Verwenden wir in 16.4e also geeignete orthogonale Projektoren als B, so erhalten wir wegen (15.31): Korollar 16.5 Ist U ein A-invarianter abgeschlossener linearer Teilraum von H , so sind U und U ⊥ gegen jeden Operator f (A) , f ∈ C([a, b]), invariant. Ist T (U) ⊆ U, so können wir die Einschränkung T0 := T : U −→ U U
einführen, die ein Element von B(U) ist. Aus dem selbstadjungierten A entsteht dabei offenbar ein selbstadjungierter Operator A0 im H ILBERTraum U. Für diesen gilt: Satz 16.6 Sei U ein A-invarianter abgeschlossener Teilraum von H . Mit den obigen Bezeichnungen gilt: a. σ (A0 ) ⊆ σ (A), b. f (A0 ) = ( f (A))0 für alle f ∈ C([a, b]), wo [a, b] ⊇ σ (A). c. Ist λ0 ein Eigenwert von A und v0 ein entsprechender Eigenvektor, so gilt f (A)v0 = f (λ0 )v0 für jede Funktion f ∈ C([a, b]). Beweis a. Ist λ ∈ ρ(A) , R := (A − λI )−1 , so sind U und U ⊥ offenbar R-invariant. Daher ist R0 = (A0 − λI )−1 in B(U), insbesondere λ ∈ ρ(A0 ). b. Definiere eine Abbildung Ψ0 : C([a, b]) → B(U) durch Ψ0 ( f ) := ( f (A))0 . Triviale Rechnungen bestätigen, dass Ψ0 eine ∗-Darstellung von C([a, b]) in U ist, für die Ψ0 ( j0 ) = I0 , Ψ0 ( j1 ) = A0 gilt. Die Eindeutigkeitsaussage in Satz 16.2a liefert daher die Behauptung. c. Für den selbstadjungierten Operator A˜ := λ0 I ist der stetige Funktionalkal˜ = f (λ0 )I kül (wieder wegen der Eindeutigkeit in 16.2a) offenbar durch f ( A)
A
Der stetige Funktionalkalkül
73
gegeben. Daher folgt die Behauptung aus Teil b, angewandt auf den A-invarianten Unterraum U := LH(v0 ). Die Aussage (16.8) kann auf den stetigen Funktionalkalkül ausgedehnt werden, und das ist für seine Nützlichkeit von großer Bedeutung: Satz 16.7 (Spektraler Abbildungssatz) Für f ∈ C([a, b]) mit [a, b] ⊇ σ (A) gilt stets σ ( f (A)) = f (σ (A)) . Beweis Sei μ ∈ f (σ (A)). Dann ist auf σ (A) die stetige Funktion g0 (λ) := 1/( f (λ) − μ) wohldefiniert, und wir können sie zu einem g ∈ C([a, b]) fortsetzen, wie in Anmerkung 16.3 erläutert. Dann ist g(λ)( f (λ) − μ) = ( f (λ) − μ)g(λ) ≡ 1 auf σ (A), und daraus folgt g(A)( f (A) − μI ) = ( f (A) − μI )g(A) = I, d. h. f (A)−μI hat den inversen Operator g(A), und insbesondere ist μ ∈ ρ( f (A)). Damit ist σ ( f (A)) ⊆ f (σ (A)) gezeigt. Nun sei umgekehrt μ ∈ f (σ (A)), etwa μ = f (λ0 ) mit λ0 ∈ σ (A). Wir stellen f (A) in der Form (16.10) dar, wobei die Folge (gm ) von Polynomen gleichmäßig auf [a, b] gegen f konvergiert. Dann konvergieren die Operatoren Sm := gm (A) − gm (λ0 )I in der Operatornorm gegen T := f (A) − f (λ0 )I = f (A) − μI . Wäre also μ ∈ σ ( f (A)), so wäre T invertierbar, und nach Satz 9.4 wäre dann auch Sm für jedes genügend große m invertierbar, denn wir hätten (Sm − T )T −1 ≤ Sm − T · T −1 → 0. Aber die Sm können nicht invertierbar sein, denn für die Polynome gm stellt (16.8) sicher, dass gm (λ0 ) ∈ σ (gm (A)). Also folgt μ ∈ σ ( f (A)), wie gewünscht. Ist f ∈ C([a, b]) reellwertig, so ist B := f (A) wieder selbstadjungiert, und wenn wir ein Intervall [c, d] ⊇ σ (B) = f (σ (A)) wählen, so haben wir für eine stetige Funktion g : [c, d] → C sowohl den Operator g(B) = g( f (A)) als auch (g ◦ f )(A), denn g ◦ f ∈ C([a, b]). Die Schreibweise suggeriert, dass beide Operatoren übereinstimmen, und das ist auch tatsächlich der Fall: Satz 16.8 Sei [a, b] ⊇ σ (A), f ∈ C([a, b]) reellwertig und g ∈ C([c, d]) beliebig, wo [c, d] ⊇ σ ( f (A)) = f (σ (A)). Dann ist g( f (A)) = (g ◦ f )(A). Beweis Ist g = limm→∞ gm gleichmäßig auf [c, d], so ist auch g ◦ f = limm→∞ (gm ◦ f ) gleichmäßig auf [a, b]. Wenn wir die Behauptung also für den Fall zeigen können, wo g ein Polynom ist, so folgt sie nach dem W EIERSTRASSschen
74
16 Spektralsatz und quantenmechanische Dynamik
Approximationssatz und der Stetigkeitseigenschaft aus Satz 16.2b auch für den alln ck ξ k ein Polynom. Dann ist gemeinen Fall. Sei also g(ξ ) = k=0
g◦ f =
n
ck f k
k=0
mit f 0 = j0 , also folgt (g ◦ f )(A) =
n
ck ( f (A))k = g( f (A)),
k=0
da für die Funktionalkalküle zu A und zu f (A) jeweils die Regeln (16.3) und (16.4) gelten. Beispiel 16.9 (Quadratwurzel eines Operators) Sei nach wie vor A ∈ B(H ) H ER MITE sch. Nach Theorem 9.10d ist die Eigenschaft x|Ax ≥ 0
∀x ∈ H
(16.12)
äquivalent dazu, dass σ (A) ⊆ [0, ∞[. Operatoren, die diese Eigenschaften besitzen, nennt man positiv semidefinit oder kurz positiv und schreibt dafür A ≥ 0 in Übereinstimmung mit der in Aufgabe 15.4 getroffenen Definition. Der stetige Funktionalkalkül ermöglicht einen sehr einfachen Beweis für die folgende wichtige Behauptung Ist A positiv, so hat A genau eine positive selbstadjungierte Quadratwurzel, d. h. es gibt genau einen positiven selbstadjungierten Operator A1/2 mit (A1/2 )2 = A. Beweis Wir stetigen √ w, q : [0, ∞[−→ [0, ∞[ mit √ betrachten die beiden √ Funktionen 2 2 w(λ) := λ und q(λ) := λ . Wegen ( λ) = λ = λ2 für alle λ ≥ 0 ist q ◦ w = w ◦ q = j1 . Ist nun σ (A) ⊆ [0, ∞[, so existiert A1/2 := w(A), und dieser Operator ist selbstadjungiert und positiv nach Korollar 16.4c und Satz 16.7. Ferner ist (A1/2 )2 = q(w(A)) = (q ◦ w)(A) = j1 (A) = A. Ist andererseits W ∈ B(H ) eine positive selbstadjungierte Quadratwurzel von A, so folgt W = j1 (W ) = (w ◦ q)(W ) = w(W 2 ) = w(A) = A1/2 , womit auch die Eindeutigkeit erwiesen ist.
Bemerkung Im Allgemeinen gibt es zu einem positiven H ERMITEschen Operator A viele Quadratwurzeln, von denen aber eben nur eine positiv ist (vgl. Aufgabe 16.7).
A
Der stetige Funktionalkalkül
75
Sie entstehen alle aus A1/2 durch „partiellen Vorzeichenwechsel„, d. h. zu selbstadjungiertem W mit W 2 = A gibt es einen abgeschlossenen, unter W und A1/2 invarianten Unterraum U so, dass Wx =
A1/2 x für x ∈ U ,
W x = −A1/2 x für x ∈ U ⊥ .
Anwendung auf unitäre Operatoren Anwenden von Korollar 16.4d auf die Funktion f (λ) = eiλ zeigt sofort, dass U := exp iA = eiA stets ein unitärer Operator ist. Hiervon gilt auch die Umkehrung: Satz 16.10 Zu jedem unitären Operator U ∈ B(H ) gibt es einen selbstadjungierten Operator A ∈ B(H ) mit σ (A) ⊆ [−π, π ] und U = exp iA. Der Beweis ist ein gutes Beispiel für den Einsatz des stetigen Funktionalkalküls, und man findet ihn in [40] ausführlich dargestellt. Hier wollen wir ihn nur skizzieren, und wir beginnen als Vorbemerkung mit der vereinfachten Situation, wo wir es mit komplexen Zahlen zu tun haben statt mit Operatoren. Sei also u ∈ C , |u| = 1. Um nun den Phasenwinkel α ∈] − π, π ] zu bestimmen, für den u = eiα ist, kann man folgendermaßen vorgehen: Man schreibt u = v+iw mit v := Re u , w := Im u und setzt zunächst β := arccos v, wobei es sich um den√Zweig des Arkuskosinus handelt, der [−1, 1] auf [0, π ] abbildet. Dann ist sin β = 1 − v 2 = ±w, und man setzt α := β, falls sin β = w ist, anderenfalls α := −β (vgl. Abb. 16.2). Dieses Verfahren kann man für Operatoren mit etwas mehr technischem Aufwand imitieren. Zunächst schreibt man U = V + iW mit selbstadjungierten V, W , indem man setzt: V :=
1 (U + U ∗ ) , 2
W :=
1 (U − U ∗ ). 2i
β −β w
Abb. 16.2 Bestimmung des Phasenwinkels über den Arkuskosinus
u
v
76
16 Spektralsatz und quantenmechanische Dynamik
Dann ist V W = W V , also V 2 + W 2 = (V − iW )(V + iW ) = U ∗ U = I und daher V x2 + W x2 = x|V 2 x + x|W 2 x = x2 für alle x. Es folgt V , W ≤ 1 und daher σ (V ), σ (W ) ⊆ [−1, 1] nach Theorem 9.10. Wir können also B := arccos V setzen, und nach dem spektralen Abbildungssatz ist σ (B) ⊆ [0, π ]. Satz 16.8 ergibt außerdem sin B = (I − V 2 )1/2 = (W 2 )1/2 , und wieder unterscheiden sich W und sin B „nur um ein Vorzeichen“. Das bedeutet hier aber – ähnlich wie am Schluss des Beispiels 16.9 – , dass es einen B-invarianten abgeschlossenen Unterraum U ⊆ H gibt mit sin B = −W in U ⊥ ,
sin B = W in U , und man setzt dann " Ax :=
Bx −Bx
für x ∈ U , für x ∈ U ⊥ .
Dann kann man beweisen, dass σ (A) ⊆ [−π, π ] sowie cos A = cos B = V , sin A = W ist. Es folgt exp i A = cos A + i sin A = U , wie gewünscht.
B Der messbare Funktionalkalkül und die Spektralzerlegung für beschränkte selbstadjungierte Operatoren Auch in diesem Abschnitt ist H immer ein komplexer H ILBERTraum und A ein beschränkter selbstadjungierter Operator in H . Ist J ⊆ R ein beschränktes Intervall, so gehört die Funktion j1 (λ) ≡ λ offenbar zu M∞ (J ), und daher haben wir zu einem Spektralmaß E auf (J, B 1 ) stets das Spektralintegral j1 dE = λ dE(λ). J
J
Den schon in der Einleitung angekündigten Spektralsatz formulieren wir nun – für den beschränkten Fall – wie folgt: Theorem 16.11 (Spektralsatz) Zu dem selbstadjungierten Operator A ∈ B(H ) und einem kompakten Intervall J = [a, b] ⊇ σ (A) gibt es genau ein Spektralmaß E : (J, B 1 ) −→ B(H ) mit A= λ dE(λ). (16.13) J
Beweis Wir beginnen mit der Eindeutigkeit. Sei also E ein Spektralmaß auf J , das (16.13) erfüllt. Durch Ψ ( f ) := f (λ) dE(λ) J
B
Messbare Funktionalkalkül und Spektralzerlegung
77
ist dann nach Theorem 15.15 eine ∗-Darstellung gegeben, welche die dortige Bedingung (W) erfüllt. Wegen (15.10) und (16.13) erfüllt sie auch Ψ ( j0 ) = I ,
Ψ ( j1 ) = A ,
und nach Satz 16.2a muss Ψ daher auf C(J ) mit dem stetigen Funktionalkalkül zu A übereinstimmen. Ist umgekehrt Ψ eine ∗-Darstellung von M∞ (J ), die (W) erfüllt und auf C(J ) mit dem stetigen Funktionalkalkül übereinstimmt, so wird nach Theorem 15.15 durch E(S) = Ψ (χ S ) ein Spektralmaß E definiert, und für dieses ist λ dE(λ) = Ψ ( j1 ) = j1 (A) = A. J
Daher folgen Existenz und Eindeutigkeit des (16.13) erfüllenden Spektralmaßes aus dem untenstehenden Satz 16.12. Satz und Definition 16.12 Sind A und J wie in Theorem 16.11, so gibt es genau eine stetige lineare Abbildung Ψ von M∞ (J, B 1 ) in B(H ), für die Bedingung (W) gilt sowie Ψ ( f ) = f (A) für alle f ∈ C(J ). Diese ist eine ∗-Darstellung von M∞ (J ). Man nennt sie den messbaren Funktionalkalkül zu A, und man schreibt für jede beschränkte messbare Funktion f wieder f (A) statt Ψ ( f ). Diesen Satz beweisen wir weiter unten in einem Anhang. Zuerst diskutieren wir einige wichtige zusätzliche Eigenschaften des Spektralmaßes zu A: Satz 16.13 Sei E(S) , S ∈ B 1 das Spektralmaß zu A auf J ⊇ σ (A). a. E(S) = 0, falls S ∩ σ (A) = ∅. b. Ist Ω offen in R, so gilt sogar E(Ω ∩ J ) = 0
⇐⇒
Ω ∩ σ (A) = ∅.
Beweis a. Um E(S) = 0 für S ∩ σ (A) = ∅ zu zeigen, verwenden wir die in Satz 15.4 eingeführten positiven endlichen Maße μx , x ∈ H . Es genügt, zu zeigen, dass μx (J \σ (A)) = 0
∀x ,
(∗)
denn dann folgt für S ⊆ J \σ (A) 0 ≤ μx (S) ≤ μx (J \σ (A)) = 0 für alle x und damit E(S) = 0 nach Lemma 15.6b. Um (∗) zu zeigen, betrachten wir für jedes m ∈ N die offene Umgebung U1/m (σ (A)) und wählen eine stetige Funktion ζm mit 0 ≤ ζm ≤ 1, ζm ≡ 0 auf σ (A) und ζm ≡ 1 auf K m := J \U1/m (σ (A)). (Nach Lemma 11.8 gibt es sogar eine
78
16 Spektralsatz und quantenmechanische Dynamik
C ∞ -Funktion mit diesen Eigenschaften, doch wenn nur Stetigkeit verlangt wird, kann man sie sich viel einfacher beschaffen, z. B. durch die Formel ζm (λ) := d(λ, σ (A))/(d(λ, σ (A)) + d(λ, K m )).) Für jedes m ist dann χ K m ≤ ζm , also
0 ≤ μx (K m ) ≤
ζm dμx = x | J
ζm dE x = x|ζm (A)x = 0, J
denn da ζm auf σ (A) verschwindet, ist ζm (A) = 0 nach Satz 16.2b. (vgl. An∞ merkung 16.3). Wegen J \σ (A) = K m folgt (∗) nun aus der σ -Additivität m=1
der μx . b. Für offenes Ω haben wir noch zu zeigen, dass E(Ω ∩ J ) = 0 ⇒ Ω ⊆ ρ(A). Dazu verwenden wir den in Satz 16.12 eingeführten messbaren Funktionalkalkül. Sei also E(Ω ∩ J ) = 0. Ist λ0 ∈ Ω, so gibt es δ > 0 mit Uδ (λ0 ) ⊆ Ω, weil Ω offen ist. Für die Funktion g(λ) := (λ − λ0 )−1 χ J \Ω (λ) gilt dann |g(λ)| ≤ 1/δ, also g ∈ M∞ (J ). Aus g(λ)(λ − λ0 ) = (λ − λ0 )g(λ) = χ J \Ω (λ) folgt g(A)(A − λ0 I ) = (A − λ0 I )g(A) = E(J \Ω) = E(J ) − E(Ω ∩ J ) = I, also g(A) = (A − λ0 I )−1 und insbesondere λ0 ∈ ρ(A).
Anmerkung 16.14 In Verallgemeinerung der für R ADONmaße verwendeten Terminologie (vgl. Bemerkung (i) nach dem Beweis von Korollar 12.4) bezeichnet man das Komplement der größten offenen Menge, in der ein Spektralmaß verschwindet, als den Träger dieses Spektralmaßes. Satz 16.13 lässt sich also zusammenfassen durch die Aussage: Der Träger des Spektralmaßes zu A ist das Spektrum von A.
Teil a. des Satzes hat wieder zur Folge, dass das Intervall J in Wirklichkeit gar keine Rolle spielt. Tatsächlich betrachtet man das Spektralmaß E zu A meist als eine Mengenfunktion, die auf allen B ORELmengen von R definiert ist, indem man ein beliebiges kompaktes Intervall J ⊇ σ (A) wählt und dann E(S) := E(S ∩ J ) setzt. Dies ist eben wegen Satz 16.13a wohldefiniert, d. h. von der speziellen Wahl von J unabhängig. Die Spektralintegrale werden dann auch über ganz R erstreckt, und man schreibt (16.13) in der Form A=
λ dE =
∞ −∞
λ dE(λ).
(16.14)
B
Messbare Funktionalkalkül und Spektralzerlegung
79
Der messbare Funktionalkalkül kann auf alle B OREL-messbaren Funktionen f ∈ M(R, B 1 ) ausgedehnt werden. Man setzt f (A) :=
∞
−∞
f (λ) dE(λ)
(16.15)
und erkennt wie in Anmerkung 16.3, dass dies nur von der Einschränkung f
σ (A)
abhängt. Ist die Funktion f anfangs nur auf σ (A) gegeben, so definiert man f (A) wieder dadurch, dass man sie irgendwie auf ein das Spektrum umfassendes Intervall (oder auf ganz R) fortsetzt. Im Allgemeinen ist f (A) natürlich ein unbeschränkter Operator (aber nach 15.17 und 15.18d immerhin abgeschlossen und dicht definiert!), doch ist er beschränkt, wenn f auf σ (A) beschränkt ist, denn dann kann man f ja zu einem Element von M∞ (R, B 1 ) fortsetzen. Von der Physik her erwartet man, dass die Messung der durch A repräsentierten Observablen nur Werte aus dem Spektrum von A mit positiver Wahrscheinlichkeit liefern wird. Diese Erwartung wird durch Satz 16.13 mathematisch fundiert. Die Aussagen von Korollar 16.4 übertragen sich auf den messbaren Funktionalkalkül. Für Teile a–d ist das klar, und die Verallgemeinerung von e, also die Aussage B A = AB
⇒
B f (A) = f (A)B
∀ f ∈ M∞
(16.16)
werden wir unten im Anhang beweisen. Dann gilt aber auch Korollar 16.5 sinngemäß. Die Eindeutigkeitsaussagen in den Sätzen 16.2 und 16.12 ergeben zusammen die Folgerung, dass der messbare Funktionalkalkül die einzige Bedingung (W) erfüllende ∗-Darstellung Ψ von M∞ ist, für die Ψ ( j0 ) = I ,
Ψ ( j1 ) = A
gilt. Dies wiederum erlaubt es, den Beweis von Satz 16.6 auf den messbaren Funktionalkalkül zu übertragen. Insgesamt können wir also konstatieren: Korollar 16.15 Die Aussagen aus 16.4, 16.5 und 16.6 gelten sinngemäß auch für den messbaren Funktionalkalkül auf M∞ . Dies sollte unbedingt im Zusammenhang mit Satz 15.10 gesehen werden, wo weitere Äquivalenzen bewiesen wurden, die Vertauschbarkeit und invariante Teilräume betreffen. Es ergibt sich: Korollar 16.16 Für B ∈ B(H ) sind äquivalent: (i) B A = AB, (ii) B f (A) = f (A)B für alle f ∈ M∞ , (iii) für die Spektralprojektoren E(S) zu A gelten die Aussagen (ii) und (iii) aus Satz 15.10.
80
16 Spektralsatz und quantenmechanische Dynamik
Besonders wichtig ist hier der Fall B = A. Wendet man Korollar 16.16 für diesen Fall auf das Spektralmaß zu A an, so erkennt man, dass die Spektralprojektionen E(S) stets mit A vertauschen, dass also die Spektralräume U(S) := R(E(S)) stets A-invariant sind. Eine disjunkte Zerlegung σ (A) =
∞
Sn
n=1
führt also zu einer Darstellung von H als orthogonale direkte Summe H=
∞
⊥
U(Sn )
n=1
in A-invariante abgeschlossene Teilräume (Korollar 15.3). Dies ist von grundsätzlicher Bedeutung (vgl. auch Aufgabe 16.10). Beispiele 16.17 a. Für einen beliebigen Maßraum (X, A, ν) betrachten wir den H ILBERTraum H := L 2 (X, A, ν). Gegeben sei eine reelle Funktion ϕ ∈ L ∞ (X, A, ν). Der entsprechende Multiplikationsoperator A = Mϕ (vgl. Beispiel 9.2b und Satz 14.6) ist dann beschränkt und selbstadjungiert. Offenbar ist Ak der Multiplikationsoperator mit ϕ k und allgemeiner p(A) = M p◦ϕ für jedes Polynom p. Dies legt die Vermutung nahe, dass der messbare Funktionalkalkül zu A gegeben ist durch Φ( f ) := M f ◦ϕ .
(16.17)
Um dies nachzuweisen, wählen wir ein kompaktes Intervall J ⊇ [−ϕ∞ , ϕ∞ ] und definieren Φ : M∞ (J, B 1 ) → B(H ) durch (16.17). Mit völlig trivialen Rechnungen bestätigt man, dass Φ eine ∗-Darstellung von M∞ (J ) ist und dass Φ( j0 ) = I , Φ( j1 ) = A gilt. Bedingung (W) folgt mit dem Satz von der dominierten Konvergenz, denn x|Φ( f )y = x(t) f (ϕ(t))y(t) dν(t) , und für f ∞ ≤ C wird der Integrand punktweise durch die ν-summierbare Funktion C|x(t)y(t)| majorisiert. Die Eindeutigkeit des messbaren Funktionalkalküls zeigt daher, dass f (A) = Φ( f ) = M f ◦ϕ für alle f ∈ M∞ . Insbesondere ist das Spektralmaß zu A durch E(S) = Mω S
mit ω S := χϕ −1 (S)
(16.18)
gegeben, denn χ S ◦ ϕ = χϕ −1 (S) . Das positive Maß μx zu einem Vektor x ∈ H ist damit
B
Messbare Funktionalkalkül und Spektralzerlegung
81
μx (S) = x|E(S)x =
ϕ −1 (S)
|x(t)|2 dν(t).
(16.19)
b. Wir betrachten einen kompakten selbstadjungierten Operator A in einem beliebigen komplexen H ILBERTraum H . Dabei nehmen wir an, es ist dim R(A) = ∞, denn der Fall dim R(A) < ∞ wäre eine triviale Vereinfachung, die über das in Abschn. 15A über H ERMITEsche Matrizen Gesagte nicht wesentlich hinausgeht. Seien (λn ) die Nullfolge der Eigenwerte und (en ) das Orthonormalsystem entsprechender Eigenvektoren gemäß dem Satz von H ILBERT-S CHMIDT (Theorem 9.19). Da dieses System eine Orthonormalbasis von R(T ) = N (T )⊥ bildet, haben wir für alle x ∈ H ∞ en |x en , (16.20) x = P0 x + n=1
wobei P0 die orthogonale Projektion auf N (T ) bezeichnet. Diese Beziehung sowie Gl. (9.31) kann man in Gestalt von Spektralintegralen schreiben, indem man die folgende projektorwertige Mengenfunktion einführt: Wir bezeichnen mit (αk )k≥1 die Folge der verschiedenen Eigenwerte = 0 von A (etwa nach absteigenden Beträgen geordnet), ergänzt durch α0 := 0, und setzen E(S) :=
∞
χ S (αk )Pk
Pk :=
mit
|en en | ,
k≥1
(16.21)
λn =αk
k=0
für S ⊆ R. (Hier haben wir die in der Physik übliche D IRAC-Notation verwendet.) Offenbar ist Pk der orthogonale Projektor auf den endlichdimensionalen Raum N (A −αk I ) der Eigenvektoren zu αk . Die unendliche Reihe ist konvergent im Sinne der starken Operatorkonvergenz, d. h. für jedes x ∈ H ist die Reihe E(S)x =
∞
χ S (αk )Pk x
k=0
in H konvergent. Das liegt an der Konvergenz der F OURIERreihe (16.20). Insbesondere ist x = P0 x +
∞
Pk x
∀x ∈ H ,
k=1
d. h. E(R) = I . Da Eigenvektoren zu verschiedenen Eigenwerten zueinander orthogonal sind, zeigt Satz 8.27b, dass E(S) stets ein orthogonaler Projektor ist, sofern die Summe nur aus endlich vielen Termen = 0 besteht. Besteht sie aber aus unendlich vielen Termen, so zeigt man mittels Satz 8.26 durch Grenzübergang, dass sie ebenfalls einen orthogonalen Projektor liefert (Übung!). Schließlich ist für jedes x ∈ H
82
16 Spektralsatz und quantenmechanische Dynamik
μx (S) =
∞
m k (x)χ S (αk )
mit m k (x) := Pk x2 ≥ 0,
(16.22)
k=0
und das ist nach Beispiel 10.2d ein Maß, das sogar auf der gesamten Potenzmenge von R definiert ist, erst recht also auf den B ORELmengen. Dies zeigt (Satz 15.7 und Lemma 15.6a), dass wir durch (16.21) in der Tat ein Spektralmaß (sogar auf der vollen Potenzmenge von R) definiert haben. Um Spektralintegrale in Bezug auf dieses Spektralmaß zu berechnen, ziehen wir Satz 15.9 und das dritte Beispiel aus 10.31a heran. Für f ∈ M∞ (J ) , J ⊇ σ (A) ist demnach x |
f dE x =
f dμx =
∞
m k (x) f (αk ) =
k=0
∞
f (αk )x|Pk x ,
k=0
also wegen Lemma 15.6b. f dE =
∞
f (αk )Pk = f (0)P0 +
k=0
∞
f (λn )|en en | ,
(16.23)
n=1
wobei diese Reihen wieder im Sinne der starken Operatorkonvergenz zu verstehen sind, d. h. nach Einsetzen eines x ∈ H liefern sie Reihen, die in H konvergieren. Insbesondere ist (9.31) nichts anderes als (16.13) für das hier vorliegende Spektralmaß, d. h. wir haben tatsächlich das Spektralmaß zu A konstruiert.
Anhang: Existenz und Eindeutigkeit des messbaren Funktionalkalküls Zum Beweis von Satz 16.12 benötigen wir das folgende Lemma, aus dem die Bedeutung von Bedingung (W) klar wird: Lemma 16.18 Sei α eine stetige Linearform auf dem BANACHraum M∞ (J ), die auf dem Teilraum C(J ) verschwindet. Angenommen, sie erfüllt außerdem die Bedingung (W0) Ist f der punktweise Limes einer beschränkten Folge ( f m ) ⊆ M∞ (J ), so ist α( f ) = lim α( f m ) . m→∞
Dann muss α ≡ 0 sein. Beweis Es sei A das System aller B ORELmengen S ⊆ J , für die α(χ S ) = 0 ist. Offenbar ist χ J \S = χ J − χ S , und wenn S die Vereinigung der disjunkten Mengen Sm , m ∈ N ist, so ist punktweise
B
Messbare Funktionalkalkül und Spektralzerlegung
χ S = lim
m→∞
m
83
χ Sm .
k=1
Mit der Linearität von α und Bedingung (W0) folgert man hieraus leicht, dass A eine σ -Algebra ist. Außerdem gehört jede abgeschlossene Teilmenge von J zu A. Ist nämlich K ⊆ J abgeschlossen, also auch kompakt, so gibt es zu jedem m ∈ N eine stetige Funktion ζm mit 0 ≤ ζm ≤ 1, die auf K mit 1, auf J \U1/m(K ) mit 0 übereinstimmt. Dann ist aber punktweise χ K = limm→∞ ζm , und Bedingung (W0) liefert α(χ K ) = limm→∞ α(ζm ) = 0. Die B ORELalgebra B 1 wird definitionsgemäß von den offenen Mengen von R erzeugt (vgl. Definition 10.8), also auch von den abgeschlossenen Mengen, da diese gerade die Komplemente der offenen sind. Die σ -Algebra B 1 (J ) der in J enthaltenen B ORELmengen wird daher von den abgeschlossenen Teilmengen von J erzeugt. Folglich ist A = B 1 (J ), d. h. α(χ S ) = 0 für alle S ∈ B 1 (J ). Da α linear ist, folgt nun α(g) = 0 für alle g ∈ M∞ e , und da α auch stetig (in Bezug auf die Norm von M∞ !) ist, folgt mit Lemma 15.8 schließlich α ≡ 0. Die Eindeutigkeitsaussage in Satz 16.12 folgt nun schon sofort aus dem folgenden Korollar: Satz 16.19 Sind Φ1 , Φ2 : M∞ (J ) → B(H ) zwei stetige lineare Abbildungen, die beide Bedingung (W) erfüllen, und ist Φ1 ( f ) = Φ2 ( f ) für alle f ∈ C(J ), so muss Φ1 ≡ Φ2 sein. Beweis Zu beliebigen Vektoren x, y ∈ H betrachten wir die Linearformen αx,y ( f ) := x | (Φ1 ( f ) − Φ2 ( f ))y . Sie erfüllen offenbar alle Voraussetzungen von Lemma 16.18, also ist x|Φ1 ( f )y = x|Φ2 ( f )y für alle x, y ∈ H , f ∈ M∞ (J ). Die Behauptung folgt daher aus Theorem 8.18.
Bemerkung Hieraus folgt leicht die (bisher unbewiesene) Aussage (16.16). Dazu betrachtet man die Abbildungen Φ1 ( f ) := BΨ ( f )
und
Φ2 ( f ) := Ψ ( f )B ,
wobei Ψ die ∗-Darstellung aus Satz 16.12 ist. Wegen x|Φ1 ( f )y = B ∗ x|Ψ ( f )y und x|Φ2 ( f )y = x|Ψ ( f )(By) folgt Bedingung (W) für die Φi aus ihrer Gültigkeit für Ψ . Nach Korollar 16.4e ist Φ1 ( f ) = Φ2 ( f ) für alle stetigen f , also auch für alle beschränkten messbaren f , wie behauptet. Beweis (von Satz 16.12) Wir brauchen nur noch die Existenz der Abbildung Ψ : M∞ (J ) → B(H ) mit den geforderten Eigenschaften zu zeigen, und dabei werden
84
16 Spektralsatz und quantenmechanische Dynamik
wir die Operatoren T = Ψ ( f ) gemäß Theorem 8.18 durch die entsprechenden Sesquilinearformen beschreiben, also durch ihre Matrixelemente. Zunächst definieren wir für jedes x ∈ H ein lineares Funktional Λx auf C(J ) durch Λx (g) := x|g(A)x ,
g ∈ C(J ) .
(16.24)
Ist g reellwertig, so ist g(A) selbstadjungiert, also Λx (g) ∈ R. Ist g ≥ 0, so ist √ g = w 2 mit w := g, also Λx (g) = x|w(A)2 x = w(A)x2 ≥ 0, also erfüllt Λx die Monotoniebedingung (10.72), und der R IESZsche Darstellungssatz 10.40 liefert nun ein vollständiges R ADONmaß μx auf J , für das gilt:1 Λx (g) = g dμx , g ∈ C(J ) . (16.25) J
Dabei ist μx (J ) =
1 dμx = Λx ( j0 ) = x2 < ∞ . J
Also ist jedes f ∈ M∞ (J ) μx -summierbar, und wenn wir q f (x) ≡ ηx ( f ) := f dμx für f ∈ M∞ (J )
(16.26)
J
setzen, so folgt |q f (x)| = |ηx ( f )| ≤ f ∞ · x2 .
(16.27)
Außerdem gilt Bedingung (W0) für die Linearformen ηx , wie man sofort mittels des Satzes über dominierte Konvergenz nachprüft. Diese Bedingung gilt dann offenbar auch für endliche Linearkombinationen verschiedener ηx . Nun setzen wir h f (x, y) :=
1 i 1−i q f (x + y) − q f (x + iy) − (q f (x) + q f (y)) 2 2 2
(16.28)
für x, y ∈ H und f ∈ M∞ (J ). Die auf M∞ (J ) definierten Linearformen ηx,y ( f ) := h f (x, y)
(16.29)
1 Um den Satz genau in der in Kap. 10 angegebenen Form benutzen zu können, müsste man eigentlich eine offene Umgebung Ω ⊇ J betrachten, Λx auf Cc (Ω) definieren und dann das gewonnene R ADONmaß auf J beschränken. Das ist aber eine rein technische Angelegenheit, die keine Probleme verursacht, und wenn man statt Theorem 10.40 eine etwas allgemeinere Version des R IESZschen Darstellungssatzes benutzt, ist es auch gar nicht nötig.
B
Messbare Funktionalkalkül und Spektralzerlegung
85
erfüllen dann Bedingung (W0). Für g ∈ C(J ) ist h f eine stetige Sesquilinearform, denn nach (16.24), (16.25), (16.26) und der Polarisationsgleichung (Lemma 15.6a) haben wir h g (x, y) = x|g(A)y .
(16.30)
Nun zeigen wir, dass h f auch für beliebiges f ∈ M∞ (J ) eine stetige Sesquilinearform ist. Um z. B. die Rechenregel h f (x, c1 y1 + c2 y2 ) = c1 h f (x, y1 ) + c2 h f (x, y2 )
(16.31)
für f ∈ M∞ (J ), x, y1 , y2 ∈ H und c1 , c2 ∈ C nachzuweisen, betrachten wir für einen Moment feste Vektoren x, y1 , y2 und Skalare c1 , c2 , setzen z := c1 y1 + c2 y2 und untersuchen die Linearform α := ηx,z − c1 ηx,y1 − c2 ηx,y2 . Diese erfüllt (W0) und verschwindet auf C(J ), da die Gültigkeit von (16.31) für stetiges f ja schon bekannt ist. Nach Lemma 16.18 ist also α ≡ 0 und somit gilt (16.31) für alle f , jedenfalls für die gewählten Werte von x, y1 , y2 , c1 , c2 . Diese waren aber beliebig gewählt, also gilt (16.31) tatsächlich generell. Ebenso prüft man nach, dass h f (c1 x1 + c2 x2 , y) = c1 h f (x1 , y) + c2 h f (x2 , y)
(16.32)
generell gilt. Also ist h f immer eine Sesquilinearform, und um ihre Stetigkeit nachzuprüfen, genügt es, zu zeigen, dass sie für x = y = 1 beschränkt bleibt. Aus (16.28), (16.27) folgt aber |h f (x, y)| ≤ f ∞ ≤ f ∞
1 1 x + y2 + x + iy2 + x2 + y2 2 2
(x + y)2 + x2 + y2 ,
also sup |h f (x, y)| ≤ 6 f ∞
x=1 y=1
und damit die Stetigkeit von h f . Für jedes f ∈ M∞ (J ) definieren wir nun T = Ψ ( f ) als denjenigen Operator, der gemäß Theorem 8.18 der Sesquilinearform h f entspricht. Es gilt also h f (x, y) = x | Ψ ( f )y = ηx,y ( f )
(16.33)
86
16 Spektralsatz und quantenmechanische Dynamik
für alle x, y ∈ H , f ∈ M∞ (J ). Da h f nach (16.26), (16.28) linear von f abhängt, ist Ψ : M∞ (J ) → B(H ) eine lineare Abbildung, und sie erfüllt (W), weil die ηx,y (W0) erfüllen. Da der Isomorphismus aus Theorem 8.18 isometrisch ist, haben wir außerdem Ψ ( f ) ≤ 6 f ∞
∀f,
und damit ist Ψ auch stetig. Für g ∈ C(J ) ist x|Ψ (g)y = x|g(A)y nach (16.30) und (16.33), also Ψ (g) = g(A), wie verlangt. Schließlich müssen wir noch nachweisen, dass Ψ eine ∗-Darstellung ist. Um die Rechenregel Ψ ( f¯) = Ψ ( f )∗
(16.34)
zu bestätigen, betrachten wir die stetigen linearen Abbildungen Φ1 ( f ) := Ψ ( f¯)
und
Φ2 ( f ) := Ψ ( f )∗ .
Beide erfüllen Bedingung (W) (für Φ2 beachte man x|Ψ ( f )∗ y = y|Ψ ( f )x ), also folgt (16.34) aus Satz 16.19 und der Tatsache, dass (16.34) für den stetigen Funktionalkalkül gilt. Ähnlich zeigen wir Ψ ( f g) = Ψ ( f )Ψ (g)
(16.35)
für f, g ∈ M∞ (J ), allerdings in zwei Schritten: Zuerst halten wir ein stetiges g fest und betrachten die Abbildungen Φ1 ( f ) := Ψ ( f g) und
Φ2 ( f ) := Ψ ( f )Ψ (g).
Beide erfüllen (W) (für Φ2 beachte man, dass x|Ψ ( f )Ψ (g)y = x|Ψ ( f )z mit dem festen Vektor z := Ψ (g)y), und auf C(J ) stimmen sie überein, weil der stetige Funktionalkalkül (16.35) erfüllt. Also gilt (16.35) sogar für alle f ∈ M∞ (J ), und das ist für jedes stetige g der Fall. Nun betrachten wir für ein beliebiges festes f ∈ M∞ (J ) die Abbildungen Φ1 (g) := Ψ ( f g) und
Φ2 (g) := Ψ ( f )Ψ (g) .
Beide erfüllen (W) (für Φ2 beachte man, dass x|Ψ ( f )Ψ (g)y = w|Ψ (g)y mit dem festen Vektor w := Ψ ( f )∗ x), und nach dem Ergebnis unseres ersten Schrittes gilt (16.35) für jedes stetige g, dann aber auch für jedes g ∈ M∞ (J ). Damit ist (16.35) für alle f, g nachgewiesen. Bemerkung Die in diesem Beweis hergeleitete Abschätzung Ψ ( f ) ≤ 6 f ∞ ist natürlich irreführend, denn nach Korollar 15.16 gilt ja die viel bessere Abschätzung
B
Messbare Funktionalkalkül und Spektralzerlegung
87
(15.36). Der überflüssige Faktor 6 ist gewissermaßen eine Schwäche des hier vorgestellten Beweisverfahrens, aber wir können diese leicht in Kauf nehmen, da sie keinen Schaden anrichtet. 16.20 Ausblicke (i) Bei der hier vorgestellten Form der Spektraltheorie ignoriert man die Vielfachheit (= Multiplizität, in der Physik meist Entartung genannt). Für einen Eigenwert λ ist die Vielfachheit bekanntlich die Dimension von N (A − λI ), also die maximale Anzahl von linear unabhängigen Eigenvektoren. Eine detaillierte darstellungstheoretische Untersuchung des Funktionalkalküls ermöglicht es jedoch, für das gesamte Spektrum eine Vielfachheitsfunktion zu definieren, und in diesem Zusammenhang wird der Spektralsatz dahingehend verfeinert, dass der H ILBERTraum zunächst als orthogonale Summe von abgeschlossenen A-invarianten Teilräumen geschrieben wird, für die die Einschränkungen von A jeweils nur einfaches Spektrum haben (Spektraldarstellung). Diese feinere Analyse führt zu einer vollständigen Beschreibung der selbstadjungierten Operatoren bis auf unitäre Äquivalenz. Das bedeutet: Wenn zwei selbstadjungierte Operatoren A1 , A2 in allen spektralen Daten (d.h. Spektrum, Spektralmaß und Vielfachheitsfunktion) übereinstimmen, so gibt es einen unitären Operator U ∈ B(H ) mit A2 = U −1 A1 U . Gewissermaßen sind A1 , A2 dann ein und derselbe Operator, nur in verschiedenen (unendlichdimensionalen!) Koordinatensystemen geschrieben. Diese Multiplizitätstheorie ist in [69] skizziert und z. B. in [24] ausführlich dargestellt. Vgl. auch [1] oder [91]. (ii) Man kann auch Funktionalkalküle in mehreren Variablen definieren und untersuchen, wenn die betreffenden Operatoren kommutieren. Sind also A1 , . . . , Am ∈ B(H ) kommutierende selbstadjungierte Operatoren, so betrachtet man die C ∗ Algebra C(Σ0 ) der stetigen komplexwertigen Funktionen auf der kompakten Menge Σ0 := σ (A1 ) × · · · × σ (Am ) ⊆ Cm und der stetige Funktionalkalkül für diese Operatoren ist dann die ∗-Darstellung Φ : C(Σ0 ) → B(H ), für die die Funktionen πk : Σ0 −→ C , (λ1 , . . . , λm ) −→ λk überführt werden in Φ(πk ) = Ak ,
k = 1, . . . , m.
(16.36)
Für Polynome in m Variablen p(λ1 , . . . , λm ) =
|α|≤n
cα λα
(16.37)
88
16 Spektralsatz und quantenmechanische Dynamik
(Multiindex-Schreibweise!) ergibt sich daraus
Φ( p) =
cα Aα = p(A1 , . . . , Am ),
|α|≤n
wie man es naiv erwartet, und man schreibt auch für allgemeinere Funktionen f wieder f (A1 , . . . , Am ) statt Φ( f ). Existenz und Eindeutigkeit dieser ∗-Darstellung zu beweisen, ist allerdings mit den in Abschn. A vorgestellten elementaren Methoden nicht mehr möglich, und wir können nicht darauf eingehen, wie das geschieht. Aber der Beweis des Fortsetzungssatzes 16.12 kann ohne Mühe auf die neue Situation übertragen werden, d. h. wir haben eine eindeutige Fortsetzung Ψ des stetigen Funktionalkalküls auf die Algebra M∞ (Σ0 , B n ), die Bedingung (W) erfüllt, und diese ist der messbare Funktionalkalkül für das Operatorensystem (A1 , . . . , Am ). Durch E(S) := χ S (A1 , . . . , Am )
(16.38)
ist dann ein eindeutiges Spektralmaß E auf den B ORELschen Teilmengen von Σ0 gegeben, das die Eigenschaft Ak =
Σ0
λk dE(λ1 , . . . , λm ) ,
k = 1, . . . , m
(16.39)
hat. Auf diese Weise sind A1 , . . . , Am gemeinsam spektral zerlegt, und für alle f ∈ M∞ (Σ0 , B n ) hat man f (A1 , . . . , Am ) =
Σ0
f (λ1 , . . . , λm ) dE(λ1 , . . . , λm ).
(16.40)
Der Träger Σ dieses Spektralmaßes ist allerdings i. A. nicht ganz Σ0 . Dies spiegelt das Bestehen von Relationen zwischen den Operatoren A1 , . . . , Am wider, also von Beziehungen wie etwa A21 A2 + A2 A23 − A1 A3 = 0 o. dgl. Eine solche Relation hat allgemein die Form p(A1 , . . . , Am ) ≡ 0, wo p ein Polynom (16.37) ist. Besteht diese Relation, so folgt Σ0
| p(λ)|2 dμx (λ) = 0
für alle x ∈ H , denn da p auf der kompakten Menge Σ0 beschränkt ist, kann man ja den Funktionalkalkül anwenden. Daraus folgt aber E(Ω) = 0 für jede offene Menge Ω ⊆ Cm \ p −1 (0), also muss Σ ⊆ p −1 (0) sein. Für den Funktionalkalkül bedeutet dies wieder, dass der Operator f (A1 , . . . , Am ) in Wirklichkeit nur von der Einschränkung f Σ abhängt. Einzelheiten hierzu findet man etwa in [9] oder [73]. In [70] wird eine andere Begründung für den Funktionalkalkül für mehrere Variable gegeben, bei der das
C
Unbeschränkte selbstadjungierte Operatoren
89
gemeinsame Spektralmaß für A1 , . . . , Am als eine Art Produktmaß aus den Spektralmaßen der einzelnen A j gewonnen wird. Bemerkung Bei dieser Theorie kommt es eigentlich nicht darauf an, dass die Operatoren A1 , . . . , Am selbstadjungiert sind, sondern die von ihnen erzeugte abgeschlossene Teilalgebra A ⊆ B(H ) soll selbstadjungiert sein in dem Sinne, dass B∈A
⇒
B∗ ∈ A .
In der mathematischen Literatur geht man daher zumeist von kommutierenden normalen Operatoren T1 , . . . , Tm aus und betrachtet die von diesen sowie ihren Adjungierten erzeugte abgeschlossene Teilalgebra. Diese ist wieder kommutativ, weil die Operatoren normal sind. Es handelt sich aber hier nicht um eine Verallgemeinerung, denn man könnte dieselbe Algebra ja durch die 2m selbstadjungierten Operatoren Ak := Tk + Tk∗ ,
Bk := i(Tk − Tk∗ ) ,
k = 1, . . . , m
erzeugen. (iii) In der Theorie der Operatoralgebren definiert man für Teilmengen M ⊆ B(H ) den Kommutanten M durch M := {B ∈ B(H ) | BT = T B ∀ T ∈ M} und den Bikommutanten durch M := (M ) . Korollar 16.16 besagt u. a., dass jedes Ψ ( f ) = f (A) , f ∈ M∞ mit jedem B ∈ B(H ) vertauscht, welches mit A vertauscht. Das bedeutet, dass das Bild R(Ψ ) des messbaren Funktionalkalküls zu A im Bikommutanten von {A} enthalten ist. Bemerkenswert ist der sog. Bikommutantensatz von J. VON N EUMANN, der besagt, dass sogar {A} = R(Ψ ) = { f (A) | f ∈ M∞ }
(16.41)
ist (vgl. etwa [1, 17, 95] oder Band I von [46]). Dieser Satz kann als der Ausgangspunkt der Theorie der VON N EUMANNschen Operatoralgebren gelten.
C Unbeschränkte selbstadjungierte Operatoren In diesem Abschnitt verallgemeinern wir Spektralsatz und messbaren Funktionalkalkül auf unbeschränkte selbstadjungierte Operatoren in H . Theorem 16.21 (Spektralsatz) Zu einem selbstadjungierten Operator A gibt es genau ein Spektralmaß E : (R, B 1 ) −→ B(H ) mit A = λ dE(λ). (16.42)
90
16 Spektralsatz und quantenmechanische Dynamik
Wir wollen hier nur die Konstruktion des fraglichen Spektralmaßes skizzieren und verweisen für die Eindeutigkeit sowie weitere Einzelheiten auf [57]. Wir gehen aus von der Beobachtung, dass nach Theorem 14.25 die C AYLEY-Transformierte U des selbstadjungierten Operators A ein unitärer Operator in H ist. Nach Satz 16.10 gibt es also einen beschränkten selbstadjungierten Operator B mit −U = exp iB
σ (B) ⊆ [−π, π ] .
und
Nach Theorem 16.11 ist B = ϕ d E(ϕ) mit einem eindeutig bestimmten Spek das außerhalb von [−π, π ] verschwindet. Da stetiger und messbarer tralmaß E, Funktionalkalkül für stetige Funktionen übereinstimmen, ergibt dies U = − exp iB = −
eiϕ d E(ϕ).
Aus Satz 14.24 wissen wir, dass I −U injektiv ist, und das bedeutet, dass −1 = e±iπ kein Eigenwert von exp iB ist. Also ist E({π, −π }) = 0 (Korollar 15.19), und daher ist sogar
eiϕ d E(ϕ)
U =−
mit X :=] − π, π [.
(16.43)
X
Nach Gl. (14.46) in Satz 14.24 kann man A aus seiner C AYLEYtransformierten zurückgewinnen durch A = i(I + U )(I − U )−1 . Einsetzen von λ = eiϕ in die Funktion g(λ) := i(1 − λ)/(1 + λ) ergibt aber g(eiϕ ) = i
1 − eiϕ ϕ = tan , iϕ 2 1+e
(16.44)
wie man durch Erweitern des Bruches mit e−iϕ/2 unschwer bestätigt. Einsetzen von U = −eiB in (14.46) liefert daher, zumindest formal B = A = tan 2
tan X
ϕ d E(ϕ). 2
(16.45)
Diese Schlussfolgerung ist allerdings etwas voreilig, denn dabei wird eine Variante von Satz 16.8 benutzt, bei der f nicht reellwertig und g nicht beschränkt zu sein braucht, und sie soll auch noch den korrekten Definitionsbereich mitliefern. Um diese Klippe zu umschiffen, beachten wir, dass durch T :=
tan X
ϕ d E(ϕ) 2
C
Unbeschränkte selbstadjungierte Operatoren
91
jedenfalls ein selbstadjungierter Operator T in H definiert ist (Theorem 15.18c). Aus (16.44) folgt aber tan
ϕ (1 + eiϕ ) = i(1 − eiϕ ) 2
für alle ϕ ∈ X , und damit liefert Theorem 15.18b. wegen (16.43) T (I − U ) ⊂ i(I + U ) = A(I − U ) , wobei D(T (I − U )) = D(I − U ) ∩ D(i(I + U )) = H ist. Daher ist R(I − U ) ⊆ D(T ), aber wir wissen aus Satz 14.24, dass R(I − U ) = D(A) ist. Es folgt T ⊃ A, aber da beide Operatoren selbstadjungiert sind, haben wir auch T = T ∗ ⊂ A∗ = A, also A = T , d. h. (16.45) gilt tatsächlich. Nun ist offenbar h : X −→ R , ϕ −→ tan (ϕ/2) ein Homöomorphismus, und der inverse Homöomorphismus ist gegeben durch h −1 : R −→ X , λ −→ 2 arctan λ. Also ist durch −1 (S)) E(S) := E(h
(16.46)
eine projektorwertige Mengenfunktion auf den B ORELmengen von R definiert, und man prüft durch triviale Rechnungen nach (vgl. wieder [57]), dass E ein Spektralmaß ist und dass f (h(ϕ)) d E(ϕ) (16.47) f (λ) dE(λ) = X
für alle messbaren Funktionen f auf R gilt. Insbesondere folgt nun (16.42) aus (16.45), und wir haben das gesuchte Spektralmaß gefunden. Beispiele 16.22 a. Sei (X, A, ν) ein Maßraum und ϕ ∈ M(X, A) reellwertig. Der Multiplikationsoperator Mϕ im H ILBERTraum H := L 2 (X, A, ν) ist dann selbstadjungiert (vgl. Satz 14.6 und die Beispiele 14.19a, 14.21a). Für den Fall einer beschränkten Funktion ϕ haben wir das entsprechende Spektralmaß schon in Beispiel 16.17a bestimmt, und es liegt nahe, die gefundene Formel (16.18) auch im jetzigen allgemeineren Fall anzusetzen, also E(S) := Mω S
mit ω S := χϕ −1 (S) .
92
16 Spektralsatz und quantenmechanische Dynamik
Es ist nicht schwer, nachzuprüfen, dass dies ein Spektralmaß definiert, und auch die Beziehung Mϕ = λ dE(λ) lässt sich mittels (15.37) leicht verifizieren. Wir empfehlen beides als Übungen. b. Sei L(D) ein formal selbstadjungierter linearer Differentialoperator in n Variablen mit konstanten Koeffizienten, und sei L seine (eindeutige!) L 2 (Rn )Realisierung (vgl. Beispiele 14.15b, 14.19c und 14.21c). Ferner sei U die F OURIER -P LANCHEREL-Transformation in Rn . Nach (14.20) ist U LU −1 = Mϕ
mit ϕ(ξ ) := L(iξ ) ,
also L = U −1 Mϕ U . Das Spektralmaß zu dem selbstadjungierten Operator L ist daher gegeben durch F(S)ψ := U −1 [χϕ −1 (S) ψ] für ψ ∈ L 2 (Rn ). Das folgt mittels der Ergebnisse der Aufgaben 15.2 und 15.9 sofort aus Beispiel a. Ein besonders wichtiger Spezialfall ist L = −Δ, also (bis auf physikalische Konstanten) der H AMILTONoperator für ein freies Teilchen. Für diesen ist ϕ(ξ ) = |ξ |2 , also entsteht F(S)ψ, indem man die F OURIERtransformierte ψ mit der charakteristischen Funktion der Menge ϕ −1 (S) = {ξ ∈ Rn | ξ12 + · · · + ξn2 ∈ S} multipliziert und anschließend die inverse F OURIERtransformation anwendet. Satz 16.23 Das Spektrum σ (A) ist der Träger des Spektralmaßes E zu A, d. h. für offene Teilmengen Ω ⊆ R gilt E(Ω) = 0
⇐⇒
Ω ∩ σ (A) = ∅ .
Ein detaillierter Beweis hiervon ist in [57] zu finden, und wir sagen hier nur soviel: Mit den Bezeichnungen aus der Beweisskizze zu Theorem 16.21 haben wir für offene Mengen Ω ⊆ R E(Ω) = 0
⇐⇒
−1 (Ω)) = 0 E(h
16.13b. −1 ⇐⇒ h (Ω) ∩ σ (B) = ∅
⇐⇒
Ω ∩ h(σ (B)) = ∅,
weil h ein Homöomorphismus ist. Die Behauptung folgt also aus h(σ (B)) = σ (A) = σ (h(B)).
C
Unbeschränkte selbstadjungierte Operatoren
93
Dies kann man zwar nicht direkt aus dem spektralen Abbildungssatz 16.7 folgern, weil dessen Voraussetzungen nicht erfüllt sind, aber es folgt aus einer Charakterisierung des Spektrums eines Spektralintegrals (s. [57]). Man kann dem Spektralmaß aber nicht nur ansehen, ob man sich im Spektrum befindet oder nicht, sondern auch, um welchen Teil des Spektrums es sich handelt. Dabei ist zu beachten, dass das Residualspektrum eines selbstadjungierten Operators immer leer ist, denn der in Theorem 9.10b. gegebene Beweis ist wegen Satz 14.17c auf unbeschränkte Operatoren übertragbar. Korollar 16.24 Sei E das Spektralmaß zu A und λ ∈ R. Dann ist a. λ ∈ ρ(A) ⇐⇒ es gibt δ > 0 mit E(]λ − δ, λ + δ[) = 0, b. λ ∈ σ P (A) ⇐⇒ E({λ}) = 0, und in diesem Fall ist E({λ}) die orthogonale Projektion auf N (A − λI ), c. λ ∈ σC (A) ⇐⇒ E({λ}) = 0, aber für jedes δ > 0 ist E(]λ−δ, λ+δ[) = 0. Beweis Da ρ(A) offen ist, folgt a aus Satz 16.23. Behauptung b ist wegen (16.42) ein Spezialfall von Korollar 15.19. Wegen σ R (A) = ∅ folgt c aus a und b, denn es ist die einzige verbleibende Möglichkeit, wenn weder a noch b zutreffen. Korollar 16.25 Der selbstadjungierte Operator A ist genau dann beschränkt (und überall definiert), wenn sein Spektrum beschränkt ist. Beweis Sei σ (A) beschränkt, etwa σ (A) ⊆ [−C, C] =: J . Ist E das Spektralmaß zu A, so haben wir nach Satz 16.23 λ dE(λ), A= J
also nach (15.39) Ax2 =
|λ|2 dμx (λ) ≤ C 2 x2 J
für alle x ∈ D(A), und somit ist A beschränkt. Da A auch abgeschlossen und dicht definiert ist, folgt auch D(A) = H (Theorem 14.2b). Die Umkehrung ist aus Kap. 9 wohlbekannt. Selbstverständlich wird nun der messbare Funktionalkalkül auch auf unbeschränktes A ausgedehnt: Definition 16.26 Für jedes f ∈ M(R, B 1 ) setzt man f (A) := f dE, wo E das Spektralmaß zu A ist.
94
16 Spektralsatz und quantenmechanische Dynamik
Die rechnerischen Eigenschaften dieses Funktionalkalküls ergeben sich als Spezialfälle der Sätze 15.17 und 15.18. Insbesondere ist f (A) beschränkt und überall definiert, wenn f ∈ M∞ (R) ist, und das Spektralmaß selbst ergibt sich aus dem Funktionalkalkül durch E(S) = χ S (A). Korollar 16.16 kann jedoch nicht ohne weiteres auf unbeschränkte Operatoren übertragen werden, denn die Bedingung AB − B A = 0 kann ziemlich nichtssagend sein, wenn die Definitionsbereiche von A und B ungünstig zueinander liegen. Daher bezeichnet man zwei unbeschränkte selbstadjungierte Operatoren als vertauschbar, wenn ihre Spektralprojektionen miteinander kommutieren, und man kann dies in vielen Fällen nachweisen, ohne die Spektralprojektionen explizit zu kennen. Diese Problematik sowie der angedeutete Lösungsansatz ist in [69], Ch. VIII.5, ausführlich diskutiert. 16.27 Ausblick: Entwicklungen nach verallgemeinerten Eigenfunktionen Wenn der Operator A nur Punktspektrum hat, so nimmt der Spektralsatz die Form Aψ =
∞
λn en |ψ en
(16.48)
n=1
an. Dabei ist (λn ) die Folge der Eigenwerte (mit Vielfachheit gezählt!), und (en ) ist eine Orthonormalbasis aus entsprechenden Eigenvektoren. Der Beweis für diese Tatsache ergibt sich sofort aus Korollar 16.24, indem man wie in Beispiel 16.17b vorgeht. Im allgemeinen Fall liefert die rechte Seite von (16.48) immer noch den Beitrag des Punktspektrums zur Spektralzerlegung. Für den Beitrag des kontinuierlichen Spektrums versucht man, analoge Ausdrücke mit Integralen statt Reihen anzusetzen, etwa in der Form Aψ =
∞ n=1
λn en |ψ en +
σC (A)
λeλ |ψ eλ dλ ,
(16.49)
wobei das Objekt E λ ≡ |λ einen „Zustand“ repräsentiert, in dem die Observable exakt den Wert λ hat. Dem Einwand, dass solch ein Objekt in dem zu Grunde liegenden H ILBERTraum H nicht zu finden sei, wird damit begegnet, dass es sich ja auch nicht um einen physikalisch realistischen Zustand handle, sondern um eine Idealisierung. In vielen Fällen können solche Entwicklungen tatsächlich konkret in rigoros gültiger Form angegeben werden. Z. B. für den Impulsoperator P = −id/dx in L 2 (R1 ) gilt P = U −1 Mϕ U mit ϕ(κ) ≡ κ (Beispiel 16.22b), und, zumindest für ψ ∈ S1 , bedeutet dies ∞ ∞ 1 κeiκ x ψ(κ) dκ = κeκ (x)eκ |ψ dκ (16.50) (Pψ)(x) = √ 2π −∞ −∞
C
Unbeschränkte selbstadjungierte Operatoren
95
mit eiκ x eκ (x) := √ 2π und eκ |ψ :=
∞
−∞
eκ (y)ψ(y) dy .
Die spitzen Klammern bezeichnen hier also formal denselben Ausdruck, durch den auch das Skalarprodukt in L 2 (R1 ) definiert ist, doch sind sie hier als Abbildung L ∞ (R1 ) × S1 −→ C aufzufassen. Die Gültigkeit der Entwicklungsformel (16.50) für ψ ∈ S1 ist für alle praktischen Zwecke auch ausreichend, denn der selbstadjungierte Operator P ist ja der Abschluss (Satz 14.4b) von P S . 1
Für größere Klassen von Operatoren kann man solche Entwicklungen etwa mit Hilfe der Distributionstheorie angeben (vgl. z. B. [31]) oder mit Hilfe von Spektraldarstellungen [24]. Für S CHRÖDINGERoperatoren A = −Δ + V existieren auch spezielle Entwicklungen nach Eigenfunktionen des Differentialoperators, die vorgegebene Wachstumseigenschaften haben [81]. Durch all das kann aber die hier vorgestellte Theorie der Spektralmaße nicht ersetzt werden, und zwar aus den folgenden Gründen: • Häufig kommt man in (16.49) nicht mit dem L EBESGUEmaß dλ auf der λ-Achse aus, benötigt also doch die allgemeine Maßtheorie. • Keine der hier angedeuteten Theorien ist allgemeingültig – sie handeln immer nur von speziellen Typen von Operatoren. • Im Gegensatz zu der mit dem Spektralmaß formulierten Spektralzerlegung sind diese Entwicklungen meist nicht eindeutig. • Die Spektralmaße führen direkt zu den Wahrscheinlichkeitsmaßen μ(S) = ψ|E(S)ψ und damit zur statistischen Interpretation der Quantenmechanik. Dies leistet keine der verallgemeinerten Eigenfunktionsentwicklungen. • Der mathematische Aufwand, der für eine rigorose Begründung einer verallgemeinerten Eigenfunktionsentwicklung betrieben werden muss, ist mindestens so hoch wie der für die Theorie der projektorwertigen Spektralmaße.
Die Spektralschar eines selbstadjungierten Operators Das Spektralmaß E zu einem (beschränkten oder unbeschränkten) selbstadjungierten Operator A liefert mittels der Definitionsgleichung (15.32) eine Spektralschar (E λ )λ∈R , die mit A assoziiert wird und für die A=
∞ −∞
λ dE λ
(16.51)
96
16 Spektralsatz und quantenmechanische Dynamik
ist. Der Funktionalkalkül ist dann (zumindest für stetiges f ) durch f (A) =
∞ −∞
f (λ) dE λ
(16.52)
gegeben, und beides sind verallgemeinerte S TIELTJES-Integrale, d. h. Grenzwerte von entsprechenden R IEMANN -S TIELTJES-Summen, und zwar im Sinne der Operatornorm, wenn f und A beschränkt sind, sonst immerhin im Sinne der starken Operatorkonvergenz. Dieser Formulierung der Spektralzerlegung mittels Spektralscharen wird in der älteren Literatur zumeist der Vorzug gegeben, weil sie ohne allgemeine Maß- und Integrationstheorie auskommt. Bleibt man aber bei diesem elementaren Zugang, so kann man den Funktionalkalkül nur für stetige Funktionen definieren (oder bestenfalls für Funktionen, die sich nicht sehr von stetigen unterscheiden), und man handelt sich auch eine Reihe technischer Umständlichkeiten ein. Bemerkenswert ist allerdings die Gestalt, die Korollar 16.24 annimmt, wenn man es mittels Spektralscharen formuliert: Korollar 16.28 Sei (E λ )λ die Spektralschar zum selbstadjungierten Operator A, und sei λ0 ∈ R. Dann: a. λ0 ∈ ρ(A) ⇐⇒ es gibt δ > 0, für das gilt: |λ − λ0 | < δ ⇒ E λ = E λ0 . b. λ0 ∈ σ P (A) ⇐⇒ Pλ0 := limδ→0+ E λ0 − E λ0 −δ = 0, und Pλ0 ist dann der orthogonale Projektor auf den Eigenraum zu λ0 . c. λ0 ∈ σC (A) ⇐⇒ Pλ0 = 0, aber für δ, ε > 0 ist E λ0 +ε − E λ0 −δ = 0. Der Limes in der Definition von Pλ0 ist natürlich wieder im Sinne der starken Operatorkonvergenz zu verstehen. Nach Satz 15.11 ist die Funktion λ −→ E λ rechtsseitig stetig (bzgl. der starken Operatorkonvergenz), und, wie wir hier sehen, sind die Eigenwerte gerade die Sprungstellen, während die Punkte des kontinuierlichen Spektrums die Stetigkeitsstellen sind, in denen die Funktion jedoch nicht lokal konstant ist. Die Bezeichnung „kontinuierliches Spektrum“ für σC (A) rührt vermutlich von dieser Tatsache her.
D Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung Auch in diesem Abschnitt ist A stets ein (beschränkter oder unbeschränkter) selbstadjungierter Operator in dem komplexen H ILBERTraum H . Die Funktionen gt (λ) := eitλ , t ∈ R nehmen für reelles λ nur Werte vom Betrag 1 an, und für sie gilt gs gt = gs+t . Da der Funktionalkalkül eine ∗-Darstellung von M∞ ist, folgt hieraus für die Operatoren Ut := exp it A
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
97
Us+t = Us Ut = Ut Us
(16.53)
Ut∗ = Ut−1 = U−t
(16.54)
sowie
für alle s, t ∈ R. Die Schar (Ut , t ∈ R) bildet daher (in Bezug auf die Multiplikation von Operatoren) eine kommutative Gruppe von unitären Operatoren. Man definiert: Definition 16.29 Die Schar der Ut := exp it A, t ∈ R heißt die unitäre Transformationsgruppe, die vom selbstadjungierten Operator A erzeugt wird. Wir wenden uns nun ihren wichtigsten Eigenschaften zu: Satz 16.30 Sei Ut , t ∈ R die von A erzeugte unitäre Transformationsgruppe. a. Für jedes x ∈ D(A) gilt: iAx =
Ut x − x d Ut x , := lim t=0 t−→0 dt t
(16.55)
und umgekehrt existiert der Limes genau dann, wenn x ∈ D(A) ist. Der Operator iA heißt der infinitesimale Generator der Gruppe {Ut | t ∈ R}. b. Die Schar (Ut ) ist stark stetig bezüglich t ∈ R, d. h. für jedes t0 ∈ R und x ∈ H gilt: lim Ut x − Ut0 x = 0.
t−→t0
(16.56)
Beweis a. Zunächst bemerken wir, dass für t = 0 der Operator f t (A) =
1 (Ut − I ) − iA t
(16.57)
auf D(A) definiert ist und offenbar die zu der Funktion f t (λ) :=
1 itλ (e − 1) − iλ t
(16.58)
gehörende Operatorfunktion ist. Nun ist nach dem Mittelwertsatz der Differentialrechnung 1 itλ (e − 1) = iλeiλθt , t
0<θ <1
und daher | f t (λ)|2 ≤ |λ|2 |eiλθt − 1|2 ≤ 4|λ|2 .
(16.59)
98
16 Spektralsatz und quantenmechanische Dynamik
Nach Gl. (15.39) aus Satz 15.17 ist daher 2 ∞ ∞ 1 2 (Ut − I )x − iAx = | f t (λ)| dμx (λ) ≤ 4|λ|2 dμx (λ). t −∞
(16.60)
−∞
Ist nun x ∈ D(A), so ist die rechte Seite von (16.60) nach Satz 15.17 und dem Spektralsatz endlich. Da außerdem lim | f t (λ)|2 = 0
t−→0
ist, sind die Voraussetzungen des L EBESGUEschen Konvergenzsatzes für majorisierte Konvergenz erfüllt, und es folgt daher aus (16.60), dass 1 (Ut − I )x = iAx t−→0 t lim
(16.55)
für x ∈ D(A) gilt. Nehmen wir nun umgekehrt an, dass für ein gegebenes x ∈ H Gl. (16.55) gilt. Dann gibt es eine Konstante M ≥ 0, so dass 1 (Ut − I )x2 ≤ M 2 t
∀ t ∈ R,
(16.61)
weil Ut − I ≤ Ut + 1 = 2 ist. Da außerdem 1 2 lim (eitλ − 1) = |λ|2 t−→0 t ist, können wir das Lemma von FATOU (Satz 10.26) anwenden und bekommen ∞
∞ |λ| dμx (λ) = 2
−∞
−∞
eitλ − 1 2 lim dμx (λ) t−→0 t
∞ itλ e − 1 2 ≤ lim inf dμx (λ) t−→0 t −∞
1 2 = lim inf (Ut − I )x ≤ M 2 , t−→0 t und das bedeutet nach Satz 15.17a und dem Spektralsatz gerade, dass x ∈ D(A) ist, womit Teil a des Satzes bewiesen ist. b. Wegen der Gruppeneigenschaft Ut = Ut−t0 Ut0
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
99
genügt es, die Behauptung (16.56) für t0 = 0 zu zeigen. Zu x ∈ H und ε > 0 wählen wir y ∈ D(A) so, dass x − y < ε/4 (was möglich ist, weil D(A) dicht ist). Nach Teil a. hat t −1 (Ut y − y) dann für t → 0 einen Limes in H , bleibt also auch in einer Umgebung von t0 = 0 beschränkt. Also gibt es C > 0 so, dass Ut y − y ≤ C|t| für alle genügend kleinen |t|, und dann folgt Ut x − x ≤ Ut y − y + 2x − y < C|t| + ε/2. Für alle genügend kleinen |t| ist auch der erste Term < ε/2, und damit folgt (16.56). Als Anwendung bekommen wir die eindeutige Lösbarkeit der Anfangswertaufgabe für die S CHRÖDINGER-Gleichung: Satz 16.31 Sei A ein selbstadjungierter Operator in H . Dann ist für jedes x ∈ D(A) die Anfangswertaufgabe 1 d ψ(t) = Aψ(t) , i dt
ψ(0) = x
(16.62)
eindeutig lösbar. Die Lösung ist ψ(t) = Ut x
mit Ut = eit A .
(16.63)
Beweis Zu gegebenem x ∈ D(A) definieren wir ψ(t) durch (16.63). Für beliebiges t0 ∈ R haben wir dann lim
τ →0
ψ(t0 + τ ) − ψ(t0 ) Uτ − I = lim U t0 x τ →0 τ τ Uτ − I x = Ut0 (iAx). = Ut0 lim τ →0 τ
Mit Satz 16.30a folgt hieraus, dass ψ(t0 ) ∈ D(A) und iAψ(t0 ) = lim
τ →0
dψ ψ(t0 + τ ) − ψ(t0 ) = (t0 ) τ dt
ist. Damit ist gezeigt, dass für x ∈ D(A) auch Ut x ∈ D(A) für alle t ∈ R ist und dass ψ(t) die Anfangswertaufgabe (16.62) löst. Sind ϕ(t), ψ(t) zwei Lösungen, so setzen wir u(t) := ϕ(t) − ψ(t) ,
h(t) := u(t)2 .
Dann ist u (t) = iAu(t) ,
u(0) = 0.
100
16 Spektralsatz und quantenmechanische Dynamik
Für differenzierbare H -wertige Funktionen v, w auf einem Intervall gilt allgemein d v(t)|w(t) = v (t)|w(t) + v(t)|w (t) , dt was man genauso wie die Produktregel für skalare Funktionen beweist (vgl. auch Aufgabe 8.7). Für v = w = u ergibt das h (t) = iAu(t)|u(t) + u(t)|iAu(t) = i u(t)|Au(t) − Au(t)|u(t) = 0.
Also ist h konstant, d. h. h(t) = h(0) = 0 für alle t, woraus die Eindeutigkeit folgt. Beispiele 16.32 In einfachen Fällen kann man Ut = eit A berechnen, indem man die Anfangswertaufgabe (16.62) explizit löst. Von dieser Art sind die folgenden Beispiele. Der H ILBERTraum ist dabei jedesmal H = L 2 (Rn ). a. Die Ortsoperatoren Q k sind die Multiplikationsoperatoren mit πk (x) := xk , k = 1, . . . , n. Die Anfangswertaufgabe (16.62) lautet dann 1 ∂ ψ(t, x) = xk ψ(t, x) , i ∂t
ψ(0, x) = ψ0 (x)
mit gegebenem ψ0 ∈ H . Ihre Lösung ist offenbar ψ(t, x) = eit xk ψ0 (x), und damit ist Ut = exp it Q k der Multiplikationsoperator mit eit xk . b. Die Impulsoperatoren Pk sind die eindeutigen L 2 -Realisierungen von i−1 ∂/∂ xk . Ihre Definitionsbereiche enthalten den Raum Sn der schnell fallenden Testfunktionen (Definition 11.3), und für ψ0 ∈ Sn hat die Anfangswertaufgabe 1 ∂ 1 ∂ ψ(t, x) = ψ(t, x) , i ∂t i ∂ xk
ψ(0, x) = ψ0 (x)
die eindeutige Lösung ψ(t, x) = ψ0 (x + t ek ) = ψ0 (x1 , . . . , xk + t, . . . , xn ). Da Sn in L 2 (Rn ) dicht ist (Theorem 11.9), folgt hieraus (exp it Pk )ψ = ψ(· + t ek ) ,
k = 1, . . . , n.
c. Der H AMILTONoperator eines freien Teilchens ist die L 2 -Realisierung von −Δ, und wieder ist Sn in seinem Definitionsbereich enthalten. Für ψ0 ∈ Sn ist das C AUCHY-Problem ∂ψ(t, x) = −iΔx ψ(t, x) , ∂t
ψ(0, x) = ψ0 (x)
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
101
zu lösen, und seine Lösung ist nach Beispiel 13.26 für t = 0 gegeben durch 1 i|x − y|2 dn y. ψ(t, x) = ψ0 (y) exp 4t (2π t)n/2 (1 + i)n Rn Das ist also (e−itΔ ψ0 )(x), falls ψ0 ∈ Sn . Diese Formel lässt zwar nicht unmittelbar erkennen, dass der dadurch gegebene Operator sich stetig zu einem unitären Operator in L 2 (Rn ) fortsetzt, aber wir wissen aus Satz 16.31, dass es so ist. Der berühmte Satz von S TONE, den wir jetzt beweisen werden, besagt, dass die hier besprochenen stark stetigen unitären Transformationsgruppen sozusagen die einzig möglichen sind. Um dies genau zu formulieren, definieren wir: Definition 16.33 Eine stark stetige unitäre Einparametergruppe in H ist eine Schar (Ut )t∈R von Operatoren aus B(H ), für die (16.53), (16.54) und (16.56) gelten. Wegen (16.54) besteht die Schar also aus unitären Operatoren, und U0 = I . Bemerkung Oft wird nur schwache Stetigkeit verlangt, d. h. die Bedingung lim x|Ut y = x|Ut0 y
t→t0
(16.64)
für alle x, y ∈ H , t0 ∈ R. Offenbar folgt dies aus (16.56), aber für Scharen von unitären Operatoren sind die beiden Bedingungen sogar äquivalent. Ist nämlich (16.64) für alle x, y erfüllt, so folgt Ut0 x|Ut x → Ut0 x2 = x2 für t → t0 , also Ut0 x − Ut x2 = Ut0 x2 − 2Re Ut0 x|Ut x + Ut x2 = 2x2 − 2Re Ut0 x|Ut x −→ 0 für t → t0 . In den Grundlagen der Quantenmechanik wird aus physikalischen Erwägungen hergeleitet, dass die Dynamik – also die zeitliche Evolution – eines Systems, dessen Zustände durch die Einheitsvektoren des H ILBERTraums H beschrieben werden, durch eine stark stetige unitäre Einparametergruppe in H gegeben sein muss (vgl. etwa [45] oder [54]). Wie der Satz von S TONE (zusammen mit Satz 16.31) zeigt, ist diese Dynamik also auch als Lösung der Anfangswertaufgabe für eine S CHRÖDINGERgleichung mit selbstadjungiertem H AMILTONoperator gegeben. Theorem 16.34 (Satz von S TONE) Zu jeder stark stetigen unitären Einparametergruppe {Ut | t ∈ R} in H existiert ein eindeutig bestimmter selbstadjungierter Operator A in H , so dass Ut = eit A .
102
16 Spektralsatz und quantenmechanische Dynamik
Beweis Nach Satz 16.30 ist klar, dass wir A durch die Gleichung iAx := lim
1
t−→0 t
(Ut − I )x
(16.55)
zu definieren versuchen. Es sei D(A) die Menge der x ∈ H , für die der Grenzwert (16.55) existiert. Dann zeigen wir zuerst: a. D(A) ist ein dichter Teilraum von H . Dies zeigen wir, indem wir einen Teilraum D0 von D(A) konstruieren, der dicht in H liegt. Sei dazu eine Funktion ϕ ∈ D(R) = C0∞ (R) gewählt. Dann existiert x(ϕ) =
ϕ(s)Us x ds
(16.65)
R
als normales R IEMANN-Integral, weil die Schar (Us ) stark stetig ist.2 Aus (16.65) und der Gruppeneigenschaft (16.53) bekommen wir dann 1 lim (Ut − I )x(ϕ) = lim t−→0 t t−→0
R
= lim
t−→0
=−
R
1 ϕ(s)(Ut+s − Us )x ds t ϕ(s − t) − ϕ(s) Us x ds t
ϕ (s)Us x ds = −x(ϕ ),
R
d. h. der Limes (16.55) existiert für jedes x(ϕ), und das bedeutet, dass D0 := {x(ϕ) | x ∈ H, ϕ ∈ C0∞ (R)} ⊂ D(A).
(16.66)
Wir zeigen als nächstes, dass D0 dicht in H ist, woraus dann a. wegen (16.66) folgt. Dazu wählen wir eine sogenannte δ-Folge (ϕn ) aus D(R), also eine Folge mit 1 ϕn (s) ≥ 0 , ϕn (s) = 0 für |s| > , ϕn (s) ds = 1, (16.67) n R
wie wir sie schon im Anschluss an Theorem 11.7 sowie in Beispiel 11.24c besprochen haben. Für beliebiges x ∈ H ist dann 2
Derartige Integrale von stetigen Funktionen mit Werten in einem BANACHraum wurden in den Aufgaben 8.8 und 8.9 ausführlich diskutiert.
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
103
x(ϕn ) − x = ϕn (s)Us x dx − x Rn
= ϕn (s)[Us − I ]x ds R
≤ sup (Us − I )x. |s|≤ n1
Wegen Us x −→ x für s −→ 0 folgt hieraus lim x(ϕn ) − x = 0,
n−→∞
(16.68)
d. h. jedes x ∈ H kann durch eine Folge (x(ϕn )) aus D0 approximiert werden, und das bedeutet gerade D0 = H . b. A ist auf D(A) ein symmetrischer Operator. Seien nämlich x, y ∈ D(A). Dann folgt mit (16.55) und der Stetigkeit des Skalarproduktes # $ 1 x | Ay = −i lim x (Ut − I )y t−→0 t $ # 1 (U−t − I )x y = −i lim t−→0 t $ # 1 (U−t − I )x y = lim i t−→0 −t = iiAx | y = Ax | y , was die Symmetrie beweist. c. R(A ± iI ) ist dicht in H . Ist diese Behauptung gezeigt, so folgt, dass A wesentlich selbstadjungiert ist (man wende nämlich Satz 14.23b und Theorem 14.25 auf A¯ an). Wir wählen ein y ∈ R(A + iI )⊥ und zeigen y = 0. Für x(ϕ) ∈ D0 ist nach (16.65) Ut x(ϕ) =
ϕ(s)Ut+s x ds =
R
ϕ(s − t)Us x ds ∈ D0 , R
und aus (16.55) folgt dann d y | Ut x(ϕ) = y | iAUt x(ϕ) dt = −iA∗ y | Ut x(ϕ) .
104
16 Spektralsatz und quantenmechanische Dynamik
Nun ist aber y ∈ R(A + iI )⊥ = N (A∗ − iI ), d. h. es ist −iA∗ y = y, so dass wir bekommen d y | Ut x(ϕ) = y | Ut x(ϕ) . dt
(16.69)
Dies ist eine lineare Differentialgleichung erster Ordnung für die Funktion h(t) := y | Ut x(ϕ) ,
(16.70)
die sicher eine beschränkte Funktion ist, da Ut unitär ist. Sie erfüllt ferner h(0) = y | x(ϕ) .
(16.71)
Die Differentialgleichung (16.69) dagegen hat die eindeutige Lösung h(t) = h(0)et , die nur dann beschränkt ist, wenn h(0) = 0, d. h. (wegen (16.71)) wenn y | x(ϕ) = 0 ist. Also ist y ∈ D0⊥ = {0} und damit y = 0. Dies beweist, dass R(A + iI ) dicht in H ist, und für R(A − iI ) kann man den Beweis analog führen. d. A ist abgeschlossen Dies vervollständigt den Beweis, weil A schon wesentlich selbstadjungiert ist und damit als abgeschlossener Operator selbstadjungiert sein muss. iA ist nach (16.55) der infinitesimale Generator der Transformationsgruppe Ut . Wir setzen daher B := A
und Vt = eit B .
(16.72)
Dies ist möglich, da B selbstadjungiert ist. Nun zeigen wir Ut = Vt
für alle t ∈ R ,
(16.73)
weil daraus mit Satz 16.30 A = B und somit Abgeschlossenheit von A folgt. Sei also ein x ∈ D0 ⊆ D(A) ⊆ D(B) gewählt. Dann gilt, wie wir gezeigt haben U t x ∈ D0
und Vt x ∈ D(B),
und man hat nach Satz 16.30 d Vt x = iBVt x. dt
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
105
Wegen A = B auf D0 folgt daraus d (Ut x − Vt x) = iAUt x − iBVt x dt = iB(Ut x − Vt x). Da B selbstadjungiert ist, bekommt man hieraus für die Funktion h(t) := Ut x − Vt x2 wie am Schluss des Beweises von Satz 16.31 das Ergebnis h (t) ≡ 0. Also ist h(t) ≡ h(0) = 0, und wir folgern Ut x = Vt x für alle t ∈ R , x ∈ C0 . Da D0 dicht in H ist, folgt (16.73) und damit die Behauptung. 16.35 Ausblick: Operatoralgebren statt unbeschränkter Operatoren Statt des (unbeschränkten) selbstadjungierten Operators A kann man die abgeschlossene lineare Hülle A von allen seinen Spektralprojektionen E(S) , S ∈ B 1 betrachten. Wie aus der Bemerkung nach Satz 15.9 hervorgeht, ist A = R(Ψ ) = { f (A) | f ∈ M∞ (R)}, und insbesondere ist A eine kommutative C ∗ -Teilalgebra von B(H ). Man nennt sie die von A erzeugte VON N EUMANN-Algebra, und mittels des Spektralsatzes kann man selbstverständlich A aus A zurückgewinnen. Die Algebra A enthält offenbar die unitären Operatoren Ut = eit A und die Resolventen R A (ζ ) := (A − ζ I )−1 für ζ ∈ ρ(A). Nach Satz 16.30 lässt sich A schon aus der unitären Transformationsgruppe (Ut )t zurückgewinnen, und eine analoge Bemerkung gilt für die Resolventen, denn mittels der Formel von S TONE (Aufgabe 16.14) gewinnt man zunächst die Spektralschar und dann daraus das volle Spektralmaß. Zwar führen die naiven Quantisierungsvorschriften unmittelbar auf unbeschränkte Operatoren, doch erweist es sich für viele Zwecke als günstig, zu den VON N EUMANN-Algebren überzugehen. Hierfür sprechen auch physikalische Gründe – z. B. wird argumentiert, dass reale Messungen doch immer nur einen beschränkten Bereich von Werten für eine Observable liefern können, so dass für deren Beschreibung auch ein beschränkter selbstadjungierter Operator adäquat wäre (Korollar 16.25). 16.36 Ausblick: Unitäre Einparametergruppen und die kanonischen Vertauschungsrelationen In der klassischen Mechanik sind die Observablen eines Systems einfach die C ∞ -Funktionen auf dem Phasenraum M, der eine symplektische Mannigfaltigkeit ist. Da die üblichen Quantisierungsvorschriften immer nur lokale Situationen betreffen, können wir uns nach dem Satz von DARBOUX
106
16 Spektralsatz und quantenmechanische Dynamik
(Theorem 6.16) auf den Fall zurückziehen, wo M symplektische Koordinaten p1 , . . . , pn , q1 , . . . , qn hat, und dann ist jede Observable von der Form f ( p1 , . . . , pn , q 1 , . . . , q n ) mit einer C ∞ -Funktion f . In gewissem Sinne wird also die Observablenalgebra des Systems lokal von den symplektischen Koordinaten p j , qk erzeugt. Bei Quantisierung müssen diese durch entsprechende Impuls- und Ortsoperatoren P j , Q k ersetzt werden, die die kanonischen Vertauschungsrelationen P j Q k − Q k P j = −iI δ jk ,
j, k = 1, . . . , n
(16.74)
erfüllen (wie immer, setzen wir die physikalischen Konstanten gleich 1). Dies aber zwingt zur Betrachtung von unbeschränkten Operatoren, denn innerhalb von B(H ) können diese Relationen nicht erfüllt werden (Aufgabe 8.24). Allerdings stößt die exakte mathematische Formulierung der kanonischen Vertauschungsrelationen im Bereich unbeschränkter selbstadjungierter Operatoren auf fundamentale Schwierigkeiten (vgl. [69], Ch. VIII.5), und das fügt den schon im vorigen Abschnitt genannten Argumenten dafür, dass man stattdessen geeignete C ∗ -Teilalgebren von B(H ) betrachten sollte, ein weiteres gewichtiges Argument hinzu. Um einen geeigneten Kandidaten für solch eine Algebra zu finden, betrachten wir die unitären Transformationsgruppen U j (t) := exp (it P j ) ,
Vk (t) := exp (it Q k )
(16.75)
Die naheliegendsten Beispiele für Operatoren, die die kanonischen Vertauschungsrelationen (16.74) erfüllen, sind die L 2 (Rn )-Realisierungen der Operatoren Pj ψ =
1 ∂ψ , i ∂x j
Q k ψ = xk ψ,
die wir bis jetzt immer als die Impuls- bzw. Ortsoperatoren angesehen hatten. Für sie haben wir die entsprechenden unitären Transformationsgruppen in Beispiel 16.32 berechnet. Mit den dortigen Ergebnissen bekommen wir für ψ ∈ L 2 (Rn ) % & U j (s)Vk (t)ψ (x) = eit (xk +sδ jk ) ψ(x + se j ), & % Vk (t)U j (s)ψ (x) = eit xk ψ(x + se j ). Es gelten also die sog. W EYL-Relationen U j (s)Vk (t) = eiδ jk st Vk (t)U j (s).
(16.76)
Hat man umgekehrt in B(H ) 2n unitäre Einparametergruppen U j , Vk ( j, k = 1, . . . , n), die die W EYL-Relationen erfüllen, und bezeichnet man mit P j bzw. Q k
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
107
die selbstadjungierten Operatoren, von denen sie nach dem Satz von S TONE herrühren, so ergibt sich: Behauptung Für ψ ∈ D(P j Q k ) ∩ D(Q k P j ) gilt P j Q k ψ = −iδ jk ψ + Q k P j ψ. Beweis Wir betrachten feste j, k. Für ϕ ∈ D(P j ) ist nach (16.76) U j (−s)ϕ|Vk (t)ψ = eiδ jk st ϕ|Vk (t)U j (s)ψ . Anwenden von (1/i)∂/∂s auf beide Seiten und Auswerten bei s = 0 führt auf P j ϕ|Vk (t)ψ = δ jk tϕ|Vk (t)ψ + ϕ|Vk (t)P j ψ . Hierauf wenden wir (1/i)∂/∂t an und werten bei t = 0 aus. Wegen P j ψ ∈ D(Q k ) bekommen wir: P j ϕ|Q k ψ = −iδ jk ϕ|ψ + ϕ|Q k P j ψ . Wegen P j∗ = P j und Q k ψ ∈ D(P j ) bedeutet dies, dass ϕ|P j Q k ψ = ϕ|(−iδ jk ψ + Q k P j ψ) für alle ϕ aus dem dichten Teilraum D(P j ). Daher folgt die Behauptung.
Die kanonischen Vertauschungsrelationen sind also zumindest auf dem Teilraum erfüllt, wo die linke Seite von (16.74) definiert werden kann. Die Observablenalgebra eines Systems mit n Freiheitsgraden ist daher eine C ∗ Teilalgebra A von B(H ) (für einen geeigneten H ILBERTraum H ), die von 2n unitären Einparametergruppen U j , Vk erzeugt wird, welche die W EYL-Relationen erfüllen. Man nennt solch eine Algebra A eine Darstellung der W EYL-Relationen (oder auch der kanonischen Vertauschungsrelationen).3 Dass wir uns hier nicht auf einen bestimmten H ILBERTraum und eine bestimmte Algebra festlegen, schadet nichts, denn nach einem berühmten Eindeutigkeitssatz von J. V. N EUMANN sind die verschiedenen Möglichkeiten der Wahl von H und A in einem gewissen, ganz natürlichen Sinn äquivalent (s. [69], Ch. VIII.5). Systeme mit unendlich vielen Freiheitsgraden, wie sie für die Quantenfeldtheorie und die statistische Quantenphysik typisch sind, erfordern allerdings eine Observablenalgebra, die unendlich viele Einparametergruppen enthält, die (16.76) erfüllen, und dann ist die erwähnte Eindeutigkeit der Darstellung nicht mehr gegeben. Schon Die Einbettungsabbildung Ψ : A → B(H ) ist tatsächlich eine ∗-Darstellung von A im Sinne der Definition 15.14.
3
108
16
Spektralsatz und quantenmechanische Dynamik
im einfachsten Fall, nämlich bei einem quantisierten skalaren neutralen Feld, das für die Masse m > 0 die K LEIN -G ORDON-Gleichung erfüllt, entstehen für verschiedene Werte des Parameters m nicht-äquivalente Darstellungen der W EYL-Relationen (vgl. [66], Ch. X.7). All dies handelt aber von Systemen, die ein klassisches Analogon besitzen. Berücksichtigt man auch innere Quantenzahlen, so treten weitere Observable hinzu, die eigene Relationen erfüllen. Für ein Teilchen vom Spin 12 etwa benötigt man die Spineinstellungen Sx , S y , Sz in x, y und z-Richtung als weitere Observable, und diese erfüllen die Relationen [Sx , S y ] = iSz ,
[S y , Sz ] = iSx ,
[Sz , Sx ] = iS y
(16.77)
sowie Sx2 + S y2 + Sz2 =
3 I. 4
(16.78)
Diese Relationen können ohne weiteres durch beschränkte Operatoren dargestellt werden, sogar durch 2 × 2-Matrizen, nämlich durch Sx =
1 σx , 2
Sy =
1 σy , 2
Sz =
1 σz 2
mit den PAULIschen Spinmatrizen σx , σ y , σz , und wieder ist diese Darstellung in gewissem Sinne eindeutig. Aber auch hier geht die Eindeutigkeit verloren, sobald man es mit unendlich vielen Freiheitsgraden zu tun hat. Ein einfaches Beispiel hierfür, das nur mit Spinkonfigurationen arbeitet, findet sich in [78].
Aufgaben zu Kap. 16 16.1 Hier betrachten wir ausnahmsweise den H ILBERTraum H = Cn , n ∈ N. a. Sei T ∈ B(H ) = EndC (H ) eine lineare Abbildung, deren n Eigenwerte alle verschieden sind. Man zeige: Sind f (z), g(z) Polynome mit f (λ) = g(λ) für alle Eigenwerte λ von T , so ist f (T ) = g(T ). (Hinweis: Man berechne f (T ) − g(T ) in einer Basis, in der die Matrix zu T Diagonalgestalt besitzt. Wieso gibt es solch eine Basis?) b. Man zeige: Jedes T ∈ B(H ) kann als Grenzwert T = limν→∞ Tν geschrieben werden, wobei jedes Tν lauter verschiedene Eigenwerte besitzt. (Hinweis: Aus der linearen Algebra ist bekannt, dass es eine Basis gibt, in der die Matrix zu T Dreiecksgestalt hat mit den Eigenwerten in der Diagonale. Um die Tν zu konstruieren, ändere man diese Diagonalelemente leicht ab.) c. Man folgere den Satz von C AYLEY-H AMILTON: Für jedes T ∈ EndC (H ) ist χT (T ) = 0, wobei χT das charakteristische Polynom von T bezeichnet.
Aufgaben
109
16.2 Sei H ein beliebiger komplexer H ILBERTraum. Man zeige: Jedes T ∈ B(H ) kann als Linearkombination von (höchstens) vier unitären Operatoren geschrieben werden. (Hinweis: Zunächst zeige man: Ist A =√ A∗ und A ≤ 1, so ist A = 1 ∗ 2 2 (U + U ) mit U = f (A), wobei f (λ) := λ + i 1 − λ für −1 ≤ λ ≤ 1.) k 16.3 Sei A ∈ B(H ) selbstadjungiert, und sei f (z) = ∞ k=0 ck z eine Potenzreihe mit Konvergenzradius R > A. Man zeige, dass dann f (A) =
∞
ck Ak
k=0
gilt, wobei die Reihe in der Operatornorm konvergiert. Insbesondere ist für ζ ∈ C der durch den stetigen Funktionalkalkül gegebene Operator exp ζ A gleich dem in den Aufgaben 8.5 und 8.19 besprochenen Operator exp ζ A. 16.4 Sei A ∈ B(H ) , A = A∗ . Man zeige: A ist positiv und invertierbar genau dann, wenn es ein δ > 0 gibt mit A ≥ δ I im Sinne von Aufgabe 15.4. 16.5 Für einen beliebigen Operator T ∈ B(H ) zeige man: a. T ∗ T invertierbar ⇐⇒ T invertierbar ⇐⇒ T T ∗ invertierbar. b. Ist T invertierbar, so ist R := (T ∗ T )1/2 positiv und invertierbar. c. Ist T invertierbar, R := (T ∗ T )1/2 und U := T R −1 , so ist U unitär. Bemerkung Allgemein schreibt man R = |T | := (T ∗ T )1/2 . Man kann beweisen, dass dann T = UR gilt mit einem isometrischen Operator U ∈ B(H ) (Polarzerlegung). Die Isometrie U ist genau dann unitär, wenn T invertierbar ist. Die Polarzerlegung von Operatoren wird in den meisten Lehrbüchern der Funktionalanalysis behandelt, z. B. in [69]. 16.6 Für selbstadjungiertes A ∈ B(H ) setzen wir |A| := (A2 )1/2 ,
A± :=
1 (|A| ± A). 2
Man zeige: a. A+ und A− sind positive selbstadjungierte Operatoren, die mit A vertauschen. Ferner ist A = A+ − A− und |A| = A+ + A− . Wie kann man A± mittels des stetigen Funktionalkalküls aus A gewinnen? b. Sei E das Spektralmaß zu A und E 0 := E(] − ∞, 0]). Für x ∈ H gilt dann: x ∈ R(E 0 )
⇐⇒
A+ x = 0.
110
16
Spektralsatz und quantenmechanische Dynamik
c. Für die Spektralschar (E λ )λ , die mit A assoziiert ist, gilt: E λ ist die orthogonale Projektion auf den abgeschlossenen Unterraum N ((A − λI )+ ). Bemerkung Das Ergebnis von Teil c liefert eine verblüffend elementare Konstruktion der Spektralschar zu A. Man benötigt dazu noch nicht einmal den stetigen Funktionalkalkül, sondern nur die Existenz und Eindeutigkeit der positiven Quadratwurzel. Der Spektralsatz in der Form (16.51) kann über diesen Zugang bewiesen werden (vgl. etwa [70]). 16.7 Sei A ∈ B(H ) ein positiver selbstadjungierter Operator (Beispiel 16.9), und sei E das entsprechende Spektralmaß. Man zeige: Für jede B ORELmenge S ⊆ R ist durch ∞ √ W := (1 − 2χ S (λ)) λ dE(λ) 0
eine selbstadjungierte Quadratwurzel von A definiert, d. h. es ist W ∈ B(H ) , W = W ∗ und W 2 = A. Man gebe einen abgeschlossenen linearen Teilraum U an, für den gilt: W = A1/2 auf U, W = −A1/2 auf U ⊥ . 16.8 Sei A ein (möglicherweise unbeschränkter) selbstadjungierter Operator in H , sei E sein Spektralmaß, und sei J ein beschränktes Intervall mit unterer Grenze a und oberer Grenze b. Man zeige: Ist ψ ∈ R(E(J )) und ψ = 1, so ist a ≤ ψ|Aψ ≤ b und Aψ − λ0 ψ ≤ b − a für alle λ0 ∈ J . (Hinweis: Man verwende (15.38) und (15.39) aus Satz 15.17.) 16.9 Sei E das Spektralmaß zum selbstadjungierten Operator A, und sei S ⊆ R eine B ORELmenge. Man zeige: a. E(S)A ⊂ AE(S). b. Ist S beschränkt, so ist U(S) := R(E(S)) ⊆ D(A). Der Unterraum U(S) ist dann A-invariant, und die Einschränkung A0 von A auf U(S) ist ein beschränkter selbstadjungierter Operator im H ILBERTraum U(S). c. Unter den Voraussetzungen von Teil b. ist σ (A0 ) ⊆ S. (Hinweis: Ist λ0 ∈ R\S, so ist die Funktion g(λ) := (λ − λ0 )−1 χ S (λ) beschränkt und messbar auf ganz R.) 16.10 Sei A in H selbstadjungiert und δ > 0 gegeben. Man zeige: Jedes x ∈ H kann als Summe einer konvergenten Reihe x=
∞
xk
k=−∞
geschrieben werden, wobei Axk − kδxk ≤ δxk
∀k ∈ Z
Aufgaben
111
und xk |x = 0 für k = ist. (Hinweis: Mit dem Spektralmaß E zu A setzt man xk := E(](k − 1)δ, kδ])x und verwendet die vorige Aufgabe. Man beachte, dass xk = 0 für gewisse k zugelassen ist.) 16.11 Man zeige, dass für selbstadjungierte Operatoren A in H die folgenden Bedingungen äquivalent sind: x|Ax ≥ 0 für alle x ∈ D(A). σ (A) ⊆ [0, ∞[. Es gibt ein selbstadjungiertes W mit W 2 = A.
(i) (ii) (iii)
(Hinweis: Für (i) ⇒ (ii) verwende man Aufgabe 14.6, für (ii) ⇒ (iii) den Spektralsatz.) Bemerkung Sind diese Bedingungen erfüllt, so nennt man A positiv semidefinit oder kurz positiv und schreibt A ≥ 0. 16.12 Sei A in H selbstadjungiert, und seien f, g ∈ M∞ (R) reellwertig. Man zeige: Ist f (λ) ≤ g(λ) für alle λ ∈ R, so ist f (A) ≤ g(A) im Sinne von Aufgabe 15.4. 16.13 Sei A ein selbstadjungierter Operator in H , und sei g : [a, b] × R → C eine b g(t, λ) dt. Man zeige: Für alle beschränkte stetige Funktion, ferner f (λ) := a
x ∈ H ist g(t, A)x eine stetige H -wertige Funktion von t, und es gilt f (A)x =
b
g(t, A)x dt, a
wobei das Integral im Sinne von Aufgabe 8.8 zu verstehen ist. (Hinweis: Man verwende für beide Behauptungen (15.39) und den Satz von der dominierten Konvergenz. Das Integral wird dabei durch R IEMANNsche Zwischensummen bezüglich einer Folge von Zerlegungen und Stützstellen approximiert, die nicht von λ abhängt.) 16.14 Sei A ein selbstadjungierter Operator in H , und für ζ ∈ ρ(A) sei R A (ζ ) = (A − ζ I )−1 seine Resolvente. Ferner sei [a, b] ⊆ R ein kompaktes Intervall. Man zeige, dass im Sinne der starken Operatorkonvergenz gilt: a. Für jedes ε > 0 ist a
b
A − aI A − bI − arctan (R A (τ + iε) − R A (τ − iε)) dτ = 2i arctan ε ε
(Hinweis: Aufgabe 16.13 rechtfertigt die durchzuführenden Rechnungen.)
.
112
16
Spektralsatz und quantenmechanische Dynamik
b. Für das Spektralmaß E zu A gilt die sog. S TONEsche Formel 1 ε→0+ π i
b
lim
(R A (τ + iε) − R A (τ − iε)) dτ = E([a, b]) + E(]a, b[).
a
(Hinweis: Man verwende (15.39) und den Satz von der dominierten Konvergenz, um festzustellen, was mit dem Ergebnis von Teil a. für ε → 0+ passiert.) 16.15 Sei A selbstadjungiert und E sein Spektralmaß. Sei ferner B ∈ B(H ) ein Operator, der mit allen Spektralprojektionen E(S) vertauscht. Man zeige: a. Für alle f ∈ M gilt B f (A) ⊂ f (A)B. (Hinweis: Man zeige zunächst, dass μ Bx (S) ≤ B μx (S).) b. Für alle g ∈ M∞ ist Bg(A) = g(A)B. Insbesondere vertauscht B mit allen Ut = eit A und mit allen Resolventen (A − ζ I )−1 , ζ ∈ ρ(A). 16.16 Für ζ ∈ C mit |ζ | = 1 betrachten wir die selbstadjungierten Operatoren L ζ in L 2 (J ), die in Beispiel 14.28 eingeführt wurden, der Einfachheit halber aber nur (ζ ) für das Intervall J = [0, 1]. Wir setzen Ut := exp (it L ζ ), und wir definieren (ζ ) Operatoren Vt ∈ B(L 2 (J )) folgendermaßen: Zu jedem f ∈ L 2 (J ) definieren wir eine „periodische Fortsetzung mit Phasenverschiebung ζ “ durch f (x) := ζ m f (x − m) für m ≤ x < m + 1 ,
m∈Z
und setzen (ζ )
[Vt
f ](x) := f (x + t)
für 0 ≤ x ≤ 1, t ∈ R .
Außerdem sagen wir, eine Funktion g : R → C sei ζ -periodisch, wenn g(x + 1) = ζ g(x)
∀x ∈ R
gilt. Man zeige nacheinander: a. Jedes f ist ζ -periodisch, und jede ζ -periodische Funktion entsteht auf diese Weise aus ihrer Einschränkung auf J . b. Ist g ζ -periodisch, so auch gs , wo gs (x) := g(x + s) , s ∈ R. (ζ ) c. Die Vt , t ∈ R bilden eine unitäre Einparametergruppe in L 2 (J ). Sei iAζ ihr infinitesimaler Generator gemäß dem Satz von S TONE. f ∈ C 1 (R), und es gilt d. Ist f ∈ C 1 (J ) ∩ Dζ (Notation aus Beispiel 14.28), so ist (ζ )
lim
t→0
Vt
f − f = f . t
Aufgaben
113
e. Aζ = L ζ . (Hinweis: Da beide Operatoren selbstadjungiert sind, genügt es, L ζ ⊂ Aζ zu zeigen.) (ζ ) (ζ ) f. Ut = Vt für alle t. 16.17 Sei v ein C ∞ -Vektorfeld im Gebiet Ω ⊆ Rn . Wir nehmen der Einfachheit halber an, es besitze in Ω einen globalen Fluss (Φt )t∈R (vgl. die Definitionen in 3.21). Wir definieren lineare Operatoren Ut0 : D(Ω) → D(Ω) für t ∈ R durch Ut0 ψ := ψ ◦ Φt . Man zeige: 0 = U 0 U 0 . Ferner ist U 0 = I , und die U 0 sind a. Für alle s, t ∈ R ist Us0 Ut0 = Us+t t s t 0 0 . bijektiv mit (Ut0 )−1 = U−t b. Für alle ψ ∈ D(Ω) gilt
1 0 Ut ψ − ψ = vψ . t→0 t lim
c. Für 1 ≤ p < ∞ und alle ψ ∈ D(Ω) gilt: d dt t=0
0 p n |ψ(x)| p div v(x) dn x . Ut ψ d x = − Ω
Ω
(Hinweis: Man verwende die Transformationsformel (Korollar 4.13) mit f = Φ−t , ω = |Ut0 ψ| p dx1 ∧ · · · ∧ dxn und beachte auch Korollar 4.21 sowie die Definition der L IE-Ableitung eines kovarianten Tensorfeldes in Definition 3.23.) d. Ist v divergenzfrei, so haben die Ut0 eindeutige stetige Fortsetzungen Ut auf (Hinweis: Man beL 2 (Ω), und diese bilden eine unitäre Einparametergruppe. nötigt Teile a. und c., um zu zeigen, dass h(t) := Ω |Ut0 ψ|2 dn x auf ganz R verschwindende Ableitung hat!) e. Sei v divergenzfrei, und L v (x, D) sei der in Aufgabe 14.7 eingeführte formal selbstadjungierte Differentialoperator. Seine minimale L 2 -Realisierung besitzt dann eine selbstadjungierte Erweiterung Av . (Hinweis: Man verwende den Satz von S TONE.)
Teil IV
Gruppen und Darstellungen
Kapitel 17
Grundsätzliches über Gruppen
Der mathematische Gruppenbegriff kodiert eine Situation, die man in Mathematik und Physik an den verschiedensten Stellen antrifft, und die Beschäftigung mit Gruppen verteilt sich daher auch auf diverse Teildisziplinen. Die Theorie der diskreten Gruppen – d. h. der Gruppen, deren Elemente man sich als einzelne Punkte vorstellen sollte – gehört in die Algebra, und schon hier ist es ein großer Unterschied, ob man sich mit endlichen oder unendlichen Gruppen befasst. In der Theorie der topologischen Gruppen treten Aspekte aus Topologie und Funktionalanalysis hinzu, und bei der Behandlung von L IEschen Gruppen schließlich werden Begriffe und Methoden aus Algebra, Topologie, Differentialgeometrie und Funktionalanalysis herangezogen. Viele konkret wichtige Gruppen bestehen aus Matrizen, und daher benötigt man zu ihrer Untersuchung auch Werkzeuge aus der linearen Algebra und Matrizentheorie. Die Untersuchung von Kristallen in Physik und physikalischer Chemie führt ganz natürlich auf gewisse Fragestellungen über endliche Gruppen, doch ihre wirkliche Popularität haben die Gruppen in der Physik durch ihre Bedeutung in der Atom- und Elementarteilchenphysik gewonnen. Was dabei wirklich auftritt, sind L IE-Gruppen und zumeist konkrete Matrixgruppen: Die L ORENTZgruppe und die P OINCARÉgruppe werden zur Formulierung der Kovarianzeigenschaften relativistischer Systeme benötigt, bei der theoretischen Beschreibung des Drehimpulses in der Quantenmechanik, des Spins und anderer innerer Quantenzahlen treten gewisse Matrixgruppen auf, und schließlich bezieht sich jede Eichtheorie auf eine vorgegebene L IE-Gruppe als sog. Strukturgruppe. In diesem Kapitel führen wir einige Grundbegriffe ein, die für jedwede Art von Gruppen benötigt werden, illustrieren sie durch Beispiele und diskutieren ihre anschauliche und physikalische Bedeutung im Zusammenhang mit Symmetrien und Invarianzen. In den nächsten Kapiteln werden wir uns dann auf L IE-Gruppen und vor allem auf die physikalisch interessanten Matrixgruppen konzentrieren. Erst die Einführung der Darstellungstheorie in Kap. 20 erfolgt wieder in allgemeinerem Rahmen, doch bei ihrer Anwendung auf die Quantenmechanik stehen die vorher besprochenen Matrixgruppen im Vordergrund.
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_17, C Springer-Verlag Berlin Heidelberg 2010
117
118
17 Grundsätzliches über Gruppen
A Gruppen und Homomorphismen Wir stellen zunächst die wichtigsten Begriffe und Beispiele zusammen. Alle Behauptungen, die hier nicht bewiesen werden, können durch sehr einfache Rechnungen verifiziert werden. Wir empfehlen dem Leser jedoch besonders dringend, diese Rechnungen wirklich durchzuführen, um sich an den Umgang mit Gruppen zu gewöhnen. Definitionen 17.1 a. Eine Menge G = ∅ heißt eine Gruppe mit der Verknüpfung G × G (g1 , g2 ) −→ g1 g2 ∈ G, wenn gilt 1. Assoziativgesetz: (ab)c = a(bc)
∀ a, b, c ∈ G.
2. Neutrales Element: Es gibt genau ein e ∈ G mit ea = ae = a
∀ a ∈ G.
3. Inverses Element: Zu jedem a ∈ G existiert genau ein a −1 ∈ G mit aa −1 = a −1 a = e. Gilt zusätzlich das Kommutativgesetz ab = ba
∀ a, b ∈ G,
so heißt G eine abelsche Gruppe.1 Hat G endlich viele Elemente, so heißt G eine endliche Gruppe und die Anzahl |G| der Elemente die Ordnung von G. b. Eine Teilmenge H ⊆ G, welche bezüglich der Verknüpfung von G selbst eine Gruppe ist, heißt eine Untergruppe von G. Dies ist genau dann der Fall, wenn 1. h 1 , h 2 ∈ H ⇒ h 1 h 2 ∈ H, 2. h ∈ H ⇒ h −1 ∈ H. c. Man schreibt H ≤ G bzw. H < G, wenn H eine Untergruppe (bzw. eine echte Untergruppe) der Gruppe G ist. 1
Eigentlich müsste man „A BELsche Gruppe“ schreiben, denn die Bezeichnung spielt auf den norwegischen Mathematiker N IELS H ENRIK A BEL an.
A
Gruppen und Homomorphismen
119
Der Durchschnitt von Untergruppen ist offenbar wieder eine Untergruppe von G. Beispiele 17.2 (Gruppen von Zahlen) a. R ist eine abelsche Gruppe bezüglich der Addition. Man bezeichnet sie mit (R, +). Z ist eine Untergruppe von (R, +). b. R∗ := R\{0} ist eine abelsche Gruppe bezüglich der Multiplikation. R+ := {x ∈ R | x > 0} und {1, −1} sind Untergruppen von R∗ . c. C ist bezüglich der Addition eine abelsche Gruppe, bezeichnet mit (C, +), und (R, +) ist eine Untergruppe von (C, +). d. C∗ := C\{0} ist bezüglich der Multiplikation eine abelsche Gruppe, und R∗ und U(1) := {eiα | α ∈ R} = {a ∈ C | |a| = 1} sowie auch {1, i, −1, −i} sind Untergruppen von C∗ . Statt Zahlen kann man hier auch Vektoren betrachten, also Elemente eines Vektorraums: Jeder Vektorraum ist bezüglich der Vektoraddition eine abelsche Gruppe. Die fundamentale Bedeutung des Gruppenbegriffs rührt jedoch viel eher von dem folgenden Beispieltyp her: Beispiele 17.3 (Transformationsgruppen) a. Bei jeder nichtleeren Menge M bilden die bijektiven Abbildungen A : M → M bezüglich der Verkettung (= Hintereinanderausführung) von Abbildungen eine Gruppe (S(M), ◦). Das neutrale Element ist hier die identische Abbildung id M , und das inverse Element zu einer Bijektion A ist die inverse Bijektion A−1 . b. Ist M eine endliche Menge, etwa M = {1, 2, . . . , n}, so nennt man die Bijektionen von M auf sich selbst auch Permutationen. Die Gruppe S(n) aller Permutationen von {1, . . . , n} heißt die symmetrische Gruppe vom Grad n. Permutationen tauchen schon in der elementaren linearen Algebra im Zusammenhang mit Determinanten auf (vgl. etwa [34], Kap. 5) oder auch bei der Behandlung von alternierenden Multilinearformen (vgl. Abschn. 2C). c. Wenn die Menge M irgendwie strukturiert ist, so bilden die Bijektionen A ∈ S(M), bei denen sowohl A als auch A−1 die Struktur in einem vernünftigen Sinn „respektieren“, eine Untergruppe von S(M). Diese nennt man die Automorphismengruppe der strukturierten Menge M. Wir wollen diese Begriffe nicht exakt definieren, sondern sie nur durch einige Beispiele illustrieren: Ist M ein topologischer Raum, so sind die stetigen Abbildungen die strukturtreuen, und die Automorphismengruppe ist dann die Gruppe aller Homöomorphismen M → M. Ist M eine differenzierbare Mannigfaltigkeit, so wird die Struktur von den C ∞ Abbildungen respektiert, und die Automorphismengruppe ist die Gruppe aller Diffeomorphismen von M auf sich. Bei einer (pseudo)-R IEMANNschen Mannigfaltigkeit (M, g) handelt es sich um die Isometrien, bei einer symplektischen Mannigfaltigkeit (M, ω) um die symplektischen Diffeomorphismen, also die kanonischen Transformationen. Ist V ein K-Vektorraum, so sind die K-linearen Abbildungen die strukturtreuen, und die Automorphismengruppe besteht daher
120
17 Grundsätzliches über Gruppen
aus den linearen Bijektionen (die Umkehrung einer linearen Abbildung ist ja automatisch ebenfalls linear!). Ist schließlich H ein H ILBERTraum, so sind die isometrischen linearen Abbildungen die strukturtreuen, und die Automorphismengruppe besteht daher aus den unitären Operatoren in H . Man bezeichnet sie als die unitäre Gruppe U(H ). Bei endlichdimensionalen Vektorräumen kann man die linearen Abbildungen natürlich durch Matrizen beschreiben, und die Bijektionen entsprechen dann den regulären Matrizen. Der Verkettung der linearen Abbildungen entspricht die Matrixmultiplikation, und so entstehen aus den Automorphismengruppen von endlichdimensionalen Vektorräumen Gruppen von Matrizen. Diese Gruppen – und etliche ihrer Untergruppen – sind besonders wichtig, und wir führen für sie Standardbezeichnungen ein: Definitionen 17.4 Allgemeine lineare Gruppe über C: G L (n, C) := {A ∈ Cn×n | det A = 0}, allgemeine lineare Gruppe über R: G L (n, R) := {A ∈ Rn×n | det A = 0}, spezielle lineare Gruppe über C: SL (n, C) := {A ∈ Cn×n | det A = 1}, spezielle lineare Gruppe über R: SL (n, R) = {A ∈ Rn×n | det A = 1}. Es gilt G L (n, R) < G L (n, C) , SL (n, C) < G L (n, C), SL (n, R) < SL (n, C) , SL (n, R) < G L (n, R). Alle diese Behauptungen folgen aus dem Determinanten-Multiplikationssatz. Ausgehend von einer festen Matrix G kann man Untergruppen der linearen Gruppen definieren, die für die Anwendungen besonders interessant sind. Es handelt sich im reellen (bzw. im komplexen) Fall um die Gruppe OG (n) (bzw. UG (n)) der reelllinearen Transformationen des Rn (bzw. der komplex-linearen Transformationen des Cn ), die die zu G gehörige Sesquilinearform aG (v, w) := v|Gw
A
Gruppen und Homomorphismen
121
invariant lassen. Wir beschreiben dies zunächst in allgemeinem Rahmen durch den folgenden Satz: Satz 17.5 a. Sei G ∈ Rn×n gegeben. Für reelle n × n-Matrizen S sind dann die folgenden beiden Bedingungen äquivalent: Sv|G Sw = v|Gw
∀ v, w ∈ Rn
(17.1)
und S T G S = G.
(17.2)
Die Menge OG (n) aller invertierbaren S ∈ Rn×n , die diese Bedingungen erfüllen, bildet eine Untergruppe von G L(n, R). Ihre Elemente nennt man G-orthogonale Transformationen. b. Sei G ∈ Cn×n gegeben. Für komplexe n × n-Matrizen T sind dann die folgenden beiden Bedingungen äquivalent: T v|GT w = v|Gw
∀ v, w ∈ Cn
(17.3)
und T ∗ GT = G.
(17.4)
Die Menge UG (n) aller invertierbaren T ∈ Cn×n , die diese Bedingungen erfüllen, bildet eine Untergruppe von G L(n, C). Ihre Elemente nennt man G-unitäre Transformationen. c. Ist G invertierbar, so ist | det S| = 1,
| det T | = 1
für S ∈ OG (n) bzw. für T ∈ UG (n). Der Beweis erfolgt durch einfache Matrizenrechnungen und ist z. B. in [34], Kap. 19, ausführlich dargestellt. Durch spezielle Wahlen der Matrix G erhält man nun die folgenden Gruppen: Definitionen 17.6 Sei 0 ≤ p ≤ n, q = n − p und sei G := E p ⊕ (−E q ), d. h. G ist die n × n-Diagonalmatrix, die zunächst p mal die 1, dann q mal die −1 als Eintrag in der Diagonalen hat. a. Dann ist die orthogonale Gruppe der Signatur ( p, q) definiert durch O( p, q) := O G (n) ≡ {A ∈ Rn×n | A T G A = G},
122
17 Grundsätzliches über Gruppen
und die spezielle orthogonale Gruppe der Signatur ( p, q) ist S O( p, q) = O( p, q) ∩ SL (n, R). Man nennt O(n) := O(n, 0) ,
S O(n) := S O(n, 0)
die orthogonale bzw. spezielle orthogonale Gruppe. b. Die unitäre Gruppe der Signatur ( p, q) ist definiert durch U( p, q) := U G (n) ≡ {A ∈ Cn×n | A∗ G A = G}. und die spezielle unitäre Gruppe der Signatur ( p, q) ist SU( p, q) = U( p, q) ∩ SL(n, C). Man nennt U(n) = U(n, 0)
bzw. SU(n) = SU(n, 0)
die unitäre bzw. spezielle unitäre Gruppe. c. Sei n = 2m gerade und E = E m ∈ Rm×m die Einheitsmatrix. Ferner sei
0 E J := −E 0
∈ Rn×n ,
also J T = J −1 = −J.
Dann ist die symplektische Gruppe definiert durch Sp(n) := O J (n) ≡ {A ∈ Rn×n | A T J A = J }. Diese Gruppen nennt man auch die klassischen Gruppen, und man begegnet ihnen überall in Mathematik und Physik an entscheidenden Stellen. Wir notieren hier noch einige einfache Eigenschaften ihrer Elemente: Satz 17.7 Ist A ∈ O( p, q) oder A ∈ U( p, q) oder A ∈ Sp(n), so gilt | det A| = 1. Ferner ist A−1 = G A T G −1
∗
falls A ∈ O( p, q),
A = G A G falls A ∈ U( p, q), A−1 = −J A T J falls A ∈ Sp(n)
A
Gruppen und Homomorphismen
123
Beweis Wegen G 2 = E und J 2 = −E können wir jedesmal 17.5c anwenden und erhalten in allen Fällen | det A| = 1, insbesondere die Existenz von A−1 . Ferner folgt: – in O( p, q) : (G A T G)A = G(A T G A) = G 2 = E – in U( p, q) : (G A∗ G)A = G(A∗ G A) = G 2 = E – in Sp(n) : (J A T J )A = J (A T J A) = J 2 = −E,
womit die Formeln für die inverse Matrix gezeigt sind.
Anmerkung 17.8 Die symplektischen Matrizen A ∈ Sp(2m) beschreiben die linearen kanonischen Transformationen aus der klassischen Mechanik. Um dies näher zu erläutern, versehen wir R2m mit der kanonischen symplektischen Form ω=
m
dxk ∧ dyk
k=1
(vgl. Beispiel 1 aus Abschn. 6C). Wie man leicht explizit nachrechnet, ist dann ω(v, w) = v|J w
(17.5)
für Vektoren v, w ∈ R2m . Wegen der Äquivalenz von (17.2) mit (17.1) ist daher A ∈ Sp(2m)
⇐⇒
α∗ω = ω
für den Diffeomorphismus α : R2m −→ R2m , x −→ Ax . Das bedeutet, dass die durch A beschriebene lineare Transformation der symplektischen Mannigfaltigkeit (R2m , ω) genau dann eine kanonische Transformation ist, wenn A zur symplektischen Gruppe gehört. Hieraus folgt eine Verschärfung von Satz 17.7 für die symplektische Gruppe: Behauptung det A = 1
für alle A ∈ Sp(2m) .
Beweis Die 2m-Form ωm verschwindet nirgends (Satz 6.18 oder direkte Rechnung), und aus α ∗ ω = ω folgt α ∗ (ωm ) = ωm . Andererseits ist α ∗ (ωm ) = (det α)ωm nach (2.12), also det A = det α = 1.
124
17 Grundsätzliches über Gruppen
Bemerkung Ein elementarer Beweis für diese Behauptung findet sich in [34] (Ergänzungen zu Kap. 24).
Homomorphismen und Isomorphismen Das Analogon zu den linearen Abbildungen zwischen Vektorräumen bilden die Homomorphismen von Gruppen: Definitionen 17.9 Seien G, H Gruppen, eG , e H ihre neutralen Elemente, und ϕ : G −→ H eine Abbildung. a. ϕ heißt ein Gruppenhomomorphismus, wenn ϕ(g1 g2 ) = ϕ(g1 )ϕ(g2 )
∀ g1 , g2 ∈ G.
(17.6)
Man setzt Kern ϕ = {g ∈ G | ϕ(g) = e H }, Bild ϕ = {h ∈ H | h = ϕ(g) für ein g ∈ G}. b. Ist Bild ϕ = H , d. h. ϕ surjektiv, so heißt ϕ ein Epimorphismus (von Gruppen). Ist Kern ϕ = {eG }, so heißt ϕ ein Monomorphismus (von Gruppen). Ist ϕ bijektiv, so heißt ϕ ein Isomorphismus (von Gruppen). c. Zwei Gruppen G 1 , G 2 werden als isomorph bezeichnet, wenn es einen Isomorphismus G 1 → G 2 gibt. Schreibweise: G 1 ∼ = G2. Ähnlich wie bei linearen Abbildungen liegt der entscheidende Nutzen der Bedingung (17.6) darin, dass beliebige Relationen zwischen Elementen von G nach Anwendung eines Homomorphismus ϕ : G → H in analoge Relationen zwischen den jeweiligen Bildelementen übergehen. Sind also zwei Gruppen G 1 , G 2 isomorph, so kann man jede Relation in G 1 in eine analoge Relation in G 2 übertragen und umgekehrt, und daher kann man diese beiden Gruppen mit Mitteln der Gruppentheorie alleine nicht voneinander unterscheiden. Beispiele 17.10 a. exp : (R, +) −→ R+ mit exp(x) = ex ist ein Isomorphismus b. exp : (C, +) −→ C∗ mit exp(z) = ez ist ein Epimorphismus, und Kern exp = 2π Z. c. Ist (Ut )t eine unitäre Einparametergruppe im Sinne von Definition 16.33, so ist die Abbildung t −→ Ut ein Homomorphismus (R, +) → U(H ).
A
Gruppen und Homomorphismen
125
d. det : G L(n, C) −→ C∗ ist ein Epimorphismus mit Kern det = SL(n, C). Analog für R statt C. e. Die Signums-Abbildung sgn : S(n) −→ {1, −1} ist ein Epimorphismus. f. Sind V, W Vektorräume und T : V → W eine lineare Abbildung, so ist T auch ein Gruppenhomomorphismus (V, +) → (W, +). g. Sei G eine beliebige Gruppe und s ∈ G. Dann ist durch ϕs : G −→ G : g −→ s −1 gs ein Homomorphismus gegeben, und er ist sogar ein Isomorphismus, denn ϕs −1 = (ϕs )−1 . Man nennt ihn den von s erzeugten inneren Automorphismus. Man sollte sich vor Augen halten, dass auf der linken und der rechten Seite von (17.6) i. A. verschiedene Verknüpfungen stehen, nämlich die von G auf der linken und die von H auf der rechten. So haben wir etwa bei der Exponentialfunktion links die Addition, rechts aber die Multiplikation von Zahlen, so dass (17.6) hier die Form ϕ(g1 + g2 ) = ϕ(g1 )ϕ(g2 ) annimmt. Zur Illustration rechnen wir nach, dass die inneren Automorphismen ϕs aus Beispiel 17.10g tatsächlich (17.6) erfüllen: ϕs (g1 )ϕs (g2 ) = (s −1 g1 s)(s −1 g2 s) = (s −1 g1 )(ss −1 )(g2 s) = s −1 g1 g2 s = ϕs (g1 g2 ). Die folgenden Aussagen können als Übung bewiesen werden. Analoge Aussagen für lineare Abbildungen sind wohlbekannt, und deren Beweise kann man (mit kleinen Änderungen) übernehmen. Satz 17.11 Seien G, H Gruppen, U ≤ G, V ≤ H Untergruppen und ϕ : G −→ H ein Homomorphismus. Dann gilt a. b. c. d. e. f. g.
ϕ(eG ) = e H , ϕ(g −1 ) = (ϕ(g))−1 für alle g ∈ G. Kern ϕ ist eine Untergruppe von G. ϕ ist genau dann eine injektive Abbildung, wenn Kern ϕ = {e}. Bild ϕ ist eine Untergruppe von H . ϕ(U ) = {h ∈ H | h = ϕ(u) für ein u ∈ U } ist Untergruppe von H . ϕ −1 (V ) = {g ∈ G | ϕ(g) ∈ V } ist Untergruppe von G. Ist ϕ ein Isomorphismus, so ist ϕ −1 ebenfalls ein Isomorphismus.
126
17 Grundsätzliches über Gruppen
B Symmetrie als Invarianz unter einer Gruppenoperation Wir wollen nun an Beispielen diskutieren, was Symmetrie in ihrer naiven Bedeutung mit Gruppen zu tun hat und was die Symmetrien in der Physik mit Gruppen zu tun haben. Beispiel 1: Symmetrie von geometrischen Figuren In der elementaren Geometrie nennt man zwei Teilmengen M, N der Ebene R2 kongruent, wenn sie durch eine euklidische Bewegung ineinander überführt werden können. Eine euklidische Bewegung besteht dabei aus einer orthogonalen Transformation und einer Verschiebung, d. h. sie hat die Form β A,v (x) = Ax + v
mit A ∈ O(2) , v ∈ R2 .
(17.7)
Man kann sagen, dass zwei Teilmengen der Ebene genau dann zwei Exemplare von ein und derselben geometrischen Figur darstellen, wenn sie kongruent sind. Wie symmetrisch eine gegebene Teilmenge (oder Figur) ist, kann nun daran gemessen werden, ob es viele oder wenige Bewegungen gibt, die die Menge mit sich selbst zur Deckung bringen. Um dies zu präzisieren, beachten wir, dass die Menge aller euklidischen Bewegungen der Ebene mit der Verkettung als Verknüpfung eine Gruppe bildet (Aufgabe 17.11), die Isometriegruppe E(2) von R2 . Für jedes M ⊆ R2 ist dann die Menge Σ(M) := {β ∈ E(2) | β(M) = M} eine Untergruppe, wie man ohne weiteres nachrechnet. Diese Untergruppe ist umso größer, je mehr Symmetrie die geometrische Figur hat, die durch M dargestellt wird, und wir nennen sie die Symmetriegruppe von M. Um dies an konkreten Fällen zu verifizieren, erinnern wir uns ([34], Kap. 7), dass O(2) aus Drehungen R(α) =
cos α − sin α
sin α cos α
sowie Spiegelungen S(α) besteht, wobei S(α) an der Geraden Γα spiegelt, die vom Vektor (cos α, sin α)T aufgespannt wird. Also ist S(0) =
1 0 , 0 −1
und anstatt für S(α) eine Matrix anzugeben, stellen wir uns auf den Standpunkt, dass S(α) folgendermaßen entsteht: Man dreht zunächst um den Winkel −α, so dass die Achse Γα auf die x-Achse zu liegen kommt, dann spiegelt man, und dann dreht man wieder um α zurück. Das ergibt
B
Symmetrie als Invarianz unter einer Gruppenoperation
127
S(α) = R(α)S(0)R(α)−1 . Der Einfachheit halber betrachten wir jetzt nur Mengen, die um den Nullpunkt zentriert sind. Ist M solch eine Menge und β = β A,v ∈ E(2) , β(M) = M, so muss β(0) = 0 sein, also v = 0 und somit β(x) = Ax mit A ∈ O(2). Wir identifizieren jetzt die lineare Abbildung β mit der Matrix A, die sie definiert. Für Zahlen a, b > 0 betrachten wir speziell das achsenparallele Rechteck M = Ra,b := {(x, y) ∈ R2 | |x| ≤ a , |y| ≤ b} mit den Kantenlängen 2a, 2b (Abb. 17.1). Es wird durch die Drehung um π sowie durch die Spiegelungen an der x- und der y-Achse mit sich selbst zur Deckung gebracht, und natürlich von der identischen Abbildung R(0) = I . Weitere Bewegungen, die das Rechteck mit sich selbst zur Deckung bringen, gibt es nicht. Damit enthält Σ(Ra,b ) genau die 4 Elemente I, R(π ), S(0) und S(π/2), und man rechnet leicht nach, dass diese eine Untergruppe von O(2) bilden. Im Falle a = b bilden sie sogar ganz Σ(Ra,b ), aber für a = b (Quadrat!) treten noch die Drehungen R(±π/2) und die Spiegelungen S(±π/4) an den Diagonalen hinzu, d. h. die Ordnung von Σ(Ra,a ) ist 8. Hieran zeigt sich die erhöhte Symmetrie des Quadrats. Als weitere Illustration betrachten wir das regelmäßige n-Eck Pn . Es sei dem Einheitskreis einbeschrieben, und eine seiner Ecken sei auf die (komplexe) Eins gelegt (vgl. Abb. 17.2). Die Ecken sind dann die Punkte exp(2π ik/n) , k = 0, 1, . . . , n − 1, und Dn := Σ(Pn ) besteht aus den Drehungen R(2π k/n) ,
k = 0, 1, . . . , n − 1
sowie den Spiegelungen S(π k/n) ,
k = 0, 1, . . . , n − 1 .
Die Symmetriegruppe des regelmäßigen n-Ecks hat also 2n Elemente, und sie wird als Diedergruppe der Ordnung 2n bezeichnet. Für n → ∞ ergibt sich der Kreis, und seine Symmetriegruppe ist ganz O(2).
Γ3π/4
Γπ/2 R(π)
Γπ/2
Γπ/4
R(π2 ) Γ0
Abb. 17.1 Symmetrien von Rechteck und Quadrat
Γ0
128
17 Grundsätzliches über Gruppen
Abb. 17.2 Symmetrien von regelmäßigem Fünfeck und Sechseck
Am anderen Ende der Skala haben wir die völlig unregelmäßig geformten Mengen M, bei denen Σ(M) nur aus der identischen Abbildung I alleine besteht. Die Symmetrie einer geometrischen Figur sollte natürlich nicht davon abhängen, wo und wie diese in der Ebene liegt. Daher wollen wir die Symmetriegruppen Σ(M1 ) und Σ(M2 ) miteinander in Beziehung setzen, wenn M1 , M2 kongruent sind. Sei also γ ∈ E(2) so, dass γ (M2 ) = M1 . Dann ist β ∈ Σ(M2 )
⇐⇒
M2 = β(γ −1 (M1 ))
⇐⇒
M1 = γ (β(γ −1 (M1 ))) = (γ ◦ β ◦ γ −1 )(M1 )
⇐⇒
γβγ −1 ∈ Σ(M1 ) .
Also besteht Σ(M2 ) genau aus den γ −1 αγ , α ∈ Σ(M1 ), d. h. Σ(M2 ) geht aus Σ(M1 ) durch Anwendung des inneren Automorphismus ϕγ hervor, und insbesondere sind die beiden Gruppen isomorph. Haben wir z. B. ein Rechteck R irgendwo schräg in der Ebene liegen (Abb. 17.3), so wählen wir als γ eine Bewegung, die seinen Mittelpunkt in den Nullpunkt legt und seine Kanten achsenparallel ausrichtet. Dadurch entsteht eines der oben betrachteten speziellen Rechtecke Ra,b , und die Elemente von Σ(R) sind nun die vier Transformationen, die dadurch entstehen, dass man γ anwendet, das entstandene achsenparallele Rechteck dreht oder spiegelt, und schließlich mit γ −1 zurückbewegt. Alles bisher Gesagte kann ohne weiteres rigoros bewiesen werden, aber darum geht es hier nicht. Es soll nur eine Vorstellung davon gegeben werden, wie man mit Gruppen umgeht und wie man sie zur Diskussion von Symmetrie einsetzt. Auch die Wahl der Dimension n = 2 geschah nur der größeren Anschaulichkeit halber – man könnte ebensogut geometrische Figuren in Rn betrachten oder sogar auf einer R IEMANNschen Mannigfaltigkeit, vorausgesetzt, ihre Isometriegruppe ist groß genug. Bei den Symmetrien in der Physik hat man es häufig mit der Situation zu tun, dass die Elemente einer Gruppe G Transformationen – also bijektive Selbstabbil-
B
Symmetrie als Invarianz unter einer Gruppenoperation
129
γ
S(0)
γ –1
Abb. 17.3 Spiegelung eines Rechtecks in beliebiger Lage
dungen – einer (strukturierten) Menge Z in systematischer Weise hervorrufen, obwohl G gar nicht aus solchen Transformationen besteht. Auch in der Mathematik trifft man diese Situation sehr häufig an, und wir führen dafür die folgende gängige Terminologie ein: Definitionen 17.12 Sei Z = ∅ eine Menge, G eine Gruppe und e ihr neutrales Element. a. Eine Linksoperation (= Links-Aktion) von G auf Z ist eine Abbildung G × Z −→ Z : (g, z) −→ g · z ≡ gz mit den Eigenschaften (i) g1 (g2 z) = (g1 g2 )z für alle g1 , g2 ∈ G , z ∈ Z , (ii) ez = z für alle z ∈ Z . Ist eine Linksoperation von G auf Z gegeben, so sagt man auch, die Gruppe G operiert (von links) auf Z . b. Sei eine Linksoperation von G auf Z gegeben. Man schreibt g M := {gz | z ∈ M} für g ∈ G , M ⊆ Z .
130
17 Grundsätzliches über Gruppen
Die Symmetriegruppe einer Teilmenge M ⊆ Z ist dann definiert durch Σ(M) := {g ∈ G | g M = M}. Man bestätigt durch leichte Rechnung, dass Σ(M) tatsächlich eine Untergruppe von G ist. Wenn auf Z eine G-Linksoperation gegeben ist, so kann man zu jedem g ∈ G die Abbildung ϕ(g) : Z −→ Z : z −→ gz
(17.8)
bilden. Diese hat offenbar die Inverse ϕ(g −1 ), ist also bijektiv, und ferner gilt ϕ(g1 g2 ) = ϕ(g1 ) ◦ ϕ(g2 ) für alle g1 , g2 ∈ G. Damit ist ϕ ein Homomorphismus G → S(Z ) (Bezeichnung wie in Beispiel 17.3a). Ist umgekehrt ein solcher Homomorphismus ϕ gegeben, so ist durch gz := [ϕ(g)](z) ,
z∈ Z, g∈G
(17.9)
eine Linksoperation von G auf Z definiert. Auf diese Weise stehen die Linksoperationen von G auf Z in bijektiver Korrespondenz zu den Gruppenhomomorphismen G → S(Z ). Bemerkung Auf analoge Weise kann man natürlich auch Rechtsoperationen definieren. Der Unterschied liegt jedoch nicht nur in der Schreibweise, denn Bedingung (i) muss ersetzt werden durch (i’)
(zg1 )g2 = z(g1 g2 ) für alle g1 , g2 ∈ G , z ∈ Z .
Die Anwendung des Produkts g1 g2 auf Punkte von Z entspricht also hier der Anwendung von g1 und g2 in der umgekehrten Reihenfolge wie bei Linksoperationen. Auch die Rechtsoperationen stehen in bijektiver Korrespondenz zu den Homomorphismen G → S(Z ), doch muss (17.8) ersetzt werden durch ϕ(g) : Z −→ Z : z −→ zg −1 .
(17.10)
Wie schon am Beispiel der euklidischen Bewegungen der Ebene erläutert, ändert sich die Symmetriegruppe einer Teilmenge nicht wesentlich, wenn diese Teilmenge der Wirkung eines Gruppenelements unterworfen wird. Größe und Struktur der Symmetriegruppe bleiben erhalten, denn es gilt: Satz 17.13 Die Gruppe G operiere auf der Menge Z von links. Ist M1 = g M2 für ein g ∈ G und Teilmengen M1 , M2 ⊆ Z , so gilt Σ(M2 ) = g −1 Σ(M1 )g := {g −1 hg | h ∈ Σ(M1 )}, und insbesondere ist Σ(M2 ) ∼ = Σ(M1 ).
B
Symmetrie als Invarianz unter einer Gruppenoperation
131
Der Beweis besteht in genau derselben Rechnung, die oben in Beispiel 1 für den Spezialfall Z = R2 , G = E(2) durchgeführt worden ist. Nun betrachten wir einige aus der Physik stammende Beispiele von Gruppenoperationen und zugehörigen Symmetriegruppen: Beispiel 2: Drehinvariante H AMILTONsche Systeme Wir betrachten ein System von N Massenpunkten der Massen m 1 , . . . , m N und bezeichnen den Ort des j-ten Massenpunkts mit q j = (x j , y j , z j ), seinen Impuls mit p j = ( p j,x , p j,y , p j,z ). Der Konfigurationsraum ist dann Ω := {q = (q 1 , . . . , q N ) ∈ R3N | q j = q k für j = k} , und auf ihm operiert die Drehgruppe S O(3) von links durch R · (q 1 , . . . , q N ) = (Rq 1 , . . . , Rq N ) ,
R ∈ S O(3).
Der Phasenraum ist T ∗ Ω = Ω × R3N = {(q, p) | q ∈ Ω , p = ( p1 , . . . , p N ) ∈ R3N }, und auf ihm operiert S O(3) durch R · (q, p) = (Rq, R p) mit R( p1 , . . . , p N ) = (R p1 , . . . , R p N ). Die Wechselwirkung zwischen den Teilchen sei nun durch eine potentielle Energie V gegeben, die nur von den |q j | und den Abständen |q j − q k | , j = k abhängt. Dann ist V (Rq) = V (q) und für die kinetische Energie T =
N
∀ R ∈ S O(3),
1 j=1 2m j
T (R p) = T ( p)
| p j |2 gilt sowieso
∀ R ∈ S O(3).
Die H AMILTONfunktion H = T + V ist somit drehinvariant in dem Sinn, dass H (Rq, R p) = H (q, p)
∀ R ∈ S O(3).
(17.11)
Bei den physikalisch interessanten Potentialen V sind die Lösungen der H AMIL TON schen Bewegungsgleichungen auf ganz R definiert. In diesem Fall ist die Lösungsmenge M der H AMILTONschen Gleichungen eine Teilmenge von Z := {γ ∈ C 1 (R; R6N ) | γ (t) ∈ Ω × R3N ∀ t ∈ R}, und eine Linksoperation der Drehgruppe auf Z ist gegeben durch (R · γ )(t) := R · γ (t) für t ∈ R , R ∈ S O(3).
132
17 Grundsätzliches über Gruppen
Ist nun die Invarianzforderung (17.11) erfüllt und ist γ ∈ Z eine Lösung der H A MILTON gleichungen, so ist für jede Drehung R auch R · γ eine Lösung, wie man durch eine leichte Rechnung bestätigt (Kettenregel und R T = R −1 beachten!). Da die Drehungen eine Gruppe bilden, die auf Z operiert, ist damit auch schon die umgekehrte Schlussfolgerung klar: Ist R ·γ eine Lösung, so ist auch γ = (R −1 R)·γ = R −1 · (R · γ ) eine Lösung, denn R −1 gehört ja ebenfalls zu unserer Gruppe S O(3). Aus (17.11) folgt also, dass für die hier betrachtete Gruppenoperation gilt: Σ(M) = S O(3), und dies ist mit der Formulierung gemeint, die Drehgruppe sei eine Symmetriegruppe für ein mechanisches System mit drehinvarianter H AMILTONfunktion. Bemerkung Diese Überlegungen sind keineswegs auf Drehungen beschränkt. Die Gruppe G L(3, R) operiert ebenfalls auf Ω bzw. auf R3N vermöge A · q = (Aq 1 , . . . , Aq N ) und analog für die Impulse, und auf dem Phasenraum betrachten wir die Operation A · (q, p) = (Aq, (A−1 )T p) ,
A ∈ G L(3, R).
Nur diese Operation ist physikalisch sinnvoll, denn sie liefert symplektische Transformationen des Phasenraums (Aufgabe 17.10). Wir haben sie auch schon oben bei den Drehungen benutzt, aber das fällt nicht auf, weil R = (R −1 )T ist für orthogonale Matrizen R. Eine H AMILTONfunktion H : Ω × R3N → R heißt nun A-invariant, wenn gilt: H (Aq, (A−1 )T p) = H (q, p)
∀ (q, p) ∈ Ω × R3N .
(17.12)
Ist diese Forderung erfüllt, so ist mit γ = (q, p) auch A · γ = (Aq, (A−1 )T p) eine Lösung der entsprechenden Bewegungsgleichungen, wie man wieder mittels der Kettenregel leicht nachrechnet. Ist also G ≤ G L(3, R) eine Untergruppe mit der Eigenschaft, dass (17.12) für alle A ∈ G gilt, so ist G ≤ Σ(M) für die Lösungsmenge M der H AMILTONschen Gleichungen. Ganz allgemein kann man eine symplektische Mannigfaltigkeit (M, ω), eine Gruppe G und eine Linksoperation von G auf M betrachten, bei der für jedes g ∈ G die Abbildung ϕ(g) : M −→ M : x −→ gx ein symplektischer Diffeomorphismus von M auf sich ist. Eine C ∞ -Funktion H auf M heißt dann G-invariant, wenn H ◦ ϕ(g) = H
∀g ∈ G
B
Symmetrie als Invarianz unter einer Gruppenoperation
133
gilt. Wir nehmen an, dass das H AMILTONsche Vektorfeld v zu H (vgl. Definition 6.23) einen globalen Fluss besitzt, dass also alle seine Integralkurven auf ganz R definiert sind. Dann betrachtet man die Menge Z aller C 1 -Kurven γ : R → M und die durch g · γ := ϕ(g) ◦ γ definierte Linksoperation von G auf Z . Wenn H G-invariant ist, so führt jedes g ∈ G Integralkurven von v wieder in Integralkurven von v über. Denn da jedes f = ϕ(g) , g ∈ G symplektisch ist, ergibt sich mit Aufgabe 6.3 (d f )−1 p v( f ( p)) = s − grad(H ◦ f )( p) = v( p) ,
p∈ M,
und wenn γ eine Integralkurve ist, also γ˙ = v ◦ γ , so folgt für β := gγ = f ◦ γ ˙ = d f γ (t) γ˙ (t) = dgγ (t) v(γ (t)) = v(β(t)) β(t) für alle t, d. h. auch β ist eine Integralkurve von v. Für die Menge M H aller Integralkurven von v (also aller Lösungskurven der H AMILTONschen Gleichungen zur G-invarianten Funktion H ) gilt somit G = Σ(M H ). Wenn M, ω und H ein physikalisches System beschreiben, so kann man also sagen, dass dieses System G als Symmetriegruppe gestattet. Beispiel 3: Zeittranslation als Symmetrie eines autonomen Systems von Differentialgleichungen Sei Ω ⊆ Rn offen und f : R × Ω → Rn sei eine C 1 -Abbildung. Wir nehmen an, die Lösung des Anfangswertproblems x˙ = f (t, x),
x(t0 ) = x0
(vgl. etwa [34], Kap. 20) sei bei beliebiger Wahl von t0 ∈ R , x0 ∈ Ω stets auf ganz R definiert. Die Lösungskurven liegen dann in der Menge Z := {γ ∈ C 1 (R; Rn ) | γ (R) ⊆ Ω}, und auf dieser Menge ist eine Linksoperation der Gruppe G = (R, +) gegeben, indem man für τ ∈ R , γ ∈ Z setzt: (τ · γ )(t) := γ (t − τ ) ,
t ∈ R.
134
17 Grundsätzliches über Gruppen
Wenn das Differentialgleichungs-System autonom ist – d. h. wenn f nicht von t abhängt –, so ist mit γ auch jedes τ · γ , τ ∈ R eine Lösung des Systems x˙ = f (x) (nachrechnen!). Autonome Systeme haben also die Symmetriegruppe (R, +), die durch Zeittranslation operiert. Beispiel 4: Invarianz von quantenmechanischen Observablen Sei H ein komplexer H ILBERTraum, dessen Einheitsvektoren die Zustände eines quantenmechanischen Systems beschreiben. Die Automorphismengruppe von H ist dann die Gruppe U(H) aller unitären Operatoren in H, und die Menge Z aller selbstadjungierten Operatoren in H beschreibt die Gesamtheit der Observablen des betrachteten Systems. Eine Linksoperation von U(H) auf Z ist gegeben durch U · A = U AU −1 . Diese Operation ist naheliegend, denn für die Graphen gilt G(U AU −1 ) = {(U x, U y) | (x, y) ∈ G(A)} (nachrechnen!). Der physikalische Sinn dieser Operation liegt jedoch in dem Umstand, dass die statistische Verteilung der Messwerte von A ∈ Z im Zustand x ∈ H genau dieselbe ist wie die Verteilung der Messwerte von U AU −1 im Zustand U x. Um dies einzusehen, betrachten wir das Spektralmaß E von A und erinnern uns, dass das Spektralmaß des selbstadjungierten Operators U AU −1 durch F(S) := U E(S)U −1
(S ⊆ R B ORELmenge)
gegeben ist. (Dies folgt aus den Aufgaben 15.2 und 15.9 zusammen mit der Eindeutigkeit des Spektralmaßes.) Die Wahrscheinlichkeit, dass eine Messung von U AU −1 im Zustand U x einen Wert innerhalb der B ORELmenge S ergibt, ist also U x|F(S)U x = U x | U E(S)U −1 U x = U x|U E(S)x = x|E(S)x , und dies ist die Wahrscheinlichkeit, dass eine Messung von A im Zustand x einen Wert innerhalb von S ergibt. Die Symmetriegruppe Σ({A}) einer einzelnen Observablen A ∈ Z besteht also aus den U ∈ U(H), für die U AU −1 = A ist. Das ist offenbar äquivalent zu U (D(A)) = D(A) und U A = AU . Man sagt dann, die Observable A sei invariant unter U , und in diesem Fall ergibt der Zustand U x stets die gleiche statistische Verteilung der Messwerte wie der Zustand x. In der Quantenmechanik ist häufig eine Untergruppe G ≤ U(H) gegeben, und man fragt sich, welche Observablen A gegen alle U ∈ G invariant sind oder unter
B
Symmetrie als Invarianz unter einer Gruppenoperation
135
welchen Bedingungen bestimmte besonders wichtige Observable wie etwa die Energie unter G invariant sind. Dies werden wir im nächsten Beispiel näher illustrieren. Ist insbesondere der H AMILTONoperator H unter G invariant, so folgt U eit H U −1 = eit H für alle U ∈ G , t ∈ R, und damit ist die ganze Dynamik unter G invariant. Die Lösung der S CHRÖDINGERgleichung zum Anfangswert U x (mit U ∈ G) ergibt sich dann als eit H U x = (U eit H U −1 )U x = U (eit H x), also durch Anwenden von U auf die Lösung zum Anfangswert x. Bemerkung Hier sollte man beachten, dass zwei Einheitsvektoren x, y ∈ H genau dann ein und denselben physikalischen Zustand beschreiben, wenn sie sich nur um einen Phasenfaktor unterscheiden. Daher sollte man auf der Menge der Einheitsvektoren in H die Äquivalenzrelation x∼y
def
⇐⇒
es gibt θ ∈ R mit y = eiθ x
einführen. Der Zustandsraum des Systems ist in Wirklichkeit die Menge der Äquivalenzklassen [x], x ∈ H, x = 1, der sog. projektive H ILBERTraum PH (vgl. Beispiel 1.7b, wo der endlichdimensionale Sonderfall hiervon besprochen wurde). Auf PH × PH ist durch W ([x], [y]) := |x|y |2 eine reelle Funktion wohldefiniert, die physikalisch als die Wahrscheinlichkeit dafür aufgefasst werden kann, den Zustand [y] zu messen, wenn der Zustand [x] präpariert wurde. Als die physikalisch relevanten Automorphismen des Zustandsraums sollten daher die bijektiven Abbildungen α : PH → PH gelten, für die gilt: W (α[x], α[y]) = W ([x], [y])
∀ [x], [y] ∈ PH.
Jede unitäre Transformation U ∈ U(H) induziert solch einen Automorphismus, indem man setzt: % & % & α x := U x und nachrechnet, dass dies vom gewählten Repräsentanten x unabhängig ist. Es gibt jedoch noch weitere Automorphismen von PH, und daher ist die obige Erörterung der Symmetrien von Observablen eigentlich unvollständig. Zu den mathematischen Grundlagen der Quantenmechanik gehört also auch eine sorgfältige Diskussion der Automorphismen von PH, ihres Zusammenhangs mit unitären Operatoren und ihrer Operation auf Observablen. Wir verweisen dazu auf die Literatur, etwa auf [45, 54, 89].
136
17 Grundsätzliches über Gruppen
Beispiel 5: Drehsymmetrische quantenmechanische Systeme Wir diskutieren hier nur eine exemplarische einfache Situation, nämlich ein einziges Teilchen der Masse m > 0. Es soll sich in einem stationären Zustand befinden, der durch die Wellenfunktion ψ ∈ L 2 (R3 ) beschrieben wird. Wird die gesamte experimentelle Anordnung nun einer Drehung R unterworfen, so herrschen nach Ausführung dieser Drehung am Ort x genau dieselben Verhältnisse, die vor der Drehung am Ort R −1 x geherrscht haben. Die nach der Drehung entstandene Wellenfunktion ist daher gegeben durch ψ (x) = ψ(R −1 x). ψ
(17.13)
Daher betrachtet man auf dem Zustandsraum H = L 2 (R3 ) die durch R · ψ = ψ ◦ R −1 definierte Linksoperation der Gruppe S O(3).2 Die Transformationsformel ergibt sofort −1 2 3 |ψ(R x)| d x = |ψ(x)|2 d3 x, und daher ist der Operator U (R) : H −→ H : ψ −→ R · ψ stets unitär. Da es sich hierbei um einen Spezialfall von (17.8) handelt, erkennt man, dass die betrachtete Linksoperation durch einen Gruppenhomomorphismus U : S O(3) −→ U(L 2 (R3 )) gegeben ist. Solch ein Homomorphismus ist eine Darstellung der Gruppe S O(3), und mit diesen Darstellungen werden wir uns noch ausführlicher zu beschäftigen haben (vgl. Kap. 20 ff.). Nun sei A ein selbstadjungierter Operator in H, der eine Observable des Systems beschreibt. Ist das System rotationssymmetrisch, so erwarten wir, dass die Statistik der Messwerte von A durch die Drehung R der experimentellen Anordnung nicht beeinflusst wird. Wie in Beispiel 4 erläutert, ist dies äquivalent dazu, dass für jedes R ∈ S O(3) gilt: AU (R)ψ = U (R)Aψ
für alle ψ ∈ D(A) = U (R) D(A) .
(17.14)
2 Bei einer Drehung R des Koordinatensystems hätte man ψ (x) = ψ(Rx), aber das definiert eine Rechtsoperation.
B
Symmetrie als Invarianz unter einer Gruppenoperation
137
In unserem konkreten Fall bedeutet dies A(ψ ◦ R −1 ) = (Aψ) ◦ R −1
∀ R ∈ S O(3).
Da mit R auch R −1 die gesamte Gruppe S O(3) durchläuft, könnte man hier auch R schreiben statt R −1 . Ganz explizit bedeutet die Rotationsinvarianz von A also, dass für alle R ∈ S O(3) und für alle ψ ∈ D(A) fast überall gilt: )(x) = (Aψ)(Rx) (Aψ
(x) := ψ(Rx) . für ψ
Dies trifft z. B. auf A = −Δ zu, wie wir aus Aufgabe 17.17 wissen, und damit auch auf A = −Δ + V für ein Zentralpotential V (x) = v(|x|). Bemerkung In der relativistischen Quantenmechanik sind ähnliche Überlegungen, die man für die L ORENTZgruppe und die P OINCARÉgruppe anstellt, von entscheidender Bedeutung (vgl. z. B. [10, 84, 87]). Beispiel 6: Invarianz von Mehrteilchensystemen unter Vertauschung der Teilchen Der Zustand eines quantenmechanischen Systems von N Teilchen werde durch die Wellenfunktion ψ ∈ H := L 2 (R3N ) beschrieben. Sind die Teilchen gleichartig, so können sie prinzipiell nicht voneinander unterschieden werden, und daher repräsentieren die Funktionen ψ(q1 , . . . , q N ) und ψ(qπ 1 , . . . , qπ N ) ein und denselben Zustand, wenn π eine Permutation der Zahlen 1, 2, . . . , N ist (qk = (xk , yk , z k )). Also gibt es zu jeder Permutation π ∈ S(N ) eine komplexe Zahl ζ = ϕ(π ) vom Betrag 1 mit ψ(q1 , . . . , q N ) = ζ ψ(qπ 1 , . . . , qπ N )
f. ü.
Ist nun π = π1 ◦π2 , so führt die schrittweise Vertauschung der Teilchenpositionen – also zuerst die Anwendung von π2 , dann die von π1 – auf dieselbe Wellenfunktion wie die direkte Anwendung von π . Das erzwingt die Bedingung ϕ(π1 ◦ π2 ) = ϕ(π1 )ϕ(π2 ),
(17.15)
d. h. ϕ ist ein Homomorphismus der Gruppe S(N ) in die Gruppe U(1) = {z ∈ C | |z| = 1}. Wenn (17.15) gilt, so ist tatsächlich durch mit ψ (q1 , . . . , q N ) := ϕ(π )ψ(qπ 1 , . . . , qπ N ) π ·ψ =ψ eine Linksoperation von S(N ) auf H gegeben (nachrechnen!). Es gibt aber nur zwei Möglichkeiten, (17.15) zu erfüllen, denn es gilt: Lemma 17.14 Sei N ≥ 2. Dann gibt es genau zwei Homomorphismen S(N ) → U(1), nämlich
138
17 Grundsätzliches über Gruppen
ϕ B (π ) ≡ 1 und ϕ F (π ) = sgn π, die Signumsfunktion. Beweis Für 1 ≤ j < k ≤ N bezeichnen wir mit τ jk die Permutation, die j und k miteinander vertauscht und alle übrigen Elemente von {1, . . . , N } fest lässt (Transposition). In der Gruppe S(N ) haben wir dann τ 2jk = τ jk ◦ τ jk = id, und für jeden Homomorphismus ϕ : S(N ) → U(1) folgt hieraus ϕ(τ jk )2 = ϕ(τ 2jk ) = ϕ(id) = 1. Also ist ϕ(τ ) = ±1 für jede Transposition τ . Wir unterscheiden die beiden Fälle (i) ϕ(τ12 ) = 1, (ii) ϕ(τ12 ) = −1. Zu beliebigen Zahlen j, k mit 1 ≤ j < k ≤ N gibt es offenbar (mindestens) eine Permutation σ ∈ S(N ), für die gilt: σ1 = j ,
σ 2 = k.
Dann ist τ jk = σ τ12 σ −1 , wie man durch elementweises Nachprüfen sofort bestätigt. Da U(1) abelsch ist, folgt hieraus ϕ(τ jk ) = ϕ(σ )ϕ(τ12 )ϕ(σ )−1 = ϕ(τ12 ), d. h. im Fall (i) ist ϕ(τ jk ) = 1 für jede Transposition τ jk , und im Fall (ii) ist stets ϕ(τ jk ) = −1. Nun kann man die Zahlen 1, 2, . . . , N offenbar durch endlich viele Vertauschungen in jede beliebige Reihenfolge bringen (ein rigoroser Beweis hierfür kann z. B. durch Induktion nach N leicht erbracht werden). Das bedeutet, dass jede Permutation π ∈ S(N ) als Produkt von endlich vielen Transpositionen geschrieben werden kann, etwa π = τ (1) τ (2) · · · τ (m) mit τ (ν) = τ jν kν , ν = 1, . . . , m. Daraus folgt aber ϕ(π ) = 1 im Fall (i) und ϕ(π ) = (−1)m im Fall (ii). Im Fall (i) ist also ϕ = ϕ B . Da die Signumsfunktion ebenfalls ein Homomorphismus ist, der auf allen Transpositionen den Wert −1 annimmt, folgt im Fall (ii) ϕ(π ) = sgn π = ϕ F (π ), wie behauptet.
B
Symmetrie als Invarianz unter einer Gruppenoperation
139
Bei Teilchen, für die ϕ B der richtige Homomorphismus ist, sind die Wellenfunktionen also symmetrisch in den qk (Bosonen), im anderen Fall antisymmetrisch (Fermionen). Bemerkung Es wird immer wieder spekuliert, dass es außer Bosonen und Fermionen vielleicht noch andere Teilchentypen gibt („Parastatistiken“). Lemma 17.14 zeigt, dass die Wellenfunktionen solcher Teilchen nicht komplexwertig sein können – sie müßten ihre Werte in geeigneten Vektorräumen haben, auf denen S(N ) in nichttrivialer Weise operiert. Beispiel 7: Eichinvarianz Eichtheorien bilden eine fortgeschrittene Thematik, die über den Rahmen dieses Buches hinausgeht, doch können wir an einem einfachen Beispiel zumindest einige Grundgedanken erläutern. Dazu betrachten wir in R3 differenzierbare Vektorfelder A = (A1 , A2 , A3 ) , B = (B1 , B2 , B3 ) mit B = rot A und stellen uns B als ein Magnetfeld vor. Ein Teilchen der Masse m > 0 und der elektrischen Ladung e > 0, das sich in diesem Magnetfeld bewegt, hat den H AMILTONoperator H A :=
3 1 2 p A, j 2m
mit p A, j :=
j=1
1 ∂ − e A j (x), i ∂x j
aber dieser ist nicht eindeutig bestimmt, da man das Vektorpotential A „umeichen“ darf.3 Daher betrachtet man die Gruppe G aller C ∞ -Funktionen R3 → U(1) (vgl. Aufgabe 17.7) und definiert eine Linksoperation von G auf H = L 2 (R3 ) durch (γ · ψ)(x) := γ (x)ψ(x) ,
ψ ∈ H, x ∈ R3 .
Die Elemente von G werden als Eichtransformationen bezeichnet. Wegen |γ (x)| ≡ 1 ist der Operator U (γ ) : H → H, ψ → γ · ψ für jedes γ ∈ G unitär, und wir haben einen Homomorphismus U : G −→ U(H), γ −→ U (γ ). Wir ermitteln nun die Wirkung der U (γ ) auf die Observablen p A, j und H A . Dazu betrachten wir o. B. d. A. eine differenzierbare Wellenfunktion ψ ∈ H := U (γ ) p A, j U (γ )−1 ψ. Die folgende Rechnung ist punktund berechnen ψ weise zu verstehen – das Argument x ∈ R3 wurde der Kürze halber überall weggelassen:
3 Genau genommen, müssen an A und B geeignete Voraussetzungen gemacht werden, die dafür sorgen, dass H A ein wohldefinierter selbstadjungierter Operator in L 2 (R3 ) ist, aber diesen Aspekt können wir für die Zwecke dieses Beispiels getrost ignorieren.
140
17 Grundsätzliches über Gruppen
1 ∂ − e A j (γ −1 ψ) i ∂x j 1 ∂ψ 1 ∂γ = γ γ −1 − γ −2 ψ − γ −1 e A j ψ i ∂x j i ∂x j 1 ∂ψ 1 ∂ −1 1 ∂γ = − eAjψ − γ ψ= − eAj ψ i ∂x j i ∂x j i ∂x j
=γ ψ
mit j := A j + 1 γ −1 ∂γ , A ie ∂x j
j = 1, 2, 3.
Setzen wir also 1 A := A + γ −1 ∇γ , ie
(17.16)
U (γ ) p A, j U (γ )−1 = pA, j
(17.17)
so erhalten wir
für γ ∈ G , j = 1, 2, 3. Daraus ergibt sich weiter U (γ )H AU (γ )−1 =
3 1 (U (γ ) p A, j U (γ )−1 ) (U (γ ) p A, j U (γ )−1 ) 2m j=1
=
3 1 2 pA, j , 2m j=1
also U (γ )H AU (γ )−1 = HA .
(17.18)
Nun ist aber rot A = rot A = B. Am einfachsten sieht man das, wenn man γ (x) = exp(ieθ (x)) schreibt, was lokal immer möglich ist, und zwar mit einer reellwertigen Funktion θ . Dann ist offenbar 1 −1 γ ∇γ = ∇θ, ie und somit verschwindet die Rotation von A − A. Nun sei M(B) die Menge aller H AMILTONoperatoren H A zu Vektorpotentialen A für das gegebene Magnetfeld B. Unsere Überlegungen zeigen dann, dass für die betrachtete Operation von G auf der Menge der Observablen gilt: G = Σ(M(B)) .
Aufgaben
141
Außerdem findet man zu zwei beliebigen Vektorpotentialen A, A für B immer eine A − A) = 0 gibt Eichtransformation γ ∈ G, die H A in HA überführt. Wegen rot ( A = A + ∇θ (man beachte 4.42a. sowie es nämlich ein Skalarfeld θ : R3 → R mit die Tatsache, dass R3 zusammenziehbar ist). Dann setzt man γ (x) := eieθ(x) und bestätigt (17.18) durch dieselben Rechnungen wie vorher.
Aufgaben zu Kap. 17 17.1 Sei G eine Gruppe und ∅ = H ⊆ G. Man zeige: H ist genau dann eine Untergruppe von G, wenn für alle a, b gilt a, b ∈ H
⇒
ab−1 ∈ H.
17.2 Seien G, H zwei Gruppen, eG , e H ihre neutralen Elemente. Auf P := G × H erklären wir eine Verknüpfung durch (g1 , h 1 ) · (g2 , h 2 ) := (g1 g2 , h 1 h 2 ) für g1 , g2 ∈ G , h 1 , h 2 ∈ H . a. Man weise nach, dass P hierdurch zu einer Gruppe wird. Was ist das neutrale Element, und wie bildet man zu (g, h) ∈ P das inverse Element? (Man bezeichnet G × H mit dieser Verknüpfung als das direkte Produkt der beiden Gruppen.) b. Man definiere das direkte Produkt von m Gruppen G 1 , . . . , G m . 17.3 Sei B := {b1 , . . . , bn } eine Basis des reellen Vektorraums Rn . Die Menge " Γ :=
n k=1
' m k bk m 1 , . . . , m n ∈ Z
heißt dann das von B erzeugte Gitter. a. Man zeige: Jedes Gitter ist eine Untergruppe der Gruppe (Rn , +). b. Sei Zn das n-fache direkte Produkt der Gruppe (Z, +) mit sich selbst (Aufg. 17.2). Man zeige: Jedes Gitter in Rn ist als Gruppe zu Zn isomorph. 17.4 Sei G eine Gruppe und a ∈ G beliebig. Man erklärt die Potenzen a n dann in der üblichen Weise, also für n ∈ N0 durch die rekursive Festsetzung a0 = e ,
a n+1 = a · a n = a n · a
142
17
Grundsätzliches über Gruppen
und für n = −m < 0 durch a −m = (a −1 )m . Man zeige: a. Es gelten die Rechenregeln a m+n = a m a n = a n a m ,
a mn = (a m )n = (a n )m
für m, n ∈ Z. b. Durch pa (n) := a n ist ein Gruppenhomomorphismus pa : (Z, +) → G definiert. c. Angenommen, es gibt m = 0 mit a m = e. Dann ist Bild pa eine endliche Untergruppe von G, und m ist ein ganzzahliges Vielfaches der Ordnung |Bild pa |. Die Ordnung |Bild pa | ist die kleinste positive ganze Zahl k mit a k = e. Bemerkung Die Ordnung von Bild pa wird als die Ordnung des Gruppenelements a bezeichnet. Sie ist also genau dann unendlich, wenn pa ein Monomorphismus ist. 17.5 In jeder Gruppe G definiert man das Zentrum Z (G) durch Z (G) := {g ∈ G | ag = ga
∀ a ∈ G}.
Man zeige: a. Z (G) ist eine Untergruppe von G. b. Ist α ein Automorphismus von G, d. h. ein Isomorphismus von G auf G, so ist α(Z (G)) = Z (G). 17.6 a. Sei V ein Vektorraum und A : V → V eine lineare Abbildung, T : V → V eine lineare Bijektion. Man zeige: Ist v ∈ V ein Eigenvektor von A zum Eigenwert λ, so ist T v ein Eigenvektor von B := T AT −1 zum Eigenwert λ. Wenn T und A vertauschen, so überführt T also Eigenvektoren von A in Eigenvektoren von A (zu demselben Eigenwert). b. Man folgere: Das Zentrum von G L(n, C) besteht genau aus den Matrizen der Form λE n , λ ∈ C\{0}. Dabei bezeichnet E n die n ×n-Einheitsmatrix. (Hinweis: Jede komplexe n × n-Matrix hat mindestens einen Eigenwert!) c. Man folgere: Das Zentrum von G L(n, R) besteht genau aus den Matrizen der Form λE n , λ ∈ R\{0}. (Hinweis: Man verwende G L(n, R) ⊆ G L(n, C).) d. Mit derselben Methode bestimme man auch die Zentren von U(n) und O(n). 17.7 Sei Ω eine differenzierbare Mannigfaltigkeit (z. B. eine offene Teilmenge von Rm ), und sei G eine Matrixgruppe, d. h. eine Untergruppe von G L(n, R) 2 2 oder von G L(n, C). Wir fassen G als Teilmenge von Rn bzw. von Cn auf und
Aufgaben
143
definieren G als die Menge aller C ∞ -Abbildungen A : Ω → G. Man zeige: Mit der Verknüpfung (AB)(x) := A(x)B(x) ,
A, B ∈ G , x ∈ Ω
bildet G eine Gruppe. (Hinweis: Um zu zeigen, dass A(x)−1 wieder eine C ∞ Funktion von x ist, drücke man mittels der C RAMERschen Regel die Matrixelemente von A(x)−1 durch die Matrixelemente von A(x) aus.) 17.8 Sei G eine Gruppe und H ≤ G eine Untergruppe. Für a ∈ G definiert man dann die Rechts-Nebenklasse H a durch H a := {ha | h ∈ H } und die Links-Nebenklasse a H durch a H := {ah | h ∈ H } . Man zeige: a. Für a, b ∈ G ist H a = H b ⇐⇒ H a ∩ H b = ∅ ⇐⇒ ab−1 ∈ H ⇐⇒ ba −1 ∈ H und analog für Linksnebenklassen. b. G kann als disjunkte Vereinigung von Rechts- (oder Links-)Nebenklassen geschrieben werden. c. Ist H endlich, so haben alle Nebenklassen von H dieselbe Elementeanzahl wie H . (Hinweis: Bijektive Abbildungen erhalten die Elementeanzahl von Teilmengen!) d. Ist G endlich, so ist die Ordnung von G ein ganzzahliges Vielfaches der Ordnung von H . (Hinweis: Man verwende Teile b und c) 17.9 Sei G eine Gruppe und H ≤ G eine Untergruppe. Angenommen, die Anzahl k der verschiedenen Rechts-Nebenklassen von H in G ist endlich. Man zeige, dass dann die Anzahl der verschiedenen Links-Nebenklassen ebenfalls gleich k ist, insbesondere endlich. (Hinweis: Was geschieht unter Inversenbildung mit den verschiedenen Rechts-Nebenklassen H g1 , . . . , H gk ?) Bemerkung Die Anzahl k der Nebenklassen nennt man den Index von H in G. 17.10 Man zeige: a. Ist A eine reguläre reelle n × n-Matrix, so gehört die 2n × 2n-Matrix := A
A 0 0 (A−1 )T
144
17
Grundsätzliches über Gruppen
zur symplektischen Gruppe Sp(2n). (Hinweis: Man kann das leicht direkt nachrechnen, aber es ist auch ein Spezialfall von Satz 6.22, wovon man sich überzeugen sollte.) ist ein Grupppenhomomorphismus ϕ : G L(n, R) −→ Sp(2n) b. Durch ϕ(A) = A gegeben. c. Wie vereinfacht sich ϕ(A) für A ∈ O(n)? 17.11 Es sei E(n) die Menge aller Abbildungen β : Rn → Rn , die die Form β A,v (x) = Ax + v
mit A ∈ O(n) , v ∈ Rn
haben („euklidische Bewegungen“). Man zeige: a. Jedes β ∈ E(n) ist bijektiv und isometrisch, d. h. es gilt |β(x) − β(y)| = |x − y|
für alle x, y ∈ Rn .
(17.19)
b. Jedes β ∈ E(n) ist winkeltreu, d. h. für beliebige x, y, z ∈ Rn gilt stets β(x) − β(z) | β(y) − β(z) = x − z|y − z . c. Mit der Verkettung von Abbildungen als Verknüpfung bildet E(n) eine Gruppe (also eine Untergruppe der Gruppe aller Bijektionen von Rn auf sich). d. Wir versehen die Menge G := O(n) × Rn mit einer Verknüpfung, indem wir setzen (A, v) · (B, w) := (AB, Aw + v). Damit bildet G eine Gruppe, die zu E(n) isomorph ist. 17.12 Sei β : Rn → Rn eine bijektive Abbildung, die die Isometriebedingung (17.19) erfüllt. Wir wollen beweisen, dass dann β ∈ E(n) sein muss. Man zeige dazu nacheinander: a. Die Abbildung α(x) := β(x) − β(0) ist ebenfalls bijektiv und isometrisch, und sie erfüllt außerdem α(0) = 0. b. |α(x)| = |x| für alle x ∈ Rn . c. Für alle x, y ∈ Rn ist α(x)|α(y) = x|y . (Hinweis: Man verwende die Polarisationsgleichung in der Form 2v|w = |v|2 + |w|2 − |v − w|2 .) d. Für alle x, z ∈ Rn ist z|α(x) = α −1 (z)|x . e. α ist eine lineare Abbildung und damit durch eine reguläre reelle Matrix A gegeben. (Hinweis: Für gegebene x, y ∈ Rn , λ ∈ R beweise man zunächst, dass für alle z ∈ Rn
Aufgaben
145
z | α(x + y) = z|α(x) + α(y)
und
z | α(λx) = z | λα(x)
gilt.) f. A ∈ O(n). g. β ∈ E(n), wie angekündigt. Bemerkung Damit ist E(n) genaudie Isometriegruppe der R IEMANNschen Mannigfaltigkeit (Rn , g0 ), wo g0 = nj=1 dx j ⊗ dx j die Standardmetrik bezeichnet. Diese Tatsache wurde im Anschluss an 5.21 ohne Beweis erwähnt. 17.13 Sei (Rn , +) die additive Gruppe von Rn , d. h. wir wählen auf der Menge Rn die Addition als Gruppenverknüpfung. Man zeige: a. Die einzige kompakte Untergruppe von (Rn , +) ist {0}. (Hinweis: Für welche x ∈ Rn ist {nx | n ∈ Z} beschränkt?) b. Sei K eine Gruppe, die gleichzeitig ein kompakter topologischer Raum ist. Der einzige stetige Gruppenhomomorphismus ϕ : K → (Rn , +) ist dann ϕ ≡ 0. 17.14 Sei Z = ∅ eine Menge und G eine Gruppe, die auf Z von links operiert. Für z ∈ Z bezeichnet man die Menge Oz := {gz | g ∈ G} als die Bahn oder den Orbit von z unter der gegebenen Operation. Man zeige: a. Durch y∼z
def
⇐⇒
es gibt g ∈ G mit z = gy
ist auf Z eine Äquivalenzrelation definiert (vgl. Anmerkung 1.24). Die Bahn Oz ist dabei die Äquivalenzklasse von z. b. Man kann Z als disjunkte Vereinigung der Bahnen von gewissen z ∈ Z darstellen. 17.15 Zwei Elemente x, y einer Gruppe G heißen konjugiert, wenn es g ∈ G gibt so, dass y = gxg −1 . Man zeige, dass dies eine Äquivalenzrelation ist. Man folgere, dass G als disjunkte Vereinigung von Konjugiertenklassen K x := {gxg −1 | g ∈ G} geschrieben werden kann. (Hinweis: Man kann das direkt verifizieren oder auch beachten, dass durch (g, z) −→ gzg −1
146
17
Grundsätzliches über Gruppen
eine Linksoperation von G auf Z = G gegeben ist, so dass man die vorige Aufgabe benutzen kann.) 17.16 Gegeben sei eine Linksoperation einer Gruppe G auf einer Menge Z = ∅, die transitiv ist in dem Sinn, dass zu z 0 , z 1 ∈ Z stets ein g ∈ G existiert mit z 1 = gz 0 . (In der Terminologie von Aufgabe 17.14 bedeutet das, dass es nur eine einzige Bahn gibt, nämlich ganz Z .) Für ein festes z 0 ∈ Z betrachten wir die Untergruppe H = Σ({z 0 }) = {h ∈ G | hz 0 = z 0 }. a. Zu z ∈ Z bilden wir die Menge C z := {g ∈ G | gz 0 = z}. Man zeige, dass C z eine Links-Nebenklasse von H in G ist (vgl. Aufgabe 17.8) b. Sei G/H die Menge aller Links-Nebenklassen von H in G. Man zeige, dass die Abbildung β : Z −→ G/H , z −→ C z bijektiv ist. c. Für den Fall einer transitiven Rechtsoperation von G auf Z konstruiere man eine analoge Bijektion von Z auf die Menge H \G der Rechts-Nebenklassen von H = Σ({z 0 }). Bemerkung Die Untergruppe Σ({z 0 }) wird als der Stabilisator des Punktes z 0 bezeichnet. In physikalischen Anwendungen wird sie meist „little group“ genannt. 17.17 Man zeige: Für jede temperierte Distribution Ψ ∈ Sn und jedes R ∈ O(n) gilt Δ(Ψ ◦ R) = (ΔΨ ) ◦ R. Insbesondere gilt dies für Ψ ∈ L 2 (Rn ). (Hinweis: Am bequemsten geht das, wenn man die F OURIERtransformation benutzt, insbes. Theorem 11.33c.)
Kapitel 18
Drehgruppe und L ORENTZgruppe
Wie angekündigt, besprechen wir nun einige konkrete Matrixgruppen etwas näher, die für die Physik von entscheidender Bedeutung sind. Über die physikalische Anwendung hinaus dienen die hier dargestellten Einzelheiten im weiteren Verlauf auch als ein Fundus für Beispiele, an denen sich allgemeinere Begriffe und Methoden illustrieren lassen. Allerdings bietet unsere Darstellung nur einen ersten Einstieg, und wer mehr über die betrachteten Gruppen erfahren möchte, sei z. B. auf [14, 18, 48, 94] verwiesen oder auch – für die rein mathematischen Aspekte – auf [20, 37].
A Die Gruppe SO(3) der räumlichen Drehungen Wir wiederholen in diesem Abschnitt kurz die bekanntesten Eigenschaften der orthogonalen Gruppen (vgl. z. B. [34], Kap. 7E): Satz 18.1 a. Die Gruppe O(n) = {A ∈ Rn×n | A T A = E} zerfällt in zwei disjunkte Mengen O(n) = {A ∈ O(n) | det A = 1} ∪ {A ∈ O(n) | det A = −1} = S O(n) ∪ O(n)− . b. Ist n ungerade und A ∈ S O(n), so ist λ = 1 ein Eigenwert von A. c. Ist A ∈ O(n)− , so ist λ = −1 ein Eigenwert von A. d. Ist A ∈ O(n) und U ⊆ Rn ein Unterraum mit A(u) ⊆ U , so gilt A(U ⊥ ) ⊆ U ⊥ . Hauptsächlich interessiert uns im Folgenden die Gruppe S O(3). Ihre Elemente sind die Drehungen im R3 : K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_18, C Springer-Verlag Berlin Heidelberg 2010
147
148
18 Drehgruppe und L ORENTZgruppe
Satz 18.2 Zu jedem A ∈ S O(3) existiert eine Orthonormalbasis {u 1 , u 2 , u 3 } des R3 und ein α ∈ [0, 2π [, so dass A bezüglich dieser Basis folgende Gestalt hat ⎛ ⎞ 1 0 0 A = ⎝0 cos α − sin α ⎠ (Drehung um u 1 ). 0 sin α cos α Dabei ist der Drehwinkel α durch Spur A = 1 + 2 cos α bestimmt. Wichtig ist auch, dass man S O(3) durch die sogenannten E ULERschen Winkel parametrisieren kann. Satz 18.3 Sei {e1 , e2 , e3 } die Standardbasis des R3 . Für ein α ∈ [0, 2π [ sei ⎛
⎞ 1 0 0 R1 (α) = ⎝0 cos α − sin α ⎠ (Drehung um e1 -Achse), 0 sin α cos α ⎛ ⎞ cos α 0 sin α R2 (α) = ⎝ 0 1 0 ⎠ (Drehung um e2 -Achse), − sin α 0 cos α ⎛ ⎞ cos α − sin α 0 R3 (α) = ⎝ sin α cos α 0⎠ (Drehung um e3 -Achse). 0 0 1 Dann gilt a. Zu jedem A ∈ S O(3) existieren sogenannte E ULERsche Winkel α, β, γ ∈ [0, 2π [, so dass A = R3 (γ )R2 (β)R1 (α) . b. Zu jedem A ∈ S O(3) existieren ϕ, ψ, θ ∈ [0, 2π [, so dass A = R1 (ϕ)R2 (ψ)R1 (θ ) . Anmerkung 18.4 Die Zerlegung O(n) = S O(n) ∪ O(n)− und ähnliche Zerlegungen versteht man besser, wenn man den Begriff der Zusammenhangskomponente heranzieht: Wir nennen eine Teilmenge X eines topologischen Raums Y zusammenhängend, wenn jeder Punkt p ∈ X mit jedem anderen Punkt q ∈ X durch
B
Die L ORENTZgruppe
149
eine stetige, in X verlaufende Kurve verbunden werden kann.1 Die Vereinigung von zusammenhängenden Teilmengen, die alle einen festen Punkt p enthalten, ist nun zusammenhängend, denn zwei Punkte q1 , q2 aus dieser Vereinigung können ja verbunden werden, indem man zuerst q1 mit p und dann p mit q2 verbindet. Daher ist die Vereinigung aller zusammenhängenden Teilmengen, die p enthalten, selbst zusammenhängend, also die größte zusammenhängende Teilmenge, die p enthält, und man nennt sie die Zusammenhangskomponente von p. In S O(3) z. B. kann man jedes Element A durch eine stetige Kurve mit der Einheitsmatrix E verbinden – man schreibt A = R3 (γ )R2 (β)R1 (α) wie in Satz 18.3a. und definiert C : [0, 1] → SO(3) durch C(t) := R3 ((1 − t)γ )R2 ((1 − t)β)R1 ((1 − t)α) . Also ist S O(3) zusammenhängend. Dann ist aber auch O(3)− zusammenhängend, denn zu A, B ∈ O(3)− findet man eine innerhalb von O(3)− verlaufende Verbindungskurve D(t), indem man eine Kurve C(t) ∈ S O(3) , 0 ≤ t ≤ 1 wählt, die B −1 A ∈ SO(3) mit E verbindet, und setzt D(t) := BC(t) . Aber ganz O(3) ist nicht zusammenhängend. Denn wenn F : [0, 1] → O(3) eine beliebige stetige Kurve ist, so ist f (t) := det F(t) eine stetige Funktion, die nur die Werte ±1 annehmen kann. Nach dem Zwischenwertsatz aus der elementaren Analysis muss f dann konstant sein, und im Falle f ≡ +1 verläuft F ganz in S O(3), im Fall f ≡ −1 ganz in O(3)− . Daher besteht O(3) aus den beiden Zusammenhangskomponenten S O(3) und O(3)− . Für beliebiges n ist die Situation völlig analog. Es ist nur etwas schwieriger, zu beweisen, dass S O(n) zusammenhängend ist – man konstruiert zu gegebenem A ∈ S O(n) eine Kurve C : [0, 1] → S O(n), die A mit E = E n verbindet, indem man die Eigenwerttheorie der orthogonalen Matrizen geschickt einsetzt (vgl. etwa [20, 37] oder [58]) – aber der Rest der Argumentation verläuft ganz ebenso wie für den Fall n = 3 gerade skizziert.
B Die L ORENTZgruppe Die L ORENTZtransformationen, welche die Raum-Zeit-Transformationen der relativistischen Physik beschreiben, bilden die allgemeine L ORENTZgruppe L = O(1, 3)
1 Dies entspricht nicht genau dem in der Mathematik üblichen Begriff einer zusammenhängenden Menge, was jedoch bei den hier vorkommenden Mengen keinen Unterschied macht.
150
18 Drehgruppe und L ORENTZgruppe
im Sinne von Definition 17.6a. Ist also (vgl. Abschn. 4F) ⎛
G ≡ −I1,3
1 0 ⎜0 −1 = (gμν ) = ⎜ ⎝0 0 0 0
0 0 −1 0
⎞ 0 0⎟ ⎟, 0⎠ −1
(18.1)
so besteht die allgemeine L ORENTZgruppe L aus allen A = (aμν )0≤μ,ν≤3 ∈ R4×4 mit AT G A = G .
(18.2)
aνα gνν aνβ = gαβ .
(18.3)
In Komponenten lautet das: 3 ν=0
Für jedes A ∈ L gilt nach Satz 17.7 | det A| = 1 ,
A−1 = G A T G .
(18.4)
Aus der letzten Gleichung folgt G = A A−1 G = AG A T G 2 = AG A T , und somit gilt: A∈L
⇒
AT ∈ L .
(18.5)
Setzt man in (18.3) α = β = 0, so findet man sofort 2 2 2 2 a00 − (a10 + a20 + a30 )=1
(18.6)
und daher |a00 | ≥ 1
für A = (aμν ) ∈ L .
(18.7)
Da die 0-Achse der Zeitachse entspricht, nennt man L ORENTZ-Transformationen A mit • a00 ≥ 1 vorwärts-zeitartig oder orthochron, • a00 ≤ −1 rückwärts-zeitartig. Die beiden möglichen Vorzeichen von a00 sowie die beiden möglichen Vorzeichen von det A zerlegen L in 4 disjunkte Teilmengen. Diese werden von speziellen L ORENTZtransformationen ineinander überführt, nämlich durch
B
Die L ORENTZgruppe
⎛
1 0 ⎜0 −1 P=⎜ ⎝0 0 0 0
151
0 0 −1 0
⎞ 0 0⎟ ⎟, 0⎠ −1
⎛ −1 ⎜0 T =⎜ ⎝0 0
⎞ 000 1 0 0⎟ ⎟ , −E = P T , 0 1 0⎠ 001
(18.8)
also Raumspiegelung, Zeitspiegelung und Totalspiegelung im M INKOWSKI-Raum R4 . Genauer: Satz 18.5 a. Die L ORENTZgruppe zerfällt in folgende disjunkte Teilmengen: ↑
L + = {A ∈ L | det A = 1, a00 ≥ 1} , ↓
= (−E)L + ,
↑
↑
= P L+ ,
L + = {A ∈ L | det A = 1, a00 ≤ −1}
↑
L − = {A ∈ L | det A = −1, a00 ≥ 1} ↓
↑
L − = {A ∈ L | det A = −1, a00 ≤ −1} = T L + . b. Folgende Teilmengen sind Untergruppen von L: – – – –
↑
die eigentliche orthochrone L ORENTZ-Gruppe L + , ↑ ↑ die orthochrone oder vollständige L ORENTZ-Gruppe L ↑ := L + ∪ L − , ↑ ↓ die eigentliche L ORENTZ-Gruppe L + = L + ∪ L + = SO(1, 3), ↑ ↓ die orthochore L ORENTZ-Gruppe L 0 = L + ∪ L − .
Beweis a. ist trivial. b. Dass L + eine Untergruppe ist, ist klar. Ferner überlegt man sich mittels (18.4) und (18.6) (Aufgabe 18.1) (i) Ist A = (aμν ) ∈ L und B = (bμν ) = A−1 , so ist b00 = a00 . (ii) Sind A = (aμν ), B = (bμν ) ∈ L und C = A · B, so gilt " c00
≥ 1, ≤ −1,
falls a00 ≥ 1, b00 ≥ 1 oder a00 ≤ −1, b00 ≤ −1, falls a00 ≥ 1, b00 ≤ −1 oder a00 ≤ −1, b00 ≥ 1.
(18.9)
↑
Daraus folgt dann, dass auch L ↑ , L 0 und L + Untergruppen von L sind. ↑
↑
↓
↓
Bemerkung Die Teilmengen L + , L − , L + und L − sind die Zusammenhangs↑ komponenten von L. Wir werden nämlich im nächsten Abschnitt sehen, dass L +
152
18 Drehgruppe und L ORENTZgruppe
zusammenhängend ist, und daraus folgt, dass auch die drei anderen Mengen zusam↑ menhängend sind, da man sie aus L + durch Multiplikation mit den festen Matrizen P, T, −E gewinnt. Andererseits muss jede stetige Kurve F : [0, 1] → L nach dem Argument aus Anmerkung 18.4 konstante Determinante +1 oder −1 haben, und das Matrixelement f 00 (t) von F(t) kann keine Werte in ] − 1, 1[ annehmen, hat seine Werte also (nach dem Zwischenwertsatz!) entweder nur in [1, ∞[ oder nur in ] − ∞, −1]. Daraus folgt, dass die Kurve ganz in einer der vier Mengen verläuft, und somit sind sie die Zusammenhangskomponenten. ↑ Von Wichtigkeit ist, dass man die Gruppe SO(3) als Untergruppe von L + auffassen kann. Satz 18.6 a. Ist ⎛ ⎞ a11 · a13 R=⎝ · · · ⎠ a31 · a33
∈ SO(3) ,
so ist ⎛ 1 0 ⎜0 a11 = ⎜ R ⎝0 · 0 a31
⎞ 0 0 · a13 ⎟ ⎟ · · ⎠ · a33
↑
∈ L+ .
ist ein injektiver Gruppenhomomorphismus ι : Die Abbildung R −→ R ↑ SO(3) −→ L + . ↑ b. A = (aμν ) ∈ L + gehört genau dann zu ι(SO(3)), wenn a00 = +1 . ↑
c. Sei e0 = (1, 0, 0, 0)T ∈ R4 und seien A, B ∈ L + mit A e0 = B e0
(gleiche Wirkung auf Zeitachse).
Dann gibt es ein eindeutiges R ∈ SO(3) mit . A = BR mit R Bemerkung Meist wird ι in der Notation unterdrückt. Man identifiziert also R ↑ und realisiert so SO(3) als Untergruppe von L + .
C
Parametrisierung der L ORENTZgruppe
153
Beweis a. Wegen der Bauart von G gilt T G R = G R
⇐⇒
R T (−E)R = −E
⇐⇒
RT R = E .
∈ L. Wegen der Bauart von R ist klar, dass ι ein Monomorphismus Also ist R von Gruppen ist und dass = det R = 1 , det R
00 = 1 ( R)
gilt. b. Ist A ∈ L, so ist auch A T ∈ L, und daher ergibt (18.6) 2 2 2 2 2 2 2 a10 + a20 + a30 = a01 + a02 + a03 = a00 − 1.
Daher ist a00 = 1 äquivalent zu folgender Form von A: ⎛ 10 0 ⎜0 A=⎜ ⎝0 B 0
⎞ 0 ⎟ ⎟ ⎠
Aus A−1 = G A T G folgt dann B −1 = B T , und außerdem ist det B = det A = 1 ↑ für A ∈ L + , d. h. B ∈ SO(3). c. Setze R ≡ (rμν ) := B −1 A. Es ist A e0 = B e0
⇐⇒ ⇐⇒
R e0 = e0 ⇒ r00 = 1 mit R ∈ SO(3) . R ∈ ι(SO(3)) ⇐⇒ A = B R
C Parametrisierung der L ORENTZgruppe ↑
Sei B ∈ L + eine eigentliche orthochrone L ORENTZtransformation, welche die (x2 , x3 )-Ebene punktweise festlässt. Dann lässt auch B T = G B −1 G diese Ebene punktweise fest, und daher hat B die Form ⎛ b00 ⎜b10 ⎜ B=⎝ 0 0
b01 b11 0 0
⎞ 00 0 0⎟ ⎟. 1 0⎠ 01
154
18 Drehgruppe und L ORENTZgruppe
Die Bedingung (18.3) liefert dann für α, β = 0, 1 die folgenden Gleichungen: 2 2 b00 − b10 = 1, 2 b11
2 − b01
(18.10)
= 1,
(18.11)
b10 b11 − b00 b01 = 0
(18.12)
Daraus folgt dann: – Wegen (18.10) gibt es ein α ∈ R, so dass b00 = cosh α,
b10 = sinh α .
(18.13)
b01 = sinh β .
(18.14)
– Wegen (18.11) gibt es ein β ∈ R, so dass b11 = cosh β,
Einsetzen von (18.13) und (18.14) in (18.12) ergibt 0 = sinh α cosh β − cosh α sinh β = sinh(α − β), Somit ist
d. h. α = β
cosh α sinh α b00 b01 = . b10 b11 sinh α cosh α
Analoge Überlegungen kann man auch für die anderen fünf Koordinatenebenen des M INKOWSKI-Raums anstellen. Bei den Ebenen, die die x0 -Achse enthalten, treten jedoch andere Vorzeichen auf, so dass hier die Parametrisierung durch trigonometrische Funktionen statt der Hyperbelfunktionen erfolgt. Insgesamt ergibt sich: Satz 18.7 Für α ∈ [0, 2π [, β ∈ R lassen die folgenden Transformationen A j (α), ↑ B j (β) ∈ L + jeweils eine Koordinatenebene im R4 punktweise fest, und sie sind die einzigen, die dies tun: ⎛
⎛ ⎞ ⎞ 10 0 0 1 0 0 0 ⎜0 1 0 ⎜0 cos α 0 sin α ⎟ 0 ⎟ ⎜ ⎟ ⎟ A1 (α) = ⎜ ⎝0 0 cos α − sin α ⎠ , A2 (α) = ⎝0 0 1 0 ⎠ , 0 0 sin α cos α 0 − sin α 0 cos α ⎛ ⎛ ⎞ ⎞ 1 0 0 0 cosh β sinh β 0 0 ⎜0 cos α − sin α 0⎟ ⎜ sinh β cosh β 0 0⎟ ⎜ ⎟ ⎟, A3 (α) = ⎜ ⎝0 sin α cos α 0⎠ , B1 (β) = ⎝ 0 0 1 0⎠ 0 0 0 1 0 0 01 ⎛ ⎞ ⎛ ⎞ cosh β 0 sinh β 0 cosh β 0 0 sinh β ⎜ 0 1 0 0⎟ ⎜ 0 10 0 ⎟ ⎟ ⎜ ⎟ B2 (β) = ⎜ ⎝ sinh β 0 cosh β 0⎠ , B3 (β) = ⎝ 0 0 1 0 ⎠ . 0 0 0 1 sinh β 0 0 cosh β
C
Parametrisierung der L ORENTZgruppe
155 ↑
Diese heißen die Generatoren von L + . Die A j (α) sind die reinen Raumdrehungen, die B j (β) die L ORENTZ-Boosts. Die folgende Aussage entspricht der Parametrisierung von SO(3) durch ↑ E ULERsche Winkel in Satz 18.3. Sie bedeutet außerdem, dass die Gruppe L + von den Generatoren erzeugt wird in dem Sinne, dass jedes Element der Gruppe als Produkt von endlich vielen Generatoren geschrieben werden kann. Hieraus folgt auch ↑ die schon im vorigen Abschnitt aufgestellte Behauptung, dass L + zusammenhän↑ gend ist, denn man kann jedes A ∈ L + nach der in Anmerkung 18.4 geschilderten ↑ Methode durch eine innerhalb von L + verlaufende stetige Kurve mit der Einheitsmatrix verbinden. Satz 18.8 ↑
a. Jedes A ∈ L + kann in der Form 1 B3 (β) R 2 A=R
mit R1 , R2 ∈ SO(3)
dargestellt werden. ↑ b. Genauer: Zu jedem A ∈ L + gibt es ϕ, θ, ϕ , ψ , θ ∈ [0, 2π [ und β ∈ R, so dass A = A3 (ϕ +
π )A1 (θ )B3 (β)A3 (ϕ )A2 (ψ )A1 (θ ) . 2
(18.15)
↑
Beweis Sei A = (aμν ) ∈ L + , wobei wir A ∈ SO(3) annehmen können, d. h. es ist a00 > 1. Sei e0 = (1, 0, 0, 0)T . Dann ist A e0 = (a00 , a10 , a20 , a30 )T ,
(18.16)
2 2 2 2 r 2 := a10 + a20 + a30 = a00 − 1 > 0.
(18.17)
und es gilt
2 − r 2 = 1 gibt es ein β ∈ R mit Wegen a00
r = sinh β ,
a00 = cosh β .
(18.18)
Wegen (18.17) können wir Kugelkoordinaten a10 = r cos ϕ sin θ, a20 = r sin ϕ sin θ, a30 = r cos θ einführen. Dann ergibt sich mit den Matrizen A j , B j aus Satz 18.7
(18.19)
156
18 Drehgruppe und L ORENTZgruppe
⎛ ⎞ a00 ⎜ 0 ⎟ π π ⎟ A3 (ϕ + 2 )A1 (θ )B3 (β) e0 = A3 (ϕ + 2 )A1 (θ ) ⎜ ⎝ 0 ⎠= r ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ a00 a00 a00 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 r cos ϕ sin θ ⎟=⎜ ⎟ ⎜a10 ⎟ = A e0 , = A3 (ϕ + π2 ) ⎜ = ⎝−r sin θ ⎠ ⎝ r sin ϕ sin θ ⎠ (18.19) ⎝a20 ⎠ a30 r cos θ r cos θ d. h. A3 (ϕ +
π )A1 (θ )B3 (β) e0 = A e0 . 2
(18.20)
Dann können wir aber die Sätze 18.6c und 18.3a anwenden. Demgemäß existiert eine Drehung R2 mit 2 = A3 (ϕ )A2 (ψ )A1 (θ ) R
∈ SO(3)
so, dass 2 1 B3 (β) R A=R
1 = A3 (ϕ + π )A1 (θ ) mit R 2
(18.21)
D Die Gruppen SU(2) und SL(2, C) Nach Satz 18.3 ist SO(3) eine „3-parametrige Gruppe“, weil jedes Element A ∈ SO(3) in der Form A = R3 (γ )R2 (β)R1 (α) ,
0 ≤ α, β, γ < 2π
geschrieben werden kann. Wir betrachten nun die Gruppe SU(2) = {A ∈ C2×2 | A∗ A = E , det(A) = 1} .
(18.22)
Wertet man diese Bedingungen aus, so ergibt sich Satz 18.9 SU(2) besteht aus allen Matrizen der Form a −b , A= b a
a, b ∈ C mit |a|2 + |b|2 = 1 .
(18.23)
D
Die Gruppen SU(2) und SL(2, C)
157
Die Elemente von SU(2) entsprechen also den Punkten einer dreidimensionalen Sphäre S3 := {(a, b) ∈ C2 | |a|2 + |b|2 = 1} und hängen also ebenfalls von 3 reellen Parametern ab, so dass man fragen kann, ob ein Zusammenhang zu SO(3) besteht. Zunächst hat man folgende analoge Aussage zu Satz 18.3 Satz 18.10 Definiert man für α ∈ R die Matrizen
cos α/2 i sin α/2 S1 (α) = , i sin α/2 cos α/2
cos α/2 − sin α/2 S2 (α) = , sin α/2 cos α/2 (18.24)
iα/2 0 e , S3 (α) = 0 e−iα/2 so ist S j (α) ∈ SU(2), und es gilt: Zu jedem A ∈ SU(2) gibt es α, β, γ ∈ [0, 4π [, so dass A = S3 (γ )S2 (β)S1 (α) bzw. (evtl. mit anderen Winkeln!) A = S3 (α)S2 (β)S3 (γ )
(18.25)
(18.26)
Insbesondere ist SU(2) zusammenhängend. Beweis Wir begnügen uns damit, die Formel (18.26) zu beweisen. Sei also gemäß 18.9 a −b , a, b ∈ C, |a|2 + |b|2 = 1 . A= (18.23) b a Dann schreiben wir zunächst a = |a| eiϕ ,
b = |b| eiψ
(18.27)
% & mit ϕ, ψ ∈ [0, 2π [. Wegen (18.23) gibt es dann ein θ ∈ 0, π/2 , so dass |a| = cos θ ,
|b| = sin θ .
Die Matrix A hat dann die Form cos θ eiϕ − sin θ e−iψ A= sin θ eiψ cos θ e−iϕ = S3 (ϕ − ψ) S2 (2θ ) S3 (ϕ + ψ) ,
(18.28)
(18.29) (18.30)
wie man sofort überprüft. – Dass SU(2) zusammenhängend ist, folgt aus (18.25) oder (18.26) wie in Anmerkung 18.4.
158
18 Drehgruppe und L ORENTZgruppe
Bemerkung Der Beweis ergibt (18.26) mit α = ϕ−ψ ∈]−2π, 2π [ , β = 2θ ∈ [0, π ] und γ = ϕ + ψ ∈ [0, 4π [. Aber S3 (t ± 2π ) = −S3 (t), also kann man durch eine Verschiebung um ±2π auch erreichen, dass 0 ≤ α < 2π , 0 ≤ γ < 4π ist, und mit diesen Laufbereichen hat man dann eine eindeutige Parametrisierung von SU(2). ↑ Nach Satz 18.8 ist die eigentliche orthochrone L ORENTZgruppe L + eine ↑ 6-parametrige Gruppe, denn jedes A ∈ L + kann in der Form (18.15) geschrieben werden mit den in Satz 18.7 angegebenen Generatoren A j (α), B j (β). Ferner ist ↑ SO(3) nach Satz 18.6 eine Untergruppe von L + . Betrachten wir andererseits die Gruppe SL(2, C) = {A ∈ C2×2 | det A = 1} ,
(18.31)
so sehen wir, dass diese ebenfalls von 6 reellen Parametern abhängt. Ferner ist SU(2) eine Untergruppe von SL(2, C). Für die Gruppe SL(2, C) kann man einen ↑ analogen Satz wie Satz 18.8 für L + beweisen, und insbesondere ist auch diese Gruppe zusammenhängend. Das wollen wir aber nicht tun, weil wir im Folgenden lediglich die 6 Generatoren von SL(2, C) benötigen: Definitionen 18.11 (Generatoren von SL(2, C)) S1 (α) =
cos α/2 i sin α/2 i sin α/2 cos α/2
eiα/2 0 S3 (α) = 0 e−iα/2 K 2 (β) =
S2 (α) =
,
cos α/2 − sin α/2 , sin α/2 cos α/2
cosh β/2 sinh β/2 K 1 (β) = , sinh β/2 cosh β/2
,
cosh β/2 i sinh β/2 −i sinh β/2 cosh β/2
, K 3 (β) =
β/2 0 e . 0 e−β/2
Die S j (α) sind die Generatoren von SU(2) aus Satz 18.10. Die Generatoren K j (α) dagegen sind nicht unitär. Benutzt man die bekannten Formeln cos iβ = cosh β ,
sin iβ = i sinh β ,
so sieht man, dass K j (β) = S j (−iβ) ist.
E
Die Überlagerungsabbildung
159
E Die Überlagerungsabbildung ↑
Wir wollen nun einen Zusammenhang zwischen den Gruppen L + und SL(2, C) einerseits und SO(3) und SU(2) andererseits herstellen, wie ihn die gerade angestellten Betrachtungen über die Anzahl der Parameter schon suggerieren. L ORENTZtransformationen Λ = (λμν ) operieren als lineare Abbildungen im M INKOWSKI-Raum M 4 = R4 der Vektoren x = x0 e0 + x1 e1 + x2 e2 + x3 e3 ,
xμ ∈ R
mit der quadratischen Form S(x) = x|Gx = x02 − x12 − x22 − x32
(18.32)
und sind durch S(Λx) = S(x) ,
x ∈ M4
(18.33)
charakterisiert. Dies ist zu Bedingung (18.2) äquivalent, da man Satz 17.5a sowie die Polarisationsgleichung 2v|Gw = S(v + w) − S(v) − S(w)
(18.34)
verwenden kann. In vielen Fällen ist es jedoch praktisch, den folgenden zu M 4 isomorphen Vektorraum H zu betrachten: Satz 18.12 Sei H ⊆ C2×2 der reelle Vektorraum der H ERMITEschen 2 × 2Matrizen, versehen mit dem Skalarprodukt X | Y :=
1 Spur (X Y ) . 2
(18.35)
a. Die vier Matrizen 10 01 0 i 1 0 σ0 = , σ1 = , σ2 = , σ3 = . 01 10 −i 0 0 −1
(18.36)
bilden eine Orthonormalbasis von H. Insbesondere ist H ein vierdimensionaler reeller H ILBERTraum. b. Für die Entwicklung X=
3 μ=0
x0 + x3 x1 − i x2 xμ σμ = x1 + i x2 x0 − x3
,
xμ ∈ R
(18.37)
160
18 Drehgruppe und L ORENTZgruppe
von X ∈ H nach dieser Basis gilt det X =
x02
−
x12
−
x22
−
x32
=S
3
x μ eμ ,
(18.38)
μ=0
d. h. der durch τ eμ = σμ ,
μ = 0, 1, 2, 3
(18.39)
gegebene Isomorphismus τ : R4 −→ H überführt die L ORENTZsche quadratische Form in die Determinante. c. Jede lineare Abbildung Λ : H −→ H mit det(Λ(X )) = det X
∀X ∈H
(18.40)
ist eine L ORENTZtransformation in dem Sinn, dass die Matrix, welche Λ bezüglich der Basis {σ0 , . . . , σ3 } repräsentiert, zu L = O(1, 3) gehört. Alle Behauptungen können sofort nachgerechnet werden (Übung!). Insbesondere folgt c aus b und der Charakterisierung (18.33). Bemerkungen (i) Das auf H verwendete Skalarprodukt ist ein Spezialfall des Skalarprodukts, das auf Cn×n durch die Formel X |Y :=
n 1 1 Spur X ∗ Y = x jk y jk n n j,k=1
für X = (x jk ) , Y = (y jk ) gegeben ist. Es handelt sich also im wesentlichen um 2 das euklidische Skalarprodukt auf Cn – der Faktor 1/n sorgt lediglich dafür, dass die Einheitsmatrix die Norm 1 hat. (ii) Die Matrizen (h¯ /2)σ1 , −(h¯ /2)σ2 und (h¯ /2)σ3 sind die berühmten PAULIschen Spinmatrizen. Sei nun A ∈ SL(2, C). Dann definieren wir eine Abbildung Λ A : H −→ H
durch Λ A (X ) := AX A∗ , X ∈ H.
(18.41)
Da die Matrizenmultiplikation distributiv ist, ist Λ A eine lineare Abbildung. Wegen Λ A (X )∗ = (AX A∗ )∗ = A∗∗ X ∗ A∗ = AX A∗
für X ∈ H
E
Die Überlagerungsabbildung
161
ist tatsächlich Λ A (X ) ∈ H. Ferner ist det(Λ A (X )) = det(AX A∗ ) = | det A|2 det X = det X
(18.42)
wegen det A = 1, d. h. Λ A : H −→ H ist eine L ORENTZtransformation in H. Auf diese Weise bekommen wir eine Abbildung Λ
SL(2, C) A −→ Λ A ∈ L = O(1, 3) .
(18.43)
Wir zeigen, dass diese Abbildung ein Gruppenhomomorphismus ist. Seien A, B ∈ SL(2, C). Dann folgt Λ AB (X ) = (AB)X (AB)∗ = A(B X B ∗ )A∗ = AΛ B (X )A∗ = Λ A (Λ B (X )) . Wir wollen noch den Kern Kern Λ = {A ∈ SL(2, C) | Λ A = idH } bestimmen. Es ist also A ∈ Kern Λ genau dann, wenn Λ A (X ) = AX A∗ = X
für alle X ∈ H.
Wählen wir insbesondere für X die Basiselemente σμ , so folgt Aσμ A∗ = σμ
für μ = 0, 1, 2, 3.
(18.44)
Hier setzen wir nacheinander μ = 0, 1, 2 ein und verwenden schließlich noch det A = 1. So ergeben sich die folgenden Konsequenzen: a. μ = 0: Aσ0 A∗ = σ0
⇐⇒
A A∗ = σ0
⇐⇒
A ∈ SU(2)
⇐⇒
A=
a b −b a
Wir können daher (18.44) schreiben als Aσμ = σμ A
für μ = 1, 2, 3,
A ∈ SU(2) .
(18.45)
b. μ = 1:
a b −b a
a b 01 01 = 10 10 −b a
⇐⇒
a = a, b = −b
⇐⇒
⇐⇒
b a −b a = a −b a b
a = α, b = iβ,
α, β ∈ R .
.
162
18 Drehgruppe und L ORENTZgruppe
c. μ = 2:
α iβ iβ α
0 −i 0 −i α iβ = i 0 i 0 iβ α
⇐⇒
⇐⇒
−β −iα β −iα = iα β iα −β
β = 0.
d. α0 1 = det A = det = α 2 ⇒ α = ±1 . 0α Also ergibt sich insgesamt Kern Λ = {σ0 , −σ0 } ,
(18.46)
denn dass ±σ0 tatsächlich zum Kern gehören, ist klar. Betrachten wir nun noch Λ A für A ∈ SU(2). Dann folgt mit dem Skalarprodukt (18.35) Λ A (X ) | Λ A (Y ) = =
1 2
1 2
Spur (Λ A (X )Λ A (Y ))
Spur (AX A∗ AY A∗ ) = 12 Spur (X Y ) = X | Y ,
(18.47)
denn es ist A∗ = A−1 für A ∈ SU(2) sowie Spur (AX A∗ AY A∗ ) = Spur (A∗ AX Y ) = Spur (X Y ) . Gleichung (18.47) besagt, dass Λ A eine orthogonale Abbildung in H ist und daher zu O(4) gehört. Da ferner Λ A (σ0 ) = Aσ0 A∗ = A A∗ = σ0 für A ∈ SU(2) gilt, bleibt die σ0 -Achse (=e0 -Achse) fest. Nach Satz 18.1d ist daher das orthogonale Komplement LH(σ1 , σ2 , σ3 ) (=LH(e1 , e2 , e3 )) ebenfalls invariant unter Λ A , so dass die Einschränkung zu O(3) gehört. Wir fassen zusammen: Satz 18.13 a. Jedem A ∈ SL(2, C) wird durch Λ A (X ) := AX A∗ ,
X ∈H
eine L ORENTZtransformation Λ A in H zugeordnet. Für jedes A ∈ SU(2) ist Λ A eine orthogonale Abbildung in H, welche LH(σ0 ) und LH(σ1 , σ2 , σ3 ) als invariante Unterräume hat.
E
Die Überlagerungsabbildung
163
b. Die Zuordnung Λ
SL(2, C) A −→ Λ A ∈ L = O(1, 3) liefert einen Gruppenhomomorphismus Λ : SL(2, C) −→ L
mit Kern Λ = {σ0 , −σ0 } .
c. Die Zuordnung SU(2) A −→ Λ A ∈ O(3) liefert einen Gruppenhomomorphismus Φ = Λ
SU(2)
: SU(2) −→ O(3)
mit Kern Φ = {σ0 , −σ0 } .
wobei O(3) wie in Satz 18.6 als Untergruppe von L aufzufassen ist. Wir wollen noch Bild Λ ⊆ L
und
Bild Φ ⊆ O(3)
bestimmen. Dazu werden wir zu gegebenem A ∈ SL(2, C) die Matrix (λμν ) = (λμν (A)) berechnen, die die Transformation Λ A bezüglich der Basis {σ0 , σ1 , σ2 , σ3 } von H darstellt. Da H ein reeller Hilbertraum mit der Orthonormalbasis {σ0 , . . . , σ3 } bezüglich des Skalarproduktes X | Y =
1 Spur (X Y ) 2
ist, gilt λμν = σμ | Λ A (σν ) und damit nach Definition von Λ A : 1 Spur (σμ Aσν A∗ ) . (18.48) 2 a c ab an, so bekommen wir Setzen wir A in der Form A = , also A∗ = cd bd zunächst folgende Produkte λμν =
164
18 Drehgruppe und L ORENTZgruppe
2 |a| + |b|2 ac + bd , ac + bd |c|2 + |d|2 ab + ab bc + ad ∗ Aσ1 A = , ad + bc cd + cd iab − iab iad − ibc Aσ2 A∗ = , icb − iad icd − icd 2 |a| − |b|2 ac − bd Aσ3 A∗ = . ac − bd |c|2 − |d|2 Aσ0 A∗ =
Mit Formel (18.48) kann man hieraus die Matrixelemente sukzessive berechnen. Wir begnügen uns mit der 0-Spalte und stellen den Rest als Übung: λ00 = = λ10 = = λ20 = = λ30 = =
∗ 1 2 Spur (σ0 Aσ0 A ) 2 2 2 2 1 2 (|a| + |b| + |c| + |d| ) , ∗ 1 2 Spur (σ1 Aσ0 A ) 1 2 (ac + bd + ac + bd) = Re (ac + bd) , ∗ 1 2 Spur (σ2 Aσ0 A ) 1 2 (i(ac + bd) − i(ac + bd)) = Im (ac + bd) , ∗ 1 2 Spur (σ3 Aσ0 A ) 2 2 2 2 1 2 (|a| + |b| − |c| − |d| ) .
Fährt man in dieser Weise fort, so bekommt man folgendes Ergebnis: Satz 18.14 Für A=
ab ∈ SL(2, C) cd
hat die Abbildung Λ A : H −→ H bezüglich {σ0 , σ1 , σ2 , σ3 } die folgende Matrixdarstellung (λμν ): ⎛1
⎞ − |b|2 + |c|2 − |d|2 ) ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ Re (ad + bc) −Im (ad − bc) Re (ac − bd) Re (ac + bd) ⎜ ⎟ ⎜ ⎟ ⎜ ⎟. ⎜ ⎟ ⎜ ⎟ Im (ad + bc) Re (ad − bc) Im (ac − bd) Im (ac + bd) ⎜ ⎟ ⎝ ⎠ 1 2 + |b|2 − |c|2 − |d|2 ) Re (ab − cd) −Im(ab − cd) 1 (|a|2 − |b|2 − |c|2 + |d|2 ) (|a| 2 2 2 2 (|a|
+ |b|2 + |c|2 + |d|2 ) Re (ab + cd) −Im (ab + cd)
1 2 2 (|a|
Insbesondere ist λ00 = 12 (|a|2 + |b|2 + |c|2 + |d|2 ) > 0
E
Die Überlagerungsabbildung
165
und Spur (Λ A ) = |a|2 + |d|2 + 2Re (ad) = (Re a + Re d)2 + (Im a + Im d)2 ≥ 0 . Aus den beiden letzten Aussagen lassen sich folgende Konsequenzen ziehen: a. Wegen λ00 > 0 ist Bild Λ ⊆ L ↑ , und insbesondere ist T ∈ Bild Λ und
− E ∈ Bild Λ .
b. Wegen Spur (Λ A ) ≥ 0 und Spur P = −2 ist auch P ∈ Bild Λ , ↑
↑
und das bedeutet: Bild Λ ⊆ L + . Dass tatsächlich Bild Λ = L + ist, überprüft man, ↑ indem man zeigt, dass die 6 Generatoren A j (α), B j (β) von L + gemäß Satz 18.7 allesamt in Bild Λ liegen: Satz 18.15 Bezeichnen S j (α), K j (β) die in Satz 18.11 angegebenen Generatoren von SL(2, C) und sind A j (α), B j (β) die in Satz 18.7 angegebenen Generatoren ↑ von L + , so gilt Λ(S j (α)) = A j (α) , Λ(K j (β)) = B j (β)
,
j = 1, 2, 3 .
Das rechnet man mit Satz 18.14 als Übung nach. Die explizite Formel für die Matrixelemente von Λ A zeigt auch, dass diese Polynome und damit analytische Funktionen der Matrixelemente von A sind. Wir können das Ergebnis aller dieser Überlegungen also folgendermaßen zusammenfassen: Theorem 18.16 ↑
a. Die in Satz 18.13 b. definierte Abbildung Λ : SL(2, C) −→ L + liefert einen analytischen Epimorphismus mit Kern Λ = {σ0 , −σ0 }. b. Die in Satz 18.13 c. definierte Abbildung Φ : SU(2) −→ SO(3) liefert einen analytischen Epimorphismus mit Kern Φ = {σ0 , −σ0 }. Bemerkung Die Homomorphismen Λ und Φ werden als Überlagerungsabbildungen (engl. „covering maps“) bezeichnet, und man sagt, SL(2, C) (bzw. SU(2)) sei die ↑ universelle Überlagerung (engl. „universal covering“) von L + (bzw. von SO(3)). Diese Terminologie hat nichts mit Überlagerungen im Sinne von Superposition zu
166
18 Drehgruppe und L ORENTZgruppe
tun. Vielmehr spielt sie auf gewisse topologische Aspekte an, die für die moderne Teilchenphysik durchaus wichtig sind, hier aber zu weit führen (vgl. [59, 60, 62, 85]). Wir werden in Abschn. 22D noch etwas näher darauf eingehen, müssen es aber, was Einzelheiten betrifft, bei den Literaturhinweisen belassen.
F Quaternionen Ist man nur an den Gruppen SO(3) und SU(2) interessiert, so ist es zweckmäßig, anstelle des H ILBERTraumes H = LHR (σ0 , σ1 , σ2 , σ3 ) aus Satz 18.12, der aus HERMITEschen Matrizen besteht, einen anderen H ILBERTraum zu benutzen, der die unitären Matrizen als Teilmenge enthält. Satz 18.17 Es seien 10 0 i 0 −1 i 0 e0 = , e1 = , e2 = , e3 = , 01 i 0 1 0 0 −i
(18.49)
und es sei H := LHR (e0 , e1 , e2 , e3 ) die Menge aller reellen Linearkombinationen q=
3 μ=0
x + ix3 −x2 + ix1 xμ eμ = 0 x2 + ix1 x0 − ix3
.
(18.50)
Dann gilt: a. H bildet einen 4-dimensionalen H ILBERTraum mit dem Skalarprodukt q1 | q2 = 12 Spur (q1∗ q2 )
(18.51)
und der Orthonormalbasis {e0 , e1 , e2 , e3 }. b. Die Menge SU(2) bildet die Einheitssphäre in H, d. h. SU(2) = {q ∈ H | q = 1} .
(18.52)
c. Die Menge H bildet bezüglich der Matrizenaddition und -multiplikation einen sogenannten Schiefkörper, d. h. es gelten alle Körperaxiome mit Ausnahme des Kommutativgesetzes der Multiplikation. Die Elemente q ∈ H heißen Quaternionen (die Bezeichnung H erinnert an ihren Entdecker H AMILTON). Die Aussagen des Satzes lassen sich wieder durch einfache Rechnungen bestätigen, die als Übungen empfohlen seien. Für Teil b. sollte man
F Quaternionen
167
dabei die Form (18.23) der Elemente von SU(2) heranziehen, und für c. ist zu beachten, dass man nur die Aussage q = 0
⇒
det q = 0
nachzuprüfen hat. Das ist aber klar wegen der Beziehung q2 = det q
für alle q ∈ H,
(18.53)
die man ohne weiteres aus (18.50) und (18.51) folgert. Mit Hilfe des Raumes H kann man nun ebenfalls den Epimorphismus Φ : SU(2) −→ SO(3) konstruieren. Für festes s ∈ SU(2) definiert man eine Abbildung Fs : H −→ H durch
Fs (q) := sqs ∗ ,
(18.54)
die sicher linear ist. Beachtet man (18.53), so folgt aus (18.54) Fs (q)2 = det(Fs (q)) = det(sqs ∗ ) = det q = q2 , d. h. jedes Fs ist eine orthogonale Abbildung in H, gehört also zu O(4). Wegen Fs (e0 ) = se0 s ∗ = e0
(18.55)
ist der 1-dimensionale Unterraum U0 := LHR (e0 ) invariant unter Fs und daher nach Satz 18.1d auch das orthogonale Komplement V := U0⊥ = LHR (e1 , e2 , e3 ) .
(18.56)
R(s) := Fs ,
(18.57)
Definieren wir daher V
so ist R(s) ∈ O(3), und genau wie im Beweis von Satz 18.13 erkennen wir, dass die Zuordnung R
SU(2) s −→ R(s) ∈ O(3) ein Gruppen-Homomorphismus mit Kern R = {e0 , −e0 } ist. Genau wie bei der Abbildung Λ : SL(2, C) −→ L aus Theorem 18.16 kann man nun die Matrix R(s) = (ri j )
bezüglich der Basis {e1 , e2 , e3 }
von V bestimmen. Es gilt allgemein ri j (s) = ei | R(s)e j =
1 2
Spur (ei∗ se j s ∗ ) .
(18.58)
168
18 Drehgruppe und L ORENTZgruppe
Wegen e j = iσ j und σ j∗ = σ j ergibt das ri j (s) = λi j (s) (i, j = 1, 2, 3), und durch Einsetzen in die Formel aus Satz 18.14 bekommt man dann folgendes Ergebnis: Satz 18.18 a. Ist
x + ix3 −x2 + ix1 A= 0 x2 + ix1 x0 − ix3
∈ SU(2) ⊆ H ,
so hat die lineare Abbildung R(A) ∈ SO(3) bezüglich der Basis {e1 , e2 , e3 } die folgende Matrixdarstellung: ⎛
x02 + x12 − x22 − x32
⎜ ⎝ 2(x0 x3 + x1 x2 ) 2(x1 x3 − x0 x2 )
2(x1 x2 − x0 x3 ) x02 − x12 + x22 − x32 2(x0 x1 + x2 x3 )
2(x0 x2 + x1 x3 )
⎞
⎟ 2(x2 x3 − x0 x1 ) ⎠ . x02 − x12 − x22 + x32
(18.59)
b. R stimmt mit dem Epimorphismus Φ aus Theorem 18.16b. überein. Bezeichnen S j (α), j = 1, 2, 3 die Generatoren von SU(2) aus Satz 18.10 und R j (α), j = 1, 2, 3 die Generatoren von SO(3) aus 18.3, so gilt insbesondere R(S j (α)) = R j (α),
j = 1, 2, 3 .
(18.60)
Aufgaben zu Kap. 18 18.1 Ohne die Behauptungen von Satz 18.5b zu benutzen, beweise man die Aussagen (i) und (ii) aus dessen Beweis und vervollständige den Beweis damit. (Hinweis zu (ii): Mittels der S CHWARZschen Ungleichung zeige man zunächst |a01 b10 + 2 − 1)1/2 (b2 − 1)1/2 .) a02 b20 + a03 b30 | ≤ (a00 00 18.2 Sei e0 = (1, 0, 0, 0)T , und Z ± := {x ∈ R4 | x|Gx > 0 , e0 |Gx ≷ 0} sei die Menge der in die Zukunft (bzw. in die Vergangenheit) gerichteten zeitartigen Weltvektoren. Man zeige: a. A ∈ L , Ae0 ∈ Z + ⇒ A ∈ L ↑ . A(Z + ) = Z + . (Hinweis: Man verwende Satz 18.8 und beb. A ∈ L ↑ ⇒ ⇒ v0 > |v j | für j = 1, 2, 3 achte, dass v = (v0 , v1 , v2 , v3 )T ∈ Z + (warum?).) c. L ↑ = {A ∈ L | A(Z + ) = Z + }.
Aufgaben
169 ↑
↓
18.3 Man zeige, dass L 0 = L + ∪ L − eine Untergruppe von L ist. 18.4 Für v = (x, y, z)T ∈ R3 setze ⎛
⎞ 0 −z y N (v) := ⎝ z 0 −x ⎠ −y x 0 Man zeige: a. Ist |v| = 1 und α ∈ R, so bewirkt die Matrix D(α, v) := E + (sin α)N (v) + (1 − cos α)N (v)2 Die Drehung um den Winkel α, deren Drehachse von v aufgespannt wird und deren Drehsinn durch die Rechte-Hand-Regel bestimmt ist. Insbesondere ist D(α, v) ∈ SO(3). b. Sei B 3 := {v ∈ R3 | |v| ≤ 1} die abgeschlossene Einheitskugel im dreidimensionalen Raum, und sei P : B 3 → SO(3) definiert durch " D(π |v|, v/|v|) für v = 0 P(v) := E für v = 0 . Diese Abbildung ist stetig und surjektiv. c. Für jedes A ∈ SO(3) ist −1 ≤ Spur A ≤ 3. Was bedeutet Spur A = −1 für den Drehwinkel? (Hinweis: Satz 18.2.) d. Sei H := {A ∈ SO(3) | Spur A = −1}. Dann bildet P die offene Kugel U := {v | |v| < 1} bijektiv auf SO(3) \ H ab. e. Die Sphäre S2 = ∂ B 3 wird von P auf H abgebildet. Dabei hat jedes A ∈ H genau zwei Urbilder ±v ∈ S2 . 18.5 Man beweise, dass SO(3) zum dreidimensionalen reellen projektiven Raum RP3 homöomorph ist (vgl. Beispiel 1.7a). (Hinweis: Man verwende (18.52) und den Epimorphismus Φ.) 18.6 Man bestimme die Konjugiertenklassen in G = SU(2) (vgl. Aufgabe 17.15). Dazu zeige man: a. Jede Matrix A ∈ SU(2) ist in G konjugiert zu S3 (α) für geeignetes α ∈ R. (Hinweis: Da A normal ist, ist sie diagonalisierbar, und die Ähnlichkeitstransformation auf Diagonalgestalt kann durch eine unitäre Matrix bewirkt werden.) b. S3 (α) und S3 (−α) sind konjugiert. c. Sei K α die Konjugiertenklasse von S3 (α). Auf K α hat die Spur den Wert Spur A = 2 cos
α . 2
170
18 Drehgruppe und L ORENTZgruppe
d. Die Konjugiertenklassen von G sind genau die K α mit 0 ≤ α ≤ 2π . e. Zwei Elemente A, B ∈ G sind genau dann in G konjugiert, wenn ihre Spuren übereinstimmen. f. Wird G wie in Satz 18.17 mit S3 identifiziert, so ist für 0 ≤ α ≤ 2π ⎧ 3 ⎨
⎫ ⎬ α xμ eμ x0 = cos Kα = , ⎩ 2⎭ μ=0 ist also für 0 = α = 2π eine zweidimensionale Sphäre vom Radius sin (α/2). Was sind K 0 und K 2π ? (Hinweis: Was sind die Spuren der Matrizen eμ ?) 18.7 Seien e0 , e1 , e2 , e3 die Matrizen aus (18.49). a. Die 8 Matrizen ±eμ , μ = 0, . . . , 3 bilden eine Untergruppe von SL(2, C). Man beweise dies durch explizite Berechnung aller vorkommenden Matrizenprodukte. b. Bei einer Quaternion q = v0 e0 + v1 e1 + v2 e2 + v3 e3 bezeichnet man v0 als den Realteil und den Vektor v = (v1 , v2 , v3 )T als den Vektorteil. Eine Quaternion heißt rein-imaginär, wenn ihr Realteil verschwindet. Man beweise: Sind q = v1 e1 + v2 e2 + v3 e3
und r = w1 e1 + w2 e2 + w3 e3
zwei rein-imaginäre Quaternionen, so hat ihr Produkt qr den Realteil −v · w = −(v1 w1 + v2 w2 + v3 w3 ) und als Vektorteil gerade das Vektorprodukt v × w. c. Die konjugierte Quaternion zu q = v0 e0 + v1 e1 + v2 e2 + v3 e3 ist q¯ := v0 e0 − v1 e1 − v2 e2 − v3 e3 . Man zeige: q q¯ = qq ¯ = q2 e0 ,
2 q −1 = q/q ¯ .
18.8 Man beweise, dass U(n) zusammenhängend ist. (Hinweis: Die Eigenwerte einer unitären Matrix U haben bekanntlich stets den Betrag 1, und man kann U unitär diagonalisieren, d. h. es gibt eine unitäre Matrix S, für die SU S −1 Diagonalgestalt hat. Aufgrund dieser Tatsachen ist es leicht, eine Kurve anzugeben, die U innerhalb von U(n) mit der Einheitsmatrix E verbindet.) 18.9 Sei G ≤ O(n) eine Untergruppe. Wenn es ein Gitter Γ des Rn (Aufgabe 17.3) gibt mit A(Γ ) = Γ
für alle A ∈ G
Aufgaben
171
(kurz: wenn G ein Gitter invariant lässt), so nennt man G eine kristallographische Punktgruppe. Für solch eine Gruppe G beweise man die folgenden Aussagen: a. Es gibt eine reguläre Matrix S ∈ Rn×n mit der Eigenschaft, dass die Matrixelemente der S −1 AS , A ∈ G sämtlich ganze Zahlen sind. b. Für jedes A ∈ G ist die Spur eine ganze Zahl zwischen −n und n. c. G ist eine endliche Gruppe. (Hinweis: Man betrachte S wie in Teil a und überlege sich, dass es für die Beträge der Matrixelemente von S −1 AS , A ∈ G eine feste obere Schranke gibt.) d. Ist n = 3 und R ∈ G ∩ SO(3) eine Drehung, so muss der Drehwinkel eine der Zahlen 2π, π, 2π/3, π/2, π/3 sein. (Hinweis: Der Drehwinkel bestimmt die Spur!) e. Ist n = 3, so kommen für die Ordnungen der Elemente von G (vgl. Aufgabe. 17.4) nur die Zahlen 1, 2, 3, 4, 6 in Frage. (Hinweis: Ist T ∈ G eine Spiegelung, so ist −T eine Drehung.) f. Warum gibt es keine Kristalle mit fünfzähliger Symmetrieachse?
Kapitel 19
L IE-Gruppen und L IE-Algebren
Abgesehen von den Permutationsgruppen (Beispiel 6 aus Kap. 17), den Gittern (Aufgabe 17.3) und den kristallographischen Gruppen (Aufgabe 18.9) interessieren in der Physik hauptsächlich kontinuierliche Gruppen, d. h. solche, deren Elemente kontinuierlich variiert werden können. Man kann sie auch als Transformationsscharen betrachten, welche von endlich vielen reellen Parametern abhängen (oder auch von unendlich vielen, doch ist das ein fortgeschrittenes Thema, auf das wir hier nicht eingehen können). Typische Beispiele hierfür haben wir im vorigen Kapitel kennengelernt: a. Nach Satz 18.3 kann jedes Element R ∈ SO(3) durch E ULERsche Winkel in der Form % % R = R(α, β, γ ) := R3 (γ )R2 (β)R1 (α), α, β, γ ∈ 0, 2π (19.1) beschrieben werden. Dies lässt sich auffassen als eine Parameterdarstellung der 3-dimensionalen Mannigfaltigkeit SO(3) im 9-dimensionalen Raum R3×3 . b. Nach Satz 18.10 kann jedes Element A ∈ SU(2) ebenfalls in der Form A = A(α, β, γ ) := S3 (γ )S2 (β)S1 (α),
% % α, β, γ ∈ 0, 4π
(19.2)
durch drei Winkel dargestellt werden. Dies lässt sich auffassen als eine Parameterdarstellung einer 3-dimensionalen Mannigfaltigkeit im komplexen H ILBERTraum C2×2 , der – nach Übergang zu Real- und Imaginärteil – mit R8 identifiziert werden kann. ↑ c. Nach Satz 18.8 lässt sich jedes Element Λ ∈ L + durch 6 Parameter beschreiben, und zwar in der Form Λ = Λ(ϕ, θ, β, ϕ , ψ , θ ) := A3 (ϕ + π2 )A1 (θ )B3 (β)A3 (ϕ )A2 (ψ )A1 (θ ) , (19.3) wobei 0 ≤ ϕ, θ, ϕ , θ , ψ < 2π, β ∈ R. Dies kann man auffassen als eine Para↑ meterdarstellung der 6-dimensionalen Mannigfaltigkeit L + im 16-dimensionalen reellen Raum R4×4 . K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_19, C Springer-Verlag Berlin Heidelberg 2010
173
174
19 L IE-Gruppen und L IE-Algebren
Alle physikalisch bedeutsamen Matrixgruppen sind von diesem Typ. Sie stel2 2 2 len also Untermannigfaltigkeiten von Rn bzw. Cn ≡ R2n dar, und wenn man diese (zumindest in der Nähe der Einheitsmatrix E) parametrisiert, so erhält man eine parameterabhängige Schar von Transformationen. Differentiation nach diesen Parametern an der Stelle X = E liefert dann die entsprechenden infinitesimalen Transformationen, und mittels der Exponentialfunktion kann man aus diesen die eigentlichen Gruppenelemente zurückgewinnen. Daher wiederholen und vertiefen wir in Abschn. A die einschlägigen Kenntnisse über die Exponentialfunktion und den Logarithmus von Matrizen. In Abschn. B definieren wir präzise, wann eine aus Matrizen bestehende Gruppe eine L IE-Gruppe ist („lineare L IE-Gruppen“), überzeugen uns, dass die klassischen Gruppen von diesem Typ sind, und geben auch einen Ausblick auf den allgemeinen Begriff der L IE-Gruppe als einer Mannigfaltigkeit mit kompatibler Gruppenstruktur. Das hervorstechendste Merkmal der infinitesimalen Transformationen ist die Tatsache, dass mit A, B auch der Kommutator [A, B] := AB − B A eine infinitesimale Transformation desselben Typs ist. Die infinitesimalen Transformationen, die aus den Transformationen einer gegebenen L IE-Gruppe durch Differentiation am Punkt Eins entstehen, bilden daher eine sog. L IE-Algebra, d. h. eine Rechenstruktur, in der die Bildung von Linearkombinationen und Kommutatoren unbegrenzt möglich ist. Dieser Begriff, der schon in den Kap. 3 und 6 angeklungen ist, wird in Abschn. C exakt definiert, es werden etliche Beispiele gegeben, und vor allem wird die Beziehung zwischen einer L IE-Gruppe und ihrer L IE-Algebra genauer untersucht. Wir beenden das Kapitel dann in Abschn. D mit einer knappen Diskussion der speziellen L IE-Algebren, die zu den in Kap. 18 betrachteten Gruppen gehören. Das Wechselspiel zwischen L IE-Gruppen und ihren L IE-Algebren (anders gesagt, zwischen Transformationen und infinitesimalen Transformationen) ist eigentlich der Angelpunkt der ganzen Theorie, und es wird uns in Kap. 22 auch noch einmal beschäftigen. Detaillierte Untersuchungen können zumeist in der entsprechenden L IE-Algebra viel leichter vorgenommen werden als in der L IE-Gruppe selbst, und die Ergebnisse können dann mittels der Exponentialfunktion weitgehend in die Gruppe übertragen werden. Dass diese Übertragung nicht völlig uneingeschränkt möglich ist, liegt daran, dass die Exponentialfunktion i. A weder injektiv noch surjektiv ist. Allerdings bildet die Exponentialfunktion stets eine Umgebung der Null in der L IE-Algebra diffeomorph auf eine Umgebung der Eins in der Gruppe ab (s. u. Satz 19.2 und Theorem 19.11b), und daher können die lokalen Verhältnisse, die in einer geeigneten Umgebung der Eins in der Gruppe herrschen, exakt durch die entsprechende L IE-Algebra beschrieben werden. In vielen Anwendungen hat man es denn auch gar nicht mit einer ganzen Gruppe zu tun, sondern nur mit einer sog. lokalen L IE-Gruppe, d. h. einer parametrisierten Schar von Transformationen in der Nähe der identischen Transformation, bei
A
Exponentialfunktion und Logarithmus von Matrizen
175
der Multiplikation und Inversenbildung durch analytische Funktionen der Parameter beschrieben werden und bei der die Gruppenaxiome immer dann erfüllt sind, wenn die betrachteten Transformationen in der betreffenden Umgebung der Eins liegen. Lokale L IE-Gruppen sowie die Auswirkung der in ihnen enthaltenen Transformationen auf die transformierten Größen können vollständig durch entsprechende L IE-Algebren beschrieben werden, und das eröffnet z. B. die Möglichkeit, explizite Lösungen von Differentialgleichungen durch Ausnutzung von deren Symmetrien und infinitesimalen Symmetrien zu gewinnen. Diesen interessanten Aspekt – der sogar den historischen Ausgangspunkt der ganzen L IE-Theorie bildet – können wir hier jedoch nicht vertiefen und verweisen dazu u. A. auf [18, 58, 75] oder [63].
A Exponentialfunktion und Logarithmus von Matrizen Die Exponentialfunktion einer quadratischen Matrix A ∈ Kn×n ist bekanntlich durch die konvergente Potenzreihe e A ≡ exp A :=
∞ Ak k!
(19.4)
k=0
definiert. Natürlich handelt es sich dabei um einen Spezialfall der in den Aufgaben 8.5, 8.7, 8.19 und 16.3 behandelten Exponentialfunktion eines beschränkten linearen Operators, und insbesondere kann man sich für eine H ERMITEsche Matrix A auch vorstellen, dass exp A mittels des stetigen Funktionalkalküls durch Einsetzen von A in die Funktion f (λ) = eλ zustande kommt. Für unsere jetzigen Zwecke reicht jedoch eine elementare Behandlung der Exponentialmatrix, wie sie etwa in [34], Kap. 19 gegeben wurde. Insbesondere wurden dort die folgenden Tatsachen bewiesen: Theorem 19.1 Für beliebige n × n-Matrizen A, B und Zahlen s, t gilt stets a.
d exp t A = A exp t A = (exp t A)A , t ∈ R . Für gegebenes x ∈ Kn dt ist die vektorwertige Funktion y(t) := et A x sogar die eindeutige Lösung der Anfangswertaufgabe y˙ = Ay ,
b. c. d. e. f. g.
y(0) = x.
e A+B = e A e B , falls A und B vertauschen, d. h. falls AB = B A. e(s+t)A = es A et A . −1 = e−A . e A ist regulär, e A A Spur A . det e = e −1 Se A S −1 = e S AS für jede reguläre Matrix S. T ∗ T ∗ e A = e A und e A = e A .
176
19 L IE-Gruppen und L IE-Algebren
h. Die Eigenwerte von e A sind die Zahlen eλ , wobei λ die Eigenwerte von A ∈ Cn×n durchläuft. Dabei ist die (algebraische) Vielfachheit eines Eigenwerts μ von e A stets gleich der Summe der Vielfachheiten der Eigenwerte λ von A, für die μ = eλ ist. 2
2
2
Wir erinnern nun daran, dass man Rn×n bzw. Cn×n mit Rn bzw. mit Cn = R2n identifizieren kann, indem man die n 2 Matrixelemente bzw. Real- und Imaginärteil der Matrixelemente als die Koordinaten auffasst. Die Gruppe GL(n, K) = {A ∈ Kn×n | det A = 0} ist dann eine offene Teilmenge und somit ebenfalls eine differenzierbare Mannigfaltigkeit. Die Exponentialreihe (19.4) definiert wegen 19.1d eine differenzierbare (sogar analytische!) Abbildung exp : Kn×n −→ GL (n, K), die in der Nähe des Nullpunktes ein lokaler Diffeomorphismus ist: Satz 19.2 a. Die Exponentialabbildung exp : Kn×n A −→ e A ∈ GL (n, K) liefert einen analytischen Diffeomorphismus von einer offenen Umgebung U0 von 0 ∈ Kn×n auf eine offene Umgebung U1 von E ∈ GL(n, K). Die Ableitung dieses Diffeomorphismus im Punkt X = 0 ist d exp0 = id.
(19.5)
b. Insbesondere existieren ε > 0, δ > 0, so dass jedes A ∈ GL(n, K) mit A − E < δ eindeutig in der Form A = eB ,
mit B ∈ Kn×n , B < ε
(19.6)
dargestellt werden kann. Beweis Wir brauchen nur (19.5) nachzuweisen, denn dann folgt a. aus dem klas2 sischen Satz über inverse Funktionen, angewandt auf den Raum Kn der n × nMatrizen, und b ist eine unmittelbare Folgerung aus a. Um das Differential zu berechnen, betrachten wir ein beliebiges H ∈ Kn×n . Nach d der Kettenregel ist dt exp(t H ) = d exp0 (H ). Aber nach Theorem 19.1a hat t=0 die linke Seite den Wert H . Somit ist d exp0 die identische Abbildung, wie behauptet. Es ist naheliegend, die lokale Umkehrabbildung als Logarithmus zu bezeichnen. Auch für den Logarithmus wollen wir nun eine Potenzreihendarstellung angeben. Dabei benutzen wir auf Kn×n stets die Operatornorm
B
Lineare L IE-Gruppen und allgemeine L IE-Gruppen
177
A := sup |Ax|, |x|≤1
wobei | · |, wie immer, die euklidische Norm auf Kn bezeichnet. Satz und Definition 19.3 Für A ∈ Cn×n mit A < 1 konvergiert die Reihe ln(E + A) :=
∞ (−1) j−1
j
j=1
Aj
(19.7)
absolut, und es gilt eln(E+A) = E + A ln(e ) = A A
für A < 1 ,
für A < ln 2 .
(19.8) (19.9)
Man nennt ln(E + A) den Logarithmus von E + A. Beweis Die absolute Konvergenz von (19.7) folgt aus A j ≤ A j (vgl. (8.5)) und der absoluten Konvergenz der TAYLORreihe ln(1 + z) =
∞ (−1) j−1 j=1
j
zj
für |z| < 1,
während sich (19.8) und (19.9) aus den Gleichungen eln(1+z) = 1 + z ln(ez ) = z
für |z| < 1,
für |z| < ln 2
ergeben. Setzt man hier statt z eine Matrix A ein, so ist jeder Term der entstehenden Potenzreihen von der Form cm Am mit cm ∈ C, und somit kommutieren alle diese Terme. Das Einsetzen der einen Potenzreihe in die andere liefert daher im Falle der Matrix dasselbe Ergebnis wie im Falle der Zahl z.
B Lineare L IE-Gruppen und allgemeine L IE-Gruppen Wir beginnen mit L IE-Gruppen, die aus Matrizen bestehen, und wenden uns erst danach dem allgemeinen Fall zu: Definition 19.4 Eine Untergruppe G ≤ GL(n, K) heißt eine lineare L IE-Gruppe, 2 wenn G gleichzeitig eine Untermannigfaltigkeit von Rn×n ≡ Rn bzw. von Cn×n ≡ 2 R2n ist.
178
19 L IE-Gruppen und L IE-Algebren
Alle klassischen Gruppen sind lineare L IE-Gruppen. Das folgt z. B. für SL(n, R) direkt aus dem Satz vom regulären Wert (Theorem 1.21), angewandt auf die Funktion f : Rn×n −→ R, X −→ det X . Dass 1 ein regulärer Wert für f ist, erkennt man am bequemsten mittels der bekannten (und leicht zu beweisenden!) E ULERschen Homogenitätsrelation: Wegen f (t X ) = t n f (X ) für t ∈ R ist d f X (X ) = n f (X ), also d f X = 0 für X ∈ SL(n, R) = f −1 (1). Für die orthogonalen Gruppen haben wir es schon in Kap. 1 als Anwendungsbeispiel für den Satz vom regulären Wert bewiesen, und die dort verwendete Methode kann auf G-orthogonale und G-unitäre Gruppen verallgemeinert werden, wobei sich allerdings für den Fall einer beliebigen Matrix G eine gewisse Komplikation ergibt: Satz 19.5 Die in Satz 17.5 beschriebenen Gruppen OG (n) und UG (n) sind lineare L IE-Gruppen. Die Tangentialräume im Punkt X = E sind dabei gegeben durch TE OG (n) = {H ∈ Rn×n | H T G + G H = 0} bzw. TE UG (n) = {H ∈ Cn×n | H ∗ G + G H = 0}.
Beweis Für die Gruppen UG (n) verläuft der Beweis ähnlich wie für die OG (n), und wir besprechen daher nur die letzteren ausführlich. Sei also G ∈ Rn×n fest vorgegeben. Ist A ∈ OG (n), so definiert die Linksmultiplikation mit A−1 einen Diffeomorphismus von Rn×n auf Rn×n , und außerdem haben wir A−1 X ∈ OG (n)
⇐⇒
X ∈ OG (n),
weil es sich um eine Gruppe handelt. Ein Flachmacher (vgl. Definition 1.18) für OG (n) um den Punkt A ∈ OG (n) ist also gegeben durch h(X ) := h 0 (A−1 X ), wenn h 0 ein Flachmacher um den Punkt E ist. Daher genügt es, einen Flachmacher h 0 um E zu finden. Dazu betrachten wir die differenzierbare Abbildung Ψ : Rn×n −→ Rn×n , X −→ X T G X − G. Nach Definition ist OG (n) = GL(n, R) ∩ Ψ −1 (0). Um die totale Ableitung dΨ E im Punkt X = E zu berechnen, betrachten wir ein beliebiges H ∈ Rn×n . Man hat:
B
Lineare L IE-Gruppen und allgemeine L IE-Gruppen
179
d Ψ (E + t H ) dt t=0 d T = [t (H G + G H ) + t 2 H T G H ] dt t=0
dΨ E (H ) =
= H T G + G H. Setze nun W := Bild dΨ E = {H T G + G H | H ∈ Rn×n } und d := dim W . Im n 2 -dimensionalen H ILBERTraum Rn×n haben wir den orthogonalen Projektor P auf W , und wir setzen Φ := P ◦ Ψ . Nach der Kettenregel ist dΦ E = P ◦ dΨ E , also Bild dΦ E = W und somit rang E Φ = d maximal. Daraus folgt rang X Φ = d in einer offenen Umgebung U0 ⊆ GL(n, R) von E, weil die Unterdeterminanten der JACOBImatrix stetig vom Punkt X abhängen. Für die Einschränkung Φ 0 := Φ U : U0 −→ W 0
bedeutet dies, dass der Nullvektor von W ein regulärer Wert ist, und somit zeigt Theorem 1.21, dass M1 := U0 ∩ Φ −1 (0) eine Untermannigfaltigkeit der Dimension k := n 2 − d von U0 ist. Offenbar ist U0 ∩ OG (n) ⊆ M1 . Andererseits betrachten wir den linearen Unterraum V := Kern dΨ E = {H ∈ Rn×n | H T G + G H = 0} sowie die Menge M0 := exp(V ). Zunächst zeigen wir: M0 ⊆ OG (n).
(∗)
Dazu betrachten wir die Kurve Y (t) := et H , 0 ≤ t ≤ 1 für ein H ∈ V . Es ist d d t HT t H Ψ (Y (t)) = e Ge dt dt T
= et H (H T G + G H )et H = 0 und somit Ψ (Y (1)) = Ψ (Y (0)) = 0. Dies zeigt, dass Y (1) = exp H ∈ OG (n), wie behauptet. Nach Satz 19.2 hat die Null in Rn×n eine offene Umgebung Ω mit U1 := exp(Ω) ⊆ U0 , für die exp Ω ein Diffeomorphismus Ω → U1 ist. Dann ist
180
19 L IE-Gruppen und L IE-Algebren
U1 ∩ M0 = exp(Ω ∩ V ) eine Untermannigfaltigkeit von U1 , und zwar von der Dimension k, denn nach der Dimensionsformel aus der linearen Algebra (vgl. etwa [34], Kap. 7) ist dim V = n 2 − dim Bild dΨ E = n 2 − d = k. Aber wegen (∗) ist U1 ∩ M0 ⊆ U1 ∩ OG (n) ⊆ M1 .
(∗∗)
Die Menge U1 ∩ M0 ist also eine k-dimensionale Untermannigfaltigkeit der kdimensionalen Mannigfaltigkeit M1 und daher eine offene Teilmenge. Somit hat der Punkt E eine offene Umgebung U2 ⊆ U1 mit U2 ∩ M0 = U2 ∩ M1 , und wegen (∗∗) ist dann auch U2 ∩ OG (n) = U2 ∩ M1 . Ein Flachmacher für M1 um E liefert daher (nach etwaiger Verkleinerung seines Definitionsbereiches) auch einen Flachmacher h 0 für OG (n) um E, wie gewünscht. Da also OG (n) in U2 durch die Gleichung Φ(X ) = 0 gegeben ist, ergibt sich der Tangentialraum in E zu TE OG (n) = Kern dΦ E = Kern dΨ E = V . Auch die SL(n, C) und die Gruppen G-orthogonaler (bzw. G-unitärer) Transformationen mit Determinante 1 sind lineare L IE-Gruppen, wie wir weiter unten sehen werden (vgl. Korollar 19.12). 2 Wenn man statt Untermannigfaltigkeiten von Kn allgemeine differenzierbare Mannigfaltigkeiten betrachtet, gelangt man zum allgemeinen Begriff der L IEGruppe. Dieser wurde schon in Kap. 1 (Aufgabe 1.10) gestreift, und wir wiederholen ihn hier: Definition 19.6 Eine L IE-Gruppe ist eine Gruppe G, die gleichzeitig die Struktur einer differenzierbaren Mannigfaltigkeit trägt, und bei der die Gruppenverknüpfung G × G −→ G , (g, h) −→ gh sowie die Inversenbildung G −→ G , g −→ g −1 differenzierbare Abbildungen sind. Die Mannigfaltigkeits-Struktur auf G × G ist dabei die in Beispiel 1.17e beschriebene. Man kann leicht nachprüfen, dass jede lineare L IE-Gruppe auch eine L IE-Gruppe in diesem allgemeinen Sinn ist (Übung!) Zum Nachweis der Differenzierbarkeit der Inversenbildung benutzt man dabei am besten die C RAMERsche Regel.
C
Die L IE-Algebra einer L IE-Gruppe
181
Anmerkung 19.7 Ein (nicht ganz leicht zu beweisender!) Satz von E. C ARTAN besagt: Jede abgeschlossene Untergruppe einer L IE-Gruppe ist auch eine Untermannigfaltigkeit und damit selbst eine L IE-Gruppe. Ein Beweis hierfür findet sich z. B. in [51] oder [61]. Insbesondere ist also jede abgeschlossene Untergruppe von GL(n, K) eine lineare L IE-Gruppe. Durch Verwendung dieses Satzes kann man daher ohne jede Rechenarbeit bestätigen, dass die klassischen Gruppen sämtlich L IE-Gruppen sind, doch wäre das nicht sehr instruktiv.
Kartesische Produkte Sind G1 , G2 zwei L IE-Gruppen, so hat man auf dem kartesischen Produkt G = G1 × G2 einerseits die Struktur der Produktmannigfaltigkeit (Beispiel 1.17e), andererseits die Gruppenverknüpfung des direkten Produkts (Aufgabe 17.2), und man überzeugt sich leicht, dass diese zusammen wieder eine L IE-Gruppe bilden. Analog kann man das Produkt von beliebig (aber endlich) vielen L IE-Gruppen definieren. Sind G1 , G2 lineare L IE-Gruppen, so kann man auch ihr Produkt als lineare L IEGruppe auffassen, indem man (X 1 , X 2 ) ∈ G1 × G2 mit der Block-Diagonalmatrix X=
X1 0 0 X2
identifiziert. Für mehr als zwei lineare L IE-Gruppen gilt Analoges.
Kompakte L IE-Gruppen Eine L IE-Gruppe heißt kompakt, wenn die zu Grunde liegende Mannigfaltigkeit kompakt ist. Wie wir noch sehen werden, kommt diesem Typ von Gruppen besondere Bedeutung zu. Eine Matrixgruppe G ist offenbar genau dann kompakt, wenn G eine beschränkte abgeschlossene Teilmenge von Kn×n ist. Die klassischen Gruppen sind offenbar abgeschlossen, da sie durch Gleichungen wie etwa X T G X = G oder det X = 1 gegeben sind. Beschränkt – und damit kompakt – sind die orthogonalen und die unitären Gruppen, denn aus X ∗ X = E folgt Spur (X ∗ X ) = n, und diese Spur ist gerade das Quadrat der euklidischen Norm auf Cn×n (vgl. Bemerkung (i) nach Satz 18.12). Die Argumentation im reellen Fall ist analog. Jedoch ist die L ORENTZgruppe oder die Gruppe der euklidischen Bewegungen nicht kompakt.
C Die L IE-Algebra einer L IE-Gruppe Wichtig ist, dass der Tangentialraum TE (G) an eine L IE-Gruppe G in E nicht nur ein Vektorraum ist, sondern eine zusätzliche algebraische Struktur trägt. Diese wollen wir nun zunächst in allgemeinem Rahmen definieren.
182
19 L IE-Gruppen und L IE-Algebren
Definition 19.8 Eine L IE-Algebra L über K ist ein K-Vektorraum mit einem sogenannten L IE-Produkt L × L −→ L , (A, B) −→ [A, B] , das folgende Eigenschaften hat: a. Linearität in beiden Faktoren: [A, λB + μC] = λ [A, B] + μ [ A, C] , [λA + μB, C] = λ [A, C] + μ [B, C] .
(19.10)
b. Antikommutativität: [A, B] = − [B, A] .
(19.11)
[A, [B, C]] + [C, [A, B]] + [B, [C, A]] = 0.
(19.12)
c. JACOBI-Identität:
Bemerkung Statt (19.11) für alle A, B ∈ L zu fordern, fordert man oft [A, A] = 0 ∀ A ∈ L .
(19.13)
Wegen der Bilinearität (19.10) sind beide Forderungen äquivalent (Übung!). Beispiele 19.9 a. Kn×n mit dem Kommutatorprodukt [A, B] := AB − B A
(19.14)
ist eine L IE-Algebra. b. Allgemeiner wird jede K-Algebra (d. h. jeder K-Vektorraum, der mit einer bilinearen und assoziativen Multiplikation versehen ist – vgl. Definition 15.12a) zu einer L IE-Algebra, indem man das Kommutatorprodukt [x, y] := x y − yx einführt. c. Sei M eine differenzierbare Mannigfaltigkeit und Γ (T M) der Raum der differenzierbaren Vektorfelder auf M. Mit der L IEklammer von Vektorfeldern als Klammerprodukt bildet Γ (T M) eine L IE-Algebra, wie wir schon in Satz 3.29 gesehen haben.
C
Die L IE-Algebra einer L IE-Gruppe
183
d. Sei (M, ω) eine symplektische Mannigfaltigkeit. Die P OISSONklammer macht dann C ∞ (M) zu einer L IE-Algebra, wie aus Satz 6.30 und Korollar 6.32 hervorgeht. e. R3 mit dem Vektorprodukt [v, w] := v × w ist eine L IE-Algebra. f. Sei L eine beliebige L IE-Algebra. Ein linearer Teilraum M von L wird L IETeilalgebra genannt, wenn gilt: A, B ∈ M
⇒
[A, B] ∈ M.
Dann bildet M offenbar für sich schon eine L IE-Algebra, wenn das in L definierte Klammerprodukt verwendet wird.
Das erste dieser Beispiele ist für uns das wichtigste, wie der nächste Satz zeigen wird. Dabei – und auch im gesamten weiteren Verlauf – ist zu beachten, dass wir bei einer linearen L IE-Gruppe G ⊆ Kn×n nicht zwischen den abstrakten Tangentialräumen TX G und den Räumen TXunt G unterscheiden werden (vgl. die Diskussion vor den Definitionen 1.23). Ein Element H ∈ Kn×n gehört also genau dann zu TX G, wenn H = α(0) ˙ ist für eine C ∞ -Kurve α :] − ε, ε[−→ G mit α(0) = X . Jede derartige Kurve repräsentiert den Tangentialvektor H . Theorem 19.10 Sei G eine lineare L IE-Gruppe. Dann ist der Tangentialraum TE (G) bezüglich des Kommutatorprodukts eine L IE-Algebra, die sogenannte L IEAlgebra L(G) von G. Beweis Es ist zu zeigen, dass für beliebige Tangentenvektoren A, B ∈ TE (G) der Kommutator [A, B] = AB − B A ebenfalls ein Tangentenvektor ist. Seien also α(t), β(t) Kurven die A bzw. B repräsentieren. Dann betrachten wir die Abbildung γ (s, t) := α(t)β(s)α(t)−1 ,
s, t ∈] − ε, ε[ .
(19.15)
Für jedes feste t ist γ (0, t) = E, also ist C(t) :=
∂γ −1 ˙ (0, t) = α(t)β(0)α(t) = α(t)Bα(t)−1 ∂s
ein Vektor aus TE G. Da TE G ein abgeschlossener linearer Teilraum von Kn×n ist (Satz 7.10b), gehört also auch
184
19 L IE-Gruppen und L IE-Algebren
C(t) − B ˙ C(0) = lim t→0 t t =0 d α(t)−1 t=0 = −A, wie sich sofort ergibt, wenn man die Gleichung dt ≡ E bei t = 0 differenziert. Daher folgt
zu TE G. Aber α(t)α(t)−1
dα dα −1 ˙ (0)Bα(0)−1 + α(0)B (0) = AB − B A C(0) = dt dt und somit [A, B] ∈ TE G.
Der folgende Satz gibt den Zusammenhang zwischen einer linearen L IE-Gruppe G und ihrer L IE-Algebra L(G) präzise wieder: Theorem 19.11 Sei G ≤ GL(n, K) eine lineare L IE-Gruppe. a. Eine Matrix A ∈ Kn×n gehört genau dann zu L(G), wenn für geeignetes ε > 0 et A ∈ G ist für alle t ∈] − ε, ε[. Dann ist sogar et A ∈ G für alle t ∈ R. b. Die Exponentialabbildung liefert einen Diffeomorphismus einer Umgebung der Null in L(G) auf eine Umgebung der Eins in G. c. Die differenzierbaren Kurven Φ : R → G mit der Eigenschaft Φ(s + t) = Φ(s)Φ(t) = Φ(t)Φ(s)
∀ s, t ∈ R
(19.16)
sind genau die Kurven der Form Φ(t) = exp t A
mit A ∈ L(G).
(19.17)
Man nennt sie die Ein-Parameter-Untergruppen von G. Beweis a. Sei α(t) := et A ∈ G für |t| < ε. Dann ist α(0) = E und α(0) ˙ = A, also A ∈ TE G = L(G). Ferner kann man zu beliebigem t ∈ R ein m ∈ N so wählen, dass |t/m| < ε ist, und dann folgt et A = (e(t/m)A )m ∈ G, weil es sich um eine Gruppe handelt. Nun sei umgekehrt ein A ∈ L(G) gegeben, etwa A = α(0) ˙ mit α(0) = E. Für ˙ beliebiges X ∈ G und β(t) := α(t)X haben wir dann β(0) = X und β(0) = AX , also AX ∈ TX G. Durch v(X ) := AX
C
Die L IE-Algebra einer L IE-Gruppe
185
ist demzufolge auf der Mannigfaltigkeit G ein differenzierbares Vektorfeld gegeben. Nach Theorem 3.22 hat dieses Vektorfeld für jeden Anfangspunkt X ∈ G eine Integralkurve γ X :] − ε, ε[→ G. Das bedeutet insbesondere, dass Y = γ E (t) , |t| < ε eine in G verlaufende Lösung des Anfangswertproblems Y˙ = AY ,
Y (0) = E
ist. Aber dieses Problem hat nach Theorem 19.1 in Kn×n die eindeutige Lösung Y (t) = et A . Für |t| < ε ist mithin et A = γ E (t) ∈ G. b. Sei m := dim G = dim L(G), und sei U0 eine Umgebung der Null in Kn×n , auf der die Exponentialabbildung ein Diffeomorphismus ist (Satz 19.2). Da L(G)∩U0 eine m-dimensionale Teilmannigfaltigkeit von U0 ist, ist ihr Bild V0 := exp(L(G) ∩ U0 ) eine m-dimensionale Teilmannigfaltigkeit von GL(n, K). Wir wählen U0 o. B. d. A. als Kugel, so dass A ∈ L(G)∩U0 ⇒ t A ∈ L(G)∩U0 für |t| ≤ 1. Nach Teil a ist dann V0 ⊆ G, d. h. V0 ist eine m-dimensionale Teilmannigfaltigkeit der m-dimensionalen Mannigfaltigkeit G und damit eine offene Teilmenge. c. Jede Kurve der Form (19.17) verläuft nach Teil a in G und erfüllt (19.16) nach Theorem 19.1c Ist umgekehrt Φ : R → G eine differenzierbare Kurve, die ˙ (19.16) erfüllt, so ist A := Φ(0) ∈ L(G) sowie ˙ Φ(t) =
d ˙ Φ(s + t) = Φ(0)Φ(t) = AΦ(t) ds s=0
für alle t. Ferner ist Φ(0) = E (man setze s = t = 0 in (19.16)!), und damit folgt Φ(t) = et A aus Theorem 19.1a. Korollar 19.12 Ist G ≤ GL(n, K) eine lineare L IE-Gruppe, so ist auch SG := {X ∈ G | det X = 1} eine lineare L IE-Gruppe, und es gilt L(SG) = {A ∈ L(G) | Spur A = 0}.
Beweis Wegen des Determinanten-Multiplikationssatzes ist klar, dass SG eine Untergruppe von G ist. Wie wir zu Beginn des Beweises von 19.5 gesehen haben, genügt es zum Nachweis der Untermannigfaltigkeits-Eigenschaft, einen Flachmacher für SG um den Punkt X = E zu finden. Dazu setzen wir U1 := exp(U0 ), wo U0 eine offene Kugel um Null ist, auf der die Exponentialabbildung ein Diffeomorphismus ist. Dabei wählen wir U0 so klein, dass |Im Spur A| < π ist für alle A ∈ U0 . Der auf U1 definierte Logarithmus ist dann ein Diffeomorphismus, und wegen Theorems 19.1e und 19.11b bildet dieser Diffeomorphismus die Menge U1 ∩ SG auf
186
19 L IE-Gruppen und L IE-Algebren
U0 ∩ {A ∈ L(G) | Spur A = 0} ab, ist also ein Flachmacher der gesuchten Art. Damit folgen beide Behauptungen. Damit haben wir für alle in Abschn. B aufgezählten Matrixgruppen den Beweis erbracht, dass sie lineare L IE-Gruppen sind. Aufgrund von Satz 19.5 und Korollar 19.12 können wir insbesondere die L IEAlgebren der klassischen linearen L IE-Gruppen charakterisieren, wobei das L IEProdukt immer das Kommutatorprodukt [A, B] = AB − B A ist: Korollar 19.13 (L IE-Algebren der klassischen Gruppen) a. gl(n, K) ≡ L(GL (n, K)) = Kn×n , b. sl(n, K) = L(SL (n, K)) = {A ∈ Kn×n | Spur A = 0}, c. u(n) = L(U(n)) = {B ∈ Cn×n | B ∗ = −B}, d. su(n) = L(SU(n)) = {B ∈ Cn×n | B ∗ = −B, Spur B = 0}, e. o(n) = L(O(n)) = so(n) = L(SO(n)) = {B ∈ Rn×n | B T = −B}. In den Anwendungen der L IE-Theorie ist es oft wichtig, eine L IE-Gruppe – zumindest lokal – als parameterabhängige Schar von Transformationen aufzufassen. Solche lokalen Parametrisierungen können mit Hilfe der Exponentialabbildung leicht gewonnen werden: Korollar 19.14 Sei G eine m-dimensionale lineare L IE-Gruppe und X 0 ∈ G fest. Ferner sei {B1 , . . . , Bm } eine Basis des Vektorraums L(G). Durch
C
Die L IE-Algebra einer L IE-Gruppe
187
Φ(t1 , . . . , tm ) := X 0 exp
m
tk Bk
(19.18)
k=1
und Ψ (t1 , . . . , tm ) := X 0 (exp t1 B1 )(exp t2 B2 ) · · · (exp tm Bm )
(19.19)
sind dann lokale Parametrisierungen der Mannigfaltigkeit G bei X 0 gegeben. Beweis Da Linksmultiplikation mit X 0 einen Diffeomorphismus liefert, genügt es wieder, den Punkt X 0 = E zu betrachten. Die Behauptung folgt dann für Φ direkt aus Theorem 19.11b. Für Ψ sieht man sofort, dass die JACOBImatrix im Nullpunkt des Rm maximalen Rang hat, denn offenbar ist ∂Ψ (0, . . . , 0) = B j , ∂t j
j = 1, . . . , m,
und die B j sind linear unabhängig.
Bemerkung Die in den Sätzen 18.3, 18.8, 18.10 sowie in Definition 18.11 vorge↑ stellten Parametrisierungen der Gruppen SO(3) , SU(2) , SL(2, C) und L + sind Spezialfälle von (19.19). Bei diesen Gruppen tritt jedoch die Besonderheit auf, dass die lokalen Parametrisierungen in Wirklichkeit sogar global sind, d. h. die gesamte Gruppe erfassen. 19.15 Ausblick: L IE-Algebra und Exponentialabbildung bei allgemeinen L IE-Gruppen Alles bisher Besprochene gilt sinngemäß auch für allgemeine L IE-Gruppen G – man muss nur die L IE-Algebra g ≡ L(G) sowie die Exponentialabbildung exp : g → G in geeigneter Weise definieren. Unser Beweis von Theorem 19.11a gibt einen Fingerzeig, wie dies geschehen kann: Man ersetzt einen Tangentenvektor A ∈ Te G (e das Einselement der Gruppe G) durch das Vektorfeld, das entsteht, wenn man A mittels Linksmultiplikation in die Tangentialräume an beliebigen Gruppenelementen verschiebt. Für Vektorfelder ist ein Klammerprodukt erklärt (Beispiel 19.9c), und die Exponentialabbildung gewinnt man durch die Flüsse zu diesen Vektorfeldern. Genauer: Für jedes g ∈ G ist die Linksmultiplikation λg : G −→ G , x −→ gx ein Diffeomorphismus. Daher operiert G von links auf der L IE-Algebra Γ T G, indem man setzt g · v := (λg )∗ v
für g ∈ G , v ∈ Γ T G,
188
19 L IE-Gruppen und L IE-Algebren
wobei die rechte Seite im Sinne von Definition 3.25 zu verstehen ist. Die Menge der G-invarianten Vektorfelder, also g˜ := {v ∈ Γ T G | g · v = v ∀ g ∈ G} ist dann wegen Satz 3.29e eine L IE-Teilalgebra von Γ T G, d. h. v, w ∈ g˜ ⇒ [v, w] ∈ g˜ . Die G-Invarianz eines Vektorfelds v ∈ g˜ bedeutet offenbar explizit, dass v(gx) = d(λg )x (v(x))
für alle g, x ∈ G,
also ist v durch seinen Wert A = v(e) beim Einselement e schon eindeutig festgelegt. Es ist nämlich v(g) = d(λg )e (A) ,
g ∈ G,
(19.20)
und bei gegebenem Tangentialvektor A ∈ g = Te G definiert diese Gleichung auch ein G-invariantes Vektorfeld v ≡ v A . Demzufolge ist die lineare Abbildung g˜ −→ g , v −→ v(e) bijektiv, und wir können sie benutzen, um die auf g˜ gegebene L IE-Klammer nach g zu übertragen: Für A, B ∈ g setzen wir %
& % & A, B := v A , v B (e)
(19.21)
mit v A (g) := d(λg )e (A) ,
v B (g) := d(λg )e (B).
Um für A ∈ g das Exponential exp A ∈ G zu definieren, betrachtet man den Fluss zu dem durch (19.20) gegebenen Vektorfeld v ≡ v A . Die G-Invarianz von v A führt dazu, dass für die Integralkurve α A durch e die folgende Beziehung gilt: α A (s + t) = α A (s)α A (t) = α A (t)α A (s).
(19.22)
Hieraus folgert man, dass die Integralkurve für alle t ∈ R definiert ist und dass (19.22) auch für alle s, t ∈ R gilt. Die Kurve α = α A ist somit ein Gruppenhomomorphismus α : R −→ G, und man nennt solch einen (differenzierbaren) Gruppenhomomorphismus eine Ein-Parameter-Untergruppe von G. Ist umgekehrt α irgendeine Ein-ParameterUntergruppe, so setzt man A := α(0), ˙ und dann ist A ∈ Te G = g sowie α = α A .
C
Die L IE-Algebra einer L IE-Gruppe
189
Die Ein-Parameter-Untergruppen von G sind somit genau die Integralkurven durch e der G-invarianten Vektorfelder. Nach diesen Betrachtungen dürfte es einleuchten, dass exp A := α A (1)
für A ∈ g
die richtige Definition für die Exponentialabbildung ist und dass die so definierte Abbildung exp : g → G die meisten Eigenschaften der Exponentialfunktion von Matrizen teilt. Einzelheiten hierüber findet man natürlich in jedem mathematischen Lehrbuch über L IE-Gruppen, aber auch in physikorientierten Werken wie [28, 33, 62, 85].
Die Zusammenhangskomponente der Eins und der Wertebereich der Exponentialabbildung Im folgenden betrachten wir eine L IE-Gruppe G, wobei es für unsere Zwecke genügt, an eine lineare L IE-Gruppe zu denken, doch ist diese Beschränkung eigentlich nicht erforderlich. Wir wollen das schon im vorigen Kapitel beobachtete Phänomen, dass G in mehrere zusammenhängende Teile zerfallen kann, etwas systematischer untersuchen. Satz 19.16 Sei G0 die Menge der X ∈ G, die innerhalb von G durch eine stetige Kurve mit der Eins E verbunden werden können. (Man nennt G0 die Zusammenhangskomponente der Eins.) Ferner sei W := exp(L(G)) der Wertebereich der Exponentialabbildung. Es gilt dann: a. G0 ist eine offene Untergruppe von G und damit ebenfalls eine L IE-Gruppe. b. W ⊆ G0 , und G0 wird von W erzeugt, d. h. jedes Element von G0 kann als Produkt von endlich vielen Elementen von W dargestellt werden. c. L(G0 ) = L(G).
Beweis a. Nach Theorem 19.11b. umfasst W eine Umgebung U von E. Betrachte ein X 0 ∈ G0 . Die Menge U0 := X 0 U = {X 0 Y | Y ∈ U} ist dann eine Umgebung von X 0 . Ein Punkt X = X 0 exp A ∈ U0 kann durch die Kurve C(t) := X 0 exp ((1 − t)A) ,
0≤t ≤1
190
19 L IE-Gruppen und L IE-Algebren
mit X 0 verbunden werden, und X 0 kann nach Voraussetzung mit E verbunden werden. Also ist auch X ∈ G0 , d. h. wir haben U0 ⊆ G0 , und somit ist G0 eine offene Teilmenge von G. Um zu zeigen, dass G0 eine Untergruppe ist, betrachten wir zwei Elemente X i , i = 0, 1 von G0 und verbinden diese durch Kurven Ci (t) , 0 ≤ t ≤ 1 mit E. Dann ist C(t) := C0 (t)C1 (t) ,
0≤t ≤1
eine stetige Kurve, die X 0 X 1 mit E verbindet. Ferner verbindet die Kurve B(t) := C0 (t)−1 ,
0≤t ≤1
das Element X 0−1 mit E. Somit gehören X 0 X 1 und X 0−1 wieder zu G0 , was zu zeigen war. b. Die Aussage W ⊆ G0 ist klar, denn X = exp A wird durch die Kurve C(t) := exp ((1 − t)A) , 0 ≤ t ≤ 1 mit der Eins verbunden. Nun betrachten wir die Menge G1 aller endlichen Produkte von Elementen von W . Wie in Teil a. für G0 geschehen, prüft man leicht nach, dass G1 eine offene Untergruppe ist. Dabei ist G1 ≤ G0 wegen W ⊆ G0 . Nach Aufgabe 17.8b. kann man G0 dann als disjunkte Vereinigung von Links-Nebenklassen schreiben, also G0 = G1 ∪
X i G1
i∈I
mit einer geeigneten Indexmenge I , wobei X i ∈ G1 für alle i. Da die Linksmultiplikation mit einem festen Element immer ein Homöomorphismus ist, ist auch jede Nebenklasse X i G1 offen, und da die Vereinigung von offenen Mengen stets offen ist, muss die Menge H := G0 \G1 offen sein. Die Behauptung ist offenbar äquivalent zu H = ∅, und wir werden jetzt die gegenteilige Annahme zum Widerspruch führen. Angenommen also, wir hätten ein X ∈ H ⊆ G0 . Wir verbinden X mit E durch eine stetige Kurve C und beachten, dass diese Kurve nach Definition von G0 innerhalb von G0 verläuft und dass C(1) = E ∈ G1 ist. Setze t1 := inf{t ∈ [0, 1] | C(t) ∈ G1 }. Das Element C(t1 ) muss entweder in G1 oder in H liegen. Ist C(t1 ) ∈ G1 , so ist t1 > 0, denn C(0) = X ∈ H . Aber G1 ist offen und C ist stetig, also gibt es δ > 0 so, dass C(t) ∈ G1 für t1 − δ < t ≤ t1 , und das steht im Widerspruch zur Definition von t1 . Ist andererseits C(t1 ) ∈ H , so ist t1 < 1, und da H offen und C stetig ist, ist C([t1 , t1 + δ[) ⊆ H für geeignetes δ > 0. Aber auch dies steht im Widerspruch zur Definition von t1 , und folglich muss H = ∅ sein. c. ist klar wegen W ⊆ G1 und Theorem 19.11a.
C
Die L IE-Algebra einer L IE-Gruppe
191
Jedes X ∈ G0 kann also in der Form X = (exp A1 )(exp A2 ) · · · (exp Am ) mit A1 , . . . , Am ∈ L(G) = L(G0 ) geschrieben werden. Dies verallgemeinert die im vorigen Kapitel für einige spezielle Gruppen angegebenen Darstellungen von Gruppenelementen durch Produkte von „Generatoren“ auf beliebige zusammenhängende L IE-Gruppen. Jedoch haben wir bei dieser Verallgemeinerung kein allgemeingültiges Rechenverfahren, mit dem man die Zahl m oder gar die A j bestimmen könnte. Die Sätze aus dem vorigen Kapitel liefern hier (für die betrachteten speziellen Gruppen!) wesentlich detailliertere Informationen. Bemerkung Manchmal ist die Frage interessant, ob W = G0 ist, ob also jedes Gruppenelement, das durch irgendeine stetige Kurve mit der Eins verbunden werden kann, schon von der Form exp A ist, so dass man als verbindende Kurve speziell C(t) = exp ((1 − t)A) , 0 ≤ t ≤ 1 wählen kann. Dies ist z. B. der Fall, wenn G abelsch ist, denn dann ist (exp A1 )(exp A2 ) · · · (exp Am ) = exp A mit A = A1 + · · · + Am ∈ L(G). Es kommt aber durchaus vor, dass W eine echte Teilmenge von G0 ist (Aufgabe 19.9). Die tieferliegende Strukturtheorie der L IE-Gruppen zeigt jedoch, dass bei kompakten L IE-Gruppen wieder W = G0 gilt (vgl. z. B. die Konsequenzen aus dem Hauptsatz über maximale Tori in [12]).
L IE-Untergruppen und L IE-Teilalgebren Sei G eine (lineare) L IE-Gruppe mit dem neutralen Element e, g = L(G) ihre L IE-Algebra. In praktisch jedem mathematischen Lehrbuch über L IE-Gruppen wird bewiesen, dass zwischen den L IE-Teilalgebren von g und den zusammenhängenden L IE-Untergruppen von G eine bijektive Korrespondenz besteht. Wir wollen das hier nicht beweisen, jedoch erläutern, denn es gibt dabei einige Feinheiten zu beachten. Sei also H ≤ G eine Untergruppe. Ist H abgeschlossen, so ist H auch eine Untermannigfaltigkeit (Anmerkung 19.7), also selbst eine L IE-Gruppe, und dann sieht man wie in Theorem 19.10, dass h := Te H eine L IE-Teilalgebra von g ist, und wie in Theorem 19.11a sieht man, dass h = {A ∈ g | exp t A ∈ H ∀ t ∈ R}
(19.23)
gilt. Es gibt jedoch i. A. noch weitere zusammenhängende Untergruppen H von G, für die durch (19.23) eine L IE-Teilalgebra von g definiert wird. Wir betrachten dazu ein einfaches, aber typisches Beispiel: Beispiel 19.17 Sei T2 := U(1) × U(1) der zweidimensionale Torus. Seine L IEAlgebra ist g = iR × iR ∼ = R2 mit dem Klammerprodukt [v, w] ≡ 0 (vgl. Aufga-
192
19 L IE-Gruppen und L IE-Algebren
be 19.5a). Daher ist jede Gerade durch den Ursprung in R2 eine L IE-Teilalgebra. Zu ν ∈ R betrachten wir die Gerade hν , die vom Vektor (1, ν) aufgespannt wird, sowie die Untergruppe Sν := exp (hν ) = Bild ϕν mit dem Gruppenhomomorphismus ϕν : R −→ T2 , t −→ (eit , eiνt ) . Da eit = 1 nur für t/2π ∈ Z eintritt, folgert man leicht, dass ν ∈ Q sein muss, falls es Zahlen t1 = t2 gibt, für die ϕν (t1 ) = ϕν (t2 ) ist. Für irrationales ν ist der Homomorphismus ϕν also injektiv. Überdies haben wir: Behauptung Ist ν irrational, so ist Sν dicht in T2 . Beweis Seien (eiα , eiβ ) ∈ T2 und ε > 0 beliebig. Nach Aufgabe 19.3d gibt es k ∈ Z so, dass |ei(β−να) − e2π ikν | < ε. Für t := α + 2π k liegt dann ϕν (t) in der ε-Umgebung des Punktes (eiα , eiβ ), denn für die erste Komponente ergibt sich eit = eiα e2π ik = eiα , und für die zweite Komponente |eiνt − eiβ | = |eiνα | · |e2π iνk − ei(β−να) | < ε. Wegen dieser Dichtigkeit kann Sν keine Untermannigfaltigkeit von T2 sein. Aber ϕν ist ein analytischer Gruppenisomorphismus der L IE-Gruppe (R, +) auf die Untergruppe Sν von T2 , und hν spielt offenbar die Rolle der L IE-Algebra dieser Untergruppe. Man kann sich die Situation gut anschaulich vorstellen, wenn man T2 wie in Aufgabe 19.5b mit einem Rotationstorus Tr,R identifiziert. Dieser sieht aus wie die Oberfläche eines glatten Reifens, und ϕν wickelt die reelle Gerade auf diesen Reifen auf. Ist ν irrational, so windet sich die Kurve t → ϕν (t) unendlich oft um den Reifen herum, ohne je in sich selbst zurückzulaufen. Die Teilraumtopologie (Definition 1.6) auf Sν ist dann auch deutlich verschieden von der Topologie der reellen Geraden. Eine typische Umgebung eines Punktes p ∈ Sν in der Teilraumtopologie ist nämlich der Schnitt von Sν mit einer kleinen Kreisscheibe auf der Oberfläche des Reifens (Abb. 19.1), und dieser besteht aus unendlich vielen getrennten, aber beliebig dicht nebeneinander liegenden Bögen. Man kann auf Sν jedoch eine neue
D
Einige spezielle L IE-Algebren
193
Abb. 19.1 Lokales Aussehen des Wertebereichs von ϕν bei irrationalem ν. Im linken Bild ist ein kürzeres, im rechten ein längeres Intervall mittels ϕν auf dem Torus aufgewickelt. Das Bild der gesamten reellen Geraden lässt sich nicht zeichnen, da die Parallelen beliebig dicht nebeneinander liegen müssten
Topologie einführen, indem man die Bilder der offenen Teilmengen von R unter ϕν als die offenen Mengen definiert. In dieser Topologie besteht eine typische Umgebung von p nur aus einem einzigen kurzen Bogen, der über p hinwegläuft (fett in Abb. 19.1). Auf jeder dieser neuen offenen Mengen ist ϕν−1 eine Karte, und die hierdurch definierte Struktur einer differenzierbaren Mannigfaltigkeit macht Sν in der Tat zu einer L IE-Gruppe, deren L IE-Algebra mit hν identifiziert werden kann. Um diesem Phänomen Rechnung zu tragen, definiert man: Definition 19.18 Eine Untergruppe H einer L IE-Gruppe G heißt L IE-Untergruppe, unter einem injektiven differenzierbaren wenn H das Bild einer L IE-Gruppe H Gruppenhomomorphismus ϕ : H → G ist. Für die so definierten L IE-Untergruppen gilt nun der anfangs erwähnte fundamentale Satz: Theorem 19.19 Bei jeder L IE-Gruppe G gibt es zwischen den zusammenhängenden L IE-Untergruppen H von G und den L IE-Teilalgebren h von g := L(G) eine bijektive Korrespondenz. Diese ordnet jeder L IE-Teilalgebra h ⊆ g das gruppentheoretische Erzeugnis H der Menge exp (h) zu, d. h. die Menge aller endlichen unter ϕ Produkte von Elementen von exp (h). Ist umgekehrt H ≤ G das Bild von H ) wie in Definition 19.18, so ist die entsprechende L IE-Teilalgebra das Bild von L( H unter de ϕ. Ferner wird sie durch (19.23) beschrieben. Bemerkung Manche Autoren bestehen darauf, dass eine L IE-Untergruppe eine Teilmannigfaltigkeit sein muss. Diese bezeichnen die in Definition 19.18 beschriebenen Untergruppen H als immersierte L IE-Gruppen.
D Einige spezielle L IE-Algebren Wir wollen die L IE-Algebren einiger Gruppen etwas genauer untersuchen. Dazu definieren wir zunächst algebraische Begriffe, die es gestatten, L IE-Algebren ihrer Struktur nach zu vergleichen oder zu beschreiben:
194
19 L IE-Gruppen und L IE-Algebren
Definitionen 19.20 a. Seien L1 , L2 beides L IE-Algebren über K. Eine lineare Abbildung ϕ : L1 −→ L2 heißt ein L IE-Algebren-Homomorphismus, wenn % & % & ϕ( A, B ) = ϕ(A), ϕ(B)
∀ A, B ∈ L1 .
(19.24)
Ist ϕ bijektiv, so heißt er ein Isomorphismus von L IE-Algebren. Die L IEAlgebren L1 , L2 heißen isomorph, wenn ein Isomorphismus L1 → L2 existiert. b. Sei L eine N -dimensionale L IE-Algebra über K, und sei (E 1 , . . . , E N ) eine Basis des Vektorraums L. Dann heißen die (eindeutig bestimmten!) Zahlen cikj mit %
&
Ei , E j =
N
cikj E k
(19.25)
k=1
die Strukturkonstanten von L bezüglich der Basis (E 1 , . . . , E N ). Die Tabelle der Strukturkonstanten legt eine L IE-Algebra bis auf Isomorphie fest: Satz 19.21 Zwei N -dimensionale L IE-Algebren L1 , L2 über K sind genau dann isomorph, wenn es Basen (E 1 , . . . , E N ) von L1 und (F1 , . . . , FN ) von L2 so gibt, dass %
N N & & % Ei , E j = cikj E k , Fi , F j = cikj Fk k=1
(19.26)
k=1
mit denselben Strukturkonstanten cikj ∈ K. Beweis Seien Basen gegeben, für die (19.26) gilt. Definiert man dann eine lineare Abbildung ϕ : L1 −→ L2 durch ϕ(E i ) := Fi ,
i = 1, . . . , N ,
so ist ϕ jedenfalls ein Vektorraum-Isomorphismus. Sind A=
ai E i ,
B=
i
bi E i ∈ L1 ,
i
so sind ϕ(A) =
i
sowie
ai Fi ,
ϕ(B) =
i
bi Fi
(19.27)
D
Einige spezielle L IE-Algebren
[A, B] = =
195
0 i
ai E i ,
1 % & b j E j = ai b j E i , E j
j
i, j
ai b j cikj E k
i, j,k
und daher
ϕ([A, B]) =
i jk
ai b j cikj Fk =
0
=
ai Fi ,
i
% & ai b j Fi , F j
i, j
1 b j F j = [ϕ(A), ϕ(B)] .
j
Ist umgekehrt ϕ : L1 → L2 ein Isomorphismus und sind cikj die Strukturkonstanten von L1 in Bezug auf eine Basis (E 1 , . . . , E N ) von L1 , so ist (F1 , . . . , FN ) mit F j := ϕ(E j ) , j = 1, . . . , N , eine Basis von L2 , und es gilt [Fi , F j ] = ϕ([E i , E j ]) = ϕ
cikj E k
k
=
cikj Fk ,
k
d. h. es gilt (19.26).
Nun beschreiben wir die L IE-Algebren näher, die zu den in Kap. 18 betrachteten Gruppen gehören. Dabei verwenden wir die dort eingeführten Bezeichnungen R j (α), S j (α), A j (α), B j (β) für spezielle Generatoren dieser Gruppen. Ferner ist (εi jk ) der übliche ε-Tensor. Satz 19.22 a. Die L IE-Algebra su(2) = L(SU(2)) besteht aus den Matrizen der Form B=
ix y + iz , −y + iz −ix
x, y, z ∈ R
(19.28)
und hat als R-Basis die infinitesimalen Generatoren S1 =
1 0 i , 2 i 0
S2 =
1 0 −1 , 2 1 0
S3 =
1 i 0 . 2 0 −i
(19.29)
Dabei ist Sj =
d S j (α) , α=0 dα
S j (α) = eα S j ,
(19.30)
196
19 L IE-Gruppen und L IE-Algebren
und es gelten die Vertauschungsrelationen %
3 & Si , S j = εi jk Sk .
(19.31)
k=1
b. Die L IE-Algebra so(3) = L(SO(3)) besteht aus den Matrizen der Form ⎛
⎞ 0 −z y B = ⎝ z 0 x⎠ , −y x 0
x, y, z ∈ R
(19.32)
und hat als R-Basis die infinitesimalen Generatoren ⎛
⎞ 00 0 R1 = ⎝0 0 −1⎠ , 01 0
⎛
⎞ 0 01 R2 = ⎝ 0 0 0⎠ , −1 0 0
⎛ ⎞ 0 −1 0 R3 = ⎝1 0 0⎠ . 0 0 0
(19.33)
Dabei ist Rj =
d R j (α) , α=0 dα
R j (α) = eα R j ,
(19.34)
und es gelten die Vertauschungsrelationen %
3 & εi jk Rk . Ri , R j =
(19.35)
k=1
c. su(2) und so(3) sind isomorphe L IE-Algebren. Beweis a. Nach Korollar 19.13 wissen wir B ∈ su(2)
⇐⇒
B ∈ C2×2 ,
B ∗ = −B, Spur B = 0.
Daraus ergibt sich sofort die Form (19.28). Offensichtlich sind S j ∈ su(2) und linear unabhängig. Die Formeln (19.30) und (19.31) rechnet man als Übung nach. b. Nach Korollar 19.13 wissen wir auch B ∈ so(3)
⇐⇒
B ∈ R3×3 ,
B T = −B,
woraus die Bauart (19.32) folgt. Die Beziehungen (19.33), (19.34) und (19.35) rechnet man nach.
D
Einige spezielle L IE-Algebren
197
c. folgt aus (19.31), (19.34) und Satz 19.21. Man beachte, dass die L IE-Algebren isomorph, die Gruppen nur epimorph sind. ↑ Für die L IE-Algebra L(L) = L(L + ) = L(L + ) der (eigentlichen orthochronen) L ORENTZgruppe liefert Satz 19.5 die Beschreibung ↑
B ∈ L(L + )
⇐⇒
B ∈ R4×4 , B T G = −G B,
(19.36)
wobei G die Matrix (18.1) ist. Wegen der Bauart von G führt dies auf folgende Gleichungen: bμμ = 0, 0 ≤ μ ≤ 3,
bμ0 = b0μ , 1 ≤ μ ≤ 3 ,
(19.37)
bμν = −bνμ , 1 ≤ μ, ν ≤ 3 , so dass wir folgende Aussage bekommen: ↑
Satz 19.23 Die 6-dimensionale reelle L IE-Algebra o(1, 3) = L(L + ) besteht aus den Matrizen der Form ⎛
0 ⎜u B=⎜ ⎝v w
u 0 z −y
v −z 0 x
⎞ w y ⎟ ⎟, −x ⎠ 0
u, v, w, x, y, z ∈ R
und hat als R-Basis die infinitesimalen Generatoren ⎛ ⎛ ⎛ ⎞ ⎞ 000 0 0 0 00 00 ⎜0 0 0 0 ⎟ ⎜0 0 0 1⎟ ⎜0 0 ⎜ ⎜ ⎟ ⎟ A1 = ⎜ ⎝0 0 0 −1⎠ , A2 = ⎝0 0 0 0⎠ , A3 = ⎝0 1 001 0 0 −1 0 0 00 ⎛
⎞ 0100 ⎜1 0 0 0 ⎟ ⎟ B1 = ⎜ ⎝0 0 0 0 ⎠ , 0000
⎛
⎞ 0010 ⎜0 0 0 0 ⎟ ⎟ B2 = ⎜ ⎝1 0 0 0 ⎠ , 0000
⎛
d dα
A j (α)
A j (α) = eα A j ,
α=0
,
Bj =
d dβ
B j (β) = eβ B j ,
und es gelten die Vertauschungsrelationen
0 −1 0 0
⎞ 0 0⎟ ⎟ 0⎠ 0
⎞ 0001 ⎜0 0 0 0 ⎟ ⎟ B3 = ⎜ ⎝0 0 0 0 ⎠ . 1000
Dabei ist Aj =
(19.38)
B j (β)
β=0
,
198
19 L IE-Gruppen und L IE-Algebren
%
3 & Ai , A j = εi jk Ak , k=1
%
3 & Bi , B j = − εi jk Ak , k=1
%
3 & Ai , B j = εi jk Bk . k=1
Alle diese Formeln rechnet man sofort nach. ↑ Nach Satz 18.15 ist die Gruppe SL(2, C) eine Überlagerungsgruppe von L + , ↑ d. h. es gibt einen analytischen Epimorphismus Λ : SL(2, C) −→ L + mit Kern (Λ) = {σ0 , −σ0 }. Nach Korollar 19.13b. gilt für die entsprechende L IEAlgebra B ∈ sl(2, C)
⇐⇒
B ∈ C2×2 , Spur B = 0.
Mit den Generatoren S j (α), K j (β) von SL(2, C) aus 18.11 bekommen wir dann: Satz 19.24 Die 6-dimensionale reelle L IE-Algebra sl(2, C) besteht aus den Matrizen der Form
a + ib x + iy B= , u + iv −a − ib
a, b, u, v, x, y ∈ R
und hat als R-Basis die infinitesimalen Generatoren S1 =
K1 =
1 2
1 2
0 i , S2 = i 0
1 2
01 , K2 = 10
0 −1 , S3 = 1 0
1 2
0 i , K3 = −i 0
1 2
1 2
i 0 , 0 −i
1 0 . 0 −1
Dabei ist Sj =
d dα
S j (α)
S j (α) = eα S j ,
α=0
,
Kj =
d dβ
K j (β)
K j (β) = eβ K j ,
und es gelten die Vertauschungsrelationen
β=0
,
Aufgaben
199
% % %
Si , S j
&
=
εi jk Sk ,
k
& K i , K j = − εi jk K k , Si , K j
&
=
k
εi jk K k .
k
d. h. die L IE-Algebren sl(2, C) und o(1, 3) sind isomorph.
Aufgaben zu Kap. 19 19.1 Sei G eine lineare L IE-Gruppe und H ≤ G eine Untergruppe. Man zeige, dass dann auch der Abschluss H eine Untergruppe ist. (Hinweis: Entscheidend ist, dass Multiplikation und Inversenbildung stetige Abbildungen sind.) Bemerkung Dies gilt – mit analogem Beweis – auch für allgemeine L IE-Gruppen. 19.2 a. Man zeige, dass die L ORENTZgruppe eine unbeschränkte Teilmenge von R16 darstellt und daher nicht kompakt ist. (Hinweis: Man betrachte die L ORENTZboosts aus Satz 18.7.) b. Man zeige, dass die Gruppen SL(n, K) und GL(n, K) nicht kompakt sind. c. Man zeige, dass die symplektische Gruppe Sp(2n) eine unbeschränkte Teilmenge des Raums der reellen 2n × 2n-Matrizen darstellt, also nicht kompakt ist. (Hinweis: Man verwende die speziellen symplektischen Matrizen aus Aufgabe 17.10.) 19.3 Wir identifizieren U(1) mit der Gruppe der komplexen Zahlen vom Betrag 1, wobei die Multiplikation komplexer Zahlen als Gruppenverknüpfung dient. Man zeige nacheinander: a. Die einzige unendliche abgeschlossene Untergruppe von U(1) ist U(1) selbst. (Hinweis: Ist H ≤ U(1) abgeschlossen und unendlich, so hat H nach B OLZANO W EIERSTRASS einen Häufungspunkt ζ0 ∈ H . Multiplikation mit ζ0−1 zeigt dann, dass es in jeder noch so kleinen Umgebung der Eins Elemente = 1 von H gibt. Deren Potenzen bilden insgesamt eine dichte Teilmenge von U(1), die ganz in H liegt.) b. Jede unendliche Untergruppe von U(1) ist dicht in U(1). (Hinweis: Aufgabe 19.1 verwenden!) c. Für jedes ν ∈ R bildet Hν := {e2π ikν | k ∈ Z} eine Untergruppe von U(1). d. Hν ist genau dann endlich, wenn ν eine rationale Zahl ist. Ist ν irrational, so ist Hν dicht in U(1).
200
19 L IE-Gruppen und L IE-Algebren
19.4 Sei G = G1 × G2 das Produkt zweier linearer L IE-Gruppen Gi , aufgefasst als Gruppe von Block-Diagonalmatrizen. a. Man zeige: Die L IE-Algebra L(G) besteht genau aus den Block-Diagonalmatrizen A=
A1 0 0 A2
mit
A1 ∈ L(G1 ) , A2 ∈ L(G2 ),
und die Exponentialabbildung ist gegeben durch
A1 0 exp 0 A2
0 exp A1 = . 0 exp A2
b. Man formuliere und beweise analoge Aussagen für zwei allgemeine L IEGruppen. (Hinweis: Man verwende Aufgabe 1.9, um Tangentialräume an G mit Produkten von Tangentialräumen an G1 , G2 zu identifizieren.)
19.5 Der n-dimensionale Torus ist die L IE-Gruppe Tn := U(1) × · · · × U(1) . 34 5 2 n-mal
a. Man zeige: L(Tn ) besteht aus den n × n-Diagonalmatrizen, deren Diagonalelemente sämtlich rein-imaginär sind. Sie kann also mit Rn identifiziert werden. b. Man gebe einen Diffeomorphismus von T2 auf den Rotationstorus Tr,R aus Aufgabe 1.4 an.
19.6 Man zeige: a. Die Mannigfaltigkeit Rn bildet zusammen mit der Addition als Gruppenverknüpfung eine L IE-Gruppe. Wir bezeichnen diese mit Vn („Gruppe der Verschiebungen“). b. Die invarianten Vektorfelder auf Vn sind genau die konstanten Vektorfelder auf Rn . c. Die L IE-Algebra L(Vn ) kann mit Rn identifiziert werden. Dabei ist das Klammerprodukt gegeben durch [v, w] = 0
für alle v, w ∈ Rn .
d. Die Exponentialabbildung exp : L(Vn ) → Vn ist die identische Abbildung Rn → Rn .
Aufgaben
201
e. Jedem v = (v1 , . . . , vn ) ∈ Rn ordnen wir die (n + 1) × (n + 1)-Matrix ⎛ 1 ⎜ .. ⎜ Φ(v) := ⎜ . ⎝0 0
... .. . ... ...
⎞ v1 .. ⎟ .⎟ ⎟ 1 vn ⎠ 0 1 0 .. .
zu. Diese Matrizen sind invertierbar, und die dadurch definierte Abbildung Φ : Vn −→ GL(n + 1, R) ist ein injektiver Gruppenhomomorphismus. In diesem Sinn kann also Vn auch als Matrixgruppe aufgefasst werden. Bemerkung Analoge Aussagen gelten natürlich auch für Cn . 19.7 Sei G ≤ GL(n, R) eine lineare L IE-Gruppe und Vn die in Aufgabe 19.6 eingeführte n-dimensionale Verschiebungsgruppe. Man zeige: a. Auf EG := G × Vn ist durch (A, v) · (B, w) = (AB, Aw + v) eine Gruppenverknüpfung definiert. Was ist das neutrale Element dieser Gruppe? b. Die Gruppe EG operiert von links auf Rn durch die Vorschrift (A, v) · x := Ax + v
(19.39)
für A ∈ G , v ∈ Vn , x ∈ Rn . Die durch (A, v) definierte affine Transformation (19.39) bestimmt A und v eindeutig. Man kann EG daher als eine Gruppe von affinen Transformationen des Rn auffassen. c. Die Produktmannigfaltigkeit EG := G × Vn zusammen mit der Gruppenverknüpfung aus a. ist eine L IE-Gruppe. d. Die Abbildung Φ : EG −→ GL(n + 1, R) mit ⎛
a11 ⎜a21 ⎜ ⎜ Φ(A, v) := ⎜ ... ⎜ ⎝an1 0
⎞ v1 v2 ⎟ ⎟ .. ⎟ .⎟ ⎟ . . . ann vn ⎠ ... 0 1 ... ... .. .
a1n a2n .. .
mit A = (ai j ) , v = (v1 , . . . , vn )T
ist ein injektiver Gruppenhomomorphismus. Daher ist EG zu einer Matrixgruppe isomorph. (Hinweis: Am bequemsten ist es, mit linearen Abbildungen statt Matrizen zu rechnen. Dazu betrachte man die Abbildungen
202
19 L IE-Gruppen und L IE-Algebren
J : Rn −→ Rn+1 , (x1 , . . . , xn ) −→ (x1 , . . . , xn , 1), P : Rn+1 −→ Rn , (x1 , . . . , xn+1 ) −→ (x1 , . . . , xn ) und beachte, dass PΦ(A, v)J x = Ax + v.) e. Die Gruppe Elin G := Bild Φ ist eine Untermannigfaltigkeit von GL(n + 1, R), also eine lineare L IE-Gruppe. Der Gruppenisomorphismus Φ : EG −→ Elin G ist auch ein Diffeomorphismus. (Hinweis: Um Rechenarbeit einzusparen, verwende man den Satz aus Anmerkung 19.7.) f. Für G = O(n) ist EG, aufgefasst als eine Gruppe von affinen Transformationen, nichts anderes als die Gruppe En der euklidischen Bewegungen (Aufgaben 17.11 und 17.12). Man formuliere und beweise analoge Aussagen für den komplexen Fall. Bemerkung Ist n = 4 und G die L ORENTZgruppe, so ist EG die aus der Relativitätstheorie bekannte P OINCARÉgruppe. 19.8 a. Man zeige: Ist T = exp A mit einer reellen n × n-Matrix A, so ist die algebraische Vielfachheit eines jeden negativen reellen Eigenwertes von T eine gerade Zahl. (Hinweis: Man verwende die in Theorem 19.1 gegebene Beschreibung der Eigenwerte von e A und betrachte dabei die reellen und die nicht-reellen Eigenwerte von A getrennt.) b. Man folgere: Ist b > 0 und b = 1, so besitzt die Matrix T (b) :=
−b 0 0 −1/b
keinen reellen Logarithmus. 19.9 Es sei b > 0, aber b = 1. Wir betrachten die Matrix T (b) aus der vorigen Aufgabe. Man zeige: Für G = SL(2, R) liegt T (b) in der Zusammenhangskomponente der Eins, aber nicht im Wertebereich der Exponentialabbildung. (Hinweis: Man verbinde T (b) innerhalb von SL(2, R) zunächst mit −E und dann −E mit E.) 19.10 a. Sei V ein n-dimensionaler K-Vektorraum und End(V ), wie üblich, der Vektorraum der K-linearen Abbildungen V → V . Man zeige: Mit dem Kommutator [S, T ] := S ◦ T − T ◦ S als Klammerprodukt bildet End(V ) eine L IE-Algebra, und diese ist isomorph zu gl(n, K).
Aufgaben
203
b. Nun sei L eine beliebige n-dimensionale L IE-Algebra (also insbesondere ein n-dimensionaler Vektorraum!). Die adjungierte Darstellung von L ist definitionsgemäß die Abbildung ad : L −→ End(L) , a −→ [a, ·], d. h. für a ∈ L ist T = ad(a) der lineare Operator mit T x = [a, x] für x ∈ L. Man zeige, dass ad ein Homomorphismus von L IE-Algebren ist. (Hinweis: Hier ist die JACOBI-Identität wesentlich!) 19.11 Man zeige, dass die L IE-Algebra R3 aus Beispiel 19.9e zu so(3) und zu su(2) isomorph ist. 19.12 Sei M eine differenzierbare Mannigfaltigkeit und L = Γ (T M) die L IEAlgebra ihrer differenzierbaren Vektorfelder (Beispiel 19.9c). a. Man gebe mit Hilfe von Satz 3.27 einen Homomorphismus von L in die L IEAlgebra End(C ∞ (M)) aller linearen Operatoren C ∞ (M) → C ∞ (M) an. b. Nun sei G eine L IE-Gruppe mit dem Einselement e und m : M × G −→ M, ( p, g) −→ p · g eine differenzierbare Rechts-Operation von G auf M. Ähnlich wie in Aufgabe 6.5 ordnen wir jedem X ∈ L(G) ein Vektorfeld X ∈ Γ (M) zu, indem wir für jedes p ∈ M setzen: X ( p) := d(r p )e (X )
mit r p : G → M, g → p · g.
Man zeige: Die Abbildung L(G) −→ Γ (T M) , X −→ X ist ein Homomorphismus von L IE-Algebren. (Hinweis: Man benutze die DefiX nition der L IE-Klammer von Vektorfeldern und beachte, dass der Fluss von durch Φ(t, p) = p · exp(t X ) gegeben ist, zumindest in einer Umgebung von t = 0.) 19.13 Seien Rk , k = 1, 2, 3, die infinitesimalen Generatoren von so(3) gemäß (19.33) und seien Jk := i Rk ,
k = 1, 2, 3 ,
J+ := J1 + iJ2 ,
J− = J1 − iJ2 .
a. Man bestimme die Kommutatoren [Jk , Jl ] ,
1 ≤ k, l ≤ 3
204
19 L IE-Gruppen und L IE-Algebren
b. Man bestimme die Kommutatoren %
& J+ , J3 ,
%
& J− , J3 ,
%
& J+ , J− .
c. Man zeige J+∗ = J− ,
J−∗ = J+ .
19.14 Mit J1 , J2 , J3 , J+ , J− wie in 19.13 sei J 2 = J12 + J22 + J32 . Man zeige a. b. c.
J 2 = J J + J32 − J3 . % 2 &+ − J , L = 0 für alle L ∈ so(3). Man bestimme J 2 explizit. Ist J 2 ∈ so(3)?
19.15 a. Man bestimme die Eigenwerte und Eigenvektoren von J3 . b. Man zeige direkt mit den Vertauschungsrelationen: Ist X ∈ C3 ein Eigenvektor von J3 zum Eigenwert λ, so ist X + := J+ X
bzw. X − := J− X
ein Eigenvektor von J3 zum Eigenwert λ + 1 bzw. λ − 1, falls X + = 0 bzw. X − = 0. 19.16 Es sei E3 die Gruppe der euklidischen Bewegungen des dreidimensionalen Raums, also E3 = SO(3) × R3 als Mannigfaltigkeit. Wir identifizieren sie mit einer Gruppe Elin 3 von 4 × 4-Matrizen durch Verwendung des Isomorphismus Φ aus Aufgabe 19.7. Mit Hilfe der Translationen T j (t) := t e j ,
j = 1, 2, 3 , t ∈ R
und der Drehungen R j (t) aus Satz 18.3 definieren wir die folgenden Elemente der L IE-Algebra e3 := L(Elin 3 ): d P j := (Φ(0, T j (t))) , Dt t=0 d (Φ(R j (t), 0)) L j := Dt t=0 für j = 1, 2, 3.
Aufgaben
205
a. Man zeige, dass (P1 , P2 , P3 , L 1 , L 2 , L 3 ) eine Basis von e3 ist. b. Man bestimme die Matrizen P j , L j explizit. c. Man verifiziere die Vertauschungsrelationen [Pk , Pl ] = 0 , εklm L m , [L k , L l ] = m
[Pk , L l ] =
m
für k, l = 1, 2, 3.
εklm Pm
Kapitel 20
Grundbegriffe der Darstellungstheorie
Wie wir in Abschn. 17B gesehen haben, läuft die Diskussion von Symmetrien und Invarianzen stets darauf hinaus, eine Operation einer Gruppe G auf einer Menge Z zu untersuchen (wir betrachten o. B. d. A. nur Linksoperationen). Die dort angegebenen Beispiele machen schon klar, dass Z in vielen Fällen ein K-Vektorraum V ist und dass die Gruppenelemente als lineare Abbildungen operieren, d. h. man hat (L)
g · (αx + βy) = αg · x + βg · y
für x, y ∈ V , α, β ∈ K , g ∈ G .
Dann ist für jedes g ∈ G die Abbildung D(g) : V −→ V , x −→ g · x eine lineare Bijektion von V auf sich, gehört also zur Gruppe GL(V ) aller Vektorraum-Automorphismen von V . Die Rechenregeln (i), (ii) aus Definition 17.12 besagen nun, dass die hierdurch gegebene Abbildung D : G −→ GL(V ) ein Gruppenhomomorphismus ist, und solch einen Homomorphismus nennt man eine Darstellung von G auf V . Umgekehrt definiert jede Darstellung D : G −→ GL(V ) offenbar eine Linksoperation von G auf V , die Bedingung (L) erfüllt. Aufgabe der Darstellungstheorie ist es nun, zu untersuchen, wie eine gegebene Gruppe G auf Vektorräumen linear operieren kann.So gesehen, ist die Darstellungstheorie eine Verallgemeinerung der Spektraltheorie, denn bei der Spektraltheorie wird untersucht, wie ein linearer Operator T ∈ End(V ) auf den Vektorraum V wirkt, indem man ihn als Summe von möglichst einfachen Teilen schreibt. Am deutlichsten sieht man das im Falle eines diagonalisierbaren Operators T . Das bedeutet, dass V eine Basis besitzt, die aus lauter Eigenvektoren von T besteht, und man kann V dann als direkte Summe V = N (T − λ1 I ) ⊕ · · · ⊕ N (T − λs I ) schreiben, wobei λ1 , . . . , λs die verschiedenen Eigenwerte von T sind. Jeder Teilraum N (T − λ j I ) ist T -invariant, und die Einschränkung von T auf N (T − λ j I ) ist einfach λ j I , hat also eine völlig triviale und darüber hinaus explizit bekannte Form. K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_20, C Springer-Verlag Berlin Heidelberg 2010
207
208
20 Grundbegriffe der Darstellungstheorie
Im allgemeinen Fall erlaubt die Theorie der J ORDANschen Normalform eine ähnliche Reduktion auf einfache Bestandteile, wobei die Rolle der Eigenwerte von den sog. J ORDANblöcken übernommen wird (vgl. etwa [34], Ergänzungen zu Kap. 7). In der Darstellungstheorie spielen die irreduziblen Darstellungen die zentrale Rolle als Bausteine, aus denen beliebige Darstellungen aufgebaut werden, und in diese Thematik geben wir in Abschn. B dieses Kapitels eine erste Einführung, nachdem wir in Abschn. A die grundlegenden Begriffe definiert und durch Beispiele illustriert haben. Im abschließenden Abschn. C motivieren wir unsere Beschäftigung mit Darstellungstheorie durch eine erste physikalische Anwendung: Wir betrachten ein quantenmechanisches System, dessen H AMILTONoperator eine nichttriviale Symmetriegruppe G hat, und untersuchen dann, wie die Darstellungstheorie von G den Grad der Entartung der zulässigen Energieniveaus beeinflusst. Dabei wird auch klar werden, wieso es von grundlegender Bedeutung ist, die irreduziblen Darstellungen der einschlägigen Gruppen explizit bestimmen zu können.
A Definition und einfache Eigenschaften einer Darstellung Wir beginnen mit dem grundlegenden Vokabular der Darstellungstheorie von Gruppen: Definitionen 20.1 Sei G eine beliebige Gruppe, V ein K-Vektorraum, und sei GL(V ) die Gruppe der Vektorraum-Automorphismen von V , also der bijektiven linearen Abbildungen A von V auf V . Weiter sei GL(n, K), wie bisher, die allgemeine lineare Gruppe, also die Gruppe der invertierbaren Matrizen A ∈ Kn×n . a. Ein Gruppen-Homomorphismus D : G −→ GL (V ),
G a −→ D(a) ∈ GL (V )
heißt eine Darstellung von G auf dem Trägerraum (= Darstellungsmodul) V . Für eine Darstellung gilt also: (i) D(a) ∈ GL (V )
∀ a ∈ G,
(ii) D(a · b) = D(a)D(b)
∀ a, b ∈ G,
(iii) D(e) = I
(Identität),
A
Definition und einfache Eigenschaften einer Darstellung
209
(iv) D(a −1 ) = D(a)−1
∀ a ∈ G.
b. Ein Gruppenhomomorphismus D : G −→ GL (n, K) heißt eine Matrixdarstellung von G vom Grade n über K.
Wir illustrieren diese Begriffe zunächst durch einige Beispiele, bei denen Matrixdarstellungen im Vordergrund stehen: Beispiele 20.2 a. Ist I die identische Abbildung aus GL (V ), E = (δi j ) ∈ GL (n, K) die Einheitsmatrix, so ist durch D(a) = I
∀ a ∈ G,
bzw. D(a) = E
∀a ∈ G
(20.1)
die sogenannte triviale Darstellung von G auf V bzw. die triviale Matrixdarstellung vom Grade n definiert. b. Ist G ≤ GL(n, K), so ist die Einbettung J : G −→ GL(n, K) , X −→ X offenbar eine Matrixdarstellung vom Grad n. Man nennt sie die natürliche Darstellung oder die Standarddarstellung der Matrixgruppe G, und sie ist keineswegs uninteressant. c. Für A ∈ Kn×n ist D(t) := exp t A eine Matrixdarstellung der Gruppe G = (R, +) vom Grade n über K. d. Ist G = GL (n, K), so wird durch D(A) := det(A)
für A ∈ GL (n, K)
(20.2)
eine Matrixdarstellung von G vom Grade 1 definiert, denn D = det ist wegen dem Determinanten-Multiplikationssatz ein Gruppenhomomorphismus von GL (n, K) in die Gruppe K∗ ≡ GL (1, K). e. Die Abbildung J : U(1) e
iϕ
cos ϕ − sin ϕ −→ ∈ SO(2) sin ϕ cos ϕ
ist offenbar ein Isomorphismus von Gruppen. Dieser ist dann eine Matrixdarstellung von U(1) vom Grade 2 über R, und J −1 ist eine Matrixdarstellung von SO(2) vom Grade 1 über C.
210
20 Grundbegriffe der Darstellungstheorie
f. Nach Theorem 18.16b gibt es einen Gruppen-Epimorphismus Φ : SU(2) −→ SO(3) Dieser ist dann eine Matrixdarstellung von SU(2) vom Grade 3 über R. Bei den meisten praktisch vorkommenden Darstellungen hat man es aber mit linearen Operatoren in einem Trägerraum V zu tun. Wir skizzieren jetzt einige generelle Typen von solchen Beispielen: Beispiele 20.3 a. Sei G eine Gruppe, die auf einer Menge Z von links operiert. In vielen der Beispiele aus Abschn. 17B entstehen hieraus Darstellungen von G auf Funktionenräumen über Z in der folgenden Weise: Gegeben ist ein Vektorraum V von auf Z definierten Funktionen, und für jedes f ∈ V und jedes a ∈ G gehört die Funktion ga (z) := f (a −1 z) ,
z∈Z
wieder zu V . Durch D(a) f := ga ist dann für jedes a ∈ G eine lineare Abbildung D(a) : V → V gegeben, und man prüft durch leichte Rechnung, dass D(a1 )D(a2 ) = D(a1 a2 ) für beliebige a1 , a2 ∈ G gilt. Insbesondere ist D(a)D(a −1 ) = D(a −1 )D(a) = D(e) = idV , und somit ist jedes D(a) bijektiv mit der inversen Abbildung D(a −1 ). Auf diese Weise erhalten wir also eine Darstellung D von G auf V . b. Sei eine Darstellung D einer Gruppe G auf dem Vektorraum V gegeben. Der Raum End(V ) der linearen Operatoren in V ist dann der Trägerraum einer neuen die durch Darstellung D, D(a)T := D(a)T D(a)−1 ,
T ∈ End(V ) , a ∈ G
definiert ist. Dass dies tatsächlich eine Darstellung definiert, rechnet man (wie in Beispiel 17.10g) leicht nach (Übung!). c. Sei G eine lineare L IE-Gruppe und g = L(G). Ist A ∈ g und X ∈ G, so definiert γ (t) := X et A X −1 eine in G verlaufende Kurve, und wir haben γ (0) = E sowie γ˙ (0) = X AX −1 . Somit ist auch X AX −1 ∈ TE G = g, und es ist klar, dass dies linear von A abhängt. Für jedes X ∈ G haben wir daher die lineare Abbildung Ad(X ) : g −→ g , A −→ X AX −1 , und man rechnet problemlos nach, dass Ad(X Y ) = Ad(X )Ad(Y ) ist für X, Y ∈ G. Insbesondere ist Ad(X )Ad(X −1 ) = Ad(X −1 )Ad(X ) = Ad(E) = idg, also ist Ad(X ) invertierbar mit der Inversen Ad(X −1 ). Die so definierte Abbildung
A
Definition und einfache Eigenschaften einer Darstellung
211
Ad : G −→ GL(g) ist also eine Darstellung von G auf dem Trägerraum g = L(G). Man nennt sie die adjungierte Darstellung der (linearen) L IE-Gruppe G. Für allgemeine L IEGruppen kann man die adjungierte Darstellung in analoger Weise einführen. Eine Darstellung D auf einem endlich-dimensionalen Trägerraum kann stets durch eine Matrixdarstellung ersetzt werden. Ist etwa (b1 , . . . , bn ) eine Basis des Trägerraums V , so repräsentiert man für jedes g ∈ G die bijektive lineare Abbildung D(g) : V → V durch die reguläre Matrix (ai j (g)) mit D(g)b j =
n
ai j (g)bi ,
j = 1, . . . , n,
(20.3)
i=1
und diese Matrizen bilden dann eine Matrixdarstellung vom Grad n. Umgekehrt definiert jede Matrixdarstellung vom Grad n eine Darstellung auf dem Trägerraum Kn in offensichtlicher Weise. Bemerkung In der Quantenmechanik treten häufig endlichdimensionale Räume von Operatoren auf, die unter einer Darstellung von dem in Beispiel 20.3b beschriebenen Typ invariant sind. Dabei ist eine Symmetriegruppe G eines quantenmechanischen Systems gegeben sowie eine Darstellung D von G auf dem Zustandsraum V des Systems. Ferner hat man linear unabhängige Operatoren T1 , . . . , Tm ∈ End(V ) so, dass der von ihnen erzeugte lineare Teilraum W := LH(T1 , . . . , Tm ) unter allen , g ∈ G invariant ist, d. h. es gilt D(g) T ∈W
⇒
D(g)T ∈W
für alle g ∈ G.
durch eine Matrix In Bezug auf die Basis (T1 , . . . , Tm ) von W kann dann jedes D(g) ai j (g) repräsentiert werden, und dann gilt D(g)T j D(g)−1 =
m
ai j (g)Ti ,
j = 1, . . . , m
(20.4)
i=1
für alle g ∈ G. Das System (T1 , . . . , Tm ) wird dann als ein Tensoroperator zur Darstellung D bezeichnet. (Beispiele dazu in den Aufgaben!) Für die meisten Zwecke ist es nicht sinnvoll, zwischen Darstellungen zu unterscheiden, die sich mittels eines festen Isomorphismus ineinander umrechnen lassen, und man wird solche Darstellungen als äquivalent erklären. Als Beispiel betrachten wir den Basiswechsel für eine gegebene Darstellung D von G auf einem n-dimensionalen Trägerraum V . Diese ist bezüglich einer Basis (b1 , . . . , bn ) durch die Matrixdarstellung (20.3) gegeben, wobei wir die auftretenden Matrizen (ai j (g)) mit A(g) abkürzen wollen. Wählen wir eine andere Basis (b1 , . . . , bn ) von V , so
212
20 Grundbegriffe der Darstellungstheorie
bekommen wir eine andere Matrixdarstellung A (g) von D(g). Nach der elementaren linearen Algebra sind die Matrizen A(g) und A (g) jedoch ähnlich, d. h. es gibt eine Matrix T ∈ GL (n, K), so dass A (g) = T A(g)T −1
(20.5)
für alle g ∈ G. Dabei ist T nur abhängig von den beiden Basen und nicht etwa von g. Dies legt die im folgenden unter a., b. aufgeführten Begriffsbildungen nahe: Definitionen 20.4 a. Zwei Darstellungen D1 , D2 von G auf K-Vektorräumen V1 , V2 heißen äquivalent, wenn es einen Isomorphismus T : V1 −→ V2 gibt, so dass D2 (g) = T D1 (g)T −1
(20.6)
für alle g ∈ G. Gleichbedeutend hiermit ist die Forderung T D1 (g) = D2 (g)T
(20.7)
für alle g ∈ G. Man schreibt dann: D1 ∼ D2 . b. Zwei Matrixdarstellungen D1 , D2 : G −→ GL (n, K) heißen äquivalent, wenn es eine reguläre Matrix T ∈ GL (n, K) gibt, so dass D2 (g) = T D1 (g)T −1
∀ g ∈ G.
(20.8)
c. Ist D : G −→ GL (V ) eine Darstellung auf einem endlichdimensionalen Trägerraum, so heißt die Funktion χ D : G −→ K mit χ D (g) = Spur D(g)
(20.9)
der Charakter der Darstellung D. Äquivalente Darstellungen haben denselben Charakter, weil sich die Spur beim Übergang zu einer ähnlichen Matrix nicht ändert. Wir werden im nächsten Kapitel sehen, dass in gewissem Ausmaß die Äquivalenzklasse einer Darstellung schon durch den Charakter eindeutig festgelegt ist, also durch eine skalare Funktion auf G. Hieraus erklärt sich die grundsätzliche Bedeutung der Charaktere. Eine wichtige Teilklasse von Darstellungen bekommt man, wenn man als Trägerraum einen H ILBERTraum zu Grunde legt. Definition 20.5 Sei H ein H ILBERTraum. Eine Darstellung D von G auf H heißt eine unitäre Darstellung, wenn D(g)u | D(g)v = u | v
∀ g ∈ G,
∀ u, v ∈ H,
(20.10)
A
Definition und einfache Eigenschaften einer Darstellung
213
d. h. wenn D(g −1 ) = D(g)−1 = D(g)∗
∀ g ∈ G.
(20.11)
Ein äußerst nützlicher Kunstgriff der Darstellungstheorie besteht darin, zu einer gegebenen Darstellung auf einem H ILBERTraum durch eine Art Mittelbildung eine äquivalente unitäre Darstellung zu konstruieren. Dies ist zumindest für kompakte Gruppen immer möglich, wie wir in Kap. 21 sehen werden. Hier führen wir den besagten Trick aber schon einmal für den Spezialfall vor, wo die Gruppe endlich und der H ILBERTraum von endlicher Dimension ist: Theorem 20.6 (Satz von M ASCHKE) Ist G eine endliche Gruppe, H ein ndimensionaler H ILBERTraum, so ist jede Darstellung D von G auf H äquivalent zu einer unitären Darstellung. Beweis Sei D : G −→ GL (H ) eine gegebene Darstellung. Damit definieren wir in H ein neues Skalarprodukt (u | v) :=
D(g)u | D(g)v ,
u, v ∈ H.
(20.12)
g∈G
Es ist eine leichte Übung zu überprüfen, dass dies ein Skalarprodukt ist. Wir zeigen, dass jedes D(h) , h ∈ G bezüglich (· | ·) unitär ist: (D(h)u | D(h)v) =
D(g)D(h)u | D(g)D(h)v
g∈G
=
D(gh)u | D(gh)v
g∈G
=
D(k)u | D(k)v = (u | v),
k∈G
denn die Abbildung g −→ k := gh ist bijektiv. Die Darstellung D ist also unitär in Bezug auf das neue Skalarprodukt. Sei nun (u 1 , . . . , u n ) eine Orthonormalbasis bezüglich (· | ·) und (v1 , . . . , vn ) eine Orthonormalbasis bezüglich · | · , d. h. (u i | u j ) = δi j ,
vi | v j = δi j .
Wir definieren eine lineare Abbildung S : H −→ H durch Su i := vi ,
i = 1, . . . , n.
(20.13)
Dann gilt, wie man sofort nachrechnet Su | Sv = (u | v)
∀ u, v ∈ H
(20.14)
214
20 Grundbegriffe der Darstellungstheorie
und folglich S D(g)S −1 u | S D(g)S −1 v = (D(g)S −1 u | D(g)S −1 v) = (S −1 u | S −1 v) = u | v , d. h. die äquivalente Darstellung D (g) := S D(g)S −1
ist bezüglich des alten Skalarproduktes unitär.
Auf Grund dieses Satzes (und seiner noch zu besprechenden Verallgemeinerungen) können wir im Folgenden o.B.d.A. annehmen, dass eine Darstellung D einer kompakten Gruppe G auf einem H ILBERTraum H unitär ist. Abschließend besprechen wir noch kurz, wie man aus gegebenen Darstellungen weitere Darstellungen durch Bildung von direkten Summen und Tensorprodukten aufbauen kann. Definitionen 20.7 Seien V1 , V2 K-Vektorräume, auf denen Darstellungen D1 , D2 von G gegeben sind. a. Auf V := V1 × V2 ist durch D(g)(x1 , x2 ) := (D1 (g)x1 , D2 (g)x2 ) ,
xi ∈ Vi , g ∈ G
(20.15)
eine Darstellung definiert. Diese nennt man die direkte Summe von D1 und D2 und schreibt D = D1 ⊕ D2 . b. Sind V1 , V2 Teilräume eines Vektorraums V und ist V = V1 ⊕ V2 , so definiert man die direkte Summe D = D1 ⊕ D2 durch D(g) = D1 (g)P1 + D2 (g)P2 ,
(20.16)
wo Pi : V → Vi die zur direkten Zerlegung V = V1 ⊕V2 gehörigen Projektionen sind. c. Sind V1 , V2 von endlicher Dimension, so bilden wir das in Abschn. 2B besprochene Tensorprodukt V = V1 ⊗ V2 . Zu jedem g ∈ G gibt es dann genau eine lineare Abbildung D(g) ≡ D1 (g) ⊗ D2 (g) : V −→ V, für die gilt: D(g)(v1 ⊗ v2 ) = D1 (g)v1 ⊗ D2 (g)v2 ,
vi ∈ Vi .
(20.17)
Die Abbildung g −→ D(g) ist eine Darstellung von G, und diese bezeichnet man als das Tensorprodukt der Darstellungen D1 , D2 und schreibt D = D1 ⊗D2 .
B
Irreduzible und vollreduzible Darstellungen
215
Man kann die direkte Summe aus Teil a als einen Spezialfall von der aus b auffassen, wenn man V1 mit V1 × {0} ⊆ V und V2 mit {0} × V2 ⊆ V identifiziert. Dann ist tatsächlich V = V1 ⊕ V2 , und (20.15), (20.16) liefern dieselben Abbildungen D(g). Als Übung sollte man den folgenden Satz beweisen: Satz 20.8 Seien D1 , D2 endlichdimensionale Darstellungen von G, und seien χ1 bzw. χ2 ihre Charaktere. Der Charakter χ von D1 ⊕ D2 ist dann χ (g) = χ1 (g) + χ2 (g) ,
g ∈ G,
und der Charakter χ von D1 ⊗ D2 ist χ (g) = χ1 (g)χ2 (g) ,
g ∈ G.
B Irreduzible und vollreduzible Darstellungen Irreduzible Darstellungen haben wir schon als die einfachsten Bausteine von anderen Darstellungen beschrieben, und es ist nun an der Zeit, sie präzise zu definieren. Definitionen 20.9 Sei D eine Darstellung einer Gruppe G auf einem KVektorraum V . a. Ein linearer Teilraum U ⊆ V heißt invariant unter der Darstellung D, wenn D(g)u ∈ U
für alle u ∈ U, g ∈ G.
(20.18)
b. Die Darstellung D heißt irreduzibel, wenn es außer {0} und V keinen echten Unterraum U ⊆ V gibt, der invariant unter D ist. Anderenfalls heißt D reduzibel. c. Ein D-invarianter Teilraum U heißt irreduzibel (bzw. reduzibel), wenn die Einschränkung von D auf U irreduzibel (bzw. reduzibel) ist. Zum Beispiel ist die 3-dimensionale Standarddarstellung von SO(3) auf dem R3 irreduzibel, denn kein 1- oder 2-dimensionaler Unterraum von R3 bleibt unter allen A ∈ SO(3) invariant. Betrachten wir dagegen die folgende Darstellung von SO(2) auf dem R3 : ⎛ ⎞ 1 0 0 D cos α − sin α SO(2) −→ ⎝0 cos α − sin α ⎠ ∈ GL(3, R) . sin α cos α 0 sin α cos α Diese Darstellung ist reduzibel, denn es sind U1 = LH(e1 ) und U2 = LH(e2 , e3 ) echte invariante Unterräume. Wir wenden uns nun der Aufgabe zu, reduzible Darstellungen in irreduzible zu zerlegen. Den Ausgangspunkt hierfür bilde die folgende einfache Aussage:
216
20 Grundbegriffe der Darstellungstheorie
Satz 20.10 Sei D eine unitäre Darstellung von G auf einem H ILBERTraum H , und sei U ⊆ H ein D-invarianter Unterraum. Dann ist auch U ⊥ invariant unter D. Ferner ist D = D ⊕ D ,
(20.19)
wobei D = D U D = D ⊥ U
die Einschränkung von D auf U , die Einschränkung von D auf U ⊥ ist.
Man nennt dies eine direkte Zerlegung von D in Teildarstellungen D , D . Beweis Für T = D(g) ist T (U ) ⊆ U , also T ∗ (U ⊥ ) ⊆ U ⊥ nach (15.30). Aber T ∗ = D(g)−1 = D(g −1 ), da es sich um eine unitäre Darstellung handelt. Mit g durchläuft aber auch g −1 die ganze Gruppe, also ist U ⊥ invariant unter D. Sei nun H ein n-dimensionaler H ILBERTraum, und sei D eine unitäre Darstellung von G auf H . Sei U 1 ein D-invarianter Unterraum von minimaler Dimension. Dann ist D1 = D U eine irreduzible Teildarstellung von D. Nach Satz 1 20.10 ist U1⊥ ebenfalls invariant unter D, aber D := D U ⊥ ist i. A. reduzibel. 1
Sei daher U2 ⊆ U1⊥ ein D -invarianter Unterraum minimaler Dimension. Dann ist D2 = D U eine irreduzible Teildarstellung. Setzt man diesen Prozess fort, so endet 2 er wegen dim H = n < ∞ nach endlich vielen Schritten. So ergibt sich: Theorem 20.11 a. Jede endlich-dimensionale unitäre Darstellung D einer Gruppe G auf H ist vollreduzibel, d. h. es gibt eine direkte Zerlegung H = U1 ⊕ · · · ⊕ Um ,
D = D1 ⊕ · · · ⊕ Dm
(20.20)
in irreduzible Teildarstellungen Di = D U . i b. Ist χ der Charakter von D, χ j der Charakter von D j , so gilt χ (g) = χ1 (g) + · · · + χm (g) ∀ g ∈ G.
(20.21)
Wählt man in jedem Teilraum Ui eine Orthonormalbasis (e1i , . . . , eni i ) (wobei dim Ui = n i ), so ist (e11 , . . . , en11 , . . . , e1m , . . . , enmm ) eine Orthonormalbasis von H . Definiert man dann die zu diesen Basen gehörenden Matrixdarstellungen Di (g) ∈ GL(n i , K), so bekommt man
B
Irreduzible und vollreduzible Darstellungen
⎛ ⎜ ⎜ D(g) = ⎜ ⎝
D1 (g)
217
0
D2 (g)
0
⎞
⎟ ⎟ ⎟, .. ⎠ . Dm (g)
(20.22)
woraus dann auch sofort (20.21) folgt. Eine reduzible Darstellung D von G, die nicht unitär ist, ist i. A. nicht vollreduzibel (vgl. Aufgaben 20.5, 20.6, und 20.7). Der Beweis von Theorem 20.11a kann aber ohne weiteres imitiert werden, sobald man einen Ersatz für Satz 20.10 hat. Man hat daher folgendes Kriterium: Satz 20.12 Eine endlich-dimensionale Darstellung D einer Gruppe G auf einem K-Vektorraum V ist genau dann vollreduzibel, wenn zu jedem D-invarianten Unterraum U ⊆ V ein D-invarianter Unterraum W ⊆ V existiert, so dass V = U ⊕ W . Wir leiten nun zwei fundamentale Eigenschaften irreduzibler Darstellungen her. Theorem 20.13 Seien D1 , D2 irreduzible Darstellungen von G auf V1 bzw. V2 , und sei A : V1 −→ V2 eine lineare Abbildung, so dass D2 (g)A = AD1 (g) ∀ g ∈ G .
(20.23)
Dann gilt: Entweder D1 und D2 sind äquivalent und A ist ein Isomorphismus oder D1 und D2 sind nicht äquivalent und es ist A = 0. Beweis Seien N (A) = {v ∈ V1 | Av = 0}
der Nullraum von A,
R(A) = A(V1 )
der Wertebereich von A.
Wegen (20.23) ist AD1 (g)v = D2 (g)Av = 0
für v ∈ N (A),
also ist N (A) invariant unter D1 . Da D1 irreduzibel ist, gilt " N (A) =
V1 , d. h. A = 0, oder {0}, d. h. A injektiv.
Wegen (20.23) ist ferner D2 (g)Av = AD1 (g)v ∈ R(A)
für Av ∈ R(A),
(20.24)
218
20 Grundbegriffe der Darstellungstheorie
d. h. R(A) ist invariant unter D2 . Da D2 irreduzibel ist, gilt " R(A) =
{0}, d. h. A = 0, oder V2 , d. h. A surjektiv.
Aus (20.24) und (20.25) folgt dann die Behauptung.
(20.25)
Theorem 20.14 (S CHURsches Lemma) a. Ist D eine irreduzible Darstellung von G auf einem n-dimensionalen CVektorraum V , so sind die einzigen linearen Abbildungen A : V −→ V mit AD(g) = D(g)A
∀g ∈ G
(20.26)
Vielfache der Identität, d. h. von der Form A = λI,
λ ∈ C.
(20.27)
b. Ist D eine unitäre Darstellung von G auf einem n-dimensionalen H ILBERTraum H und sind die einzigen linearen Abbildungen A : H −→ H , die (20.26) erfüllen, von der Form (20.27), so ist D irreduzibel. Beweis a. Sei also D irreduzibel und sei A : V −→ V eine lineare Abbildung, die gemäß (20.26) mit allen D(g) vertauschbar ist. Da V ein C-Vektorraum ist, hat A einen Eigenwert λ ∈ C mit zugehörigem Eigenraum M(λ) = {v ∈ V | Av = λv} = {0}. Für ein v ∈ M(λ) folgt aus (20.26) AD(g)v = D(g)Av = λD(g)v,
also D(g)v ∈ M(λ),
d. h. M(λ) ist invariant unter D. Da D irreduzibel ist, folgt M(λ) = V,
d. h. Av = λv für alle v ∈ V ,
und somit gilt (20.27). b. Seien nun die linearen Abbildungen A : H −→ H , die mit allen D(g) vertauschen, sämtlich Vielfache der Identität. Nehmen wir an, D sei eine unitäre, aber reduzible Darstellung von G auf H . Dann gibt es einen echten D-invarianten Unterraum {0} = U ⊆ H . Nach Satz 20.10 ist dann auch W := U ⊥ invariant unter
C
Symmetrien des H AMILTONoperators
219
D, und es ist H = U ⊕ W . Sei P : H −→ H die orthogonale Projektion von H auf U . Nach (15.31) vertauscht P mit allen D(g), aber es ist kein Vielfaches der Identität im Widerspruch zur Voraussetzung. Bemerkung Auch Theorem 20.13 wird von vielen Autoren als Teil des S CHURschen Lemmas betrachtet. Das ist insofern sinnvoll, als dass die Aussagen von 20.13 und 20.14a. meist gleichzeitig angewendet werden, wie wir im nächsten Kapitel noch sehen werden. Als direkte Anwendung haben wir: Korollar 20.15 Für eine abelsche Gruppe G ist jede Darstellung auf einem n-dimensionalen komplexen Vektorraum reduzibel, falls n ≥ 2. Jede irreduzible Darstellung ist also eindimensional über C. Beweis Sei D eine irreduzible Darstellung der abelschen Gruppe G auf V . Für festes g0 ∈ G folgt dann: D(g0 )D(g) = D(g0 g) = D(gg0 ) = D(g)D(g0 )
∀ g ∈ G,
d. h. A0 := D(g0 ) erfüllt (20.26) und daher nach Theorem 20.14a auch (20.27). Alle D(g0 ) , g0 ∈ G sind also Vielfache der Identität, also wäre die Darstellung reduzibel, wenn der Trägerraum höhere Dimension als 1 hätte. Bemerkung Ein K-Vektorraum V wird in der mathematischen Fachliteratur oft als K[G]-Modul oder kurz G-Modul bezeichnet, wenn er der Trägerraum einer fest vorgegebenen Darstellung D von G ist. Dabei wird die Darstellung – wie in der Einleitung zu diesem Kapitel geschildert – als Linksoperation der Gruppe aufgefasst, und dementsprechend schreibt man für g ∈ G , x ∈ V auch g · x oder gx statt D(g) x. Eine lineare Abbildung A : V → V , die mit allen D(g) vertauscht, wird dann als G-Morphismus bezeichnet. Ein G-Morphismus verhält sich also rechnerisch wie eine lineare Abbildung, bei der die Gruppenelemente als zusätzliche Skalare fungieren. Das S CHURsche Lemma lautet in dieser Terminologie einfach: Jeder G-Morphismus eines irreduziblen G-Moduls ist ein Vielfaches der Identität.
C Symmetrien des H AMILTONoperators Bevor wir die Darstellungstheorie weiter diskutieren, wollen wir exemplarisch auf ihre Anwendung in der Quantenmechanik eingehen. Wir greifen dazu Beispiel 5 aus Abschn. 17B wieder auf, betrachten also die unitäre Darstellung D von G = SO(3) auf H = L 2 (R3 ), die durch die Formel (D(R)ψ)(x) := ψ(R −1 x),
R ∈ SO(3)
(20.28)
definiert ist. Der H AMILTONoperator eines Ein-Teilchen-Systems ist bekanntlich gegeben durch
220
20 Grundbegriffe der Darstellungstheorie
Hψ = −
h¯ 2 Δψ + V (x)ψ, 2m
(20.29)
wobei der erste Term die kinetische Energie, der zweite Term die potentielle Energie repräsentiert. Wir haben uns schon in Abschn. 17B überzeugt, dass dabei der folgende Satz gilt: Satz 20.16 Ist das Potential V (x) invariant unter SO(3), d. h. V (Rx) = V (x)
∀ R ∈ SO(3), x ∈ R3 ,
(20.30)
so ist der durch (20.29) gegebene H AMILTONoperator H auf seinem Definitionsbereich mit allen Operatoren D(R), R ∈ SO(3), der durch (20.28) gegebenen Darstellung vertauschbar. Man nennt dann SO(3) eine Symmetriegruppe des H AMILTONoperators. Dieser Satz hat wesentliche Konsequenzen für das Eigenwertproblem von H . Betrachten wir dazu die stationäre S CHRÖDINGER-Gleichung H ψ = λψ
(20.31)
und nehmen wir an, λ ∈ R sei ein Eigenwert von H und Mλ = {ψ ∈ D(H )|H ψ = λψ}
(20.32)
der zugehörige Eigenraum. Ist dann G = SO(3) eine Symmetriegruppe von H , so folgt für ψ ∈ Mλ H (D(R)ψ) = D(R)(H ψ) = λ(D(R)ψ) d. h. D(R)ψ ist ebenfalls Eigenvektor von H zum Eigenwert λ. Der Teilraum Mλ ist also invariant unter der Darstellung D. Nehmen wir nun an, M0 ⊆ D(H ) ⊆ L 2 (R3 ) sei ein irreduzibler Teilraum unter der Darstellung D von SO(3), d. h. M0 ist invariant unter D und die Einschränkung D0 = D ist eine irreduzible Darstellung von SO(3). Nach Satz 20.16 ist dann M0 der Operator H0 = H mit allen Operatoren D0 (R) vertauschbar. Dann können M0
wir aber das S CHURsche Lemma (Theorem 20.14a) anwenden und schließen, dass H0 ein Vielfaches der Identität ist, d. h. es gibt ein λ0 ∈ R, so dass H0 ψ = λ0 ψ
für alle ψ ∈ M0 .
Dann ist M0 also ein Eigenraum von H . Diese Überlegungen sind, wie man sieht, keineswegs auf die Drehgruppe beschränkt, sondern gelten in völlig analoger Weise für beliebige Symmetriegruppen des H AMILTONoperators. Wir fassen sie zu folgendem Satz zusammen:
Aufgaben
221
Satz 20.17 Sei der C-H ILBERTraum H der Zustandsraum eines quantenmechanischen Systems, dessen Gesamtenergie durch den H AMILTONoperator H : H ⊇ D(H ) −→ H repräsentiert wird. Sei ferner D eine unitäre Darstellung einer Gruppe G auf H, so dass D(R)H ψ = H D(R)ψ
∀ R ∈ G, ψ ∈ D(H ),
d. h. G ist eine Symmetriegruppe des H AMILTONoperators. Dann gilt: a. Jeder Eigenraum von H ist invariant unter der Darstellung D, d. h. ist ψ ein Eigenvektor von H zum Eigenwert λ, so ist auch jedes D(R)ψ, R ∈ G ein Eigenvektor von H zum Eigenwert λ. b. Jeder irreduzible Teilraum von H unter D ist ein Eigenraum von H , und die Dimension der irreduziblen Darstellung gibt eine untere Schranke für die Vielfachheit des zugehörigen Eigenwertes an.
Dieser Satz hat vielerlei Anwendungen in der Physik: I. Kennt man den H AMILTONoperator H und eine Symmetriegruppe G, so kann man Aussagen über die Lösungen der S CHRÖDINGER-Gleichung machen, ohne die Gleichung selbst zu lösen. II. In der Elementarteilchenphysik ist der H AMILTONoperator H – insbesondere das Potential V (x) – unbekannt. Man kann jedoch das Energiespektrum messen und damit die Teilchenmassen. Daraus kann man dann auf die Symmetriegruppe G von H schließen, womit man dann wieder Aussagen über das Potential V (x) machen kann. In jedem der Fälle muss man jedoch die irreduziblen Darstellungen der potentiellen Symmetriegruppen kennen. Daher ist es – auch unter dem Gesichtspunkt der physikalischen Anwendungen – eine Hauptaufgabe der Darstellungstheorie, die irreduziblen Darstellungen der wichtigen Gruppen zu bestimmen. Diese Aufgabe ist heute im wesentlichen gelöst, und wir werden in den beiden letzten Kapiteln auch noch auf einige der Ergebnisse zu sprechen kommen. Für die meisten derartigen Resultate müssen wir jedoch auf die weiterführende Literatur verweisen, z. B. auf [5, 8, 12, 14, 18, 29, 30, 37, 43, 58, 61, 82, 94, 96].
Aufgaben zu Kap. 20 20.1 Sei V ein beliebiger K-Vektorraum. Für invertierbare lineare Abbildungen T : V → V setzt man T −n := (T −1 )n = (T n )−1 ,
n ∈ N.
222
20 Grundbegriffe der Darstellungstheorie
Damit ist T m für alle ganzzahligen m definiert. Man zeige: a. Durch D(m) := T m ist eine Darstellung der Gruppe (Z, +) gegeben, wenn T : V → V eine feste lineare Bijektion ist. b. Seien T1 , . . . , Tk lineare Bijektionen von V auf sich, die paarweise vertauschen. Eine Darstellung der „Gittergruppe“ (Zk , +) ist dann gegeben durch D(m 1 , . . . , m k ) := T1m 1 T2m 2 · · · Tkm k . 20.2 Es sei D die Darstellung (D(R)ψ)(x) := ψ(R −1 x),
R ∈ GL(n, R)
von GL(n, R) auf L 2 (Rn ) (Verallgemeinerung von (20.28)). a. Sei M f der Multiplikationsoperator zu einer messbaren Funktion f : Rn → C. Man zeige: D(R)M f D(R)−1 = Mg
mit g(x) := f (R −1 x)
für R ∈ GL(n, R). b. Man folgere für den Fall n = 3: Das System Q = (Q 1 , Q 2 , Q 3 ) der quantenmechanischen Ortsoperatoren Q k := Mxk ist ein Tensoroperator zur Darstellung D. 20.3 Sei D dieselbe Darstellung wie in der vorigen Aufgabe, diesmal jedoch auf dem Trägerraum Sn , der aus den schnell fallenden Testfunktionen auf Rn besteht. a. Wie in Aufgabe 14.7 betrachten wir den Differentialoperator L v zu einem gegebenen C ∞ -Vektorfeld v auf Rn , der durch 1 d 1 ψ(x + tv(x)) (L v ψ)(x) := (vψ)(x) = i i dt t=0 definiert ist. Man zeige: D(R)L v D(R)−1 = L w
mit w(x) := Rv(R −1 x)
für alle R ∈ GL(n, R). b. Man folgere für den Fall n = 3: Das System P = (P1 , P2 , P3 ) der quantenmechanischen Impulsoperatoren Pk := (h¯ /i)(∂/∂ xk ) ist ein Tensoroperator zur Darstellung D. 20.4 Sei (b1 , . . . , bn ) eine Basis des n-dimensionalen K-Vektorraums V , und sei L : V → V der entsprechende Links-Shift, d. h. der lineare Operator, der auf der Basis gegeben ist durch
Aufgaben
223
Lbk := bk−1 , Lb1 := 0.
2 ≤ k ≤ n,
Ferner sei T := I − L. Man zeige: a. L n = 0. b. T ist invertierbar, und zwar ist T −1 =
n−1
Lk.
k=0
c. Die Teilräume Wm := LH(b1 , . . . , bm ) , m = 1, . . . , n sind invariant unter der Darstellung von (Z, +), die gemäß Aufgabe 20.1a durch T gegeben ist. 20.5 Es seien V, b1 , . . . , bn , L und W1 , . . . , Wn wie in Aufgabe 20.4, aber speziell mit V = Kn . Wir betrachten die Darstellung D(t) := exp t L der Gruppe (R, +). Man zeige nacheinander: a. D(t) =
n−1 k t
Lk , t ∈ R. k! k=0 b. Die Wm sind D-invariante Unterräume. c. Für 1 ≤ j ≤ k ≤ n gilt lim
t→∞
1
t
" tL
e k−1
bj =
1 (k−1)! b1
0
für j = k , für j < k .
d. Zu 0 = v ∈ V gibt es stets ein k ∈ 1, . . . , n und einen Skalar λ = 0, für die gilt: lim
1
t→∞ t k−1
et L v = λb1 .
e. Jeder D-invariante Unterraum enthält den Vektor b1 . (Hinweis: Man beachte, dass die linearen Unterräume von Kn alle abgeschlossen sind.) f. Die Darstellung D ist nicht vollreduzibel. 20.6 Sei V ein n-dimensionaler C-Vektorraum und T ∈ GL(V ). Wir betrachten die Darstellung D von (Z, +), die gemäß Aufgabe 20.1 durch T gegeben ist. Man zeige: D ist vollreduzibel ⇐⇒ T ist diagonalisierbar. (Hinweis: Man verwende Korollar 20.15.) 20.7 a. Sei A ∈ Cn×n und D(t) := exp t A die entsprechende Darstellung der Gruppe (R, +). Man zeige, dass die folgenden drei Aussagen äquivalent sind:
224
20 Grundbegriffe der Darstellungstheorie
(i) D ist vollreduzibel. (ii) Es gibt eine Basis von Cn , deren Vektoren für alle exp t A Eigenvektoren sind. (iii) A ist diagonalisierbar. (Hinweis: Für den Schritt (i) ⇒ (ii) verwende man Kor. 20.15.) b. Sei L ein Links-Shift auf Cn (vgl. Aufgabe 20.4). Man zeige, dass L nicht diagonalisierbar ist. (Hinweis: Der einzige Eigenwert ist λ = 0 (wieso?). Welche Vielfachheit hat er?) c. Man gebe nun (für K = C) einen neuen Beweis, dass die Darstellung et L von (R, +) nicht vollreduzibel ist. 20.8 Sei D eine Darstellung einer endlichen Gruppe G auf einem beliebigen K-Vektorraum V . Man zeige, dass jeder Vektor v ∈ V in einem endlichdimensionalen D-invarianten Unterraum liegt. (Hinweis: Man betrachte Wv := LH({D(g)v | g ∈ G}).) 20.9 Seien G 1 , G 2 zwei Gruppen und P := G 1 × G 2 ihr direktes Produkt (Aufgabe 17.2). Sei weiterhin Di eine Darstellung von G i auf dem endlichdimensionalen Raum Vi (i = 1, 2). Für g = (g1 , g2 ) ∈ G 1 × G 2 setzen wir D(g) := D1 (g1 ) ⊗ D2 (g2 ), d. h. D(g) ist die eindeutig bestimmte lineare Abbildung V1 ⊗ V2 → V1 ⊗ V2 , für die D(g)(v ⊗ w) = D1 (g1 )v ⊗ D2 (g2 )w für alle v ∈ V1 , w ∈ V2 gilt. Man zeige: a. D ist eine Darstellung von P auf dem Trägerraum V1 ⊗ V2 . b. Im Fall G 1 = G 2 = G ist das Tensorprodukt D1 ⊗ D2 gegeben durch D1 ⊗ D2 = D ◦ Δ mit dem Gruppenhomomorphismus Δ : G −→ G × G , g −→ (g, g) . Bemerkung Die hier eingeführte Darstellung D wird manchmal als das äußere Tensorprodukt der Darstellungen D1 , D2 bezeichnet. 20.10 Seien D s , s = 1, 2 zwei Darstellungen einer Gruppe G auf n-dimensionalen Trägerräumen Vs . Man zeige: Sie sind genau dann äquivalent, wenn sie bzgl. geeigneter Basen von V1 , V2 durch ein und dieselbe Matrixdarstellung wiedergegeben werden können. Genauer: D 1 ∼ D 2 genau dann, wenn es Basen (b1s , . . . , bns ) von
Aufgaben
225
Vs , s = 1, 2 sowie eine Matrixdarstellung (ai j (g)) vom Grade n gibt, so dass für s = 1, 2 gilt: D s (g)bsj =
n
ai j (g)bis ,
j = 1, . . . , n .
(20.33)
i=1
20.11 Sei D eine Darstellung einer Gruppe G auf einem endlichdimensionalen Trägerraum V = V1 ⊕ V2 , wobei die Vs , s = 1, 2 zwei n-dimensionale D-invariante Teilräume sind. Setze D s := D V . s
a. Gegeben seien Basen (b1s , . . . , bns ) sowie eine Matrixdarstellung (ai j (g)) so, dass (20.33) für s = 1, 2 gültig ist. Für festes (0, 0) = (ξ, η) ∈ K2 setzen wir dann b j := ξ b1j + ηb2j ,
j = 1, . . . , n
sowie Wξ η := LH(b1 , . . . , bn ). Man zeige: Wξ η ist ebenfalls n-dimensional und D-invariant, und die Darstellung Dξ η := D W ist zu den D s äquivalent. ξη
b. Man folgere: Ist D 1 ∼ D 2 , so gibt es unendlich viele D-invariante Teilräume W ⊆ V , für die die Darstellung D W zu den D s äquivalent ist. (Hinweis: Man verwende Aufgabe 20.10.) c. Man formuliere und beweise analoge Aussagen für m ≥ 2 äquivalente n-dimensionale Darstellungen. Bemerkung Dies zeigt, dass die Zerlegung (20.20) nicht eindeutig sein kann, sobald ein Äquivalenztyp darin mehrfach auftritt. Das ist eine direkte Verallgemeinerung des Verhaltens der Spektralzerlegung beim Auftreten von entarteten Eigenwerten. 20.12 Eine Darstellung D der Gruppe G auf dem Trägerraum V sei gegeben. Ein Vektor v ∈ V heißt dann zyklisch, wenn V = LH({D(g)v | g ∈ G}) . Man zeige: Die Darstellung D ist genau dann irreduzibel, wenn jeder Vektor v = 0 zyklisch ist. 20.13 a. Man zeige: Die natürlichen Darstellungen der Matrixgruppen SO(n), SU(n) auf Rn bzw. Cn sind irreduzibel. (Hinweis: Man verwende die vorige Aufgabe und beachte, dass jeder Einheitsvektor nach dem S CHMIDTschen Orthogonalisierungsverfahren zu einer positiv orientierten Orthonormalbasis ergänzt werden kann. ) b. Man folgere für das Zentrum (Aufgabe 17.5) der orthogonalen und unitären Gruppen die Ergebnisse
226
20 Grundbegriffe der Darstellungstheorie
Z (SU(n)) = {e2π ik/n E | k = 0, 1, . . . , n − 1} , " {E, −E} , falls n gerade, Z (SO(n)) = {E} , falls n ungerade. 20.14 Sei G eine Gruppe und H eine Untergruppe. Ferner sei eine Darstellung D von H auf dem Trägerraum W gegeben. Wir konstruieren nun eine Darstellung T = D G von G, die man als die von D induzierte Darstellung bezeichnet. a. Ist g ∈ G und ist f : G → W eine beliebige Funktion, so bilden wir eine neue Funktion D R (g) f : G → W , indem wir setzen: [D R (g) f ](x) := f (xg) ,
x ∈G.
Damit ist ein Endomorphismus D R (g) ∈ End(F) des Vektorraums F aller Funktionen f : G → W definiert. Man zeige, dass D R eine Darstellung von G ist. (Der Index R steht für „rechts“.) b. Man zeige, dass die Menge V := { f ∈ F | f (hx) = D(h) f (x) für alle x ∈ G , h ∈ H } einen D R -invarianten linearen Teilraum von F bildet. Die induzierte Darstellung D G ist definitionsgemäß die Einschränkung von D R auf V . 20.15 Sei Z = {z 0 , z 1 , . . . , z k } eine endliche Menge und G eine Gruppe, die auf Z transitiv von rechts operiert (vgl. Aufgabe 17.16). Ferner sei H := Σ({z 0 }) der Stabilisator von z 0 und D eine Darstellung von H auf dem Trägerraum W . Man zeige: a. Die induzierte Darstellung D G : G → GL(V ) (Aufgabe 20.14) ist äquivalent zu einer Darstellung T von G auf dem Trägerraum V˜ = W k+1 , bei der für die direkte Zerlegung V˜ = Wz 0 ⊕ Wz 1 ⊕ · · · ⊕ Wz k
(20.34)
mit W ×{0} × · · · × {0} , Wz j := {0} × · · · × {0} × 2345
j = 0, 1, . . . , k
j-te Stelle
folgendes gilt: (I1) Für alle g ∈ G , j = 0, 1, . . . , k ist T (g)(Wz j ) = Wz j g , und (I2) Für alle h ∈ H , w ∈ W ist T (h)(w, 0, . . . , 0) = (D(h)w, 0, . . . , 0).
Aufgaben
227
(Hinweis: Man setze g0 := e, und für j ≥ 1 wähle man ein g j ∈ G mit z j = z 0 g j . Die lineare Abbildung A : V −→ W k+1 , f −→ ( f (g0 ), f (g1 ), . . . , f (gk )) vermittelt dann die Äquivalenz der Darstellungen.) b. Ist T eine Darstellung von G auf W k+1 , die (I1), (I2) erfüllt, so ist T ∼ D G . c. Sei T ∼ D G und V der Trägerraum von T . Dann besitzt T auf Z ein System von Imprimitivitäten, d. h. eine Abbildung E, die jeder Teilmenge M ⊆ Z einen linearen Operator E(M) ∈ End(V) zuordnet, so dass folgendes gilt: (E1) E(∅) = 0 , E(Z ) = I . (E2) E(M1 ∩ M2 ) = E(M1 )E(M2 ) für M1 , M2 ⊆ Z . (E3) Sind M1 , M2 ⊆ Z disjunkt, so ist E(M1 ∪ M2 ) = E(M1 ) + E(M2 ), (E4) Für M ⊆ Z und g ∈ G ist E(Mg) = T (g)−1 E(M)T (g). (Hinweis: Für T = D G , insbesondere V = V , definiert man E(M) durch " [E(M) f ](g) :=
f (g) , falls z 0 g ∈ M, 0, falls z 0 g ∈ M.
Hieraus folgert man den allgemeinen Fall.) Bemerkung Aus (E2) folgt E(M)2 = E(M), also sind die E(M) Projektionsoperatoren. Man beachte die Analogie zu den Spektralmaßen (Definition 15.1 und Satz 15.2), die natürlich kein Zufall ist. 20.16 Sei G eine endliche Gruppe und A der Vektorraum der komplexen Funktionen auf G, versehen mit der Multiplikation ( f ∗ g)(x) :=
f (x y −1 )g(y)
y∈G
und der Norm f :=
| f (x)| .
x∈G
Man zeige: a. A ist eine BANACH-Algebra mit Eins, und die Abbildung f → f ∗ mit f ∗ (x) := f (x −1 ) ist eine Involution in A (vgl. die Definitionen in 15.12). Man nennt A die Gruppenalgebra zu G und schreibt A = C[G].
228
20 Grundbegriffe der Darstellungstheorie
b. Jedem g ∈ G ordnen wir die Funktion δg ∈ A zu, die für x = g den Wert 1 und sonst den Wert 0 annimmt. Dann gilt δgh = δg ∗ δh . Deshalb kann man G als Teilmenge von A auffassen, indem man g mit δg identifiziert, und dann schreiben sich die Elemente von A in der Form cg g mit cg = f (g) ∈ C . f = g∈G
c. Ist D eine Darstellung von G auf V , so ist durch Ψ ( f ) :=
f (x)D(x)
x∈G
eine Darstellung von A (im Sinne von 15.14) gegeben. Ist umgekehrt Ψ eine gegebene Darstellung von A, so definiert D(g) := Ψ (δg ) eine Darstellung der Gruppe G. d. Eine Darstellung D von G auf einem H ILBERTraum ist genau dann unitär, wenn die entsprechende Darstellung Ψ der Gruppenalgebra eine ∗-Darstellung ist, d. h. wenn für sie gilt: Ψ ( f ∗ ) = Ψ ( f )∗
für alle f ∈ A .
Kapitel 21
Darstellungstheorie kompakter Gruppen
Das einführende Material aus dem vorigen Kapitel ermöglicht es für endliche Gruppen schon, die Darstellungstheorie recht weit voranzutreiben: Zunächst einmal genügt es, sich auf endlichdimensionale Trägerräume zu beschränken (vgl. Aufgabe 20.8), und dann kann man nach dem Satz von M ASCHKE die beteiligten Darstellungen auch als unitär annehmen. Diese aber sind nach Theorem 20.11 vollreduzibel, und für ihre irreduziblen Bausteine gilt das S CHURsche Lemma in seinen beiden Varianten 20.13 und 20.14. Ausgehend vom S CHURschen Lemma kann eine sehr weitreichende algebraische Theorie der Darstellungen endlicher Gruppen entwickelt werden, doch ist diese für die Physik so lange nicht von zentraler Bedeutung, wie es nicht gelingt, sie auf gewisse unendliche Gruppen zu verallgemeinern. Zum Glück ist eine Verallgemeinerung auf kompakte L IE-Gruppen in sehr einfacher, überschaubarer und eleganter Weise möglich, und das ist das Thema des vorliegenden Kapitels. (Wir benutzen hier das Wort „Verallgemeinerung“ und nicht nur „Analogie“, weil man jede endliche Gruppe als (nulldimensionale) kompakte L IEGruppe auffassen kann. Die dabei betrachtete Topologie ist die diskrete aus Beispiel 1.5c.) Wir beginnen in Abschn. A mit der Einführung eines fundamentalen Hilfsmittels, das es gestattet, Funktionen auf einer kompakten Gruppe – und allgemeiner auf einer lokalkompakten topologischen Gruppe – in sinnvoller Weise zu mitteln. In Abschn. B bringen wir dann die Funktionalanalysis als zusätzliches Werkzeug ins Spiel und betrachten unendlichdimensionale Darstellungen auf BANACH- und H ILBERTräumen. Insbesondere beweisen wir hier eine geeignete Verallgemeinerung des Satzes von M ASCHKE. Alsdann führen wir ein weiteres funktionalanalytisches Hilfsmittel ein, den sog. W EYL-Operator und beweisen mit seiner Hilfe, dass jede irreduzible Darstellung einer kompakten Gruppe endlichdimensional ist (Abschn. C). Ausgehend von dieser Erkenntnis können die fundamentalen Orthogonalitätsrelationen für die Matrixelemente und die Charaktere von irreduziblen Darstellungen formuliert und bewiesen werden (Abschn. D). Jede endliche Gruppe G hat auf dem |G|-dimensionalen Raum W aller Funktionen f : G → K zwei naheliegende Darstellungen, nämlich die rechtsreguläre Darstellung
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_21, C Springer-Verlag Berlin Heidelberg 2010
229
230
21 Darstellungstheorie kompakter Gruppen
[D R (g) f ](x) := f (xg),
f ∈ W , x, g ∈ G
sowie die linksreguläre Darstellung [D L (g) f ](x) := f (g −1 x),
f ∈ W , x, g ∈ G,
und der nächste Schritt in der Entwicklung der Darstellungstheorie von endlichen Gruppen würde darin bestehen, die Zerlegung dieser Darstellungen in ihre irreduziblen Bestandteile zu untersuchen. Bei unendlichen Gruppen sind die regulären Darstellungen von unendlicher Dimension, aber wieder gelingt es mit Hilfe von etwas Funktionalanalysis, diesen Schritt auch für unendliche kompakte Gruppen zu vollziehen. Das ist das Thema der letzten beiden Abschnitte, wo wir zum einen den berühmten Satz von P ETER -W EYL beweisen, zum anderen ein Kriterium dafür herleiten, wann ein System von irreduziblen Darstellungen einer gegebenen kompakten Gruppe bis auf Äquivalenz alle irreduziblen Darstellungen dieser Gruppe enthält. Das Material dieses Kapitels bildet den Kern desjenigen Teils der Darstellungstheorie, der in der Physik so vielfältige Anwendungen besitzt, und daher ist es eine unabdingbare Voraussetzung für ein korrektes mathematisches Verständnis dieser Anwendungen. Es ist zugegebenermaßen recht theoretisch und wird nur durch ein einziges Beispiel aufgelockert, in dem gezeigt wird, wie man die klassische Theorie der F OURIERreihen als einen Teil der Darstellungstheorie der Gruppe U(1) interpretieren kann. Weitere Beispiele und Anwendungen werden jedoch in den nächsten Kapiteln folgen. Wie schon erläutert, können die Ergebnisse und Methoden dieses Kapitels speziell auf endliche Gruppen angewendet werden, doch kann die Darstellungstheorie für endliche Gruppen noch viel weiter ausgebaut werden, indem man Zählprozesse und andere rein algebraische Methoden hinzunimmt. So entsteht eine reichhaltige mathematische Theorie, die zu den Glanzstücken der modernen Algebra zählt, auf die wir jedoch nicht näher eingehen können. Für gewisse Typen von endlichen Gruppen – vor allem die Permutationsgruppen – spielt die Bestimmung der irreduziblen Darstellungen aber auch für die Physik eine wichtige Rolle, und detaillierte Informationen hierzu findet man in etlichen physikalisch orientierten Büchern wie etwa [18, 58, 94] oder auch in mathematischen Einführungen wie [82]. Am anderen Ende der Skala haben wir die nicht-kompakten L IE-Gruppen, zu denen immerhin einige der für den Physiker interessantesten Gruppen zählen (vgl. Aufgabe 19.2). Für sie ist keine einheitliche Theorie nach dem Vorbild der kompakten Gruppen möglich, doch gibt es für große Beispielklassen sehr weitreichende Resultate, und die Forschung in diesem Bereich ist auch gegenwärtig stark im Fluss. In einem Ausblick am Schluss von Abschn. E erläutern wir einige der Phänomene, mit denen hier zu rechnen ist, an einem einfachen Beispiel. Für physikalisch relevante nicht-kompakte Gruppen wie die L ORENTZ-Gruppe und ihre universelle Überlagerung SL(2, C), die P OINCARÉgruppe, die G ALILEIgruppe und die Gruppe der euklidischen Bewegungen ist die Darstellungstheorie jedoch trotz der erwähnten Schwierigkeiten sehr gut untersucht, und man findet Einzelheiten hierüber in vielen Monographien wie z. B. [10, 13, 14, 30, 48, 80] oder [94].
A
Das H AAR-Integral
231
Ein weiteres wichtiges Thema, auf das wir nicht näher eingehen können, sind die induzierten Darstellungen. Sie sind von fundamentaler Bedeutung für die Grundlagen der Quantenmechanik und gestatten es u.a., die dynamischen Grundgleichungen aus elementaren Symmetriepostulaten abzuleiten (vgl. etwa [5, 45, 55, 56, 87]). In den Aufgaben 20.14, 20.15 und 24.2 vermitteln wir immerhin einen ersten Eindruck von induzierten Darstellungen.
A Das H AAR-Integral Für die Untersuchung von (insbesondere unendlich-dimensionalen) Darstellungen ist der Begriff des H AARschen Maßes oder H AARschen Integrals einer L IE-Gruppe besonders wichtig. Es handelt sich dabei um ein Maß auf G, das eine vernünftige Mittelung von Funktionen über die gesamte Gruppe ermöglicht. Dazu sei (vgl. Definition 10.38) C(G, K)
der K-Vektorraum der stetigen Funktionen f : G −→ K,
Cc (G, K)
der K-Vektorraum der stetigen Funktionen f : G −→ K mit kompaktem Träger.
Auf einer kompakten Gruppe stimmen diese Räume überein. Wir erinnern daran, dass der R IESZsche Darstellungssatz (Theorem 10.40) auch auf Mannigfaltigkeiten und insbesondere auf unseren L IE-Gruppen gilt (vgl. die Erörterungen am Schluss von Abschn. 10F). Das bedeutet, dass wir statt eines lineare Funktional λ auf Cc (G) R ADONmaßes μ auf G ebenso gut das positive betrachten können, das sich mittels λ( f ) = f dμ daraus ergibt, und das werden wir – hauptsächlich der einfacheren Notation wegen – im folgenden zumeist tun. Die Mittelbildung, auf die wir hinauswollen, sollte gegen Verschiebung einer Funktion und gegen Übergang zum inversen Argument invariant sein. Um dies präzise formulieren zu können, definieren wir: Definitionen 21.1 Sei f ∈ C(G, K) und sei A ∈ G ein festes Element. Dann definiert man die folgenden Funktionen: a. Linkstranslation: (L A f )(X ) := f (AX ) , X ∈ G, b. Rechtstranslation: (R A f )(X ) := f (X A) , X ∈ G, c. Inversion: (I f )(X ) := f (X −1 ) , X ∈ G.
232
21 Darstellungstheorie kompakter Gruppen
Mit Hilfe dieser Operationen charakterisieren wir gewisse positive lineare Funktionale auf Cc (G, K) und damit auch die entsprechenden R ADONmaße. Definitionen 21.2 a. Ein positives lineares Funktional λ : Cc (G, K) −→ K heißt ein linkes H AARIntegral, wenn es = 0 und linksinvariant ist, d. h. für f ∈ Cc (G, K) gilt: λ(L A f ) = λ( f )
für alle A ∈ G.
b. Ein positives lineares Funktional ρ : Cc (G, K) −→ K heißt ein rechtes H AARIntegral, wenn es = 0 und rechts-invariant ist, d. h. für f ∈ Cc (G, K) gilt: ρ(R A f ) = ρ( f )
für alle A ∈ G.
c. Ein H AAR-Integral μ : Cc (G, K) −→ K heißt invers-invariant, wenn μ(I f ) = μ( f )
für alle f ∈ Cc (G, K).
d. Ein R ADONmaß μ auf G heißt linkes (bzw. rechtes) H AARsches Maß, wenn das entsprechende Funktional f → G f dμ ein linkes (bzw. rechtes) H AARsches Integral ist. Ist G eine endliche Gruppe und |G| ihre Ordnung, so zeigt man leicht als Übung, dass durch ν( f ) :=
1 f (x) , |G|
f : G −→ K
x∈G
ein H AARsches Integral definiert ist, das rechts-, links- und invers-invariant ist. Ebenso ist für die Gruppe U(1) = {eiϕ | 0 ≤ ϕ < 2π } durch 1 λ( f ) := 2π
2π f (eiϕ ) dϕ ,
f ∈ C(U(1), C)
0
ein H AARsches Integral mit denselben Invarianzeigenschaften definiert. In beiden Fällen ist der Normierungsfaktor so gewählt, dass die konstante Funktion f ≡ 1 das Integral 1 hat, womit die Anwendung des Funktionals als eine Mittelung aufgefasst werden kann. Als Mannigfaltigkeit ist U(1) nichts anderes als der Kreis S1 := {(x, y) ∈ R2 | x 2 + y 2 = 1},
A
Das H AAR-Integral
233
und wenn wir diesen durch Ξ (ϕ) := (cos ϕ, sin ϕ) ,
0 ≤ ϕ < 2π
parametrisieren, so sehen wir, dass das o. a. H AARsche Integral als λ( f ) =
1 2π
S1
fω
geschrieben werden kann, wobei ω die rotationsinvariante 1-Form ω = i ∗ (xdy − ydx) = dϕ
mit Einbettung i : S1 → R2
ist (Aufgabe 21.1). Die Invarianz des Funktionals λ rührt also davon her, dass man eine invariante Differentialform integriert. Dieses Verfahren kann man auf beliebige L IE-Gruppen ausdehnen: Ist G eine m-dimensionale L IE-Gruppe mit der L IE-Algebra g, so beschafft man sich eine nullstellenfreie invariante m-Form ω aus einer m-fachen alternierenden Multilinearform auf g = Te G, indem man solch eine Multilinearform mittels Linksmultiplikation (bzw. Rechtsmultiplikation) auf die Tangentialräume an den übrigen Punkten von G transportiert, ähnlich wie wir in 19.15 invariante Vektorfelder aus den Vektoren von g gewonnen haben. Wegen ω X = 0 für alle X ∈ G legt dies auch eine Orientierung auf der Mannigfaltigkeit G fest (vgl. Definition 3.13 und den dortigen Äquivalenzbeweis), und daher kann man m-Formen f ω über G integrieren (vgl. die Sätze 4.10 und 4.12). Nun definiert man f ω,
λ( f ) :=
(21.1)
G
wenn man ω links-invariant gewählt hat, und analog ρ( f ), falls man eine rechtsinvariante Form benutzt hat. Für den Fall einer linearen L IE-Gruppe, wo sich alles etwas einfacher formulieren lässt, schildern wir diese Konstruktion jetzt genauer. Dabei beschränken wir uns auf den links-invarianten Fall – für rechts-invariante Formen und H AAR-Integrale verläuft alles völlig analog. Lemma 21.3 Sei G eine lineare L IE-Gruppe, g := L(G), und für Y ∈ G sei Y : G −→ G , X −→ Y X die Linksmultiplikation mit Y . Ist σ ∈ Altm (g) eine alternierende m-lineare Form auf g, so ist durch ω X (A1 , . . . , Am ) := σ (X −1 A1 , . . . , X −1 Am ) für X ∈ G , A j ∈ TX G
(21.2)
eine m-Form auf G definiert, und diese ist links-invariant in dem Sinn, dass ∗Y ω = ω für alle Y ∈ G.
234
21 Darstellungstheorie kompakter Gruppen
Beweis Sei G ≤ GL(n, K), und sei Y ∈ G für den Moment fest. Der Diffeomorphismus Y : G → G ist die Einschränkung der linearen Abbildung Kn×n −→ Kn×n , X −→ Y X, und daher ist sein Differential im Punkt Z ∈ G gegeben durch d(Y ) Z : TZ G −→ TY Z G , A −→ Y A. (Man kann das auch direkt an Hand der Definition 1.29a nachrechnen.) Für A ∈ TX G ist insbesondere X −1 A ∈ TE G = g, also ist die rechte Seite von (21.2) sinnvoll und definiert in der Tat eine m-Form auf G. Zum Nachrechnen der Invarianz benötigen wir außer (21.2) nur die Definition von (Y )∗ aus 3.11b. Für X, Y ∈ G und A1 , . . . , Am ∈ TX G hat man nämlich: (∗Y ω) X (A1 , . . . , Am ) = ωY X (Y A1 , . . . , Y Am ) = σ (X −1 Y −1 Y A1 , . . . , X −1 Y −1 Y Am ) = σ (X −1 A1 , . . . , X −1 Am ) = ω X (A1 , . . . , Am ). Nun betrachten wir eine feste m-lineare Form σ = 0 auf g und bilden dazu die m-Form ω ∈ Ω m (G) gemäß (21.2). (Auch bei einer Gruppe von komplexen Matrizen muss die L IE-Algebra hier als reeller Vektorraum aufgefasst werden!) Dann ist überall ω X = 0, so dass ω tatsächlich eine Orientierung auf G festlegt. Das lineare Funktional λ, das in Bezug auf diese Orientierung durch (21.1) definiert ist, ist somit positiv. Es ist sogar ein linkes H AAR-Integral, denn mit der Transformationsformel in der Form von Korollar 4.13 ergibt sich für f ∈ Cc (G) , Y ∈ G λ(L Y f ) = G
(∗Y f )ω =
G
(∗Y f )(∗Y ω) =
G
∗Y ( f ω) =
f ω = λ( f ). G
Bemerkungen (i) Verwendet man −ω statt ω, so erhält man dasselbe H AARsche Integral, da hierdurch gleichzeitig die umgekehrte Orientierung auf G zu Grunde gelegt wird. (ii) In lokalen Koordinaten kann das so konstruierte H AARsche Integral auch leicht explizit berechnet werden, und da viele L IE-Gruppen sogar globale Parametrisierungen gestatten (vgl. Kap. 18 sowie die Bemerkungen über den Wertebereich der Exponentialfunktion in Kap. 19), ist oft auch eine global für alle f ∈ Cc (G) gültige Formel möglich. Betrachten wir also eine Parametrisierung Ξ : Ω → U einer offenen Teilmenge U von G auf einem Gebiet Ω ⊆ Rm . Ist Tr f ⊆ U , so haben wir nach Satz 4.10 λ( f ) = f (Ξ (t))W (t) dm t (21.3) Ω
A
Das H AAR-Integral
235
mit W (t) = (Ξ ∗ ω)t (e1 , . . . , em ) . Da die Funktion W keine Nullstelle hat, kann sie auf der zusammenhängenden Menge Ω das Vorzeichen nicht wechseln, und man sorgt (evtl. durch Vertauschen von zwei der Komponenten von t = (t1 , . . . , tm )) dafür, dass überall W (t) > 0 ist (orientierungstreue Parametrisierung!). Wir schreiben σ = ω E in der Gestalt σ = β 1 ∧· · ·∧β m , wobei (β 1 , . . . , β m ) eine Basis des Dualraums g∗ ist. Mittels (2.9) kann man W (t) dann explizit berechnen: W (t) = ωΞ (t) (dΞt (e1 ), . . . , dΞt (em )) ∂Ξ ∂Ξ ∂Ξ = det β j Ξ (t)−1 , , . . . , Ξ (t)−1 = σ Ξ (t)−1 ∂t1 ∂tm ∂tk also ergibt sich
j W (t) = det wk (t)
∂Ξ j mit wk (t) = β j Ξ (t)−1 (t) . ∂tk
(21.4)
(iii) Besonders einfach wird dies, wenn man von einer Orthonormalbasis (B1 , . . . , Bm ) in Bezug auf das Skalarprodukt A | B = Spur A T B ausgeht und (β 1 , . . . , β m ) als die dazu duale Basis wählt. Dann ist β j (A) = B j | A , und wir bekommen ∂Ξ j (t) , j, k = 1, . . . , m . (21.5) wk (t) = Spur B Tj Ξ (t)−1 ∂tk (iv) Formel (21.3) zeigt auch, dass das Maß λ die Bedingung (T) erfüllt, die im Anschluss an Satz 10.37 in Abschn. 10F erörtert wurde. Allgemein hat man: Theorem 21.4 Jede L IE-Gruppe G besitzt ein linkes H AAR-Integral λ und ein rechtes H AAR-Integral ρ. Beide sind bis auf eine positive Konstante eindeutig bestimmt, und sie erfüllen Bedingung (T) aus Abschn. 10F Dies gilt sogar noch in wesentlich allgemeinerem Rahmen, nämlich für lokalkompakte topologische Gruppen. Details hierüber findet man z. B. in [38], Bd. I, oder auch in [39], und auch die Eindeutigkeitsaussage des Theorems ist dort bewiesen. Wir benötigen das H AARsche Integral aber in erster Linie für kompakte L IE-Gruppen, und für diese kann die Eindeutigkeit sehr einfach bewiesen werden. Sie folgt nämlich unmittelbar aus dem folgenden Satz: Satz 21.5 Die linken H AAR-Integrale auf einer kompakten Gruppe G sind auch rechts-invariant, die rechten auch links-invariant, und sie unterscheiden sich alle nur um einen positiven konstanten Faktor.
236
21 Darstellungstheorie kompakter Gruppen
Beweis Sei λ ein linkes und ρ ein rechtes H AAR-Integral auf G. Wir bezeichnen diese linearen Funktionale und die entsprechenden R ADONmaße auf G immer mit demselben Buchstaben, schreiben also λ( f ) = G f dŁλ usw. Da G kompakt ist, hat es endliches Maß, d. h. wir haben Zahlen b := λ(G) = λ(1) > 0 ,
c := ρ(G) = ρ(1) > 0.
Nun sei f ∈ Cc (G) beliebig. Wegen der Linksinvarianz von λ ist f (X Y ) dλ(Y ) = λ( f ) für alle X ∈ G, G
und wegen der Rechtsinvarianz von ρ ist f (X Y ) dρ(X ) = ρ( f )
für alle Y ∈ G.
G
Das Produktmaß λ ⊗ ρ ist ein R ADONmaß auf der kompakten Mannigfaltigkeit G × G, und die Funktion G × G −→ K , (X, Y ) −→ f (X Y ) ist auf G × G stetig. Daher ist sie λ ⊗ ρ-summierbar (Satz 10.37 in seiner auf Mannigfaltigkeiten verallgemeinerten Form!), und folglich ist der Satz von F UBINI anwendbar. Daher haben wir: cλ( f ) = f (X Y ) dλ(Y ) dρ(X ) G G f (X Y ) dρ(X ) dλ(Y ) = bρ( f ). = G
G
Also ist λ = (b/c)ρ, und insbesondere ist λ auch rechts-invariant und ρ auch linksinvariant. Für zwei linke H AAR-Integrale λ1 , λ2 folgt daraus λ = (bi /c)ρ (wo bi := λi (G)), also λ2 = (b2 /b1 )λ1 . Auf einer kompakten Gruppe braucht man also zwischen rechten und linken H AARschen Integralen nicht zu unterscheiden und spricht einfach von H AARschen Integralen bzw. H AARschen Maßen. Übergang von λ zu λ0 :=
1 λ λ(G)
führt offenbar zu einem H AARschen Integral, das die Normierungsbedingung λ0 (G) = 1 erfüllt, und dieses ist eindeutig bestimmt. Man nennt es das normierte H AARsche Integral auf G, und entsprechend für das Maß.
A
Das H AAR-Integral
237
Wir wollen noch einige Eigenschaften des H AARschen Integrals herleiten, die auch den nicht-kompakten Fall betreffen. Sei also G irgendeine lineare L IE-Gruppe und sei λ ein linkes H AAR-Integral auf G. Für festes Y ∈ G und f ∈ Cc (G) betrachten wir μY ( f ) := λ(RY −1 f ).
(21.6)
Dann ist μY sicher ein positives lineares Funktional auf Cc (G). Da Rechts- und Linkstranslationen vertauschbar sind, folgt für ein A ∈ G μY (L A f ) = λ(RY −1 L A f ) = λ(L A RY −1 f ) = λ(RY −1 f ) = μY ( f ) wegen der Links-Invarianz von λ. Also ist auch μY linksinvariant und daher ebenfalls ein linkes H AAR-Integral. Nach Theorem 21.4 existiert daher eine Konstante Δ(Y ) > 0, so dass μY ( f ) = Δ(Y )λ( f )
für alle f ∈ Cc (G),
(21.7)
und Δ ist offenbar eine stetige Funktion auf G. Aus (21.7) folgt für X, Y ∈ G weiter Δ(X Y )λ( f ) = μ X Y ( f ) = λ(R(X Y )−1 f ) = λ(RY −1 (R X −1 f )) = = Δ(Y )λ(R X −1 f ) = Δ(Y )Δ(X )λ( f ). Es gilt somit Δ(X Y ) = Δ(X )Δ(Y ) ,
X, Y ∈ G.
(21.8)
Da verschiedene linke H AAR-Integrale zueinander proportional sind, hängt Δ nicht davon ab, welches H AAR-Integral für seine Definition benutzt wurde, wie sofort aus (21.6), (21.7) hervorgeht. Definitionen 21.6 a. Die positive stetige Funktion Δ : G −→ R, welche für ein linkes H AAR-Integral λ auf G die Bedingung λ(RY −1 f ) = Δ(Y )λ( f ),
f ∈ Cc (G)
(und damit auch (21.8)) erfüllt, heißt die Modularfunktion von G. b. Die Gruppe G heißt unimodular, wenn Δ ≡ 1.
(21.7)
238
21 Darstellungstheorie kompakter Gruppen
Auf einer unimodularen Gruppe ist jedes linke H AAR-Integral nach (21.7) gleichzeitig ein rechtes H AAR-Integral, und man kann dann wieder einfach von einem H AAR-Integral sprechen. Mit diesen Begriffsbildungen lautet Satz 21.5 einfach: Jede kompakte Gruppe ist unimodular.
Die abelschen L IE-Gruppen sind trivialerweise ebenfalls unimodular. Beispiele für weitere unimodulare Gruppen sowie für solche, die es nicht sind, finden sich in den Aufgaben 21.4, 21.7 und 21.8. Die Bedeutung der Modularfunktion wird klar, wenn man in den Integralen die Substitution X → X −1 vornimmt. Es gilt nämlich: Satz 21.7 Sei λ ein linkes H AAR-Integral auf der L IE-Gruppe G, und G habe die Modularfunktion Δ. Dann gilt λ( f ) = λ
1 Δ
I( f ) ,
f ∈ Cc (G).
(21.9)
Insbesondere ist jedes H AAR-Integral auf einer unimodularen Gruppe inversinvariant. Beweis Wir setzen zur Abkürzung: f ∗ := I ( f ) ,
d. h. f ∗ (X ) = f (X −1 ),
1 f∗ . μ( f ) = λ Δ
(21.10) (21.11)
Dann ist es eine leichte Übung zu zeigen, dass μ(L Y f ) = μ( f ) für alle Y ∈ G, f ∈ Cc (G),
(21.12)
d. h. μ ist ebenfalls ein linkes H AAR-Integral auf Cc (G). Nach Theorem 21.4 gibt es daher eine Konstante C > 0, so dass μ( f ) = cλ( f )
für alle f ∈ Cc (G).
(21.13)
Es ist also c = 1 zu zeigen. Wegen Δ(E) = 1 und der Stetigkeit von Δ gibt es zu jedem ε > 0 eine Umgebung Uε von E in G mit
1 − 1 < ε Δ(X )
für alle X ∈ Uε .
(21.14)
Sei nun die Funktion h ∈ Cc (G) so gewählt, dass λ(h) > 0, aber h ≡ 0 auf G\Uε und h ∗ (X ) = h(X ) ,
X ∈ G.
(21.15)
B
Unendlich-dimensionale Darstellungen
239
Um dies zu erreichen, wählt man eine Umgebung U ⊆ Uε der Eins, für die gilt: X ∈U
⇒
X −1 ∈ Uε ,
und dann wählt man h 0 ∈ Cc (G) so, dass h 0 ≥ 0 , λ(h 0 ) > 0 und h 0 |G\U ≡ 0. Schließlich setzt man h(X ) := h 0 (X ) + h 0 (X −1 ). Dann folgt aus (21.14) h(X ) −
1 h(X ) ≤ εh(X ) Δ(X )
für alle X ∈ G
(21.16)
und daher durch Integration auch 1 h ≤ ελ(h) . λ(h) − λ Δ
(21.17)
1 1 h =λ h ∗ = cλ(h) , Δ Δ
(21.18)
Wegen (21.15) ist aber λ
und dies liefert mit (21.17) wegen λ(h) > 0 das Ergebnis |1 − c| < ε , d. h. c = 1, da ε > 0 beliebig war.
B Unendlich-dimensionale Darstellungen Bei den grundlegenden Definitionen in Kap. 20 war es durchaus zugelassen, dass der Trägerraum V einer Darstellung unendliche Dimension hat, und bei L IE-Gruppen spielen solche unendlich-dimensionalen Darstellungen auch eine wichtige Rolle. Dabei müssen wir jedoch beachten, dass bei unendlich-dimensionalen Darstellungen auch Stetigkeitseigenschaften zu berücksichtigen sind. Definition 21.8 Sei G eine lineare L IE-Gruppe, E ein BANACHraum und D : G → B(E) eine Darstellung von G auf E. Diese Darstellung heißt stetig, wenn D(g)x − D(g0 )x −→ 0 für g −→ g0 in G und alle x ∈ E. Die Operatoren D(g) gehören also zur Gruppe G(E) aller beschränkten linearen Operatoren in E, die eine beschränkte Inverse besitzen. Eine stetige Darstellung von G auf E ist somit ein Gruppenhomomorphismus D von G in die Gruppe G(E), bei dem für jeden Vektor x ∈ E die Abbildung G −→ E , g −→ D(g)x stetig ist.
240
21 Darstellungstheorie kompakter Gruppen
Beispiel 21.9 Auf E = L p (Rn ) (1 ≤ p < ∞) hat die orthogonale Gruppe O(n) die Darstellung (D(R)ψ)(x) := ψ(R −1 x),
R ∈ O(n),
(21.19)
die (20.28) verallgemeinert. Da | det R| = 1 ist für R ∈ O(n), zeigt die Transformationsformel für Integrale sofort, dass D(R)ψ p = ψ p ist, also D(R) ∈ B(E) und ebenso D(R)−1 = D(R −1 ) ∈ B(E). Wir zeigen, dass die Darstellung stetig ist. Sei also R = limk→∞ Rk in O(n), und sei zunächst h ∈ Cc (Rn ). Da h gleichmäßig stetig ist, konvergieren die h(Rk−1 x) gleichmäßig gegen h(R −1 x), und ihre Träger liegen in einer gemeinsamen kompakten Menge K ⊆ Rn . Daher haben wir p
D(R)h − D(Rk )h p = K
|h(R −1 x) − h(Rk−1 x)| p dx −→ 0
für k → ∞. Für beliebiges ψ ∈ E und ε > 0 beachten wir, dass man nach Satz 10.39 ein h ∈ Cc (Rn ) findet, für das ψ − h p < ε/3 ist. Dann sind auch D(Rk )ψ − D(Rk )h p < ε/3 und ebenso für D(R)ψ − D(R)h p , also folgt für alle genügend großen k D(R)ψ − D(Rk )ψ p ≤
ε ε + D(R)h − D(Rk )h p + < ε, 3 3
und das bedeutet, dass die gewünschte Beziehung D(R)ψ = limk→∞ D(Rk )ψ gilt. Bemerkung Dieses Beispiel zeigt auch, warum es unangebracht ist, die stärkere Bedingung D(R) − D(Rk ) → 0 für R = limk→∞ Rk zu fordern. Sind nämlich R, R zwei verschiedene Elemente von O(n), so kann man stets (auch wenn sich R und R noch so wenig unterscheiden!) eine Funktion h ∈ Cc (Rn ) finden, für die D(R)h und D(R )h disjunkte Träger haben. Man muss dazu den Träger von h nur in hinreichend großer Entfernung vom Ursprung ansiedeln (vgl. Abb. 21.1). Dann ist aber p p D(R)h − D(R )h p = 2 |h| p dx = 2h p , also ist D(R) − D(R ) ≥ 21/ p für R = R . Durch Verwendung des H AARschen Integrals sowie von etwas zusätzlicher Funktionalanalysis sind wir nun in der Lage, Theorem 20.6 in wesentlich allgemeinerer Form auszusprechen: Theorem 21.10 (Allgemeiner Satz von M ASCHKE) Jede stetige Darstellung D einer kompakten L IE-Gruppe G auf einem komplexen H ILBERTraum H ist zu einer
B
Unendlich-dimensionale Darstellungen
241
Tr D(R)h Tr h Abb. 21.1 Beliebig kleine Drehungen können zu disjunkten Trägern führen
unitären stetigen Darstellung äquivalent. Außerdem gibt es auf H ein alternatives Skalarprodukt, dessen zugehörige Norm zur ursprünglichen Norm auf H äquivalent ist, und in Bezug auf das die Darstellung D selbst unitär ist. Beweis Für jedes feste u ∈ H ist die Funktion G g −→ D(g)u eine stetige Funktion auf dem kompakten Raum G, also beschränkt, d. h. c(u) := supg∈G D(g)u < ∞. Das Prinzip von der gleichmäßigen Beschränktheit,1 das in jedem Lehrbuch der Funktionalanalysis formuliert und bewiesen wird, zeigt dann, dass sogar die Operatornormen D(g) beschränkt bleiben, dass also c0 := sup D(g) < ∞ g∈G
ist. Für alle u ∈ H , g ∈ G folgt u = D(g)−1 D(g)u ≤ ≤ D(g)−1 · D(g)u ≤ c0 D(g)u, also D(g)u ≥ (1/c0 )u und somit c0−1 u ≤ D(g)u ≤ c0 u
∀ g ∈ G , u ∈ H.
(21.20)
Nun sei λ das normierte H AARsche Maß auf G. Wir definieren ein neues Skalarprodukt durch (u | v) := D(g)u | D(g)v dλ(g). G
Eine triviale Rechnung zeigt, dass dies ein Skalarprodukt ist, und wie im Beweis von Theorem 20.6 bestätigt man, dass (D(h)u | D(h)v) = (u | v)
∀ u, v ∈ H , h ∈ G.
(21.21)
1 Auf dieses Theorem (engl. „uniform boundedness principle“) wurde im Zusammenhang mit Theorem 9.12 schon einmal hingewiesen.
242
21 Darstellungstheorie kompakter Gruppen
In Bezug auf das neue Skalarprodukt ist D also unitär. Aus (21.20) folgt c0−2 u2 ≤ (u | u) ≤ c02 u2
∀ u ∈ H,
und somit ist die von dem neuen Skalarprodukt gestiftete Norm (u | u)1/2 tatsächlich äquivalent zur gegebenen Norm. Ferner folgt aus (21.20) |(u | v)| ≤ G
|D(g)u | D(g)v | dλ(g) ≤ c02 u · v ,
also ist das neue Skalarprodukt eine beschränkte Sesquilinearform auf H und wird daher (vgl. Theorem 8.18) durch einen eindeutigen Operator T ∈ B(H) repräsentiert, d. h. wir haben (u | v) = u | T v ,
u, v ∈ H.
Aus (v | u) = (u | v) und der Eindeutigkeit des repräsentierenden Operators T folgt T ∗ = T . Nach (21.20) haben wir überdies für jedes u ∈ H u | T u = G
D(g)u2 dλ(g) ≥ c0−2 u2 ,
und nach Theorem 9.10 folgt hieraus für das Spektrum des selbstadjungierten Operators T : σ (T ) ⊆ [c0−2 , c02 ]. Insbesondere ist T positiv und hat daher eine positive selbstadjungierte Quadratwurzel S = T 1/2 (vgl. Beispiel 16.9). Nach dem spektralen Abbildungssatz (Satz 16.7) ist σ (S) ⊆ [c0−1 , c0 ], insbesondere also 0 ∈ σ (S), d. h. S hat eine beschränkte Inverse S −1 . Durch U (g) := S D(g)S −1 ,
g∈G
ist offenbar eine stetige Darstellung von G definiert, die zu D äquivalent ist, und wie im Beweis von 20.6 bestätigt man, dass U eine unitäre Darstellung ist, denn wegen Su | Sv = u | S 2 v = u | T v = (u | v) gilt (20.14) auch hier. Zum Schluss dieses Abschnitts greifen wir den aus Definition 20.7c bekannten Begriff des Tensorprodukts noch einmal auf. Für stetige Darstellungen D1 , D2 auf H ILBERTräumen H1 , H2 beliebiger Dimension kann man ebenfalls das Tensorprodukt D = D1 ⊗ D2 bilden, denn wenn man das in Abschn. 7E besprochene Tensorprodukt von H ILBERTräumen zu Grunde legt, so ist durch Gl. (20.17) für jedes g ∈ G ein beschränkter linearer Operator D(g) im H ILBERTraum H := H1 ⊗H2 definiert, und diese Operatoren bilden eine stetige Darstellung von G. Nach
C
Irreduzible Darstellungen kompakter Gruppen
243
Definition des Skalarprodukts in H ist auch klar, dass das Tensorprodukt zweier unitärer Darstellungen wieder unitär ist.
C Irreduzible Darstellungen kompakter Gruppen In diesem Kapitel betrachten wir von jetzt ab ausschließlich stetige Darstellungen einer kompakten L IE-Gruppe G. Für das normierte H AARsche Maß auf G führen wir keinen eigenen Buchstabenein, sondern schreiben die entsprechenden Integra le einfach als f (g) dg oder G f (g) dg. Wie wir in Abschn. A gesehen haben, bedeutet dies, dass die Funktion f über G „gemittelt“ wird. Zunächst ist zu beachten, dass auch Funktionen mit Werten in einem H IL BERT raum ohne weiteres über G gemittelt werden können: Satz und Definition 21.11 Sei H ein H ILBERTraum und F : G → H eine stetige Funktion. Dann existiert genau ein y ∈ H mit für alle z ∈ H. (21.22) y | z = F(g) | z dg G
Man nennt y das Integral von F über G und schreibt y= F(g) dg. G
Es hat folgende Eigenschaften: a. Das Integral hängt linear von F ab, und es gilt F(g) dg ≤ F(g) dg. G
(21.23)
G
b. Ist V ⊆ H ein linearer Teilraum und F(g) ∈ V für alle g ∈ G, so ist ¯ G F(g) dg ∈ V . Beweis Wegen supg∈G F(g) < ∞ definiert die rechte Seite von (21.22) offenbar ein stetiges lineares Funktional auf H , und dieses wird nach Theorem 8.16 eindeutig durch einen Vektor y ∈ H repräsentiert. Die Linearität des so definierten Integrals folgt unmittelbar aus der Eindeutigkeit, und (21.23) folgt aus y = sup |y | z | z≤1
(vgl. Gl. (8.17)) und der C AUCHY-S CHWARZschen Ungleichung. Unter den Voraussetzungen von b. ist F(g) | z = 0 für alle g ∈ G , z ∈ V ⊥ , also auch F(g) dg ∈ V ⊥⊥ = V¯ (wende Theorem 7.13 auf U := V¯ an). G
244
21 Darstellungstheorie kompakter Gruppen
Nach dem Satz von M ASCHKE (Theorem 21.10) können wir uns o.B.d.A. auf unitäre stetige Darstellungen beschränken, und das werden wir im folgenden durchweg tun. Ein wesentliches Hilfsmittel bei der Untersuchung solcher Darstellungen bilden die sogenannten W EYL-Operatoren: Satz 21.12 Sei D eine unitäre Darstellung einer kompakten Gruppe G auf einem H ILBERTraum H . Für festes x ∈ H definiert man den W EYL-Operator K x : H −→ H durch K x y :=
D(g)x | y D(g)x dg ,
y ∈ H.
(21.24)
G
Dann gilt a. K x ist ein kompakter und positiver selbstadjungierter Operator. b. K x vertauscht mit allen Operatoren D(h), h ∈ G. c. Ist x = 0, so ist x | K x x > 0, insbesondere K x = 0. Beweis a. Im ersten Schritt zeigen wir, dass K x ein beschränkter selbstadjungierter Operator in H ist. Für feste x, y ∈ H ist F(g) := D(g)x | y D(g)x ,
g∈G
(21.25)
eine stetige H -wertige Funktion auf G, weil D nach Voraussetzung eine stetige Darstellung ist. Für feste x, y ∈ H ist daher nach Satz 21.11 ein Vektor K x y ∈ H wohldefiniert, und dieser hängt linear von y ab. Dabei ist ax (z, y) := z | K x y =
D(g)x | y z | D(g)x dg
(21.26)
G
für x, y, z ∈ H , und dies definiert (bei festem x) eine beschränkte Sesquilinearform auf H × H , denn wegen D(g)x = x und (21.23) ist für alle z, y ∈ H |ax (y, z)| ≤
D(g)x2 y · z dg ≤ x2 y · z, G
und somit ist K x beschränkt, K x ≤ x2. Aus (21.26) ersieht man auch sofort, dass ax (y, z) = ax (z, y) und ax (y, y) = |D(g)x | y |2 dg ≥ 0, also ist K x selbstadjungiert und positiv. b. Als nächstes zeigen wir, dass K x mit allen Operatoren D(h), h ∈ G, vertauscht. Aus (21.26) folgt für beliebige x, y, z ∈ H und h ∈ G:
C
Irreduzible Darstellungen kompakter Gruppen
245
z | D(h)K x y =
D(g)x | y z | D(h)D(g)x dg G
=
D(g)x | y z | D(hg)x dg G
=
D(hg)x | D(h)y z | D(hg)x dg G
=
D(g)x | D(h)y z | D(g)x dg G
= z | K x D(h)y , wobei wir die Homomorphie-Eigenschaft einer Darstellung, die Unitarität der Operatoren D(g) und die Linksinvarianz des H AAR-Integrals benutzt haben. Da y, z ∈ H beliebig waren, gilt also D(h)K x = K x D(h) für alle h ∈ G, x ∈ H .
(21.27)
c. Um die Kompaktheit von K x zu zeigen, weisen wir nach, dass K x schwach konvergente Folgen in stark konvergente überführt (Eigenschaft (ii) aus Satz 9.13a). Sei also (yn ) eine Folge in H , die schwach gegen y ∈ H konvergiert. Dann ist nach (21.23)
K x y−K x yn ≤
|D(g) | y−yn |·D(g)xdg = x G
|D(g) | y−yn |dg, G
und für n → ∞ geht das gegen Null nach dem Satz von der dominierten Konvergenz. Denn nach Voraussetzung haben wir lim |D(g) | y − yn | = 0
n→∞
für alle g ∈ G, und da schwach konvergente Folgen beschränkt sind, etwa y − yn ≤ C (Theorem 9.12c), haben wir auch |D(g)x | y − yn | ≤ D(g)x · y − yn ≤ Cx, also ist die konstante Funktion Cx eine integrierbare Majorante. d. Angenommen, es ist 0 = x | K x x = G |D(g)x | x |2 dg. Dann folgt D(g)x | x = 0 fast überall. Da dies aber eine stetige Funktion von g ist und das Maß die Bedingung (T) aus 10F erfüllt, ist sogar D(g)x | x = 0 für alle g, also insbesondere 0 = D(e)x | x = x2 und somit x = 0.
246
21 Darstellungstheorie kompakter Gruppen
Wir verwenden nun den W EYL-Operator, um die Darstellungstheorie von kompakten Gruppen im wesentlichen auf die Betrachtung von endlichdimensionalen Darstellungen zu reduzieren: Theorem 21.13 Jede irreduzible Darstellung einer kompakten Gruppe G ist endlichdimensional. Beweis Sei D eine (o.B.d.A. unitäre) irreduzible Darstellung einer kompakten Gruppe G auf dem H ILBERTraum H = {0}. Sei K x der entsprechende W EYLOperator zu einem Vektor x = 0. Dann ist K x nach Satz 21.12 ein kompakter und positiver selbstadjungierter Operator in H mit λ := K x > 0. Nach den Sätzen 9.10c, d und 9.17b ist λ ein Eigenwert endlicher Vielfachheit von K x . Aus Satz 21.12b folgt aber, dass der Eigenraum N (K x − λI ) unter D invariant ist, also mit H übereinstimmt, denn D ist irreduzibel und N (K x − λI ) = {0}. Damit ist dim H < ∞. Eigenvektoren zu verschiedenen Eigenwerten eines selbstadjungierten Operators sind bekanntlich orthogonal zueinander. Ein ähnlicher Satz gilt auch für die irreduziblen Darstellungen einer kompakten Gruppe G: einer unitären Darstellung D Satz 21.14 Seien V1 , V2 zwei irreduzible Teilräume von G. Wenn die Teildarstellungen D s := D V , s = 1, 2 nicht äquivalent sind, so s ist V1 ⊥ V2 , d. h. x | y = 0 für x ∈ V1 , y ∈ V2 . Beweis Betrachte x ∈ V1 , o.B.d.A. x = 0. Für den entsprechenden W EYL-Operator K x gilt R(K x ) ⊆ V1 nach Satz 21.11b, denn der endlichdimensionale Raum V1 ist abgeschlossen (Satz 7.10b). Für s = 1, 2 definieren wir As : Vs → V1 durch As := K x V . Nach dem S CHURschen Lemma (Theorem 20.14a) ist dann A1 = λI mit s einem Skalar λ, und wegen Satz 21.12c ist 0 < x | K x x = x | A1 x = λx2 , also λ > 0. Nach Theorem 20.13 ist jedoch A2 ≡ 0, weil die beiden Darstellungen nicht äquivalent sind. Da K x selbstadjungiert ist, führt dies für y ∈ V2 auf λx | y = K x x | y = x | K x y = 0, woraus die Behauptung folgt.
D Orthogonalitätsrelationen Wir wissen nun nach Theorem 21.13, dass alle irreduziblen Darstellungen von kompakten Gruppen endlich-dimensional sind, und aus Satz 21.14, dass zwei nicht-äquivalente irreduzible Darstellungen zueinander orthogonal sind. Aus Theorem 20.11a und Theorem 21.10 wissen wir überdies, dass jede endlich-dimensionale Darstellung einer kompakten Gruppe vollreduzibel ist. In diesem Abschnitt geht es darum, für die Matrixelemente und die Charaktere von irreduziblen Darstellungen Orthogonalitätsrelationen abzuleiten.
D
Orthogonalitätsrelationen
247
Seien D s , s = 1, 2, zwei irreduzible unitäre Darstellungen einer kompakten Gruppe G auf n s -dimensionalen H ILBERTräumen Hs , und sei T : H1 → H2 eine lineare Abbildung (die wir uns als durch eine Matrix gegeben denken dürfen, weil die Räume endliche Dimensionen haben). Auf den Operator 2 −1 1 D (g )T D (g) dg = D 2 (g)∗ T D 1 (g) dg (21.28) A := G
G
können wir die fundamentalen Theoreme 20.13 und 20.14 anwenden, denn für alle h ∈ G ist 1 2 −1 1 D (g )T D (gh) dg = D 2 (h g˜ −1 )T D 1 (g) ˜ dg˜ = D 2 (h)A, AD (h) = G
G
d. h. A erfüllt (20.23). Sind die D s nicht äquivalent, so liefert Theorem 20.13 also A = 0. Ist hingegen D 1 = D 2 (und insbesondere n 1 = n 2 =: n), so liefert das S CHURsche Lemma A = λI mit einem Skalar λ ∈ C. Dieser lässt sich leicht berechnen, indem man rechts und links die Spur bildet:
Spur D 1 (g)−1 T D 1 (g) dg = Spur T, λn = Spur A = G
also λ = n −1 Spur T . Insgesamt finden wir
∗
D (g) T D (g) dg = 2
1
" 0, Spur T dim H1
G
I,
falls D 1 ∼ D 2 , falls D 1 = D 2 .
(21.29)
Nun sei {e1s , . . . , ens s } jeweils eine Orthonormalbasis von Hs . Dann können wir – wie in (20.3) – durch die Gleichungen D s (g)eks =
ns
d sjk (g)esj ,
g∈G
(21.30)
j=1
Matrixdarstellungen (d sjk ) von G vom Grade n s gewinnen, wobei (d sjk (g)) die unitäre Matrix ist, die durch d sjk (g) = esj | D s (g)eks
(21.31)
gegeben ist. Jedes der Matrixelemente d sjk : G −→ C ,
1 ≤ j, k ≤ n s , s = 1, 2
ist eine stetige Funktion auf G und damit ein Element des H ILBERTraumes L 2 (G), der in Bezug auf das normierte H AARsche Maß gebildet wird. (Weil G kompakt ist, enthält er alle stetigen Funktionen.)
248
21 Darstellungstheorie kompakter Gruppen
Wir leiten nun für diese Matrixelemente Orthogonalitätsrelationen her, indem wir (21.29) auf geeignet gewählte Operatoren T anwenden: Theorem 21.15 Seien D s = (d sjk ), 1 ≤ j, k ≤ n s , s = 1, 2, unitäre, irreduzible Matrixdarstellungen der kompakten Gruppe G über C. Dann bilden die Matrixelemente d sjk : G −→ C ein Orthogonalsystem in L 2 (G), d. h. es gilt 1 = 0 falls D 1 und D 2 nicht äquivalent sind, a. di2j | dkl s = b. disj | dkl
1 ns
δik δ jl .
Beweis Für feste Indizes i ∈ {1, . . . , n 2 } , k ∈ {1, . . . , n 1 } definieren wir den Operator E ik : H1 → H2 durch E ik := |ei2 ek1 |, oder ausführlich E ik x := ek1 | x ei2 . Die entsprechende Matrix hat also eine Eins am Platz (i, k) und sonst lauter Nullen, und daher ist Spur E ik = δik . Für die Größen # $ 2 2 ∗ ik 1 ηik := e D (g) E D (g) dg el1 j jl G
ergibt (21.29) also ηik jl
=
" 0,
δik n s δ jl
,
falls D 1 ∼ D 2 , falls D 1 = D 2 .
Andererseits ist aber nach (21.31) ηik jl
=
G
= G = G
e2j | D 2 (g)∗ E ik D 1 (g)el1 dg e2j | D 2 (g)∗ ei2 , ek1 | D 1 (g)el1 dg 1 1 di2j (g) dkl (g) dg = di2j | dkl ,
wo am Schluss das Skalarprodukt in L 2 (G) steht. Die Charaktere χs der irreduziblen Darstellungen D s sind definitionsgemäß χs (g) =
ns j=1
d sj j (g).
D
Orthogonalitätsrelationen
249
Sie sind also ebenfalls stetige Funktionen auf G. Ihre Skalarprodukte kann man durch Ausdistribuieren und Anwenden von Theorem 21.15 sofort berechnen, und es ergibt sich: Korollar 21.16 Seien D 1 , D 2 irreduzible Darstellungen der kompakten Gruppe G. Dann gilt für die Charaktere χ1 , χ2 dieser Darstellungen χ1 | χ2 =
χ1 (g) χ2 (g) dg =
G
" 0 = 1
χ1 (g −1 )χ2 (g) dg
G
, falls ∼ , falls D 1 ∼ D 2 . D1
D2
(21.32)
Hier ist zu beachten, dass äquivalente Darstellungen denselben Charakter haben. Im Fall D 1 ∼ D 2 ist also χ1 | χ2 = χ1 | χ1 , und daher kann man Theorem 21.15b bei der Berechnung des Skalarprodukts tatsächlich verwenden. Für endlich-dimensionale Darstellungen kann man Theorem 20.11 über die Ausreduzierung einer gegebenen Darstellung mit Hilfe der Orthogonalitätsrelationen für die Charaktere verschärfen. Dazu schreibt man (20.20) in der Form D=
m
ks D s
(21.33)
s=1
mit paarweise nicht-äquivalenten irreduziblen Darstellungen D s , die mit der Vielfachheit ks ∈ N0 in D auftreten. Der Term ks D s bedeutet also ks D s = D1s ⊕ · · · ⊕ Dkss , wobei die Darstellungen D sj , j = 1, . . . , ks alle äquivalent sind. Der Index s zählt hier also nicht die einzelnen Darstellungen, sondern vielmehr ihre Äquivalenzklassen. Die Möglichkeit ks = 0 wird zugelassen, damit man formal auch Äquivalenztypen D s in die Summe aufnehmen kann, die bei der Zerlegung von D in irreduzible Bestandteile in Wirklichkeit gar nicht auftreten. Mit dieser Schreibweise können wir nun formulieren: Theorem 21.17 Sei D eine endlich-dimensionale Darstellung der kompakten Gruppe G auf H , und sei χ der Charakter von D. Die Darstellung sei in der Form (21.33) in irreduzible Teildarstellungen zerlegt. a. Ist χs der Charakter zu D s , so ist die Vielfachheit ks eindeutig bestimmt durch ks = χs | χ =
χ (g)χs (g) dg. G
(21.34)
250
21 Darstellungstheorie kompakter Gruppen
Insbesondere ist χs | χ = 0 genau dann, wenn eine irreduzible Darstellung mit dem Charakter χs in der Zerlegung (21.33) wirklich auftritt. b. Die Darstellung D ist genau dann irreduzibel, wenn χ 22 =
|χ (g)|2 dg = 1. G
Beweis a. Gelte also (21.33). Dann folgt aus Satz 20.8a für die Charaktere χ=
m
k s χs .
(21.35)
s=1
Mit der Orthogonalitätsrelation (21.32) aus Korollar 21.16 folgt dann für r = 1, . . . , m: χr | χ =
m
ks χr | χs = kr .
s=1
b. Folgt direkt aus Teil a. Die Theoreme 20.11 und 21.17 führen nun zu der erstaunlichen Folgerung: Korollar 21.18 Jede endlich-dimensionale Darstellung ist bis auf Äquivalenz durch Vorgabe ihres Charakters eindeutig bestimmt. Wir geben ein einfaches Beispiel, das auch das Material der nächsten beiden Abschnitte gut illustrieren wird: Beispiel 21.19 Die irreduziblen komplexen Darstellungen von G = U(1) sind alle eindimensional, weil die Gruppe kommutativ ist (Korollar 20.15 und s wieTheorem 21.13). Jede davon wird also durch ein einziges Matrixelement d11 dergegeben, und dieses ist gleichzeitig der Charakter χs . Daher entsprechen die irreduziblen Darstellungen den stetigen Funktionen ϕ : U(1) → C, für die gilt: ϕ(eix eiy ) = ϕ(eix )ϕ(eiy )
∀ x, y ∈ R .
(21.36)
Eine unendliche Schar solcher Funktionen ist wohlbekannt, nämlich ϕs (eix ) := eisx ,
s ∈ Z.
Das Skalarprodukt in L 2 (U(1)) wird bzgl. des normierten H AARschen Maßes gebildet, ist also
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
1 f | g := 2π
2π
251
f (t)g(t) dt .
0
Die Orthogonalitätsrelationen für die Matrixelemente und Charaktere der irreduziblen Darstellungen sind hier also einfach die bekannten trigonometrischen Orthogonalitätsrelationen. Die ϕs sind auch die einzigen (stetigen) irreduziblen Darstellungen von U(1), denn wenn ϕ eine weitere irreduzible Darstellung ist, die zu keinem der ϕs äquivalent ist, so ist 1 2π
2π
ϕ(s)e−isx dx = ϕs | ϕ = 0
∀ s ∈ Z,
0
d. h. alle F OURIERkoeffizienten von ϕ verschwinden, und damit ist ϕ ≡ 0. Ist aber ϕ ∼ ϕs für ein gewisses s, so ist ϕ = ϕs , weil es sich ja auch um die Charaktere handelt. Somit sind die ϕs die einzigen (stetigen) Lösungen der Funktionalgleichung (21.36).
E Vollständigkeit des Orthonormalsystems der Matrixelemente Nach Theorem 21.15 bilden die Matrixelemente d sjk , 1 ≤ j, k ≤ n s , s ∈ S der irreduziblen unitären Darstellungen D s einer kompakten Gruppe G ein Orthogonalsystem im H ILBERTraum L 2 (G). Wir untersuchen nun, inwieweit dieses Orthogonalsystem vollständig ist. Diese Untersuchung läuft auf den Versuch hinaus, zwei sehr besondere (i. A. unendlich-dimensionale) Darstellungen von G in irreduzible Teildarstellungen zu zerlegen, nämlich die folgenden (vgl. auch Beispiel 20.3a): Definition 21.20 Sei D R die durch (D R (g)ϕ)(x) := ϕ(xg) ,
ϕ ∈ L 2 (G) , x, g, ∈ G
(21.37)
definierte Darstellung von G auf L 2 (G). Sie heißt die rechtsreguläre Darstellung von G. Entsprechend ist die linksreguläre Darstellung D L definiert durch (D L (g)ϕ)(x) = ϕ(g −1 x) ,
ϕ ∈ L 2 (G) , x, g, ∈ G.
(21.38)
Wie in Beispiel 21.9 überzeugt man sich, dass D L und D R stetige unitäre Darstellungen von G sind. Wir konzentrieren uns im folgenden auf die rechtsreguläre Darstellung, obwohl man alles ganz analog für die linksreguläre formulieren und beweisen könnte. Die Antwort auf das Vollständigkeitsproblem liefert der folgende berühmte Satz: Theorem 21.21 (P ETER-W EYL) Sei G eine kompakte Gruppe und sei {D s | s ∈ S} eine Menge von irreduziblen unitären Darstellungen von G, in der jede Äquivalenzklasse von irreduziblen Darstellungen von G genau einmal vertreten ist. Es seien
252
21 Darstellungstheorie kompakter Gruppen
(d sjk (g)) ,
1 ≤ j, k ≤ n s ,
s∈S
zu den D s gehörende unitäre Matrixdarstellungen von G. Dann bildet das System √ n s d sjk (g) ,
s ∈ S,
1 ≤ j, k ≤ n s
eine Orthonormalbasis des H ILBERTraums L 2 (G). Zum Beweis haben wir zu zeigen, dass der lineare Teilraum L := LH({d sjk | s ∈ S , 1 ≤ j, k ≤ n s })
(21.39)
der endlichen Linearkombinationen von Matrixelementen von irreduziblen Darstellungen in L 2 (G) dicht ist. Als Vorbereitung hierzu beweisen wir eine Charakterisierung der zu L gehörigen Funktionen, die auch für sich interessant ist: Satz 21.22 Für f ∈ L 2 (G) sind folgende Aussagen äquivalent: (i) f ∈ L. (ii) f ist stetig, und der Unterraum L f := LH({D R (g) f | g ∈ G}) hat endliche Dimension. (iii) f gehört zu einem endlichdimensionalen D R -invarianten Unterraum von C(G). Eine analoge Äquivalenzaussage gilt für D L . Insbesondere ist L invariant unter D R und D L . Beweis (i) ⇒ (ii): Jedes f ∈ L ist stetig, denn die d sjk sind als Matrixelemente von stetigen Darstellungen stetig. Auch für die Aussage über L f genügt es, den Fall f = d sjk zu betrachten, denn sie überträgt sich auf endliche Linearkombinationen. Aber für alle x, g ∈ G ist [D R (g)d sjk ](x) = d sjk (xg) =
ns ν=1
s d sjν (x)dνk (g),
und somit gehört jedes D R (g)d sjk zu dem n s -dimensionalen Unterraum, der von den d sjν , ν = 1, . . . , n s aufgespannt wird. (ii) ⇒ (iii) ist trivial, denn L f ist ein endlichdimensionaler D R -invarianter Unterraum von C(G). (iii) ⇒ (i): Sei f ∈ V , wo V ⊆ C(G) ein invarianter Unterraum endlicher Dimension ist. Nach Theorem 20.11a zerfällt die Darstellung D R V in eine direkte Summe von irreduziblen Teildarstellungen, d. h. wir haben f = g1 + · · · + gm ,
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
253
wobei jedes gi in einem irreduziblen Teilraum liegt. Da es genügt, g1 , . . . , gm ∈ L zu zeigen, können wir also o.B.d.A. annehmen, dass schon V irreduzibel ist. Da das System S alle Äquivalenzklassen von irreduziblen Darstellungen von G umfasst, muss D R V ∼ D s sein für ein gewisses s ∈ S. In Bezug auf eine geeignete Basis f 1 , . . . , f n s wird D R V also durch die Matrizen (d sjk (g)) , g ∈ G dargestellt, d. h. wir haben D R (g) f k =
ns
d sjk (g) f j ,
k = 1, . . . , n s , g ∈ G.
j=1
Werten wir dies bei der Eins e von G aus, so ergibt sich f k (g) = [D R (g) f k ](e) =
ns
d sjk (g) f j (e) ,
k = 1, . . . , n s , g ∈ G .
j=1 s , . . . , ds Also ist f k eine Linearkombination der Matrixelemente d1k n s k mit den Zahlen f j (e) als Koeffizienten (k = 1, . . . , n s ). Wir haben somit f 1 , . . . , f n s ∈ L und daher auch f ∈ L.
Wir werden nun erneut den W EYLoperator einsetzen, müssen ihn dazu aber für den Fall des H ILBERTraums L 2 (G) noch etwas genauer untersuchen: Lemma 21.23 Sei K y der W EYLoperator zu einem y ∈ L 2 (G) in Bezug auf die rechtsreguläre Darstellung. Der Wertebereich R(K y ) besteht dann aus stetigen Funktionen. Beweis Sei u ∈ L 2 (G) beliebig. Dann ist f (g) := D R (g)y | u eine stetige Funktion von g, weil D R eine stetige Darstellung ist. Insbesondere ist f ∈ L 2 (G), und wir setzen für x ∈ G w(x) :=
f (g) y(xg) dg. G
Dann ist w(x) = f¯ | D L (x −1 )y , also ebenfalls stetig, denn auch D L ist eine stetige Darstellung. Die Behauptung folgt also aus w = K y u. Um dies zu zeigen, betrachten wir das Skalarprodukt beider Seiten mit einem beliebigen v ∈ L 2 (G):
D R (g)y | u v | D R (g)y dg = f (g) v(x)y(xg) dx dg G G G v(x) f (g)y(xg) dg dx = v | w , =
v | K y u =
G
G
254
21 Darstellungstheorie kompakter Gruppen
wie gewünscht. Die Anwendung des Satzes von F UBINI ist gerechtfertigt, denn G×G
|v(x)| · | f (g)| · |y(xg)| dx dg ≤ f ∞ v2 y2 < ∞.
Beweis (von Theorem 21.21) Es genügt, zu zeigen, dass L⊥ = {0} (Satz 7.14b). Angenommen also, es gäbe 0 = y ∈ L⊥ . Sei dann K y der entsprechende, bzgl. D R gebildete W EYL-Operator. Genau wie im Beweis von Theorem 21.13 erkennt man, dass λ := K y > 0 ein Eigenwert ist und dass N (K y − λI ) ein D R -invarianter Unterraum endlicher Dimension ist. Ist g ∈ N (K y − λI ), so ist g = K y (λ−1 g) ∈ R(K y ), also g ∈ C(G) nach Lemma 21.23. Damit zeigt Satz 21.22, dass N (K y − λI ) ⊆ L ist. Wegen y ∈ L⊥ und Satz 21.11b. ist aber auch R(K y ) ⊆ L⊥ , also N (K y − λI ) ⊆ L ∩ L⊥ = {0}, ein Widerspruch. Bemerkung Man kann sogar beweisen, dass jedes f ∈ C(G) der gleichmäßige Limes von Funktionen aus L ist. Auch diese Verschärfung wird als Satz von P ETER -W EYL oder Satz von P ETER -W EYL -N EUMANN bezeichnet, und man findet Beweise dafür in vielen Lehrbüchern über L IE-Gruppen, Darstellungstheorie oder Funktionalanalysis, etwa in [2, 12, 43, 82] oder [95]. Der folgende Satz ist wegen der Eigenschaften von vollständigen Orthonormalsystemen (vgl. z. B. [34], Kap. 29) lediglich eine andere Formulierung von Theorem 21.21. Theorem 21.24 Unter den Voraussetzungen und mit den Bezeichnungen von Theorem 21.21 gilt für jede Funktion ϕ ∈ L 2 (G) ϕ(g) =
ns
s s cik dik (g),
g∈G
(21.40)
s∈S i,k=1
mit s cik
=
s n s dik
| ϕ = n s
s (g) ϕ(g) dg, dik
(21.41)
G
wobei die F OURIERreihe in L 2 (G) konvergiert, d. h. im quadratischen Mittel in Bezug auf das H AARsche Maß. Insbesondere gilt die PARSEVALsche Gleichung |ϕ(g)|2 dg = G
s∈S
ns
ns
s 2 |cik | .
(21.42)
i,k=1
Man sieht also (Beispiel 21.19), dass die bekannte Vollständigkeit des trigonometrischen Orthonormalsystems ein Spezialfall des Satzes von P ETER -W EYL ist.
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
255
Zum Schluss untersuchen wir noch etwas genauer, wie sich die rechts(bzw. links-)reguläre Darstellung aus den irreduziblen Darstellungen zusammensetzt. Als Vorbereitung beweisen wir: Satz 21.25 Sei (d jk (g)) eine irreduzible unitäre Matrixdarstellung von G vom Grade n. Dann gilt: a. Für j = 1, . . . , n spannen die orthonormalen Elemente e jk :=
√ n d jk ,
k = 1, . . . , n
(21.43)
2 in der j-ten Zeile der Matrix einen D R -irreduziblen Teilraum H j von L (G) auf. Insbesondere ist D ∼ D R H . j b. Wir haben explizit:
D R (g)e jk =
n
dik (g)e ji ,
g ∈ G.
(21.44)
i=1
Jede irreduzible Darstellung von G ist also äquivalent zu einer Teildarstellung der rechtsregulären Darstellung. c. Entsprechendes gilt für die linksreguläre Darstellung.
Beweis Die Matrixelemente d jk sind nach Theorem 21.15b orthogonal, und die Funktionen e jk , 1 ≤ k ≤ n, bilden für jedes feste j ein Orthonormalsystem. Aus (21.37) folgt für x, g ∈ G (D R (g)d jk )(x) = d jk (xg) n = d ji (x)dik (g) i=1
aufgrund der Homomorphismuseigenschaft von D, was (21.44) beweist und außerdem zeigt, dass H j = LH(e j1 , . . . , e jn ) invariant unter D R ist. Ferner besagt (21.44), dass (dik ) die Matrixdarstellung von D R H bezüglich der Orthonormalbasis (e jk , k = 1, . . . , n) ist, also auch D ∼ j DR . Hj
Kombinieren wir schließlich noch Satz 21.25 mit Theorem 21.21, so erhalten wir folgendes Ergebnis:
256
21 Darstellungstheorie kompakter Gruppen
Satz 21.26 a. Jede Äquivalenzklasse D s von irreduziblen Darstellungen der kompakten Gruppe G kommt als irreduzibler Bestandteil der rechtsregulären (linksregulären) Darstellung vor, und zwar mit Vielfachheit n s , die gleich der Dimension von D s ist. Man kann also schreiben: ns Ds , DL ∼ ns Ds . DR ∼ s∈S
s∈S
b. Die Vektoren esjk :=
√ n s d sjk ,
1 ≤ k ≤ ns
spannen für festes s ∈ S und festes j = 1, . . . , n s die irreduziblen Teilräume in der obigen Zerlegung der rechtsregulären Darstellung auf. c. Die Vektoren esjk :=
√ n s dks j ,
1 ≤ k ≤ ns
spannen für festes s ∈ S und festes j = 1, . . . , n s die irreduziblen Teilräume in der obigen Zerlegung der linksregulären Darstellung auf. Beweis Wir behandeln nur die rechtsreguläre Darstellung. Sei also Hsj := LH(esj1 , . . . , esjn s ) ,
s ∈ S, j = 1, . . . , n s .
Die Aussage des Satzes von P ETER -W EYL besagt dann, dass L 2 (G) die H IL BERT sche Summe der Hsj ist (vgl. Korollar 15.3c), und Satz 21.25 besagt, dass die auf jedem der invarianten Teilräume Hsj , j = 1, . . . , n s durch D R definierte Darvon D s mindestens stellung zu D s äquivalent ist. Insbesondere ist die Vielfachheit n s . Ist aber V irgendein irreduzibler Teilraum mit D R V ∼ D s , so ist V ⊆ H1s ⊕ · · · ⊕ Hns s , wie wir schon im Beweis von Satz 21.22 (Teil (iii) Daher ist die Vielfachheit genau n s .
⇒
(i)) gesehen haben.
Der letzte Satz hat eine naheliegende Konsequenz: Korollar 21.27 Eine unendliche kompakte Gruppe G besitzt unendlich viele verschiedene Äquivalenzklassen von stetigen irreduziblen Darstellungen. Eine endliche Gruppe hingegen besitzt nur endlich viele, und dabei gilt: |G| =
s∈S
n 2s .
(21.45)
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
257
Beweis Ist G unendlich, so kann man eine unendliche Folge (gm ) von lauter verschiedenen Punkten von G wählen. Sei dann f m eine stetige Funktion auf G, für die f m (gn ) = δmn für alle m, n gilt. Für jedes N ∈ N sind dann die Vektoren f 1 , . . . , f N ∈ C(G) linear unabhängig, und daher hat C(G) unendliche Dimension. Dann ist aber auch L 2 (G) ⊇ C(G) unendlichdimensional, und nach Theorem 21.21 und Satz 21.26a wäre das nicht möglich, wenn es nur endlich viele Typen D s von irreduziblen Darstellungen gäbe. Ist G aber endlich, so ist L 2 (G) einfach der Vektorraum aller C-wertigen Funktionen auf G, hat also die Dimension |G| < ∞. Nach Satz 21.26a kann das System S dann auch nur aus endlich vielen Typen bestehen, und es gilt (21.45). Anmerkung 21.28 Satz 21.26 bedeutet, dass die beiden regulären Darstellungen in einem leicht verallgemeinerten Sinn vollreduzibel sind. Dies gilt aber sogar für jede stetige unitäre Darstellung einer kompakten Gruppe G. Aus dem Satz von P ETER W EYL kann man nämlich folgern (vgl. etwa [12]), dass es zu jeder stetigen unitären Darstellung D von G auf einem komplexen H ILBERTraum H ein System Hs , s ∈ Σ von irreduziblen Teilräumen Hs gibt, für die der Raum L D :=
" Hs = LH
s∈Σ
' Hs
s∈Σ
dicht in H ist. Ist H separabel, so ist die Indexmenge Σ abzählbar. Jeder Vektor x ∈ H hat dann eine eindeutige Reihenentwicklung x = s∈Σ xs mit xs ∈ Hs , die in H konvergiert. In dem in Korollar 15.3 definierten Sinn ist also H die H ILBERTsche Summe der irreduziblen Teilräume Hs . 21.29 Ausblick: Darstellungstheorie und harmonische Analyse bei nichtkompakten L IE-Gruppen Als Beispiel betrachten wir die stetigen Darstellungen der abelschen eindimensionalen nichtkompakten L IE-Gruppe G = (R, +). (i) Für jedes λ ∈ R haben wir die offensichtliche irreduzible Darstellung ϕλ (t) := eiλt ,
t ∈R
(21.46)
auf dem Trägerraum C. In gewissem Sinne kann man aus diesen jede stetige unitäre Darstellung von (R, +) durch Superposition gewinnen, aber man muss dazu den Begriff der linearen Superposition wesentlich weiter fassen als bisher. Sei also U : R → H eine solche unitäre Darstellung auf dem komplexen H ILBERTraum H . Nach Definition erfüllt U dann die Bedingungen (16.53), (16.54) und (16.56), ist also nichts anderes als eine stark stetige unitäre Einparametergruppe im Sinne von Definition 16.33. Nach dem Satz von S TONE ist daher
258
21 Darstellungstheorie kompakter Gruppen
Ut = eit A ,
t ∈R
(21.47)
mit einem eindeutigen (möglicherweise unbeschränkten!) selbstadjungierten Operator A. Ist nun E das Spektralmaß zu A, so haben wir nach Definition des M∞ -Funktionalkalküls Ut = eiλt dE(λ) , t ∈ R, (21.48) R
d. h. das entsprechende Spektralintegral gibt an, wie sich die Darstellung t → Ut aus den ϕλ durch Superposition zusammensetzt. Die Theorie der unitären Darstellungen von (R, +) ist also, wenn man so will, die in den Kap. 15 und 16 skizzierte Spektraltheorie. (ii) Um eine Entsprechung für den Satz von P ETER -W EYL zu finden, versuchen wir, speziell die rechtsreguläre Darstellung D R von (R, +) aus den ϕλ zusammenzusetzen. Dazu betrachten wir D R zunächst auf dem invarianten Teilraum S1 der schnell fallenden Testfunktionen. Für f ∈ S1 gilt nach der F OURIERschen Umkehrformel f (x) =
dλ f (λ)eiλx √ , 2π R
x ∈ R,
(21.49)
also entsteht f tatsächlich durch Superposition der ϕλ mit den Zahlen f (λ) als Koeffizienten. Das zur Superposition verwendete Maß ist hier bis auf den konstanten Faktor (2π )−1/2 das L EBESGUEmaß. Auf dem Exemplar von C, das dem Wert λ des Spektralparameters entspricht, liefert D R tatsächlich die Darstellung ϕλ , denn für g := D R (t) f ist g(x) = f (x + t), also g(λ) = f (λ)ϕλ (t) .
(21.50)
All dies kann auch auf den H ILBERTraum L 2 (R) ausgedehnt werden, aber dann muss man die F OURIER -P LANCHEREL-Transformation benutzen, und die Formeln (21.49), (21.50) gelten nicht mehr punktweise wörtlich, sondern nur noch im quadratischen Mittel (vgl. Abschn. 8F). Der Mechanismus der Superposition ist dann also noch komplizierter. Bemerkung Natürlich könnte man D R auch auf die unter (i) skizzierte Weise betrachten. Dann würde das Spektralmaß des Impulsoperators die entscheidende Rolle spielen. So gesehen, sind die F OURIERintegrale Entwicklungen nach verallgemeinerten Eigenfunktionen des Impulsoperators. (iii) In den Aufgaben 20.5–20.7 wurden endlichdimensionale Darstellungen der Gruppen (R, +) und (Z, +) diskutiert, die nicht vollreduzibel sind. Wegen Theorem 20.11 können sie nicht zu unitären Darstellungen äquivalent sein. Nichtunitäre Darstellungen spielen also für diese Gruppen ebenfalls eine bedeutende Rolle, sogar wenn man sich auf endlichdimensionale Trägerräume beschränkt. Bei einer nichtkommutativen nichtkompakten L IE-Gruppe hat man es nun mit höherdimensionalen irreduziblen Darstellungen zu tun und gleichzeitig mit dem
F Ein Vollständigkeitskriterium
259
Effekt, dass die Zusammensetzung dieser Darstellungen zu allgemeineren Darstellungen mittels einer delikaten Integrationstheorie erfolgen muss und nicht mehr durch einfache Bildung von direkten Summen oder konvergenten Reihen. Die Literatur teilt sich demgemäß auch in zwei Bereiche auf: Die eigentliche Darstellungstheorie bemüht sich – hauptsächlich mittels algebraischer Methoden – um die Bestimmung der irreduziblen Darstellungen, und die harmonische Analyse untersucht die in Frage kommenden Superpositionsmechanismen und die dabei auftretenden Konvergenzprobleme mit Methoden, die hauptsächlich der mathematischen Analysis entstammen. Beide Aspekte werden in der umfangreichen Monographie [5] angesprochen. Vgl. auch [56].
F Ein Vollständigkeitskriterium Für eine gegebene Gruppe G kann man kaum je direkt ermitteln, wie ihre irreduziblen Darstellungen aussehen. Es gibt jedoch etliche Methoden, möglichst umfangreiche Systeme von irreduziblen Darstellungen aufzufinden, und dann ist es wichtig, beurteilen zu können, wann man alle Äquivalenzklassen gefunden hat, so dass man die Suche beenden kann. Also muss man für eine gegebene Menge T = {D s | s ∈ T } von unitären irreduziblen Darstellungen entscheiden können, ob diese Menge bis auf Äquivalenz alle irreduziblen Darstellungen von G enthält. Ist G endlich, so kann (21.45) hierfür herangezogen werden. Bei unendlichen kompakten Gruppen kann man sich mit etwas Funktionalanalysis behelfen, und wir reduzieren die Frage nun zunächst auf eine Dichtigkeitseigenschaft für die Matrixelemente: Satz 21.30 Sei G eine kompakte Gruppe und sei T = {D s = (d sjk ) | s ∈ T } eine Menge von stetigen irreduziblen, paarweise nicht äquivalenten Matrixdarstellungen von G. Angenommen, die lineare Hülle der vorkommenden Matrixelemente d sjk (g) | s ∈ T ,
1 ≤ j , k ≤ ns
liegt dicht in CC (G). Jede stetige irreduzible Darstellung von G ist dann äquivalent zu einer Darstellung D s , s ∈ T , d. h. T enthält bis auf Äquivalenz alle stetigen irreduziblen Darstellungen von G. Beweis Angenommen, wir haben eine irreduzible Darstellung D von G, die zu keinem D s , s ∈ T , äquivalent ist. Nach dem (allgemeinen) Satz von M ASCHKE können wir sie als unitär annehmen. Nach Satz 21.25 ist D äquivalent zu einer Teildarstellung der rechtsregulären Darstellung D R , und diese entspricht bzgl. einer ge-
260
21 Darstellungstheorie kompakter Gruppen
eigneten Basis einer Matrixdarstellung (dkl )k,l=1,...,n . Nach Theorem 21.15a haben wir dann disj | dkl = 0 für alle s ∈ T , i, j = 1, . . . , n s , k, l = 1, . . . , n. Mit LT := LH({disj | s ∈ T , i, j = 1, . . . , n s }) folgt g | dkl = 0 für alle g ∈ LT , k, l = 1, . . . , n. Nach Voraussetzung ist aber LT dicht in C(G), und da G kompakt ist, folgt aus der gleichmäßigen Konvergenz auch die L 2 -Konvergenz. Daher ist sogar g | dkl = 0 für alle g ∈ C(G), z. B. auch für g = dkl , was absurd ist. Um diesen Satz anwenden zu können, benötigt man wiederum brauchbare hinreichende Bedingungen für die hier vorkommende Dichtigkeitsaussage. Ein solches Kriterium kann leicht aus dem aus der Funktionalanalysis bekannten Satz von S TONE-W EIERSTRASS gewonnen werden, den wir nun ohne Beweis angeben. Dabei geht es um Teilalgebren der C ∗ -Algebra C(K ), die aus den stetigen komplexwertigen Funktionen auf einem kompakten H AUSDORFF-Raum K besteht (Definitionen 15.12 und Beispiele 15.13). Der hier vorkommende kompakte H AUS DORFF-Raum (Definition 1.9) könnte z. B. eine kompakte L IE -Gruppe sein. Theorem 21.31 (S TONE-W EIERSTRASS) Sei K ein kompakter H AUSDORFFRaum und sei A eine Teilalgebra der BANACHalgebra C(K ) mit folgenden Eigenschaften a. A enthält die Funktion f ≡ 1. b. A trennt die Punkte von K , d. h. sind x1 , x2 ∈ K mit x1 = x2 , so gibt es eine Funktion f ∈ A mit f (x1 ) = f (x2 ). c. Ist f ∈ A, so ist auch die konjugiert komplexe Funktion f¯ ∈ A. Dann liegt A dicht in C(K ), d. h. jede stetige Funktion f : K −→ C kann durch Funktionen aus A beliebig genau gleichmäßig approximiert werden. Ein Beweis findet sich in fast jedem Lehrbuch der Funktionalanalysis, z. B. in [95]. Um den Satz richtig einzuordnen, sollte man sich klarmachen, dass der klassische W EIERSTRASSsche Approximationssatz eine einfache Konsequenz ist – man nehme ein kompaktes Intervall [a, b] ⊆ R als K und die Teilalgebra der Polynomfunktionen als A. Für die Anwendung auf die Darstellungstheorie ist zu beachten, dass das System der endlichdimensionalen Darstellungen einer festen Gruppe nicht nur eine „Addition“ zulässt (nämlich die direkte Summe), sondern auch eine „Multiplikation“, nämlich das Tensorprodukt (vgl. Definition 20.7). Sind nun D 1 , D 2 zwei irreduzible unitäre Darstellungen von G, so ist das Tensorprodukt D 1 ⊗ D 2 immer noch
F Ein Vollständigkeitskriterium
261
unitär und endlichdimensional, hat also nach Theorem 20.11 eine Zerlegung der Form (21.33) in endlich viele irreduzible Darstellungen. Diese bezeichnet man als die C LEBSCH -G ORDAN-Zerlegung des Tensorprodukts. Satz 21.32 Sei G eine kompakte Gruppe und sei T wie in Satz 21.30. Angenommen, T hat die folgenden Eigenschaften: 1. Die 1-Darstellung F mit F(g) = 1, g ∈ G, gehört zu T . 2. Zu jedem g ∈ G mit g = e existiert ein s ∈ T mit D s (g) = E. 3. Mit jedem D s ∈ T kommt auch (bis auf Äquivalenz) die zu D s konjugierte Darstellung s
D (g) := (d sjk (g)) , g ∈ G in T vor, d. h. zu jedem s ∈ T gibt es ein t ∈ T und ein C ∈ GL(n s , C), so dass s
D (g) = C D t (g)C −1
∀ g ∈ G.
4. In T ist stets eine C LEBSCH-G ORDAN-Zerlegung Ds ⊗ Dt ∼
m
Ds j ,
sj ∈ T
j=1
mit irreduziblen Darstellungen aus T möglich. Dann gilt: Die lineare Hülle der vorkommenden Matrixelemente d sjk | s ∈ T ,
1 ≤ j , k ≤ ns
liegt dicht in CC (G). Beweis Sei A = LH({d sjk | s ∈ T ,
1 ≤ j , k ≤ n s })
(21.51)
die lineare Hülle aller in den Darstellungen aus T vorkommenden Matrixelemente. Dann müssen wir zeigen, dass A die Voraussetzungen von Theorem 21.31 erfüllt: a. folgt aus der Voraussetzung 1. von Satz 21.32, denn es gibt ein s ∈ T mit n s = 1 und s d11 (g) = 1
für alle g ∈ G.
b. folgt aus der Voraussetzung 2. von Satz 21.32, denn für g1 = g2 in G gibt es ein D s ∈ T mit
262
21 Darstellungstheorie kompakter Gruppen
E = D s (g1 g2−1 ) = D s (g1 )D s (g2 )−1 ,
d. h. D s (g1 ) = D s (g2 )
und daher d sjk (g1 ) = d sjk (g2 )
für wenigstens ein Paar ( j, k).
c. folgt aus der Voraussetzung 3. von Satz 21.32, denn zu jedem s ∈ T gibt es ein t ∈ T und eine reguläre Matrix C, so dass s (g)) = C(d t (g))C −1 , (dkl ij
d. h. nach Bildung des Matrizenproduktes hat man mit geeigneten Konstanten ij ckl : s (g) = dkl
ij
ckl ditj (g).
i, j
Linearkombinationen der disj gehören aber wieder zu A. d. Es ist noch zu zeigen, dass das Produkt zweier Funktionen aus A wieder zu A gehört, denn dann ist A Unteralgebra von CC (G). Dazu benötigen wir die C LEBSCH-G ORDAN-Zerlegung in Voraussetzung 4. von Satz 21.32. In Matrixdarstellung schreibt sich diese: ⎛ ⎜ ⎜ D s (g) ⊗ D t (g) = C ⎜ ⎝
D s1 (g)
0
D s2 (g)
0
..
⎞
⎟ ⎟ −1 ⎟C ⎠ . s m D (g)
mit einer passenden regulären Matrix C, also nach Ausführung der Matrizenmultiplikation n
disj (g)dklt (g)
=
sp m
s
s
p ai jklqr dqrp (g)
p=1 q,r =1 s
p . Ein Produkt von Matrixelementen kann demmit skalaren Koeffizienten ai jklqr zufolge als Linearkombination von Matrixelementen geschrieben werden und gehört damit ebenfalls zu A. Das Produkt von zwei Linearkombinationen von Matrixelementen gehört dann aber ebenfalls zu A.
Theorem 21.31 liefert nun die Behauptung.
Aufgaben
263
Aufgaben zu Kap. 21 21.1 Man zeige, dass ω = xdy − ydx unter allen Drehungen der Ebene R2 invariant ist, d. h. R ∗ ω = ω für alle R ∈ SO(2). 21.2 Man zeige: a. Für G = {x ∈ R | x > 0} mit der Multiplikation als Gruppenverknüpfung ist
∞
λ( f ) =
f (x)
0
dx x
ein H AARsches Integral. b. Für G = C∗ (vgl. Beispiel 17.2d) ist λ( f ) =
f (x + iy) dx dy x 2 + y2
ein H AARsches Integral. 21.3 Es seien e0 , e1 , e2 , e3 die Matrizen aus (18.49), und J : R4 → H sei der in (18.50) angegebene Isomorphismus. Man zeige: a. J ist eine Isometrie, und das Bild der Sphäre S3 = {(x0 , x1 , x2 , x3 ) ∈ R4 | x02 + x12 + x22 + x32 = 1} unter J ist G = SU(2). b. Ist X ∈ SU(2) und X die Linksmultiplikation mit X in H, so ist J −1 X J ein Element von SO(4). (Hinweis: Man beachte (18.53) und die Tatsache, dass SU(2) zusammenhängend ist.) c. Das normierte H AARsche Integral auf SU(2) ist gegeben durch λ( f ) =
1 2π 2
S3
f (J x) dσ ,
wo dσ die euklidische Volumenform auf S3 (also das „dreidimensionale Oberflächenelement“) bezeichnet. 21.4 Die sog. H EISENBERGgruppe ist R3 mit der Verknüpfung (x, y, z) · (x , y , z ) = (x + x , y + y , z + z + x y − x y). Man zeige, dass dies eine L IE-Gruppe ist. Man zeige ferner, dass das L EBESGUEMaß links- und rechtsinvariant ist. Insbesondere ist die Gruppe unimodular.
264
21 Darstellungstheorie kompakter Gruppen
21.5 Parametrisiere G := SO(3) wie in Satz 18.3b. Zwecks Vereinheitlichung der Bezeichnungen ersetzen wir jedoch die x-Achse durch die z-Achse und benennen auch die E ULERschen Winkel anders. Die gewählte Parametrisierung lautet R = R3 (ϕ)R2 (θ )R3 (α),
α, ϕ ∈ [0, 2π [ , θ ∈ [0, π ].
a. Es sei S := {x = (x, y, z) ∈ R3 | x 2 + y 2 + z 2 = 1} die Einheitssphäre im R3 . Für f ∈ C(G) setzen wir 1 f˜(x) := 2π
2π
f (A R3 (α)) dα ,
x ∈ S,
0
wobei A ∈ G so gewählt ist, dass Ae3 = x. Man zeige, dass hierdurch eine stetige Funktion auf S wohldefiniert ist. (Hinweis: Ist Ae3 = A e3 , so ist A−1 A eine Drehung um die z-Achse.) b. Man zeige: Durch 1 λ( f ) := 4π
f˜(x) dσ S
ist das normierte H AARsche Integral auf SO(3) gegeben. Dabei bedeutet dσ das euklidische Oberflächenelement, also die Volumenform ω S auf der euklidischen Sphäre S. c. Man folgere: Das normierte H AARsche Integral ist explizit λ( f ) =
1 8π 2
2π
0
π
0
2π
f (R3 (ϕ)R2 (θ )R3 (α)) sin θ dαdθ dϕ .
0
(Hinweis: Parametrisiere S durch Kugelkoordinaten x = cos ϕ sin θ,
y = sin ϕ sin θ,
z = cos θ,
0 ≤ ϕ < 2π, 0 ≤ θ ≤ π
und beachte, dass R3 (ϕ)R2 (θ )e3 der Punkt mit den Koordinaten (ϕ, θ ) ist.) 21.6 Parametrisiere SU(2) wie in Satz 18.10 durch Gl. (18.26). Dann ist das normierte H AARsche Integral gegeben durch λ( f ) =
1 16π 2
2π 0
π 0
4π
f (S3 (γ )S2 (β)S3 (α)) sin β dαdβdγ .
0
(Hinweis: Mittels des Epimorphismus Φ : SU(2) → SO(3) kann dies auf die vorige Aufgabe zurückgeführt werden. Dazu beachte man, dass S3 (α ± 2π ) = −S3 (α) und dass Φ auf jeder der Teilmengen
Aufgaben
265
G 1 := {S3 (γ )S2 (β)S3 (α) | 0 ≤ γ < 2π , 0 ≤ β ≤ π , 0 ≤ α < 2π } , G 2 := {S3 (γ )S2 (β)S3 (α) | 0 ≤ γ < 2π , 0 ≤ β ≤ π , 2π ≤ α < 4π } eindeutig invertiert werden kann.) 21.7 Für x, y ∈ R , x = 0 setze A(x, y) :=
x y . 01
Man zeige: a. Die Menge G := {A(x, y) | x, y ∈ R , x = 0} bildet eine lineare L IE-Gruppe. Die Abbildung A : (R \ {0}) × R → G ist eine globale Parametrisierung. b. Das Funktional f (A(x, y)) λ( f ) = dx dy x2 ist ein linkes H AAR-Integral, und das Funktional ρ( f ) =
f (A(x, y)) dxdy |x|
ist ein rechtes H AAR-Integral für G. c. Man berechne die Modularfunktion ΔG . Ist G unimodular? 21.8 Die m-dimensionale L IE-Gruppe G möge eine globale Parametrisierung A : Ω → G (Ω ⊆ Rm offen) besitzen, in der die Gruppenverknüpfung folgendermaßen ausgedrückt werden kann: A(x 1 , . . . , x m )A(y 1 , . . . , y m ) = A(z 1 , . . . , z m ) mit zi =
m j,k=1
a ijk x j y k +
m j=1
u ij x j +
m
vki y k + wi ,
k=1
wobei die a ijk , u ij , vki , wi feste reelle Zahlen sind. Die Rechts- und Linksmultiplikation mit einem festen g ∈ G drücken wir nun in der gegebenen Parametrisierung aus, setzen also
266
21 Darstellungstheorie kompakter Gruppen
δg (x 1 , . . . , x m ) := η(A(x 1 , . . . , x m )g) ,
σg (x 1 , . . . , x m ) := η(g A(x 1 , . . . , x m ))
für (x 1 , . . . , x m ) ∈ Ω, wo η : G → Ω die inverse Abbildung zu A bezeichnet. Man zeige: a. Die JACOBImatrizen J δg , J σg sind auf Ω konstant. Wir bezeichnen ihre Determinanten mit D(g) := det J δg bzw. S(g) := det J σg . b. Die so definierten Abbildungen D, S : G → R∗ sind stetige Gruppenhomomorphismen in die multiplikative Gruppe R∗ = R\{0}. (Hinweis: Kettenregel!) c. Ein linkes bzw. rechtes H AARsches Integral auf G ist gegeben durch λ( f ) =
Ω
f (A(x)) m d x |S(A(x))|
Ω
f (A(x)) m d x. |D(A(x))|
bzw. ρ( f ) =
d. Man berechne H AARsche Integrale für die Gruppe aus Aufgabe 21.7 (natürlich ohne die dort schon verratenen Resultate zu beachten!). e. Man bestimme H AARsche Integrale für GL(n, R) und beweise insbesondere, dass diese Gruppen unimodular sind. (Hinweis: Hier wähle man für A die identische Abbildung. Die Parameter sind also die Matrixelemente selbst.) 21.9 Man zeige: Ist G unimodular, so ist für jedes linke H AARsche Maß λ
f (g −1 xg) dλ(x) = G
f (x) dλ(x) = λ( f ) G
für alle f ∈ Cc (G) , g ∈ G. 21.10 Man zeige: Die Modularfunktion auf einer linearen L IE-Gruppe ist Δ(X ) = | det Ad(X )| . Dabei ist Ad die adjungierte Darstellung, die in Beispiel 20.3c eingeführt wurde. (Hinweis: Man betrachte ein linkes H AAR-Integral, das durch (21.1) in Verbindung mit (21.2) gegeben ist.) 21.11 Sei D eine stetige unitäre Darstellung der kompakten Gruppe G auf dem H ILBERTraum H . Für ϕ ∈ H setze Pϕ :=
D(g)ϕ dg. G
Aufgaben
267
Man zeige, dass P der orthogonale Projektor auf den abgeschlossenen linearen Teilraum H1 := N (D(g) − I ) = {ϕ ∈ H | D(g)ϕ = ϕ ∀ g ∈ G} g∈G
ist. (Hinweis: Zunächst überlege man sich, dass R(P) ⊆ H1 und Pϕ = ϕ ⇐⇒ ϕ ∈ H1 . Dann betrachte man die Zerlegung von H in die beiden D-invarianten abgeschlossenen linearen Teilräume H1 und H1⊥ .) 21.12 Sei G eine kompakte Gruppe, D s = (d sjk ) eine irreduzible Matrixdarstellung vom Grad n s und U eine unitäre Darstellung von G auf H . Setze s P jk
:= n s G
d sjk (g) U (g) dg ,
j, k = 1, . . . , n s .
Man zeige: s sind beschränkt, und (P s )∗ = P s . a. Die Operatoren P jk jk kj b. s s P jk P jt k = δst δk j P jk .
c. P jsj ist orthogonale Projektion. s = n s d s (g)P s und P s U (g) = n s d s (g)P s . d. U (g)P jk lk jk jl l=1 l j l=1 kl s u. Der Raum V := LH(v , . . . , v ) e. Ist 0 = u ∈ H und k fest, so setze v j := P jk 1 ns ist dann U -invariant, und U V ist zu D s äquivalent. f. Sei dim H < ∞. Wir zerlegen U gemäß (21.33) in irreduzible Darstellungen D t, p = U V t, p mit D t, p ∼ D t für alle p. In V t, p führen wir eine Basis t, p t, p {e1 , . . . , en t } ein, in Bezug auf die D t, p gerade die Matrixdarstellung (d tjk ) s durch Angabe ihrer Werte auf hat. Man beschreibe die lineare Abbildung P jk t, p
den Basisvektoren el
von H .
21.13 Unter den Voraussetzungen und mit den Bezeichnungen aus Aufgabe 21.12 setzen wir P s := n s
χ s (g)U (g) dg = G
ns
P jsj .
j=1
Man zeige: a. (P s )∗ = P s , P s P t = δst P s . Insbesondere ist jedes P s ein orthogonaler Projektor.
268
21 Darstellungstheorie kompakter Gruppen
b. P s U (g) = U (g)P s für alle g ∈ G. c. Im Falle dim H < ∞ ist s P s = id H sowie s, j P jsj = id H . d. P s ist der orthogonale Projektor auf den Teilraum V s von H , der die Summe aller irreduziblen Teilräume ist, auf denen U zu D s äquivalent ist. 21.14 Seien G 1 , G 2 zwei kompakte Gruppen und Di endlichdimensionale Darstellungen von G i , i = 1, 2. Man zeige: Das äußere Tensorprodukt von D1 und D2 (Aufg. 20.9) ist genau dann irreduzibel, wenn D1 , D2 irreduzibel sind. (Hinweis: Am bequemsten ist es, das Kriterium aus Theorem 21.17b zu verwenden.) 21.15 Sei G eine kompakte Gruppe. Eine Funktion f ∈ C(G) heißt Klassenfunktion, wenn f (g −1 xg) = f (x)
∀ x, g ∈ G .
(21.52)
Man zeige: a. Die Menge C K l (G) der Klassenfunktionen ist ein abgeschlossener linearer Unterraum von C(G). b. Die Charaktere der endlichdimensionalen Darstellungen von G gehören zu C K l (G). c. Durch f (h −1 xh) dh , x∈G (P f )(x) := G
ist ein beschränkter linearer Operator C(G) → C K l (G) gegeben. Dabei ist f ∈ C K l (G) ⇐⇒ P f = f . d. Ist d jk ein Matrixelement einer irreduziblen unitären Darstellung D von G, so ist P(d jk ) = n −1 χ D δ jk , wo χ D der Charakter und n der Grad von D ist. (Hinweis: Man verwende (21.29) für T = D(x) sowie (21.31).) 21.16 Sei G eine kompakte Gruppe. Mit den Bezeichnungen aus Abschn. E setzen wir K := LH({χs | s ∈ S}), wobei χs der Charakter von D s ist. Man beweise, dass jede Klassenfunktion f ∈ C K l (G) gleichmäßiger Limes von Elementen von K ist. (Hinweis: Man verwende die vorige Aufgabe sowie den Satz von P ETER -W EYL in der verschärften Fassung, die in der Bemerkung vor Theorem 21.24 berichtet wird.)
Aufgaben
269
21.17 Sei G eine endliche Gruppe und h ihre Klassenzahl, d. h. die Anzahl ihrer Konjugiertenklassen (vgl. Aufgabe 17.15). Da in Bezug auf die diskrete Topologie (Beispiel 1.5c) alle Funktionen auf G stetig sind, besteht C K l (G) aus allen Funktionen f : G → C, für die (21.52) gilt. a. Man zeige: Die Dimension des C-Vektorraums C K l (G) ist h. b. Sei {D s | s ∈ S} wieder ein System von irreduziblen Darstellungen von G, das aus jeder Äquivalenzklasse von irreduziblen Darstellungen genau einen Vertreter enthält, und sei χs der Charakter von D s . Man zeige: Die Menge der χs , s ∈ S, ist eine Orthonormalbasis von C K l (G) in Bezug auf das Skalarprodukt f 1 | f 2 :=
1 f 1 (g) f 2 (g). |G| g∈G
c. Man folgere: Die Anzahl der Äquivalenztypen von irreduziblen Darstellungen von G ist die Klassenzahl h. 21.18 Für eine kompakte lineare L IE-Gruppe G ≤ GL(n, K) folgere man den Satz von P ETER -W EYL aus Satz 21.32. (Hinweis: Um Bedingung 2 aus Satz 21.32 zu verifizieren, benutze man die natürliche Darstellung (vgl. Beispiel 20.2b). Man beachte auch Satz 10.39.)
Kapitel 22
Die infinitesimale Methode in der Darstellungstheorie
Nach Theorem 19.10 können wir jeder linearen L IE-Gruppe G ≤ GL(n, K) ihre L IE-Algebra L(G) zuordnen, die den Tangentialraum an G in E darstellt und als L IE-Produkt das Kommutatorprodukt trägt. Bei der detaillierten Untersuchung und vor allem bei der expliziten Berechnung der irreduziblen Darstellungen arbeitet man lieber mit L IE-Algebren als mit den L IE-Gruppen selbst, weil die Struktur von L IE-Algebren wesentlich leichter durchschaut werden kann. Dazu muss man die Darstellungstheorie auf die L IE-Algebren übertragen, und man muss untersuchen, was die Darstellungen von L(G) mit denen von G selbst zu tun haben. Wir führen in Abschn. A einige Grundbegriffe der Darstellungstheorie der L IEAlgebren ein, geben in Absch. B einige zusätzliche Informationen zu Exponentialfunktion und Logarithmus von Matrizen und diskutieren dann in Abschn. C, wie eine Darstellung D einer linearen L IE-Gruppe G „linearisiert“ werden kann, was zu einer Darstellung von L(G) führt. Wie man dann umgekehrt von einer Darstellung von L(G) zu einer Darstellung von G gelangt, ist das Thema des letzten Abschnitts. Allerdings sind hierbei einige topologische Feinheiten zu beachten, und wir werden versuchen, von diesen eine Vorstellung zu geben, ohne alle mathematischen Details auszuarbeiten. Das Problem besteht darin, dass eine gegebene Darstellung von L(G) zunächst nur zu einer lokalen Darstellung von G führt (d. h. zu einer Darstellung, die nur in einer Umgebung der Eins definiert ist) und dass man, um zu einer globalen ersetzen Darstellung zu gelangen, die Gruppe G durch eine modifizierte Gruppe G muss, die dieselbe L IE-Algebra besitzt wie G. In der Sprache der Topologie ist eine Überlagerung von G, und die topologische Theorie der Überlagerungen G = G ist, wenn G einfach-zusammenhängend ist. Für einfachzeigt nun, dass G zusammenhängende L IE-Gruppen besteht also tatsächlich eine bijektive Korrespondenz zwischen den Darstellungen der Gruppe und denen ihrer L IE-Algebra. Fast alles, was in diesem Kapitel besprochen wird, gilt nicht nur für Darstellungen, sondern für ganz beliebige (stetige) Homomorphismen zwischen allgemeinen L IE-Gruppen bzw. deren L IE-Algebren. Wir beschränken uns hier weitgehend auf Darstellungen von linearen L IE-Gruppen, weil es uns letzten Endes darum geht, die Darstellungen von physikalisch interessanten L IE-Gruppen zu berechnen und zu untersuchen. Bei dem Thema des letzten Abschnitts erweist sich diese Beschränkung jedoch als sehr hinderlich für eine übersichtliche Formulierung der K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_22, C Springer-Verlag Berlin Heidelberg 2010
271
272
22 Die infinitesimale Methode in der Darstellungstheorie
mathematischen Tatsachen, und deshalb gehen wir dort kurz auf die Verallgemeinerung auf beliebige Homomorphismen ein und formulieren den Zusammenhang zwischen lokalen und globalen Homomorphismen in voller Allgemeinheit.
A Darstellungen von L IE-Algebren Die Grundbegriffe der Darstellungstheorie von L IE-Algebren sind denen für Gruppen weitgehend analog, und wir stellen hier zunächst die wichtigsten derartigen Begriffe zusammen: Definitionen 22.1 Für einen n-dimensionalen K-Vektorraum V sei L(V ) die zu gl(n, K) isomorphe L IE-Algebra der linearen Abbildungen A : V −→ V mit dem Kommutatorprodukt [A, B] = AB − B A
(22.1)
als L IE-Produkt. a. Sei L eine beliebige L IE-Algebra über K. Eine Darstellung D von L auf V ist ein L IE-Algebren-Homomorphismus D : L −→ L(V ), d. h. eine lineare Abbildung mit D([L 1 , L 2 ]) = [D(L 1 ), D(L 2 )] ,
L i ∈ L.
(22.2)
Entsprechend nennt man einen L IE-Algebren-Homomorphismus D : L −→ gl(n, K) eine Matrixdarstellung von L vom Grade n über K. b. Ist V ein n-dimensionaler C-H ILBERTraum, so heißt eine L IE-AlgebrenDarstellung D von L auf V 1. selbstadjungiert, wenn D(L)∗ = D(L) für alle L ∈ L ,
(22.3)
2. schiefadjungiert, wenn D(L)∗ = −D(L) für alle L ∈ L.
(22.4)
c. Eine Darstellung D von L auf V heißt irreduzibel, wenn {0} und V die einzigen Unterräume von V sind, die invariant unter allen D(L), L ∈ L, sind. d. Eine Darstellung D von L auf V heißt vollreduzibel, wenn V =
m
Vj
(22.5)
j=1
ist, wobei die Unterräume V j D-invariant und die D j := D
Vj
irreduzibel sind.
A
Darstellungen von L IE-Algebren
273
e. Zwei Darstellungen D1 von L auf V1 , D2 von L auf V2 heißen äquivalent, wenn es einen Isomorphismus T : V1 −→ V2 gibt, so dass D2 (L)T = T D1 (L) ∀ L ∈ L.
(22.6)
Man kann diese Begriffe auch formulieren, wenn der Trägerraum der Darstellung ein unendlich-dimensionaler H ILBERTraum ist. Solche Darstellungen werden bei den Anwendungen in der Quantenmechanik benötigt. Jedoch erfordert die Theorie solcher unendlich-dimensionalen L IE-Algebren-Darstellungen erhebliche Hilfsmittel aus der Operatortheorie, und wir können aus Platzgründen hier nicht näher darauf eingehen (vgl. etwa [5]). Wir werden uns daher im Folgenden auf endlich-dimensionale Darstellungen beschränken und lediglich in Beispielen auf den unendlich-dimensionalen Fall eingehen. Für L IE-Algebren-Darstellungen hat man folgende Variante des S CHURschen Lemmas aus Satz 20.14: Satz 22.2 Sei L eine L IE-Algebra, und sei D eine selbstadjungierte oder schiefadjungierte Darstellung von L auf dem n-dimensionalen C-H ILBERTraum H . Dann gilt: Genau dann ist D irreduzibel, wenn jeder selbstadjungierte Operator C : H −→ H mit CD(L) = D(L)C
∀L ∈L
(22.7)
ein Vielfaches der Identität ist, d. h. die Form C = λI,
λ∈R
(22.8)
hat. Jeder Operator C, der (22.7) erfüllt, heißt ein C ASIMIR-Operator der Darstellung D. Beweis Wir führen den Beweis für selbstadjungierte Darstellungen. Die Aussage überträgt sich dann auf jede schiefadjungierte Darstellung D durch Übergang zu der := iD. selbstadjungierten Darstellung D a. Sei D irreduzibel, und sei C : H −→ H ein selbstadjungierter Operator, der (22.7) erfüllt. Nach einer schon mehrfach benutzten Schlussweise ist dann jeder Eigenraum Mλ von C invariant unter allen Operatoren D(L), L ∈ L. Aber C besitzt mindestens einen reellen Eigenwert λ, und da D irreduzibel ist, gilt Mλ = H,
d. h. C = λI auf ganz H .
b. Angenommen, es gibt einen echten D-invarianten Unterraum U ⊆ H . Da die D(L) selbstadjungiert sind, ist auch U ⊥ invariant unter allen D(L), L ∈ L. Die
274
22 Die infinitesimale Methode in der Darstellungstheorie
orthogonale Projektion P : H −→ H von H auf U ist dann selbstadjungiert und vertauscht nach (15.31) mit allen D(L). Aber P ist kein Vielfaches der Identität.
B Weitere Eigenschaften der Exponentialfunktion Für die Untersuchung der L IE-Gruppen und ihrer Darstellungen mittels der entsprechenden L IE-Algebren und deren Darstellungen ist es, wie wir sehen werden, von entscheidender Bedeutung, die Matrizen e A e B , e A+B und e[A,B] vergleichen zu können. Sind etwa A, B klein genug, so kann man C := ln(e A e B )
(22.9)
bilden, und dann ist e A e B = eC . Ist [A, B] = 0, so ist natürlich C = A + B. Im allgemeinen Fall [A, B] = 0 ist der Zusammenhang komplizierter und wird durch die sogenannte BAKER-C AMPBELL-H AUSDORFF-Formel gegeben (vgl. etwa [39] oder [58]), von der wir nur den folgenden Spezialfall benötigen: Satz 22.3 Seien A, B ∈ Cn×n , |t| hinreichend klein, so dass C(t) := ln(et A et B )
(22.10)
wohldefiniert ist. Dann gilt: C(t) =
∞
t k Ck
(22.11)
k=1
mit C1 = A + B, C3 =
1 12
C2 =
1 2
[A, B] ,
([[A, B] , B] + [[A, B] , A] ).
(22.12)
Insbesondere gilt für t → 0 die Asymptotik C(t) = t (A + B) +
t2 [A, B] + O(t 3 ). 2
(22.13)
Beweis Wählt man ε > 0 so klein, dass et A et B − E < 1
für |t| < ε,
so ist C(t) eine durch (22.10) eindeutig definierte analytische Funktion von t, und es gilt C(0) = 0. Daher hat C(t) tatsächlich eine Potenzreihenentwicklung der Form (22.11). Für |t| < ε ist außerdem
B
Weitere Eigenschaften der Exponentialfunktion
275
et A et B = eC(t) .
(22.14)
Setzt man in diese Gleichung die Reihenentwicklungen von et A , et B und von C(t) gemäß (22.11) ein, so führt Koeffizientenvergleich auf (22.12) (wobei wir die Einzelheiten dieser Rechnung dem Leser überlassen). Daraus folgt auch (22.13). Bemerkung Prinzipiell kann man auch alle weiteren Ck nach dieser Methode bestimmen, da der Koeffizientenvergleich entsprechende Rekursionsformeln ergibt. Die entstehenden Ausdrücke sind sämtlich Linearkombinationen von iterierten Kommutatoren, doch nimmt ihre Komplexität rasch zu, und es gelingt auf diese Weise nicht, zu einer geschlossenen Formel wie der von BAKER, C AMPBELL und H AUSDORFF zu gelangen. Als Konsequenz des letzten Satzes erhält man: Satz 22.4 Für A, B ∈ Cn×n gilt: 1
1
lim (e m A e m B )m = e A+B ,
(22.15)
m−→∞ 1
1
1
1
lim (e− m A e− m B e m A e m B )m = e[A,B] . 2
m−→∞
(22.16)
Beweis a. Um (22.15) zu beweisen, benutzen wir (22.13) in der Form C(t) = t (A + B) + O(t 2 ) Mit t =
1 m
für t → 0.
folgt dann aus (22.14) 1
1
1
(e m A e m B )m = (e m (A+B)+O(1/m ) )m 2
1
= e A+B+O( m ) −→ e A+B . m−→∞
b. Zum Beweis von (22.16) benutzen wir (22.13). Dazu schreiben wir 1
1
1
1
e− m A e− m B = e m C mit C = −(A + B) + 1
1
e m Ae m B
= e m C mit C = (A + B) +
Somit folgt, wenn wir (22.13) erneut benutzen
1 2m
1 2m
[A, B] + O( m12 ),
[A, B] + O( m12 ).
276
22 Die infinitesimale Methode in der Darstellungstheorie 1
1
1
1
(e− m A e− m B e m A e m B )m = 6 7 2 % & = (exp m1 (C + C ) + 2m1 2 C , C + O( m13 ) )m = 6 7 2 = (exp m12 [A, B] + O( m13 ) )m −→ e[A,B] . 2
Bemerkung Gl. (22.15) wird T ROTTERsche Produktformel genannt. Die speziellen Eigenschaften der Exponentialabbildung führen schließlich dazu, dass man bei stetigen Darstellungen – und anderen stetigen Homomorphismen – von L IE-Gruppen o.B.d.A. davon ausgehen kann, dass sie beliebig oft differenzierbar sind. Jeder stetige Gruppenhomomorphismus Φ : (R, +) −→ GL(n, K) ist schon von der Klasse C 1 , wie man mit etwas Analysis nachweisen kann (Details z. B. in [34], Ergänzungen zu Kap. 19), und somit (Theorem 19.11c) ist er von der Form Φ(t) = exp t A mit einer Matrix A ∈ Kn×n . Er ist also reell-analytisch und insbesondere von der Klasse C ∞ . Betrachten wir nun allgemeiner einen stetigen Gruppenhomomorphismus Φ : G −→ H, wo G , H lineare L IE-Gruppen sind (also z. B. eine stetige Matrixdarstellung von G), und fixieren wir einen Punkt X 0 ∈ G. In einer Umgebung von X 0 haben wir dann gemäß Korollar 19.14 eine Parametrisierung der Form Ξ (t1 , . . . , tm ) := X 0 (exp t1 B1 )(exp t2 B2 ) · · · (exp tm Bm ). Die Kurven R −→ H , t −→ Φ(exp t B j ) sind stetige Gruppenhomomorphismen, also ist Φ(exp t B j ) = exp t A j mit geeigneten Matrizen A1 , . . . , Am , wie gerade erläutert. Also ist Φ(Ξ (t1 , . . . , tm )) = Φ(X 0 )Φ(exp t1 B1 ) · · · Φ(exp tm Bm ) = Φ(X 0 )(exp t1 A1 ) · · · (exp tm Am ), und das ist in den Koordinaten (t1 , . . . , tm ) reell-analytisch und insbesondere C ∞ . Diese Überlegung kann auf allgemeine L IE-Gruppen ausgedehnt werden und führt zu dem folgenden Satz, der z. B. in [74] detailliert bewiesen wird: Satz 22.5 Seien G, H zwei L IE-Gruppen. Jeder stetige Gruppenhomomorphismus G → H ist reell-analytisch und insbesondere beliebig oft differenzierbar. Um den Satz in dieser Allgemeinheit aussprechen zu können, muss man allerdings zunächst sicherstellen, dass jede L IE-Gruppe in eindeutiger Weise mit der Struktur einer reell-analytischen Mannigfaltigkeit versehen werden kann, was
C
Beziehungen zwischen den Darstellungen von G und L(G)
277
ebenfalls in [74] und vielen anderen Büchern über L IE-Gruppen geschieht. Wir werden den Satz jedoch nur auf lineare L IE-Gruppen anwenden, wo dieser Aspekt unproblematisch ist. Die hauptsächliche Nutzanwendung für uns ist, dass wir Darstellungen unserer linearen L IE-Gruppen unbekümmert differenzieren können, auch wenn sie nur als stetig vorausgesetzt wurden.
C Beziehungen zwischen den Darstellungen von G und L(G) Wir zeigen zunächst, wie man von einer Gruppendarstellung zu einer Darstellung der zugehörigen L IE-Algebra kommt. Satz und Definition 22.6 Sei G eine lineare L IE-Gruppe, L(G) ihre L IE-Algebra, und sei D eine stetige Darstellung von G auf einem n-dimensionalen Vektorraum V . a. Dann wird durch D(L) := dD E (L) =
d D(et L ) t=0 dt
(22.17)
für L ∈ L(G) eine Darstellung von L(G) auf V definiert. Wir nennen D die Linearisierung der Darstellung D und schreiben D = D∗ . b. Es gilt D(e L ) = e D∗ (L) ,
L ∈ L(G) .
(22.18)
Beweis a. Die Darstellung D ist nach Satz 22.5 ein differenzierbarer Gruppenhomomorphismus G −→ GL(V ). Ihr Differential dD E am Einselement E von G ist daher eine lineare Abbildung L(G) = TE G −→ TE GL(V ) = L(V ). Wir brauchen also nur noch die Gleichung D([L 1 , L 2 ]) = [D(L 1 ), D(L 2 )]
(22.19)
für L 1 , L 2 ∈ L(G) nachzuweisen. Dazu benutzen wir Satz 22.4 sowie Teil b, den wir gleich unabhängig von (22.19) beweisen werden. Wir haben:
278
22 Die infinitesimale Methode in der Darstellungstheorie
et D([L 1 ,L 2 ]) = D(et[L 1 ,L 2 ] ) t
t
t
t
= D( lim (e− m L 1 e− m L 2 e m L 1 e m L 2 )m ) m−→∞
t
t
2
t
t
= lim {D(e− m L 1 )D(e− m L 2 )D(e m L 1 )D(e m L 2 )}m m−→∞
= lim {e− m D(L 1 ) e− m D(L 2 ) e m D(L 1 ) e m D(L 2 ) }m m−→∞ = et [D(L 1 ),D(L 2 )] . t
t
t
t
2
2
Differentiation bei t = 0 liefert nun (22.19). b. Für festes L ∈ L(G) ist durch Φ(t) := D(exp t L) ,
t ∈R
offenbar eine Ein-Parameter-Untergruppe von GL(V ) gegeben. Nach Theorem 19.11c gibt es daher A ∈ L(V ) so, dass D(exp t L) = exp t A
∀ t ∈ R.
Differenzieren wir dies bei t = 0, so finden wir A = D∗ (L). Für t = 1 ergibt sich somit (22.18). Beispiel 22.7 Für eine beliebige lineare L IE-Gruppe G berechnen wir die Linearisierung der adjungierten Darstellung D = Ad (Beispiel 20.3c). Sind L , M ∈ g = L(G), so schreiben wir Y (t) := et L , und dann haben wir nach Definition Ad(Y (t)) M = Y (t)MY (−t) für alle t ∈ R. Also ergibt (22.17) Ad∗ (L) M = Y˙ (0)MY (0) − Y (0)M Y˙ (0) = L M − M L = [L , M]. Man schreibt ad := Ad∗ und nennt dies die adjungierte Darstellung der L IE-Algebra g. Insbesondere folgt mit Satz 22.6, dass die Abbildung ad : g −→ L(g) , L −→ [L , ·] ein Homomorphismus von L IE-Algebren ist. Das kann man allerdings auch rein algebraisch aus der JACOBI-Identität ableiten (Aufgabe 19.10). Die Gl. (22.18) sorgt dafür, dass man D in gewissem Umfang aus seiner Linearisierung D∗ zurückgewinnen kann: Korollar 22.8 Seien D 1 , D 2 zwei stetige Darstellungen einer zusammenhängenden linearen L IE-Gruppe G auf dem n-dimensionalen Raum V . Dann gilt: D∗1 = D∗2
⇒
D1 = D2 .
C
Beziehungen zwischen den Darstellungen von G und L(G)
279
Beweis Nach Satz 19.16b ist jedes X ∈ G ein endliches Produkt X = eL 1 eL 2 · · · eL m mit L 1 , L 2 , . . . , L m ∈ L(G). Da D 1 , D 2 Homomorphismen sind, folgt mit (22.18) also D 2 (X ) = D 2 (exp L 1 ) · · · D 2 (exp L m ) = (exp D∗2 (L 1 )) · · · (exp D∗2 (L m )) = (exp D∗1 (L 1 )) · · · (exp D∗1 (L m )) = D 1 (exp L 1 ) · · · D 1 (exp L m ) = D 1 (X ). Auf die Voraussetzung, dass G zusammenhängend ist, kann nicht verzichtet werden, wie schon das einfache Beispiel der Determinante zeigt: Für die Gruppe GL(n, R) betrachten wir die beiden Matrixdarstellungen vom Grade 1: D(X ) := det X ,
D + (X ) := | det X |.
In einer Umgebung der Einheitsmatrix ist die Determinante positiv, also stimmen D und D + dort überein. Die Definition (22.17) liefert daher D∗ = D∗+ . Aber im Falle det X < 0 ist natürlich D + (X ) = D(X ). Zum Schluss untersuchen wir noch, wie es sich auf die Linearisierung auswirkt, wenn eine Darstellung unitär bzw. irreduzibel ist: Satz 22.9 Sei G eine lineare L IE-Gruppe, und sei D eine stetige unitäre Darstellung auf einem n-dimensionalen C-H ILBERTraum H . a. Dann ist D∗ eine schiefadjungierte und D(L) := iD∗ (L),
L ∈ L(G)
(22.20)
eine selbstadjungierte Darstellung von L(G) auf H . b. Ist G zusätzlich zusammenhängend, so ist D genau dann irreduzibel, wenn D∗ irreduzibel ist. Beweis a. Die unitäre Darstellung D ist ein analytischer Homomorphismus G −→ U(n), also ist D∗ ein L IE-Algebrenhomomorphismus L(G) −→ u(n). Aber nach Korollar 19.13 ist u(n) = {B ∈ Cn×n | B ∗ = −B}, was die Schiefadjungiertheit zeigt. Dass (22.20) dann eine selbstadjungierte Darstellung definiert, ist klar. b. Angenommen, D ist irreduzibel. Dann zeigen wir die Irreduzibilität von D∗ mittels Satz 22.2. Sei also C ein C ASIMIRoperator für D∗ . Für X 1 = exp L , L ∈ L(G), ist dann nach (22.18) C D(X 1 ) = D(X 1 )C, denn aus C D∗ (L) =
280
22 Die infinitesimale Methode in der Darstellungstheorie
D∗ (L)C folgt C exp D∗ (L) = (exp D∗ (L))C nach Definition der Exponentialabbildung. Aber nach Satz 19.16b ist jedes X ∈ G ein endliches Produkt X = X 1 X 2 · · · X m mit X j ∈ exp(L(G)) , j = 1, . . . , m, also auch D(X ) = D(X 1 )D(X 2 ) · · · D(X m ) und folglich C D(X ) = D(X )C, da C mit jedem D(X j ) vertauscht werden kann. Nach Theorem 20.14a ist also C = λI mit einem Skalar λ, und dieser muss reell sein, da C selbstadjungiert ist. Nun sei umgekehrt D∗ als irreduzibel vorausgesetzt. Wir zeigen Irreduzibilität von D mittels Theorem 20.14b. Sei also A : H → H ein linearer Operator, der mit allen D(X ) , X ∈ G, vertauscht. Da D unitär ist, folgt dann auch A∗ D(X ) = (D(X −1 )A)∗ = (AD(X −1 ))∗ = D(X )A∗ für alle X . Somit vertauschen auch die selbstadjungierten Operatoren B :=
1 (A + A∗ ) 2
und C :=
1 (A − A∗ ) 2i
mit allen D(X ). Für L ∈ L(G) ist also Bet L = et L B für alle t, und durch Differenzieren bei t = 0 ergibt sich dann B D∗ (L) = D∗ (L)B. Also ist B ein C ASIMIRoperator, und das Gleiche gilt für C. Nach Satz 22.2 ist demnach B = β I , C = γ I mit reellen Skalaren β, γ . Es folgt A = B +iC = λI , λ := α +iβ, wie gewünscht.
D Lokale und globale Homomorphismen Sei zunächst wieder G eine lineare L IE-Gruppe und g := L(G). Ist eine Darstellung D : g → L(V ) gegeben, so liegt es nahe, durch D(e L ) := exp (D(L)) ,
L∈g
(22.21)
eine Abbildung D mit Werten in GL(V ) zu definieren und zu hoffen, dass diese zu einer Darstellung D von G führt, deren Linearisierung dann das gegebene D wäre. Allerdings ist D zunächst nur auf dem Wertebereich der Exponentialfunktion definiert. Immerhin erfüllt es in einer Umgebung der Eins die Rechenregeln für eine Darstellung, denn es gilt: Satz 22.10 Sei G eine lineare L IE-Gruppe mit L IE-Algebra g = L(G), und sei D eine stetige Darstellung von g auf einem endlich-dimensionalen Vektorraum V . Dann gibt es eine Umgebung U von E in G so, dass durch (22.21) ein lokaler Gruppenhomomorphismus D : U −→ GL(V ) definiert ist, d. h. es gilt D(E) = E und
D
Lokale und globale Homomorphismen
281
D(X Y ) = D(X )D(Y ),
falls X, Y, X Y ∈ U.
Man nennt dann D eine lokale Darstellung von G auf V . Beweis Wir benutzen die BAKER -C AMPBELL -H AUSDORFF-Formel in Gestalt von Satz 22.3. Sind also A, B ∈ g und A , B < ε hinreichend klein, so existiert C(t) = ln(et A et B ) =
∞
t k Ck
(22.22)
k=1
für alle t ∈] − 1 − δ, 1 + δ[ mit einem δ > 0. Dabei ist C1 = A + B,
C2 =
1 [A, B] , 2
usw.
(22.23)
Ebenso existiert (evtl. nach Verkleinerung von ε) = ln(et D(A) et D(B) ) = C(t)
∞
k tkC
für |t| < 1 + δ.
k=1
Dabei ist 1 = D(A) + D(B) = D(A + B) = D(C1 ), C 2 = 1 [D(A), D(B)] = 1 D([A, B]) = D(C2 ), C 2 2
usw.
Tatsächlich ist k = D(Ck ) C
∀ k,
(22.24)
da alle diese Koeffizienten durch Linearkombinationen von iterierten Kommutatoren ausgedrückt werden können. Wegen der Konvergenz der Reihen folgt hieraus = D(C(t)) C(t)
für |t| < 1 + δ,
und das ergibt D(e A e B ) = D(eC(1) ) = eD(C(1))
= eC(1) = eD(A) eD(B) = D(e A )D(e B ). Dass D die Einheitsmatrix in die Einheitsmatrix überführt, ist klar.
Bemerkung Unsere Begründung für (22.24) ist nicht völlig rigoros, doch kann man sie durch den Einsatz der vollen BAKER -C AMPBELL -H AUSDORFF-Formel rigoros machen (vgl. etwa [39] oder [58]).
282
22 Die infinitesimale Methode in der Darstellungstheorie
Für das Weitere benötigen wir eine leichte Verallgemeinerung von Satz 19.16b: Lemma 22.11 Sei G eine L IE-Gruppe, G 0 die Zusammenhangskomponente der Eins und U ⊆ G 0 eine Umgebung der Eins. Dann wird G 0 von U erzeugt, d. h. jedes Element von G 0 kann als endliches Produkt von Elementen von U geschrieben werden. Beweis Da die Inversenbildung eine stetige Abbildung G → G ist, gibt es eine Umgebung V ⊆ G 0 der Eins so, dass V −1 := {X −1 | X ∈ V } ⊆ U. Die Umgebung W0 := V ∩ V −1 ist dann gegen Inversenbildung invariant und liegt in U. Die Menge G 1 aller endlichen Produkte von Elementen von W0 ist somit eine offene Untergruppe von G 0 , und genau wie im Beweis von Satz 19.16b. folgert man hieraus, dass sogar G 1 = G 0 sein muss. Nun sei G zusammenhängend und die Situation ansonsten wie in Satz 22.10. Dann kann man nach Lemma 22.11 jedes X ∈ G als endliches Produkt X = X 1 X 2 · · · X m mit X j ∈ U schreiben, und daher wird man versuchen, D durch die Festsetzung D(X 1 · · · X m ) := D(X 1 ) · · · D(X m )
(22.25)
auf ganz G fortzusetzen. Aber die Darstellung X = X 1 · · · X m ist nicht eindeutig, und dies kann die Fortsetzung von D zu einem echten Gruppenhomomorphismus vereiteln. Betrachten wir etwa G = U(1) mit der L IE-Algebra u(1) = iR. Für jedes c ∈ R ist die Abbildung Dc : u(1) −→ L(R) = R , it −→ ct eine Darstellung dieser L IE-Algebra auf dem Trägerraum V = R. Mittels (22.21) gewinnt man daraus die lokale Darstellung D c (eit ) = ect von U(1), die etwa auf U := {it | −π < t < π } wohldefiniert ist. Aber für c = 0 ist es unmöglich, D c stetig auf ganz U(1) fortzusetzen, denn eiπ = −1 = e−iπ und lim D c (eit ) = ecπ ,
t/π
lim D c (eit ) = e−cπ .
t0−π
Tatsächlich besitzt U(1) außer D 0 ≡ 1 überhaupt keine stetige reelle Darstellung auf V = R, wie man sich leicht überlegen kann (Aufgabe 22.8). Um die Sachlage vollständig zu klären, ist es zweckmäßig, sich von den Darstellungen zu lösen und allgemeine Homomorphismen von allgemeinen L IE-Gruppen und deren L IE-Algebren zu betrachten. Dann gelten die Sätze 22.6, 22.8 und 22.10 sinngemäß, und da bei der Bildung der Linearisierung D∗ eigentlich nur die
D
Lokale und globale Homomorphismen
283
Beschränkung von D auf eine (beliebig kleine!) Umgebung der Eins berücksichtigt wird, kann man das Resultat von Satz 22.6 sogar für lokale Homomorphismen aussprechen. Zusammenfassend halten wir folgendes fest: Theorem 22.12 Seien G, H zwei L IE-Gruppen, eG , e H ihre neutralen Elemente und g = L(G) , h = L(H ) ihre L IE-Algebren a. Sei Φ : U → H ein lokaler analytischer Gruppenhomomorphismus, d. h. sein Definitionsbereich U ist eine Umgebung von eG in G, es ist Φ(eG ) = e H , und wenn x, y sowie x y zu U gehören, so gilt Φ(x y) = Φ(x)Φ(y). Dann ist das Differential ϕ := dΦeG : g −→ h ein Homomorphismus von L IE-Algebren. Wir nennen es die Linearisierung von Φ und schreiben ϕ = Φ∗ . Es gilt Φ(exp L) = exp (Φ∗ (L))
(22.26)
für alle L ∈ g mit exp L ∈ U. b. Seien Φ 1 , Φ 2 : G → H zwei stetige (und damit analytische!) Gruppenhomomorphismen, und sei Φ∗1 = Φ∗2 . Wenn G zusammenhängend ist, so folgt Φ 1 = Φ 2. c. Jeder L IE-Algebren-Homomorphismus ϕ : g → h ist die Linearisierung eines lokalen Gruppenhomomorphismus Φ : U → H , der auf einer Umgebung U der Eins in G definiert ist. Unsere nächste Aufgabe ist es, festzustellen, unter welchen Umständen die Linearisierung eines (lokalen) Gruppenhomomorphismus Φ ein Isomorphismus ist. Der Satz über inverse Funktionen gibt hierauf sofort eine lokale Antwort: Φ∗ ist genau dann ein Isomorphismus von g auf h, wenn Φ (nach etwaiger Verkleinerung seines Definitionsbereichs) ein Diffeomorphismus einer offenen Umgebung U der Eins in G auf eine offene Umgebung V der Eins in H ist. Global gilt jedoch nichts Entsprechendes, sondern nur die folgende Aussage: Satz 22.13 Seien G, H zusammenhängende L IE-Gruppen mit den L IE-Algebren g bzw. h, und sei Φ : G → H ein stetiger Gruppenhomomorphismus. Dann sind äquivalent: a. Φ∗ ist ein Isomorphismus g → h. b. Φ ist surjektiv, und der Kern K von Φ ist eine diskrete Teilmenge von G, d. h. jeder Punkt von K ist isoliert.
284
22 Die infinitesimale Methode in der Darstellungstheorie
Beweis (i) Sei ϕ := Φ∗ ein Isomorphismus. Nach dem Satz über inverse Funktionen bildet Φ dann eine offene Umgebung U der Eins e in G diffeomorph auf eine offene Umgebung V der Eins in H ab. Da H zusammenhängend ist, wird H nach Lemma 22.11 von V erzeugt. Zu jedem y ∈ H gibt es also endlich viele Elemente x1 , . . . , xm ∈ U mit y = Φ(x1 )Φ(x2 ) · · · Φ(xm ) = Φ(x1 x2 · · · xm ) ∈ Bild Φ. Somit ist Φ surjektiv. Für K := Kern Φ ist überdies K ∩ U = {e}, da Φ U eine Bijektion U → V ist. Die Linksmultiplikation mit einem festen g ∈ K ist aber ein Homöomorphismus G → G, und deshalb ist gU := {gx | x ∈ U} eine offene Umgebung von g mit K ∩ gU = {g}. Daher ist K diskret. (ii) Nun sei umgekehrt Φ surjektiv und K = Kern Φ diskret. Zunächst zeigen wir, dass Kern ϕ = {0}. Sei also L ∈ Kern ϕ. Nach Voraussetzung hat die Eins e in G eine offene Umgebung U in G mit K ∩U = {e}. Passend zu U wählen wir δ > 0 so, dass |t| < δ ⇒ exp t L ∈ U (Stetigkeit der Exponentialabbildung!). Wegen ϕ(L) = 0 folgt dann Φ(exp t L) = exp (tϕ(L)) = e H , d. h. für |t| < δ ist exp t L ∈ K ∩ U und somit exp t L = e. Differenziert man das bei t = 0, so ergibt sich L = 0, wie gewünscht. Also ist ϕ jedenfalls injektiv. Wäre nun dim H > dim G, so wäre nach einem bekannten Resultat aus der elementaren Theorie der differenzierbaren Mannigfaltigkeiten (z. B. Theorem 10.5 aus [51]) H \Φ(G) dicht in H , und insbesondere könnte Φ nicht surjektiv sein. Daher ist dim H ≤ dim G, also auch dim h ≤ dim g, und da ϕ eine injektive lineare Abbildung g → h ist, müssen die Dimensionen übereinstimmen, und ϕ muss ein Isomorphismus sein. Gerade hierdurch kommt die globale topologische Struktur von G ins Spiel, wie wir noch sehen werden. Zunächst aber geben wir einige wichtige Beispiele, wo Epimorphismen mit diskretem Kern auftreten: Beispiele 22.14 a. G = (R, +) , H = U(1) , Φ(t) = eiωt mit festem ω ∈ R\{0}. Der Kern ist dann K = (2π/ω)Z = {2π k/ω | k ∈ Z}, und die Linearisierung ist Φ∗ (t) = iωt. (Um dieses Beispiel richtig in die allgemeine Theorie einzuordnen, sollte man sich erinnern, dass hier L(G) = R und die Exponentialabbildung die identische Abbildung ist – vgl. Aufgabe 19.6, wo G als V1 bezeichnet wurde.)
D
Lokale und globale Homomorphismen
285
b. G = SU(2) , H = SO(3), und Φ ist der Epimorphismus aus Satz 18.13 c. und Theorem 18.16b. Der Kern besteht hier nur aus den zwei Elementen ±σ0 = ±e, und die Linearisierung bestimmt man durch Betrachtung der Generatoren S j , R j aus den Sätzen 18.10 und 18.3. Nach Satz 18.15 ist nämlich Φ(S j (α)) = Λ(S j (α)) = R j (α) ,
j = 1, 2, 3 ,
und somit ist d d Φ∗ ( S j ) = Φ(S j (α)) R j (α) = = Rj , dα dα α=0 α=0 d. h. Φ∗ ist nichts anderes als der in Satz 19.22 angegebene Isomorphismus su(2) → so(3). ↑ c. Für G = SL(2, C) , H = L + ist die Situation analog. Der Epimorphismus Λ aus Satz 18.13b und Theorem 18.16a hat den zweielementigen Kern K = {σ0 , −σ0 }, und seine Linearisierung führt die in Satz 19.24 angegebene Basis von sl(2, C) ↑ in die in Satz 19.23 angegebene Basis von o(1, 3) = L(L + ) über, wie wieder aus Satz 18.15 hervorgeht. Nun kommen wir auf die ursprüngliche Frage zurück, ob Homomorphismen von L IE-Algebren immer als Linearisierungen von geeigneten Gruppenhomomorphismen aufgefasst werden können. Theorem 22.15 Seien G, H zusammenhängende L IE-Gruppen mit den L IEAlgebren g = L(G) und h = L(H ). Zu jedem Homomorphismus ϕ : g → h von L IE-Algebren gibt es eine L IE-Gruppe G und zwei stetige Gruppenhomomorphismen Φ : G → H , Π : G → G so, dass gilt: Π∗ ist ein Isomorphismus L(G) → g, und ϕ = Φ∗ ◦ (Π∗ )−1 .
(22.27)
Bevor wir diesen Satz beweisen, wollen wir uns seine Bedeutung klarmachen: Da Π∗ ein Isomorphismus ist, bildet Π nach dem Satz über inverse Funktionen eine Umgebung U der Eins in G diffeomorph auf eine Umgebung U der Eins in G ab, und auf U ist nach Theorem 22.12c (nach etwaiger Verkleinerung der Umgebungen) ein lokaler Gruppenhomomorphismus Φ 0 definiert, dessen Linearisierung ϕ ist. Möglicherweise kann man diesen nicht zu einem globalen Homomorphismus fortsetzen, aber Φ 0 ◦Π U kann man sehr wohl zu einem globalen Homomorphismus Φ : G → H fortsetzen. Mittels Π∗ kann man also L(G) mit g identifizieren, und mittels Π U kann man G lokal bei der Eins mit G identifizieren. Tut man das, so hat man die Fortsetzbarkeit von Φ 0 zu einem globalen Homomorphismus dadurch erreicht, dass man G in seiner globalen Struktur zu G abgeändert hat, ohne das Aussehen lokal bei der Eins wesentlich zu beeinflussen.
286
22 Die infinitesimale Methode in der Darstellungstheorie
Beweis (von Theorem 22.15) Das direkte Produkt G × H hat als L IE-Algebra g × h, wobei sowohl die linearen Operationen als auch die L IE-Klammer komponentenweise definiert sind (Aufgabe 19.4). Insbesondere ist also [(A1 , A2 ), (B1 , B2 )] = ([A1 , B1 ], [A2 , B2 ]) für A1 , B1 ∈ g und A2 , B2 ∈ h. Der Graph Γ der Abbildung ϕ ist nun eine L IE-Teilalgebra von g × h, denn für A, B ∈ g haben wir [(A, ϕ(A)), (B, ϕ(B))] = ([A, B], [ϕ(A), ϕ(B)]) = ([A, B], ϕ([A, B])) ∈ Γ, weil ϕ ein Homomorphismus von L IE-Algebren ist. Nach Theorem 19.19 gibt es zu dieser L IE-Teilalgebra eine zusammenhängende L IE-Untergruppe G von G × H mit L(G) = Γ . Nun betrachten wir die kanonischen Projektionen Π1 : G × H −→ G , (g, h) −→ g, Π2 : G × H −→ H , (g, h) −→ h, π1 : g × h −→ g , (A1 , A2 ) −→ A1 , π2 : g × h −→ h , (A1 , A2 ) −→ A2 und setzen Π := Π1 G ,
Φ := Π2 G .
Offenbar sind die Πi Gruppenhomomorphismen mit Πi ∗ = πi für i = 1, 2 und daher Π∗ = π1 Γ ,
Φ∗ = π2 Γ .
Da Γ ⊆ g × h ein Graph ist, gehört zu jedem A1 ∈ g genau ein Element von Γ , dasjenige mit der zweiten Komponente dessen erste Komponente A1 ist, nämlich A2 = ϕ(A1 ). Das bedeutet, dass π1 Γ eine Bijektion von Γ auf g ist, und daher ist Π∗ ein Isomorphismus. Wieder nach Definition des Graphen ist außerdem Φ∗ = π2 Γ = ϕ ◦ π1 Γ , und daraus folgt (22.27).
Um die Diskussionen dieses Abschnitts zu einem befriedigenden Ende zu bringen, müssen wir nun noch einige Begriffe und Resultate aus der Topologie zumindest streifen:
D
Lokale und globale Homomorphismen
287
Überlagerungen Wir benötigen die folgenden topologischen Begriffe zwar nur für L IE-Gruppen, definieren sie aber in ihrem natürlichen Kontext, nämlich für H AUSDORFFräume (Definition 1.9). Viele Beweisdetails, die in die Topologie gehören, werden wir im folgenden übergehen und verweisen dazu auf Lehrbücher der algebraischen Topologie oder der Differentialtopologie, insbesondere auf solche, wo Topologie für die Bedürfnisse der Physik aufbereitet ist, wie etwa [59, 60, 62, 85]. Definitionen 22.16 Sei Y ein zusammenhängender H AUSDORFFraum. a. Eine Überlagerung von Y besteht aus einem H AUSDORFFraum X und einer surjektiven stetigen Abbildung p : X → Y , die folgende Eigenschaft besitzt: Jeder Punkt y0 ∈ Y hat eine Umgebung V, deren Urbild p −1 (V) die Vereinigung von paarweise disjunkten offenen Mengen Ui ist, für die die Einschränkungen p U Homöomorphismen Ui → V sind. (Der Index i kann dabei eine beliebige i Indexmenge durchlaufen.) Die Abbildung p heißt die Überlagerungsabbildung oder die Projektion. b. Y heißt einfach-zusammenhängend, wenn jede geschlossene Kurve in Y zu einer konstanten Kurve homotop ist. (Der Begriff der Homotopie ist dabei wie in Definition 4.40 zu verstehen, außer dass von den beteiligten Abbildungen nur Stetigkeit verlangt wird. Geschlossene Kurven sind als stetige Abbildungen S1 → Y zu verstehen.) Das erste der beiden folgenden Beispiele zeigt, wie man sich eine Überlagerung anschaulich vorstellen sollte. Beispiele 22.17 a. X = R , Y = U(1) = {z ∈ C | z z¯ = 1} und p(t) = eit bilden eine Überlagerung. Ist nämlich z 0 ∈ U(1), so wählen wir t0 ∈ R mit eit0 = z 0 und Uk =]t0 + 2π k − β, t0 + 2π k + β[ für k ∈ Z, wo β ∈]0, π ] fest gewählt ist. Dann ist Uk eine offene Umgebung von tk := t0 + 2π k, die Uk , k ∈ Z sind paarweise disjunkt, und p U k ist für jedes k ein Homöomorphismus von Uk auf einen Kreisbogen V, der nicht von k abhängt und der eine offene Umgebung von z 0 in U(1) ist. Man kann sich die Gerade R als eine Schraubenlinie vorstellen, die durch p senkrecht auf einen Kreis projiziert wird (Abb. 22.1), und derartige Bilder, die diese und verwandte Situationen betreffen, erklären den Ausdruck „Überlagerung“. b. Das vorige Beispiel ist ein Spezialfall der folgenden Situation: Seien G, H zusammenhängende L IE-Gruppen, und sei Φ : G → H ein Epimorphismus mit diskretem Kern K . Dann hat die Eins in G eine Umgebung U0 , für die Φ U ein 0 Homöomorphismus von U0 auf eine Umgebung V0 der Eins in H ist. Zu festem h 0 ∈ H betrachten wir die Umgebung V := V0 h 0 . Ihr Urbild unter Φ ist die Vereinigung der Ug := U0 g , g ∈ Φ −1 (h 0 ), und jedes Ug ist eine Umgebung von g, die von Φ homöomorph auf V abgebildet wird. Für g1 , g2 ∈ Φ −1 (h 0 ), g1 = g2
288
22 Die infinitesimale Methode in der Darstellungstheorie
Abb. 22.1 Die reelle Gerade als Überlagerung des Kreises U(1)
t0
z0
U(1)
ist schließlich Ug1 ∩ Ug2 = ∅, denn andernfalls gäbe es x1 , x2 ∈ U0 so, dass x1 g1 = x2 g2 , und dann wäre Φ(x1 )h 0 = Φ(x2 )h 0 , also Φ(x1 ) = Φ(x2 ), und da Φ U injektiv ist, folgt x1 = x2 . Dann ist aber x1 g1 = x1 g2 , also g1 = g2 im 0 Widerspruch zur Annahme. Somit ist Φ eine Überlagerungsabbildung. Daraus erklärt sich auch die in Abschn. 18E verwendete Terminologie. c. Die Sphäre Sn = {(x0 , x1 , . . . , xn ) ∈ Rn+1 | x02 + · · · + xn2 = 1} ist für n ≥ 2 einfach-zusammenhängend. Das leuchtet anschaulich unmittelbar ein, aber ein rigoroser Beweis ist, wie häufig in der Topologie, recht aufwendig. Wir geben hier eine Skizze: Ist γ : S1 → Sn eine stetige geschlossene Kurve, so approximiert man diese zunächst, etwa nach dem W EIERSTRASSschen Approximationssatz, durch eine geschlossene C ∞ -Kurve. Wenn die Approximation gut genug ist, so sind die beiden Kurven dann auch homotop, wie man sich leicht überlegen kann. Daher dürfen wir o.B.d.A. annehmen, dass γ eine C ∞ -Kurve ist. Wegen n = dim Sn > 1 ist dann aber γ (S1 ) = Sn ([51], Theorem 10.5), und wir wählen einen Punkt P ∈ Sn \γ (S1 ). Dann kann man ganz Sn \{P} auf den gegenüberliegenden Punkt −P zusammenziehen, und dadurch wird insbesondere die Kurve γ zu einer konstanten Kurve deformiert. In einem Koordinatensystem, in dem P der Nordpol ist, lautet solch eine Homotopie etwa h(z, s) = mit
η(γ (z), s) , |η(γ (z), s)|
z ∈ S1 , s ∈ [0, 1]
D
Lokale und globale Homomorphismen
289
ηi (x, s) := (1 − s)xi für 0 ≤ i < n , ηn (x, s) := xn − s(xn + 1). d. Insbesondere ist SU(2) einfach-zusammenhängend, denn sie ist zu S3 diffeomorph, wie wir aus Satz 18.17 wissen. Das einzige substantielle Ergebnis aus der Topologie, das wir hier benötigen, ist Satz 22.18 Ist p : X → Y eine Überlagerung, X zusammenhängend und Y einfachzusammenhängend, so ist p ein Homöomorphismus. Auch hier skizzieren wir einen Beweis, ohne auf Einzelheiten einzugehen: Nach der Definition einer Überlagerung ist es klar, dass nur noch die Injektivität von p zu zeigen ist. Seien also x1 , x2 ∈ X so, dass p(x1 ) = p(x2 ) = y0 . Dann wählen wir Umgebungen V von y0 und Ui von xi wie in der Definition einer Überlagerung. Nach Voraussetzung gibt es eine stetige Kurve γ : [0, 1] → X , die x1 mit x2 verbindet, und dann ist p ◦ γ : [0, 1] → Y eine geschlossene Kurve. Sie ist (aufgefasst als Abbildung S1 → Y ) nach Voraussetzung also homotop zu einer konstanten Kurve, und solch eine Homotopie kann man immer so einrichten, dass der Punkt y0 bei der Deformation nicht bewegt wird. Es gibt also eine Abbildung h : [0, 1] × [0, 1] → Y mit h(t, 0) = p(γ (t)) für 0 ≤ t ≤ 1, h(t, 1) = y0 für 0 ≤ t ≤ 1, h(t, s)
= y0
für t = 0, t = 1 und 0 ≤ s ≤ 1.
Die Eigenschaften einer Überlagerung haben zur Folge (hier wäre wieder etwas Detailarbeit nötig!), dass h „geliftet“ werden kann zu einer Homotopie η : [0, 1] × [0, 1] → X , für die gilt: p◦η =h,
η(·, 0) = γ .
Insbesondere ist η(0, 0) = γ (0) = x1 ∈ U1 , und da p U injektiv ist, muss η(0, s) ≡ 1 x1 sein, denn x1 ist in U1 das einzige Urbild von p(η(0, s)) = h(0, s) = y0 . Aber auch p U ist injektiv und p(η(1, s)) = h(1, s) = y0 , also muss η(1, s) ≡ η(1, 0) = 2 γ (1) = x2 sein. Mit β(t) := η(t, 1) haben wir also eine Kurve, die x1 mit x2 verbindet und für die p ◦ β ≡ y0 ist. Da p −1 (y0 ) eine diskrete Menge ist, kann dies nur für konstantes β geschehen. Also ist x1 = x2 . Korollar 22.19 Seien G, H L IE-Gruppen mit den L IE-Algebren g bzw. h. Die Gruppe G sei zusammenhängend und einfach-zusammenhängend. Zu jedem Homomorphismus ϕ : g → h von L IE-Algebren gibt es dann genau einen Homomorphismus Φ : G → H von L IE-Gruppen mit ϕ = Φ∗ . Insbesondere gibt es zu jeder Darstellung D von g auf einem endlich-dimensionalen Raum V genau eine Darstellung D von G auf V , deren Linearisierung D ist.
290
22
Die infinitesimale Methode in der Darstellungstheorie
Beweis Es geht nur um die Existenz von Φ, denn die Eindeutigkeit ist schon aus Theorem 22.12b bekannt. Wir können H als zusammenhängend annehmen, indem wir H durch die Zusammenhangskomponente der Eins ersetzen. Dann erhalten wir mit Theorem 22.15 eine Gruppe G und Homomorphismen Φ : G → H , Π : G → G mit (22.27), d. h. mit ϕ = Φ∗ ◦ (Π∗ )−1 . Dabei ist Π∗ ein Isomorphismus, also Π eine Überlagerungsabbildung (Satz 22.13 und Beispiel 22.17b). Nun zeigt Satz 22.18 aber, dass Π ein Homöomorphismus, also sogar ein Isomorphismus von L IEGruppen, ist. Damit können wir Φ := Φ◦Π −1 setzen, was offenbar das Gewünschte leistet. Für eine zusammenhängende und einfach-zusammenhängende L IE-Gruppe G stiftet die Linearisierung also eine bijektive Korrespondenz zwischen den Gruppenhomomorphismen G → H auf der einen und den L IE-Algebren-Homomorphismen L(G) → L(H ) auf der anderen Seite. Insbesondere haben wir diese Korrespondenz für die Darstellungen.
22.20 Ausblick: Die universelle Überlagerung Zu jeder zusammenhängenden → G, die jede andere ÜberL IE-Gruppe G gibt es eine Überlagerung P : G lagerung von G überlagert und die deshalb die universelle Überlagerung genannt wird. Aufgrund dieser universellen Eigenschaft ist sie bis auf Isomorphie eindeutig eine zusammenhängende und einfach-zusammenhängende bestimmt. Dabei ist G L IE-Gruppe und P ein Epimorphismus von L IE-Gruppen, der diskreten Kern hat. In Theorem 22.15 kann man die von ϕ abhängende Gruppe G also durch die feste ersetzen, da G von G überlagert wird. Gruppe G Ist Π : G → G irgendein Epimorphismus mit diskretem Kern, wobei G ist. einfach-zusammenhängend ist, so erkennen wir mit Satz 22.17, dass G ∼ = G Um die universelle Überlagerung konkret anzugeben, genügt es also, eine einfachzusammenhängende Gruppe G zu finden, die einen Homomorphismus Φ mit diskretem Kern und Bild Φ = G besitzt. So haben wir in Beispiel 22.17a. die universelle Überlagerung von U(1) vor uns, und die universelle Überlagerung von SO(3) ↑ ist SU(2), die von L + ist SL(2, C), jeweils mit dem Epimorphismus aus 18E als Überlagerungsabbildung. Vorsicht ist jedoch geboten, wenn man sich nur auf lineare L IE-Gruppen beschränken will, wie wir es weitgehend tun. Z. B. kann die universelle Überlagerung von SL(2, R) nicht als lineare L IE-Gruppe realisiert werden (vgl. [71], S. 160).
Aufgaben zu Kap. 22 22.1 Die Determinante ist ein Homomorphismus GL(n, K) → K∗ = GL(1, K). Was ist ihre Linearisierung? 22.2 Für A ∈ gl(n, R) = Rn×n und f ∈ C ∞ (Rn ) definieren wir eine neue Funktion D(A) f durch
Aufgaben
291
[D(A) f ](x) :=
d f (x exp(t A)) , dt t=0
x ∈ Rn .
a. Man zeige: Ist A = (ai j ), so ist [D(A) f ](x) =
n i, j=1
xi ai j
∂f (x) ∂x j
für alle f ∈ C ∞ (Rn ). b. Man folgere: Die Abbildung D ist eine Darstellung der L IE-Algebra gl(n, R) auf dem Raum V = C ∞ (Rn ). c. Sei m ∈ N, und Vm ⊆ C ∞ (Rn ) sei der Teilraum der Polynome in n Variablen, deren Grad höchstens m beträgt. Man zeige: Vm ist D-invariant, und auf dem endlichdimensionalen Raum Vm ist D die Linearisierung einer geeigneten Darstellung der Gruppe GL(n, R). 22.3 Sei M eine differenzierbare Mannigfaltigkeit, auf der eine L IE-Gruppe G differenzierbar von rechts operiert. Für L ∈ L(G) und f ∈ C ∞ (M) definieren wir eine Funktion D(L) f durch d f (x · exp(t L)) [D(L) f ](x) := , dt t=0
x ∈ M.
a. Man zeige, dass D eine Darstellung der L IE-Algebra L(G) auf dem Raum V := C ∞ (M) ist. (Hinweis: Man kombiniere die beiden Teile von Aufgabe 19.12.) b. Sei W ein endlichdimensionaler Teilraum von C ∞ (M), der unter der Darstellung [T (g) f ](x) := f (x · g) ,
g ∈ G, x ∈ M
von G invariant ist, und sei D die Teildarstellung, die T auf W induziert. Man zeige, dass W dann auch unter der Linearisierung D∗ invariant ist und dass D∗ auf W mit D übereinstimmt. c. Man folgere die Ergebnisse der vorigen Aufgabe als Spezialfall. Bemerkung Obwohl C ∞ (M) unendliche Dimension hat, ist es wegen Teil b. angebracht, D als die Linearisierung von T anzusprechen. 22.4 Seien V1 , V2 endlichdimensionale K-Vektorräume. a. Seien D1 , D2 zwei Darstellungen einer L IE-Algebra L auf den Trägerräumen V1 bzw. V2 . Man zeige: Durch
292
22
Die infinitesimale Methode in der Darstellungstheorie
D(L) := D1 (L) ⊗ idV2 + idV1 ⊗ D2 (L) ,
L∈L
ist eine Darstellung von L auf V1 ⊗ V2 gegeben. b. Seien D 1 , D 2 stetige Darstellungen einer L IE-Gruppe G auf V1 bzw. V2 . Man zeige: (D 1 ⊗ D 2 )∗ (L) = D∗1 (L) ⊗ idV2 + idV1 ⊗ D∗2 (L) ,
L ∈ L(G) .
22.5 Sei D eine Darstellung der L IE-Algebra L auf dem Vektorraum V . Man zeige: Durch D(L)A := [D(L), A] ,
L∈L
ist eine L IE-Algebren-Darstellung von L auf dem Vektorraum End(V ) gegeben. (Hinweis: Aufgabe 19.10 ist hilfreich.) Bemerkung Man sagt, die Operatoren T1 , . . . , Tm ∈ End(V ) bilden einen Tensor operator zu D, wenn sie linear unabhängig sind und LH(T1 , . . . , Tm ) D-invariant ist. 22.6 Sei D eine stetige Darstellung einer (linearen) L IE-Gruppe auf einem ndimensionalen Vektorraum V , und sei W ein linearer Teilraum von V . Man zeige: a. Ist W D-invariant, so ist W auch D∗ -invariant. b. Ist W D∗ -invariant und die Gruppe zusammenhängend, so ist W auch D-invariant. 22.7 Sei D eine stetige Darstellung einer (linearen) L IE-Gruppe G auf einem n die gemäß Beispiel 20.3b. auf dimensionalen Vektorraum V , D := D∗ , und sei D End(V ) gelieferte Darstellung. Schließlich sei D die von D erzeugte Darstellung der L IE-Algebra L(G) auf End(V ) gemäß Aufgabe 22.5. Man zeige: ∗ = D. a. D b. Sei G zusammenhängend, und seien T1 , . . . , Tm lineare Operatoren aus End(V ). Sie bilden einen Tensoroperator in Bezug auf D genau dann, wenn sie in Bezug auf D einen Tensoroperator bilden. 22.8 Man zeige: Die Gruppe U(1) besitzt außer der trivialen Darstellung D ≡ 1 keine reelle Matrixdarstellung vom Grad 1. (Hinweis: Man wende Aufgabe 17.13b auf den Homomorphismus ϕ(z) := ln |D(z)| an.) 22.9 Seien G, H L IE-Gruppen, G zusammenhängend, und sei Φ : G → H ein stetiger Gruppenhomomorphismus mit diskretem Kern K . Man zeige: Dann ist K ≤ Z (G), d. h. die Elemente von K vertauschen mit jedem Element von G. (Hinweis: Seien x ∈ K , g ∈ G. Man verbinde x durch eine stetige Kurve γ mit der Eins und betrachte β(t) := gγ (t)g −1 . Welche Werte kann β(t) annehmen?)
Kapitel 23
Die irreduziblen Darstellungen von SU(2) und SO(3)
Die in den letzten vier Kapiteln entwickelten theoretischen Resultate und Methoden werden jetzt auf die speziellen Gruppen SU(2) und SO(3) angewendet. Diese beiden Gruppen sind nicht nur für die Physik besonders wichtig, sondern bilden auch ein Modellbeispiel und sozusagen einen Ausgangspunkt für die weitergehende mathematische Theorie der kompakten halbeinfachen L IE-Gruppen. In den ersten beiden Abschnitten besprechen wir die irreduziblen Darstellungen der beiden Gruppen, wobei wir allerdings nicht die im vorigen Kapitel besprochene „infinitesimale Methode“ verwenden, sondern direkt eine – sozusagen intelligent geratene – Folge (D s , s ∈ S) von irreduziblen Darstellungen angeben und dann beweisen, dass darin bis auf Äquivalenz alle irreduziblen Darstellungen vorkommen. Die infinitesimale Methode verwenden wir alsdann jedoch, um diese Darstellungen besser zu verstehen. Wir analysieren also in den Abschn. C–E die irreduziblen Darstellungen der gemeinsamen L IE-Algebra su(2) ∼ = so(3), die sämtlich durch Linearisierung aus den D s hervorgehen. Dabei handelt es sich um schiefadjungierte Darstellungen auf komplexen H ILBERTräumen, und es zeigt sich, dass die Benutzung von komplexen Koeffizienten es ermöglicht, den Darstellungen eine sehr einfache Form zu geben. Diese Beschreibung der irreduziblen Darstellungen in komplexifizierter Form ist aus der Physik wohlbekannt, denn es handelt sich im Prinzip um die quantenmechanische Theorie des Drehimpulses, die wir hier allerdings als eine rein mathematische Angelegenheit präsentieren. Die physikalischen Interpretationen der betrachteten Objekte sind Physikern vertraut und müssen hier nicht wiederholt werden. Andererseits ist diese Theorie als mathematische Methode ausbaufähig und kann auch auf andere L IE-Algebren übertragen werden, wobei die physikalischen Interpretationen auf der Strecke bleiben oder – wie im Falle von su(3) und ihrer Anwendung auf die starke Wechselwirkung (Klassifikation der Quarks und Quantenchromodynamik) – durch neue physikalische Deutungen ergänzt werden müssen (vgl. etwa [15, 19, 58, 75, 83] oder Band 2 von [18]).
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_23, C Springer-Verlag Berlin Heidelberg 2010
293
294
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
A Realisierung der irreduziblen Darstellungen In diesem Abschnitt konstruieren wir explizit eine unendliche Folge von irreduziblen Darstellungen der Gruppen SU(2) und SO(3). Diese sind tatsächlich bis auf Äquivalenz alle irreduziblen Darstellungen von SU(2) bzw. SO(3), was wir jedoch erst im nächsten Abschnitt beweisen. Für s = 0, 12 , 1, 32 , 2, . . . bezeichnen wir mit V s den (2s + 1)-dimensionalen C-Vektorraum der homogenen Polynome vom Grade 2s in 2 Variablen p(z) = p(x, y) =
2s
c j x j y 2s− j .
(23.1)
j=0
Sei nun A ∈ SU(2), also A=
a b −b a
mit |a|2 + |b|2 = 1.
Auf dem Raum C2 der Paare z = (x, y) operiere SU(2) durch Rechtsmultiplikation z = (x , y ) = (x, y)
a b = (ax − by, a y + bx) = z A. −b a
(23.2)
Für p ∈ V s kann man nun definieren (D s (A) p)(x, y) = p((x, y)A) = p(ax − by, a y + bx) =
2s
c j (ax
− by) j (a y
(23.3) + bx)2s− j .
j=0
Man rechnet sofort nach, dass dies in der Tat eine Darstellung definiert – es handelt sich ja um die in Beispiel 20.3a beschriebene Situation, außer dass hier eine Rechtsoperation der Gruppe G = SU(2) auf der Menge Z = C2 zu Grunde gelegt ist. Sie sind auch stetig, da p(z A) stetig von den Matrixelementen von A abhängt. Die entscheidenden Aussagen über die D s sind: Satz 23.1 a. Die durch (23.3) definierten Darstellungen D s , s = 0, 12 , 1, . . . sind irreduzibel und (in Bezug auf geeignete Skalarprodukte) auch unitär. Der Parameter s wird als das Gewicht bezeichnet.
A
Realisierung der irreduziblen Darstellungen
295
b. Für den Charakter χs der Darstellung D s gilt χs (A) = e−isα
2s
eikα =
k=0
sin[(2s + 1)(α/2)] , sin(α/2)
(23.4)
wobei α bestimmt ist durch Spur A = 2 cos (α/2) ,
0 ≤ α ≤ 2π.
(23.5)
Dabei ist A ∈ SU(2) ähnlich zu iα/2 0 e . S3 (α) = 0 e−iα/2
(23.6)
Beweis a. Man kann direkt ein Skalarprodukt auf V s angeben, in Bezug auf welches D s unitär ist, z. B. p1 (x1 + ix2 , y1 + iy2 ) p2 (x1 + ix2 , y1 + iy2 ) dx1 dx2 dy1 dy2 p1 | p2 := B
(23.7)
mit B := {(x, y) ∈ C2 | |x|2 + |y|2 ≤ 1}. (Im übrigen kann man solch ein Skalarprodukt auch finden, indem man so vorgeht wie im Beweis des Satzes von M ASCHKE.) Die Irreduzibilität zeigen wir nun mittels Theorem 20.14b. Sei also T ∈ EndC V s ein Operator, der mit allen D s (A) , A ∈ SU(2) vertauscht. Wir haben zu zeigen, dass T ein skalares Vielfaches der Identität ist. Dazu betrachten wir zua 0 , wo |a| = 1 ist. Die nächst Matrizen A mit b = 0, also A = 0 a −1 Monome p j (x, y) := x j y 2s− j ,
j = 0, 1, . . . , 2s
(23.8)
bilden offenbar eine Basis von V s , und (23.3) ergibt für b = 0 (D s (A) p j )(x, y) = p j (ax, a −1 y) = a 2 j−2s p j (x, y),
(23.9)
d. h. p j ∈ M j := N (D s (A)−a 2 j−2s I ). Für die Vektoren T p j ∈ V s folgt daraus: D s (A)T p j = T D s (A) p j = a 2 j−2s T p j ,
296
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
d. h. wir haben auch T p j ∈ M j für j = 0, . . . , 2s. Wir wählen a ∈ S1 nun so, s dass die Zahlen a 2 j−2s alle verschieden sind. Da 2s j=0 dim M j = dim V = 2s + 1 sein muss, hat dies zur Folge, dass alle M j eindimensional sind, also M j = LH( p j ) für 0 ≤ j ≤ 2s. Insbesondere ist T p j = λ j p j für geeignete Skalare λ j , j = 0, . . . , 2s. Nun betrachten wir die reelle Drehung um π/4, also die Matrix 1 1 −1 R := √ ∈ SU(2). 2 1 1 Man findet
x y y x √ +√ ,√ −√ 2 2 2 2 2s 2s x k y 2s−k , = 2−s (x + y)2s = 2−s k
(D s (R) p2s )(x, y) = p2s
k=0
also D s (R) p2s = 2−s 2−s
2s 2s k=0
k
2s 2s k=0
k
pk und somit
λ2s pk = λ2s D s (R) p2s = D s (R)T p2s = T D s (R) p2s −s
=2
2s 2s
k
k=0
−s
T pk = 2
2s 2s λk p k . k k=0
Da die pk linear unabhängig sind, können wir hier die Koeffizienten vergleichen. Das führt zu λk = λ2s für alle k, also T = λ2s I . b. Die Matrix A ∈ SU(2) hat die Eigenwerte eiα/2 , e−iα/2 mit α ∈ [0, 2π ], das durch (23.5) wohlbestimmt ist. Sie ist daher ähnlich zu S3 (α). Es genügt somit, die Spur der Matrix zu D s (S3 (α)) bezüglich der Basis (23.8) zu bestimmen. Aus (23.9) folgt mit a = eiα/2 , b = 0: (D s (S3 (α)) p j )(x, y) = eiα( j−s) p j (x, y), und somit ergibt sich für die Spur: χs (S3 (α)) = Spur D (S3 (α)) = s
2s
eiα(k−s) ,
k=0
also der erste Teil von (23.4). Der zweite Teil folgt daraus durch Aufsummieren der endlichen geometrischen Reihe und Erweitern mit e−i(2s+1)(α/2) :
A
Realisierung der irreduziblen Darstellungen
e−isα
2s
eikα = e−isα
k=0
=
297
ei(2s+1)α − 1 eiα − 1
sin [(2s + 1)(α/2)] ei(2s+1)(α/2) − e−i(2s+1)(α/2) . = iα/2 −iα/2 sin (α/2) e −e
Wir übertragen diese Ergebnisse für SU(2) nun auf die Gruppe SO(3). Nach Theorem 18.16 gibt es einen stetigen Epimorphismus Φ : SU(2) −→ SO(3), der SO(3) doppelt überlagert. Für eine irreduzible Darstellung D s von SU(2) ist der Ansatz Fs (Φ(A)) := D s (A)
für A ∈ SU(2)
(23.10)
naheliegend. Nun ist aber KernΦ = {σ0 , −σ0 }, σ0 = (δi j ) ∈ C2×2 , und daher Φ(A) = Φ(B)
⇐⇒
B = −A.
Also liefert (23.10) genau dann eine wohldefinierte Abbildung, wenn D s (A) = D s (−A) für alle A ∈ SU(2). Aber (23.9) ergibt für a = −1 D s (−σ0 ) p j = (−1)2s p j ,
j = 0, . . . , 2s ,
also D s (−σ0 ) = (−1)2s I und folglich D s (−A) = (−1)2s D s (A) ,
A ∈ SU(2) .
(23.11)
Daher ist Fs genau dann eine wohldefinierte Darstellung von SO(3), wenn 2s gerade, d. h. s ganzzahlig ist. Weil Φ lokal stetig invertierbar ist (vgl. Beispiel 22.17b), ist dann Fs eine stetige Darstellung von SO(3) auf V s , die überdies irreduzibel ist, weil D s irreduzibel ist. Da nach Satz 18.15 Φ(S3 (α)) = R3 (α) gilt und überdies jede Drehmatrix mit Drehwinkel α zu R3 (α) ähnlich ist, überträgt sich auch die Formel für den Charakter, wobei der Parameter α mit dem Drehwinkel identifiziert wird. Wir haben also folgendes Ergebnis: Satz 23.2 Sei Φ : SU(2) −→ SO(3) der in Abschn. 18E konstruierte Epimorphismus, und seien D s , s = 0, 12 , 1, . . . die in Satz 23.1 angegebenen irreduziblen Darstellungen von SU(2) auf V s . Dann gilt: a. Für s = 0, 1, 2, . . . werden durch Fs (Φ(A)) := D s (A),
A ∈ SU(2)
stetige unitäre irreduzible Darstellungen von SO(3) definiert.
(23.10)
298
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
b. Bezeichnet R(α) ∈ SO(3) eine Drehung um den Winkel α, so gilt für den Charakter ψs der Darstellung Fs ψs (R(α)) =
sin[(2s + 1)(α/2)] , sin(α/2)
α = 0.
(23.12)
B C LEBSCH -G ORDAN-Zerlegung und Vollständigkeit Wenn das Tensorprodukt von zwei irreduziblen Darstellungen einer Gruppe wieder in irreduzible Darstellungen zerlegt wird, so spricht man von einer C LEBSCH G ORDAN-Zerlegung. Diese wurden schon in Abschn. 21F kurz angesprochen. Solche Zerlegungen wollen wir nun für die im vorigen Abschnitt konstruierten Darstellungen D s bzw. Fs der Gruppen SU(2) und SO(3) herleiten. Satz 23.3 Für s = 0, 12 , 1, . . . sei V s der C-Vektorraum der homogenen Polynome p(x, y) =
2s
c j x j y 2s− j ,
j=0
und es sei D s die durch (23.3) definierte irreduzible Darstellung von SU(2) vom Gewicht s auf V s . Dann gilt die C LEBSCH-G ORDAN-Formel D s ⊗ D t ∼ D s+t ⊕ D s+t−1 ⊕ · · · ⊕ D |s−t| .
(23.13)
Beweis Nach Korollar 21.18 ist eine endlich-dimensionale Darstellung durch Angabe ihres Charakters bis auf Äquivalenz vollständig bestimmt. Ist also χs der Charakter von D s , so gilt nach Satz 20.8 χ D s ⊗D t (A) = χs (A)χt (A),
(23.14)
und der Charakter von D s+t ⊕ D s+t−1 ⊕ · · · ⊕ D |s−t| ist χs+t (A) + χs+t−1 (A) + · · · + χ|s−t| (A).
(23.15)
Nach Satz 23.1 gilt aber χs (A) =
2s
eiα(k−s) ,
(23.16)
k=0
wenn A ähnlich zu S3 (α) ∈ SU(2) ist. Nun findet man jedoch, indem man ausdistribuiert und die entstehenden Terme neu zusammenfasst, für s ≥ t
B
C LEBSCH -G ORDAN-Zerlegung und Vollständigkeit
χs (A) · χt (A) =
2s k=0
=
s+t p=s−t
299
⎞ ⎛ 2s eiα(k−s) ⎝ eiα( j−t) ⎠ ⎛ ⎝
j=0 2p
⎞
eiα(l− p) ⎠
l=0
= χs+t (A) + · · · + χs−t (A), und das ist gerade die Behauptung. Für t ≥ s verfährt man analog.
Als Folgerung aus Satz 23.3 ergibt sich dann: Satz 23.4 Sind Fs , s = 0, 1, 2, . . . die in Satz 23.2 angegebenen irreduziblen Darstellungen von SO(3), so gilt Fs ⊗ Ft ∼ Fs+t ⊕ Fs+t−1 ⊕ · · · ⊕ Fs−t ,
s ≥ t.
(23.17)
Auf die Anwendung dieser beiden Sätze in der Quantenmechanik kommen wir im nächsten Kapitel zurück. Hier nutzen wir sie aus, um die Vollständigkeit der konstruierten Systeme von irreduziblen Darstellungen nachzuweisen: Korollar 23.5 Jede stetige irreduzible Darstellung von SU(2) ist äquivalent zu einer der Darstellungen D s , 2s ∈ N0 , aus Satz 23.1. Jede stetige irreduzible Darstellung von SO(3) ist äquivalent zu einer der Darstellungen Fs , s ∈ N0 , aus Satz 23.2. Beweis Das folgt aus den Sätzen 21.30 und 21.32, sobald die vier Voraussetzungen aus 21.32 nachgeprüft sind. Diese Nachprüfung verläuft für SO(3) völlig analog zu der für SU(2), und wir besprechen nur die letztere Gruppe ausführlich. Voraussetzung 1. ist erfüllt, denn D 0 ≡ 1, und 2. ist erfüllt, weil D 1/2 zu der natürlichen Darstellung von SU(2) äquivalent ist. Um 3. nachzuweisen, gehen wir zu den Matrixdarstellungen über, die den Basen (23.8) in den V s entsprechen, schreiben also D s (A) pk =
2s
d sjk (A) p j ,
k = 0, . . . , 2s.
d sjk (A) p j ,
k = 0, . . . , 2s.
j=0
Das führt zu D s (A) pk =
2s j=0
Führen wir also den Raum W s der homogenen Polynome vom Grad 2s in den Variablen x, y sowie den reell-linearen Isomorphismus C : V s −→ W s , p −→ p
300
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
ein, so haben wir C D s (A) = D s (A) C ,
A ∈ SU(2)
und somit ist D s (A) = C D s (A)C −1 für alle A, also D s ∼ D s . Schließlich ist Voraussetzung 4. wegen Satz 23.3 erfüllt.
C Die irreduziblen Darstellungen der L IE-Algebren von SU(2) und SO(3) Wir wollen nun die irreduziblen Darstellungen von SU(2) und SO(3) mit Hilfe der zugehörigen L IE-Algebren su(2) = {B ∈ C2×2 | B ∗ = −B,
Spur B = 0},
so(3) = {B ∈ R3×3 | B = −B} T
(23.18) (23.19)
studieren. Wie wir in den Sätzen 23.1, 23.2 gesehen haben, sind die Darstellungen D s bzw. Fs bzgl. geeigneter Skalarprodukte unitär, und da die Gruppen SU(2) und SO(3) zusammenhängend sind, können wir Satz 22.9 auf sie anwenden. Es liefert also jede irreduzible Darstellung D s von SU(2) eine irreduzible und schiefadjungierte Darstellung Ds von su(2) gemäß Ds (L) = D∗s (L) =
d s t L D (e ) , t=0 dt
L ∈ su(2),
(23.20)
und jede irreduzible Darstellung Fs von SO(3) liefert eine schiefadjungierte irreduzible Darstellung Fs von so(3) gemäß Fs (L ) = Fs∗ (L ) =
d Fs (et L ) , t=0 dt
L ∈ so(3).
(23.21)
Bereits mit den Ds haben wir aber – bis auf Äquivalenz – alle irreduziblen Darstellungen von su(2) gefunden: Korollar 23.6 Jede irreduzible Darstellung der L IE-Algebra su(2) ist zu einem der Ds äquivalent. Beweis Jede irreduzible Darstellung D von su(2) ist die Linearisierung D = D∗ einer stetigen und o.B.d.A. unitären Darstellung D von SU(2), denn SU(2) ist einfach-zusammenhängend (vgl. Korollar 22.19 und Beispiel 22.17d). Nach Satz 22.9b ist D irreduzibel, also äquivalent zu einem der D s (Korollar 23.5), und dann ist D ∼ Ds . Für G = SO(3) ist keine bijektive Korrespondenz zwischen den irreduziblen Darstellungen von G und denen von L(G) zu erwarten, da SO(3) nicht einfach-
D
Die kanonische Basis einer irreduziblen Darstellung von su(2)
301
zusammenhängend ist. Tatsächlich ist auch keine vorhanden, wie wir gleich sehen werden. Nach Satz 19.22c sind die L IE-Algebren su(2) und so(3) isomorph. Versehen wir nämlich su(2) nach Satz 19.22a mit der Standardbasis S1 =
1 0 i , 2 i 0
S2 =
1 0 −1 , 2 1 0
S3 =
1 i 0 2 0 −i
(23.22)
und so(3) nach Satz 19.22b. mit der Standardbasis ⎡
⎤ 00 0 R1 = ⎣0 0 −1⎦ 01 0
⎡
⎤ 0 01 R2 = ⎣ 0 0 0⎦ , −1 0 0
⎡
0 −1 R3 = ⎣1 0 0 0
⎤ 0 0⎦ , 0
(23.23)
so gelten die Vertauschungsrelationen 3 % & Si , S j = εi jk Sk ,
3 & % Ri , R j = εi jk Rk .
k=1
(23.24)
k=1
Die lineare Abbildung ϕ : su(2) −→ so(3), die S j in R j überführt ( j = 1, 2, 3), ist daher ein Isomorphismus, und für diesen haben wir schon in Beispiel 22.14b gesehen, dass ϕ = Φ∗ die Linearisierung des Epimorphismus Φ aus Abschn. 18E ist, der in Satz 23.2 zur Konstruktion der Fs benutzt wurde. Aus Fs ◦ Φ = D s folgt also mit der Kettenregel Fs ◦ ϕ = Ds , oder, anders geschrieben: Fs = Ds ◦ ϕ −1 ,
s = 0, 1, 2, . . .
Die Fs sind also nichts anderes als die Ds , s ∈ N0 , die nur mittels des Isomorphismus ϕ in Darstellungen von so(3) umgeschrieben wurden. Jedoch sind auch die Ds ◦ ϕ −1 mit s = 12 , 32 , . . . irreduzible Darstellungen von so(3), die sich aber nicht über (23.21) aus Gruppendarstellungen ergeben, denn solche gibt es nach Satz 23.2 nur für ganzzahlige Gewichte s. Dieses Phänomen ist natürlich nur deshalb möglich, weil SO(3) nicht einfach-zusammenhängend ist. Wir werden dies nicht weiter verfolgen, sondern betrachten die L IE-Algebren im Folgenden unabhängig von den Gruppen.
D Die kanonische Basis einer irreduziblen Darstellung von su(2) Sei L eine 3-dimensionale reelle L IE-Algebra mit R-Basis {E 1 , E 2 , E 3 } und %
3 & εi jk E k , Ei , E j = k=1
(23.25)
302
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
d. h. L ist isomorph zu su(2) und so(3). Daher hat L schiefadjungierte irreduzible Darstellungen Ds vom Gewicht s = 0, 12 , 1, . . . auf (2s +1)-dimensionalen komplexen H ILBERTräumen Hs . Weil eine L IE-Algebren-Darstellung ein L IE-AlgebrenHomomorphismus ist, übertragen sich alle Vertauschungsrelationen, so dass wir folgende Ergebnisse bekommen: a. Setzt man A j := Ds (E j ),
j = 1, 2, 3,
(23.26)
εklm Am .
(23.27)
k = 1, 2, 3
(23.28)
so sind die A j schiefhermitesch, und es gilt [Ak , Al ] =
m
b. Die Operatoren Jk := iAk , sind hermitesch und erfüllen [Jk , Jl ] = i
εklm Jm .
(23.29)
m
Hieraus folgert man durch leichte Rechnung (wie in Aufgabe 19.13): Satz 23.7 Sei L eine 3-dimensionale L IE-Algebra über R mit R-Basis {E 1 , E 2 , E 3 }, die (23.25) erfüllt. Sei Ds eine schiefadjungierte irreduzible Darstellung vom Gewicht s auf dem komplexen H ILBERTraum Hs . Für die Operatoren J+ := J1 + iJ2 = −A2 + iA1 ,
J− := J1 − iJ2 = A2 + iA1
(23.30)
und J3 gelten die Vertauschungsrelationen %
& J+ , J3 = −J+ ,
%
& J− , J3 = J− ,
%
& J+ , J− = 2J3 .
(23.31)
Ferner gilt J+∗ = J− ,
J−∗ = J+ .
(23.32)
Da J3 eine hermitesche Abbildung ist, besitzt sie nur reelle Eigenwerte. Nun kann man aus (23.31) – wie in Aufgabe. 19.15 – leicht die folgende Aussage ableiten, aus der die Rolle der Operatoren J+ , J− als „Auf- und Absteigeoperatoren“ deutlich wird:
D
Die kanonische Basis einer irreduziblen Darstellung von su(2)
303
Satz 23.8 Sei f ∈ Hs ein Eigenvektor von J3 zum Eigenwert λ ∈ R, also J3 f = λ f.
(23.33)
Dann gilt: a. Ist f + := J+ f = 0, so ist f + Eigenvektor von J3 zum Eigenwert λ + 1, d. h. J3 f + = (λ + 1) f + .
(23.34)
b. Ist f − := J− f = 0, so ist f − Eigenvektor von J3 zum Eigenwert λ − 1, d. h. J3 f − = (λ − 1) f − .
(23.35)
Mit Hilfe dieser Operatoren J+ , J− , J3 konstruieren wir nun eine spezielle Basis des Trägerraumes Hs der irreduziblen Darstellung Ds . Dazu sei λ der größte Eigenwert von J3 und f λ ein zugehöriger normierter Eigenvektor. Wir haben also (man beachte Satz 23.8) J3 f λ = λ f λ ,
J+ f λ = 0,
f λ = 1.
(23.36)
Ist J− f λ = 0, so setzen wir J− f λ = αλ f λ−1
mit αλ , so dass f λ−1 = 1.
(23.37)
Nach Satz 23.8 ist dann J3 f λ−1 = (λ − 1) f λ−1 ,
f λ | f λ−1 = 0 ,
(23.38)
weil Eigenvektoren zu verschiedenen Eigenwerten des hermiteschen Operators J3 orthogonal sind. Ist nun wieder J− f λ−1 = 0, so setzen wir J− f λ−1 = αλ−1 f λ−2
mit αλ−1 , so dass f λ−2 = 1.
(23.39)
Wieder ist nach Satz 23.8 J3 f λ−2 = (λ − 2) f λ−2 . Setzen wir diesen Prozess fort, so bekommen wir ein Orthonormalsystem f λ , f λ−1 , f λ−2 , . . . von Eigenvektoren von J3 zu Eigenwerten λ, λ−1, λ−2, . . .. Da dim Hs = 2s+1 < ∞ ist, hat J3 nur endlich viele Eigenwerte, so dass der Prozess nach endlich vielen Schritten abbrechen muss, d. h. es gibt ein κ mit J− f κ = 0. So erhalten wir das endliche Orthonormalsystem ( f μ ) von normierten Eigenvektoren von J3 , für das gilt
304
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
J3 f μ = μf μ ,
J− f μ = αμ f μ−1 ,
μ = λ, λ − 1, . . . , κ ,
(23.40)
wobei wir ακ = 0 setzen. Wir untersuchen nun die Wirkung des Operators J+ auf die Eigenvektoren f μ . Nach Wahl von λ als maximaler Eigenwert von J3 ist, wie schon in (23.36) erwähnt, J+ f λ = 0. Weiter ergibt sich mit den Vertauschungsrelationen aus Satz 23.7: 1 J+ J− f λ αλ & = % 1 < J− J+ f λ + J+ , J− f λ = αλ 2λ 2 J3 f λ = fλ, = αλ αλ
J+ f λ−1 =
d. h. J+ f λ−1 ist proportional zu f λ , etwa J+ f λ−1 = βλ f λ .
(23.41)
Wir zeigen, dass allgemein für μ ≥ κ J+ f μ = βμ+1 f μ+1
(23.42)
gilt, und zwar durch absteigende Induktion nach μ mit (23.41) als Induktionsanfang. Gelte (23.42) also bereits für f λ , f λ−1 , . . . , f μ+1 , wo μ ≥ κ. Dann folgt aus (23.40) wie bei der Herleitung von (23.41): J+ f μ =
1
J+ J− f μ+1 αμ+1 & = % 1 < J− J+ f μ+1 + J+ , J− f μ+1 = αμ+1 = 1 < = βμ+2 J− f μ+2 + 2J3 f μ+1 αμ+1 = 1 < = βμ+2 αμ+2 f μ+1 + 2(μ + 1) f μ+1 αμ+1 = βμ+1 f μ+1
mit βμ+1 =
2(μ + 1) + αμ+2 βμ+2 . αμ+1
(23.43)
D
Die kanonische Basis einer irreduziblen Darstellung von su(2)
305
Damit ist der Induktionsschritt vollzogen. Aus den Relationen J− f μ = αμ f μ−1 ,
J+ f μ = βμ+1 f μ+1
folgt nun für μ > κ βμ f μ | f μ = J+ f μ−1 | f μ = f μ−1 | J− f μ = αμ f μ−1 | f μ−1 und damit wegen f μ = 1 αμ = βμ
für μ > κ.
(23.44)
Setzen wir dies in (23.43) ein und ersetzen μ + 1 durch μ, so folgt 2 = 2μ αμ2 − αμ+1
für μ ≥ κ.
(23.45)
Wir summieren diese Gleichung nun bezüglich μ von λ abwärts bis zu einem beliebigen Wert ν ≥ κ. Das ergibt 2 = 2λ + 2(λ − 1) + · · · + 2ν. αν2 − αλ+1
Nun ist aber αλ+1 = βλ+1 = 0, und dies liefert, wenn wir die rechte Seite zusammenfassen αν2 = (λ + ν)(λ − ν + 1).
(23.46)
Mit dieser Formel können wir die Anzahl der Eigenvektoren von J3 in der Folge f λ , f λ−1 , . . . , f κ bestimmen. Wegen ακ = 0 folgt aus (23.46) nämlich für ν = κ (λ + κ)(λ − κ + 1) = 0. Wegen κ ≤ λ ist κ = −λ die einzige mögliche Lösung dieser Gleichung. Somit liefert das beschriebene Verfahren ein Orthonormalsystem von Eigenvektoren f λ , f λ−1 , . . . , f −λ zum Operator J3 , wobei f λ−m zum Eigenwert λ − m gehört. Dies ergibt aber notwendig eine Bedingung an die Zahl λ, von der wir bisher nur wissen, dass sie der größte Eigenwert von J3 ist. Da die Eigenwerte, die wir aus λ durch Anwendung des Operators J− gewinnen, alle von der Form λ−m mit m = 0, 1, 2, . . . sind, muss auch −λ = λ − m
für ein m ∈ N0
306
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
sein, d. h. λ muss von der Form λ=
m 2
für ein m ∈ N0
(23.47)
sein, also ganz- oder halbzahlig. Um λ festzulegen, beachten wir, dass wir von einer (2s + 1)-dimensionalen irreduziblen Darstellung ausgegangen sind. Da kein echter Teilraum des Trägerraums Hs unter allen Ds (L), L ∈ L, invariant ist und da die Ds (L) als Linearkombinationen der Operatoren J+ , J− , J3 geschrieben werden können, spannen die Vektoren f λ , f λ−1 , . . . , f −λ ganz Hs auf. Ihre Anzahl 2λ + 1 ist also gleich dim Hs = 2s + 1, und es folgt λ = s. So bekommen wir folgendes Ergebnis: Satz 23.9 Sei L eine zu su(2) und so(3) isomorphe L IE-Algebra mit Basis {E 1 , E 2 , E 3 }, und sei Ds eine schiefadjungierte irreduzible Darstellung von L vom Gewicht s auf einem (2s +1)-dimensionalen H ILBERTraum Hs . Definiert man dann J+ = −Ds (E 2 ) + iDs (E 1 ), J− = Ds (E 2 ) + iDs (E 1 ), J3 =
iDs (E
(23.48)
3 ),
so existiert eine Orthonormalbasis { f ms | −s ≤ m ≤ s} von Hs , die aus Eigenvektoren von J3 besteht und kanonische Basis der Darstellung Ds von L heißt. Für diese gilt s s J+ f ms = αm+1 f m+1 ,
J− f ms J3 f ms
= =
s fs αm m−1 , s m fm ,
−s ≤ m ≤ s − 1, −s + 1 ≤ m ≤ s,
(23.49)
−s ≤ m ≤ s
mit s αm =
(s + m)(s − m + 1),
−s ≤ m ≤ s.
(23.50)
Diese ist bis auf einen Phasenfaktor eindeutig bestimmt, d. h. für jede Orthonormalbasis { f ms | −s ≤ m ≤ s}, die (23.49) erfüllt, ist f ms = ζ f ms für alle m, wobei ζ ∈ C eine feste Zahl mit |ζ | = 1 ist. Die Formel (23.50) folgt dabei aus (23.46). Die Eindeutigkeitsaussage ergibt sich daraus, dass der normierte Eigenvektor f ss zum größten Eigenwert von J3 bis auf einen Phasenfaktor eindeutig ist und alle anderen f ms aus ihm durch iteriertes Anwenden von J− und nachfolgendes Normieren hervorgehen.
E
Ausreduktion einer gegebenen Darstellung
307
E Ausreduktion einer gegebenen Darstellung Sei weiterhin L eine zu su(2) und so(3) isomorphe L IE-Algebra. Zunächst halten wir fest: Korollar 23.10 Jede Darstellung D von L auf einem endlich-dimensionalen H ILBERTraum H ist vollreduzibel. Beweis Man kann o.B.d.A. L = su(2) annehmen. Nach Korollar 22.19 und Beispiel 22.17d ist D die Linearisierung einer stetigen Darstellung D der kompakten Gruppe SU(2), und D ist vollreduzibel nach Theorem 21.10 und Theorem 20.11a. Wegen Korollar 23.6 bedeutet dies, dass H in der folgenden Form zerlegt werden kann: H=
ks V s =
s∈S
ks
H js ,
(23.51)
s∈S j=1
wobei die Einschränkung von D auf den invarianten Teilraum H js stets zur irreduziblen Darstellung D s vom Gewicht s äquivalent ist. (Hier ist immer ks > 0 – es werden also in der endlichen Indexmenge S ⊆ {n/2 | n ∈ N0 } nur die tatsächlich vorkommenden Gewichte aufgeführt!) Da die H js abgeschlossene lineare Unterräume sind, sind sie auch gegenüber den Linearisierungen Ds := D∗s invariant, und somit ergibt (23.51) auch die Zerlegung D=
ks D s
s∈S
in irreduzible Darstellungen von L.
Für die Anwendungen ist es von entscheidender Bedeutung, eine Zerlegung der Form (23.51) explizit bestimmen zu können, und dies wird als Ausreduzieren der gegebenen Darstellung bezeichnet. Im Falle der L IE-Algebra L ∼ = su(2) ist dies sogar algorithmisch möglich, und die Grundlage hierfür bildet ein explizit bekannter C ASIMIR-Operator: Satz 23.11 Sei L eine zu su(2) isomorphe L IE-Algebra mit Basis {E 1 , E 2 , E 3 }, die die Vertauschungsrelationen (23.25) erfüllt, und sei D eine schiefadjungierte Darstellung von L auf einem (endlich-dimensionalen) H ILBERTraum H . Seien J+ = −D(E 2 ) + iD(E 1 ), J− = D(E 2 ) + iD(E 1 ),
(23.52)
J3 = iD(E 3 ). Dann gilt: a. Der Operator J 2 = J12 + J22 + J32 = J+ J− − J3 + J32
(23.53)
308
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
ist ein C ASIMIR-Operator der Darstellung D, d. h. 0
1 J 2 , D(L) = 0
für alle L ∈ L.
(23.54)
b. Ist insbesondere D eine irreduzible Darstellung vom Gewicht s, so gilt J 2 f = s(s + 1) f
für alle f ∈ H = Hs ,
(23.55)
d. h. jedes f ∈ H ist Eigenvektor von J 2 zum (2s + 1)-fachen Eigenwert λs = s(s + 1). Beweis a. Dass J 2 ein C ASIMIR-Operator ist, rechnet man als leichte Übung nach (analog zu Aufgabe 19.14), ebenso die Umrechnung aus (23.53). b. Ist D irreduzibel, so folgt aus (23.54) und Satz 22.2, dass J 2 ein Vielfaches der Identität ist, d. h. J 2 f = λ f,
λ ∈ R,
für alle f ∈ H ,
da J 2 hermitesch ist. Allerdings benötigt man dieses Argument eigentlich gar nicht, denn (23.55) kann mittels Satz 23.9 durch direkte Rechnung bestätigt werden. Ist nämlich { f ms | −s ≤ m ≤ s} eine kanonische Basis von H , so folgt aus (23.53) und den Wirkungen von J+ , J− , J3 auf f ms nach Satz 23.9 J 2 f ms = J+ J− f ms − J3 f ms + J32 f ms 2 s = αm f m − m f ms + m 2 f ms .
Wegen 2 = (s + m)(s − m + 1) αm
folgt J 2 f ms = ((s + m)(s − m + 1) − m + m 2 ) f ms = (s + 1)s f ms . H js
aus der Zerlegung (23.51) sind also J 2 -invariant und bestehen Die Räume aus Eigenvektoren zum Eigenwert s(s + 1). Diese Eigenwerte sind für verschiedene Gewichte s auch verschieden. Das Spektrum des selbstadjungierten Operators J 2 besteht daher genau aus den λs := s(s + 1) mit s ∈ S, und der Eigenraum zu λs ist N (J 2 − λs I ) = ks V s = H1s ⊕ · · · ⊕ Hkss .
E
Ausreduktion einer gegebenen Darstellung
309
Die Darstellung D kann daher in folgender Weise explizit ausreduziert werden: I. Zur Basis {E 1 , E 2 , E 3 } von L berechne man die Operatoren Jk = iD(E k ),
J 2 = J12 + J22 + J32 .
II. Für jedes s = 0, 12 , 1, . . . bestimme man die Maximalzahl n s linear unabhängiger Lösungen der Eigenwertgleichung J 2 f (i) = s(s + 1) f (i) ,
i = 1, . . . , n s .
(23.56)
Sei H s = LH( f (1) , . . . , f (n s ) ). Dann gibt es zwei Möglichkeiten: a. H s ist isotypisch, d. h. direkte Summe irreduzibler Räume H js gleicher Dimension. b. H s ist irreduzibel. III. Ist H s isotypisch, so haben die Gleichungen J3 f = s f,
J+ f = 0
(23.57)
p = ks linear unabhängige Lösungen f 1 , . . . , f p , und es ist H s = H1s ⊕ · · · ⊕ H ps , dim H s = p · dim H js = p(2s + 1).
(23.58)
IV. Ist H s irreduzibel, so haben die Gl. (23.57) genau eine linear unabhängige Lösung f 1 , und es ist H s = H1s
mit dim H s = 2s + 1.
(23.59)
V. Ist Hqs ein irreduzibler Teilraum aus (III) oder (IV), so wird eine kanonische Basis von Hqs gegeben durch q
f s−m = (J− )m f q , wo f q eine normierte Lösung von (23.57) ist. Damit ergibt sich die Basis q
f s−m = (J− )m f q ,
m = 0, . . . , 2s,
q = 1, . . . , p
(23.60)
von Hs , die aus Eigenvektoren von J3 besteht und als eine kanonische Basis der Teildarstellung pDs von L bezeichnet wird. Insbesondere gilt:
310
23 Die irreduziblen Darstellungen von SU(2) und SO(3) q
q
s J+ f m = αm+1 f m+1 ,
−s ≤ m ≤ s − 1,
q J− f m q J3 f m
−s + 1 ≤ m ≤ s,
= =
s fq , αm m−1 q m fm ,
(23.61)
−s ≤ m ≤ s
mit s αm =
(s + m)(s − m + 1),
−s ≤ m ≤ s.
(23.62)
Die Formel (23.62) folgt dabei aus (23.50). Lässt man nun s alle in D vorkommenden Gewichte durchlaufen, so erhält man insgesamt eine Orthonormalbasis s,q
{ f m | s ∈ S, q = 1, . . . , ks , m = −s, −s + 1, . . . , s − 1, s} von H , eine kanonische Basis der Darstellung D. Zuweilen wird sie auch als eine der Darstellung D angepasste Basis bezeichnet.
Aufgaben zu Kap. 23 23.1 Sei D eine stetige Darstellung von SO(3) auf dem endlichdimensionalen komplexen Trägerraum V und d Rk (α) Jk := i Rk = i , dα α=0
k = 1, 2, 3.
a. Man zeige: Die Eigenwerte des hermiteschen Operators J3 sind ganzzahlig, und für jedes m ∈ Z ist die Dimension von N (J3 − m I ) gleich der Anzahl von irreduziblen Teildarstellungen vom Typ Fl mit l ≥ |m|, die in der Zerlegung von D in irreduzible Teile auftreten. b. Man folgere: Wenn es einen Vektor 0 = v ∈ V gibt, für den D(R3 (α))v = e±ilα v ,
α ∈ R,
so enthält D eine irreduzible Teildarstellung vom Typ Fl . 23.2 Für n, l ∈ N sei Wn,l der C-Vektorraum der komplexwertigen homogenen Polynome p(x) =
|ν|=l
xν
Multiindex-Schreibweise!
Aufgaben
311
vom Grad l in n Variablen. Man zeige: a. Durch [D(A) p](x) := p(x A) ,
A ∈ SO(n)
ist eine stetige Darstellung der Gruppe SO(n) auf Wn,l gegeben. b. Ist l = 2k gerade (k ∈ N), so hat D eine eindimensionale irreduzible Teildarstellung. (Hinweis: Betrachte p(x) = (x12 + · · · + xn2 )k .) c. Der Teilraum Vn,l := { p ∈ Wn,l | Δp = 0} der harmonischen homogenen Polynome vom Grad l ist D-invariant. (Hinweis: Man beachte die in Aufgabe 17.17 bewiesene Rotationsinvarianz des L APLACEOperators.) 23.3 Wir geben eine konkrete Beschreibung der irreduziblen SO(3)-Darstellungen Fl , ohne auf die Überlagerungsgruppe SU(2) zurückzugreifen. Wir verwenden die Bezeichnungen aus der vorigen Aufgabe, betrachten aber speziell n = 3. Mit Δ3 bzw. Δ2 bezeichnen wir den drei- bzw. zweidimensionalen L APLACE-Operator. Man zeige nacheinander, dass für beliebiges l ∈ N die folgenden Aussagen gelten: a. Schreibt man ein Polynom p ∈ W3,l in der Form p(x1 , x2 , x3 ) =
l x3k qk (x1 , x2 ) k! k=0
mit qk ∈ W2,l−k , so ist Δ3 p(x1 , x2 , x3 ) =
l−2 k l−2 k x3 x3 qk+2 (x1 , x2 ) + Δ2 qk (x1 , x2 ), k! k! k=0
k=0
und es ist Δ3 p = 0 genau dann, wenn qk+2 = −Δ2 qk
für k = 0, 1, . . . , l − 2.
Daher ist ein harmonisches p durch Vorgabe von q0 , q1 schon eindeutig festgelegt. b. Die C-Vektorräume V3,l und W2,l × W2,l−1 sind isomorph. c. dim W2,l = l + 1 und dim V3,l = 2l + 1.
312
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
d. Das Polynom v(x1 , x2 , x3 ) := (x1 + ix2 )l gehört zu V3,l und erfüllt D(R3 (α)) = e−ilα v ,
α ∈ R.
e. Der Raum V3,l ist D-irreduzibel mit D V ∼ Fl . (Hinweis: Man verwende 3,l Aufgabe 23.1.) 23.4 a. Sei n ≥ 3, S = Sn−1 , und für 0 < θ < π sei Sθ ⊆ S der „Breitenkreis“ 2 Sθ := {(x1 , . . . , xn ) ∈ Rn | x12 + · · · + xn−1 = sin2 θ , xn = cos θ }.
Sei f : S → C eine stetige Funktion auf S, die nicht von x1 , . . . , xn−1 abhängt, sondern nur von xn . Man zeige, dass dann gilt:
π
f ω S = Ωn−2 S
f (sin θ, 0, . . . , 0, cos θ ) sinn−2 θ dθ.
0
Dabei bedeutet ωs die euklidische Volumenform auf S und Ωn−2 die Oberfläche der (n − 2)-dimensionalen Einheitssphäre. (Hinweis: Ein rigoroser Beweis ist mittels Aufgabe 4.9c möglich.) b. Man zeige: Jede Klassenfunktion (vgl. Aufgabe 21.15) g auf SU(2) kann eindeutig in der Form g(A) = f (α) mit einer stetigen geraden 2π -periodischen Funktion f geschrieben werden. Dabei ist α bestimmt durch Spur A = 2 cos
α . 2
Für das H AARsche Integral gilt dann SU(2)
1 g(A) dA = π
2π
f (α) sin2
0
α dα. 2
(Hinweis: Neben Teil a. verwende man Aufgaben 18.6 und 21.3.) 23.5 Man berechne
|χs (A)|2 dA und gebe dann mittels Theorem 21.17b einen
SU(2)
neuen Beweis für die Irreduzibilität der Darstellungen D s . 23.6 Man beweise die Vollständigkeit des Systems der Darstellungen D s (Korollar 23.5), ohne auf Abschn. 21F und damit auf den S TONE -W EIERSTRASSschen Satz zurückzugreifen. (Hinweis: Neben Korollar 21.16 und Aufgabe 23.4 verwende man die wohlbekannte Tatsache, dass die Funktionen sin kθ , k ∈ N ein vollständiges Orthonormalsystem im Raum der ungeraden 2π -periodischen Funktionen bilden.)
Aufgaben
313
23.7 Sei L eine reelle L IE-Algebra (z. B. die L IE-Algebra zu einer L IE-Gruppe). Die Komplexifizierung von L ist der C-Vektorraum LC := L × L mit der komplexen Skalarmultiplikation (a + ib)(v, w) := (av − bw, aw + bv) ,
a, b ∈ R , v, w ∈ L
und der L IE-Klammer [(v1 , w1 ), (v2 , w2 )] = ([v1 , v2 ] − [w1 , w2 ], [v1 , w2 ] + [w1 , v2 ]) . Man zeige: a. LC ist eine komplexe L IE-Algebra, und die injektive Abbildung L → LC : v → (v, 0) ist ein Homomorphismus von L IE-Algebren. Ferner ist i(v, 0) = (0, v) und i(0, w) = (−w, 0). Daher schreibt man v + iw statt (v, w) und kann dann mit den Elementen von LC in gewohnter Weise rechnen. b. LC = L ⊕ iL. Ist (b1 , . . . , bn ) eine R-Basis von L, so ist dieses System auch eine C-Basis von LC , und zwar mit denselben Strukturkonstanten. Ferner ist (b1 , . . . , bn , ib1 , . . . , ibn ) eine R-Basis von LC . c. (su(2))C ∼ = sl(2, C). (Hinweis: Jede Matrix X ∈ C2×2 kann eindeutig in der Form X = A + iB mit H ERMITEschen Matrizen A, B geschrieben werden.) Bemerkung Bekanntlich ist sl(2, C) isomorph zur L IE-Algebra der eigentlichen or↑ thochronen L ORENTZgruppe L + (Satz 19.24). Dass diese L IE-Algebra als Komplexifizierung von su(2) aufgefasst werden kann, ermöglicht es, mittels der Darstellun↑ gen Ds die irreduziblen Darstellungen von L + zu klassifizieren, einschließlich der unendlich-dimensionalen und der nicht-unitären.
Kapitel 24
Einige Anwendungen
Unsere erste Anwendung (Abschn. A) bezieht sich auf spezielle Funktionen: Wir werden die bekannten Kugelflächenfunktionen Ylm darstellungstheoretisch motivieren und zeigen, dass ihre wichtigsten Eigenschaften Spezialfälle von Grundprinzipien der Darstellungstheorie sind, die wir in den Kap. 21–23 diskutiert haben. Dabei nehmen wir die Gelegenheit wahr, an einem konkreten Beispiel kurz auf homogene Räume einzugehen, eine wichtige Verallgemeinerung der L IE-Gruppen, für die wir im übrigen auf die weiterführende Literatur verweisen, etwa auf [5] oder [71]. In den restlichen Abschnitten greifen wir das Thema von Abschn. 20C wieder auf und befassen uns mit den Eigenwerten und den Matrixelementen von H AMIL TON operatoren, die eine Kugel- oder Axialsymmetrie besitzen. Wie schon im vorigen Kapitel geht es bei diesen Schlussabschnitten nicht darum, dem physikalisch vorgebildeten Leser etwas Neues zu vermitteln. Vielmehr ist es unser Bestreben, Bekanntes in der hier entwickelten mathematisch rigorosen Sprache zu formulieren und damit zum besseren Verständnis der gruppentheoretischen Methoden und zum Abbau von eventuell vorhandenen Sprachbarrieren beizutragen. Für das weitere Studium der physikalischen Anwendungen gibt es eine Fülle von guter Fachliteratur, und wir erwähnen hier nur die Titel [15, 25, 53, 83] sowie den Klassiker [93].
A Kugelfunktionen und infinitesimale Drehungen Im Folgenden sei S := {x = (x, y, z) ∈ R3 | x 2 + y 2 + z 2 = 1} die Einheitssphäre im R3 , parametrisiert durch Kugelkoordinaten x = cos ϕ sin θ,
y = sin ϕ sin θ,
z = cos θ,
0 ≤ ϕ < 2π, 0 ≤ θ ≤ π,
und es sei L 2 (S) der H ILBERTraum der (Klassen von) messbaren Funktionen f : S −→ C mit 2π π f =
| f (ϕ, θ )|2 sin θ dθ dϕ < ∞,
2
0
(24.1)
0
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_24, C Springer-Verlag Berlin Heidelberg 2010
315
316
24 Einige Anwendungen
dessen Skalarprodukt gegeben ist durch 2π π f (ϕ, θ ) g(ϕ, θ ) sin θ dθ dϕ.
f | g = 0
(24.2)
0
Wie in Beispiel 21.9 überzeugt man sich von den folgenden Tatsachen (man beachte, dass sin θ dθ dϕ das euklidische Oberflächenelement auf S und somit rotationsinvariant ist!): Satz 24.1 a. Auf L 2 (S) wird durch %
& T (R) f (x) := f (R −1 x),
x ∈ S, R ∈ SO(3)
(24.3)
für f ∈ L 2 (S) eine unitäre stetige Darstellung von SO(3) definiert. b. Bezeichnet # : SU(2) −→ SO(3) den im Satz 18.13c konstruierten Epimorphismus, so wird durch %
& % & D(A) f (x) = T (#(A)) f (x) = f (#(A)−1 x)
(24.4)
eine unitäre Darstellung von SU(2) auf L 2 (S) definiert.
Bevor wir diese Darstellung näher untersuchen, wollen wir die Mittelbildung auf der Sphäre S mit dem H AARschen Maß auf SO(3) in Verbindung bringen: Lemma 24.2 Für g ∈ C(S) und x 0 ∈ S gilt 1 4π
2π 0
π
g(ϕ, θ ) sin θ dθ dϕ =
0
g(R −1 x 0 ) dR.
SO(3)
Beweis Wähle A0 ∈ SO(3) so, dass x 0 = A0 e3 . Da SO(3) unimodular ist, haben wir −1 g(R x 0 ) dR = g(Rx 0 ) dR = g(R A0 e3 ) dR = g(Re3 ) dR. SO(3)
SO(3)
SO(3)
SO(3)
Nun verwenden wir die aus Aufgabe 21.5 bekannte explizite Formel für das normierte H AARsche Maß auf SO(3) und beachten, dass R3 (α)e3 = e3 für alle α:
A
Kugelfunktionen und infinitesimale Drehungen
1 g(Re3 ) dR = 8π 2
SO(3)
=
1 4π
2π
0
2π
π 0
0
π
2π
317
g(R3 (ϕ)R2 (θ )R3 (α)e3 ) sin θ dαdθ dϕ
0
g(R3 (ϕ)R2 (θ )e3 ) sin θ dθ dϕ.
0
Aber R3 (ϕ)R2 (θ )e3 ist der Punkt mit den Kugelkoordinaten (ϕ, θ ), also haben wir die behauptete Identität. Bemerkung Dieses Lemma und sein Beweis reflektieren die Tatsache, dass die Sphäre S als der homogene Raum SO(3)/SO(2) aufgefasst werden kann. Hierzu betrachte man die zu SO(2) isomorphe Untergruppe G 3 := {R3 (α) | α ∈ R}, also den Stabilisator des Punktes e3 ∈ S (Aufgabe 17.16). Der fragliche homogene Raum ist dann definiert als die Menge der Links-Nebenklassen AG 3 , A ∈ SO(3) (vgl. Aufgabe 17.8), und man identifiziert ihn mit S, indem man jeder Nebenklasse AG 3 den Punkt Ae3 zuordnet. Dies ist sinnvoll und liefert eine bijektive Abbildung SO(3)/SO(2) → S, denn Ae3 = A e3
⇐⇒
A−1 A ∈ G 3
⇐⇒
AG 3 = A G 3 .
Diese Abbildung führt die natürliche Linksoperation von SO(3) auf dem homogenen Raum über in die natürliche Linksoperation auf S, und man überträgt die Mannigfaltigkeitsstruktur von S mittels dieser Bijektion auf die Menge der Nebenklassen. So wird der homogene Raum zu einer Mannigfaltigkeit, auf der die Gruppe SO(3) von links operiert. Für allgemeine Gruppen, die auf irgendwelchen Mengen operieren, haben wir diese Konstruktion schon in Aufgabe 17.16 betrachtet. Wir wollen die Darstellung T von SO(3) aus (24.3) nun mit Hilfe der zugehörigen L IE-Algebren-Darstellung T = T∗ untersuchen. Formal ist diese nach Satz 22.10 definiert durch T (L) f := lim
t−→0
1 (T (et L ) − I ) f, t
L ∈ so(3) ,
(24.5)
wobei wir jedoch beachten müssen, dass T eine unendlich-dimensionale Darstellung ist. Um die dabei auftretenden Schwierigkeiten zu umgehen, betrachten wir T nur für Funktionen f ∈ C ∞ (S). Dann können wir schreiben & % d f (e−t L x) , T (L) f (x) = t=0 dt
(24.6)
was wir auf Grund unserer Differenzierbarkeitsvoraussetzung explizit ausrechnen können. Nach Satz 23.9 genügt es, die „infinitesimalen Operatoren“ J1 , J2 , J3 der
318
24 Einige Anwendungen
Darstellung zu bestimmen, die der Standardbasis R1 , R2 , R3 von so(3) entsprechen (vgl. (23.23)). Für t → 0 ergibt sich ⎛ ⎞ x e−t R1 x = ⎝ y ⎠ z ⎛ ⎞ x e−t R2 x = ⎝ y ⎠ z ⎛ ⎞ x e−t R3 x = ⎝ y ⎠ z
⎛
⎞ 0 −t ⎝−z ⎠ +O(t 2 ), y ⎛ ⎞ z −t ⎝ 0 ⎠ +O(t 2 ), −x ⎛ ⎞ −y −t ⎝ x ⎠ +O(t 2 ). 0
(24.7)
Daraus folgt dann durch TAYLORentwicklung von f (e−t L x): f (e−t R1 x) = f ((x, y + t z, z − t y) + O(t 2 ))
∂ f (x, y, z) + · · ·, = f (x, y, z) + t z ∂∂y − y ∂z f (e−t R2 x) = f ((x − t z, y, z + t x) + O(t 2 ))
∂ − z ∂∂x f (x, y, z) + · · ·, = f (x, y, z) + t x ∂z
(24.8)
f (e−t R3 x) = f ((x + t y, y − t x, z) + O(t 2 ))
= f (x, y, z) + t y ∂∂x − x ∂∂y f (x, y, z) + · · · .
Aus diesen Entwicklungen kann man die infinitesimalen Operatoren T (R j ) der Darstellung (24.6) (in kartesischen Koordinaten) direkt ablesen. Ihre Umrechnung auf Kugelkoordinaten folgt dann einfach mit der Kettenregel (vgl. etwa [34], Kap. 10): Satz 24.3 Sei T die gemäß (24.3) definierte unitäre Darstellung von SO(3) auf L 2 (S) und sei T ihre Linearisierung, betrachtet als Darstellung auf C ∞ (S). Dann gilt: a. In kartesischen Koordinaten sind die infinitesimalen Operatoren der Darstellung T gegeben durch
∂ , J1 = iT (R1 ) = i z ∂∂y − y ∂z
∂ ∂ J2 = iT (R2 ) = i x ∂z − z ∂ x ,
J3 = iT (R3 ) = i y ∂∂x − x ∂∂y .
(24.9)
A
Kugelfunktionen und infinitesimale Drehungen
319
b. In Kugelkoordinaten sind die infinitesimalen Operatoren gegeben durch ∂ ∂ J1 = i cot θ cos ϕ ∂ϕ + i sin ϕ ∂θ , ∂ ∂ J2 = i cot θ sin ϕ ∂ϕ − i cos ϕ ∂θ ,
J3 =
(24.10)
∂ i ∂ϕ .
c. Für die „Leiteroperatoren“ (23.30) gilt in Kugelkoordinaten J+ = eiϕ
∂ ∂θ
∂ , + i cot θ ∂ϕ
∂ ∂ J− = e−iϕ − ∂θ . + i cot θ ∂ϕ
(24.11)
d. Für den C ASIMIR-Operator (23.53) der Darstellung gilt: 1 ∂ C = −J = sin θ ∂θ 2
∂ 1 ∂2 sin θ + . ∂θ sin2 θ ∂ϕ 2
(24.12)
Wir wollen nun die Darstellung T in irreduzible Teildarstellungen zerlegen und diese mit Hilfe der Operatoren aus Satz 24.3 explizit berechnen. Theoretische Grundlage für die Durchführbarkeit dieses Vorhabens sind die folgenden beiden Aussagen: Lemma 24.4 a. L 2 (S) ist die H ILBERTsche Summe von T -invarianten Teilräumen Hs , für die T H zu einer der Darstellungen Fl aus Satz 23.2 äquivalent ist. Jedes f ∈ L 2 (S) s hat also eine eindeutige, in L 2 (S) konvergente, Reihenentwicklung f =
fs
mit f s ∈ Hs
s
und f s | f t = 0 für s = t (vgl. die in Korollar 15.3 getroffene Definition). b. Hs ⊆ C ∞ (S) für alle s. Beweis a. Aus Anmerkung 21.28 wissen wir, dass H = L 2 (S) als H ILBERTsche Summe von irreduziblen Teilräumen Hs dargestellt werden kann. Aber nach Korollar 23.5 ist T H dann äquivalent zu einer der irreduziblen Darstellungen Fl mit s l = l(s) ∈ N0 . b. Sei Hs ein irreduzibler Teilraum für die Darstellung T , etwa T H ∼ Fl und s insbesondere dim Hs = 2l + 1. Zunächst zeigen wir, dass Hs ⊆ C(S) ist.
320
24 Einige Anwendungen
Sei ψl der Charakter von Fl und G := SO(3). Wir definieren einen linearen Operator P0 in C(S) durch (P0 g)(x) := (2l + 1) ψl (R)g(R −1 x) dR , x ∈ S. G
Wegen der Kompaktheit von G ist klar, dass P0 g tatsächlich eine stetige Funktion auf S ist. Außerdem ergibt die C AUCHY-S CHWARZsche Ungleichung 1/2
|(P0 g)(x)| ≤ (2l + 1)
|ψl (R)| dR
|g(R
2
G
−1
1/2 2
x)| dR
G
für alle x ∈ S. Aber ψl ist beschränkt auf G, und für das zweite Integral bekommen wir mit Lemma 24.2 und (24.1) 1 g2 |g(R −1 x)|2 dR = 4π G unabhängig von x. Daher gibt es eine Konstante C ≥ 0 so, dass P0 g∞ ≤ Cg für alle g ∈ C(S). Nach dem BLE-Theorem (Theorem 8.7) hat P0 also eine eindeutige Fortsetzung zu einem stetigen linearen Operator P : L 2 (S) → C(S) (beachte auch Satz 10.39 in seiner auf Mannigfaltigkeiten verallgemeinerten Form!), und man kann P auch als einen Operator L 2 (S) → L 2 (S) auffassen, dessen Wertebereich aus (Klassen von) stetigen Funktionen besteht. Mittels der Definition des vektorwertigen Integrals (Definition 21.11) und (8.6) prüft man leicht nach, dass P f = (2l + 1) ψl (R)T (R) f dR G
für alle f ∈ L 2 (S). Ist f ∈ Hs , so führen die Orthogonalitätsrelationen für die Matrixelemente von Fl nach leichter Rechnung zu Pf = f (man kann z. B. Aufgabe 21.13 auf die Darstellung U = T H anwenden). Damit s ist aber klar, dass jedes f ∈ Hs stetig ist. Folglich ist auch P0 f = P f = f , und dies bedeutet die punktweise Identität f (x) = (2l + 1) ψl (R) f (R −1 x) dR , x∈S (∗) G
für jedes f ∈ Hs .
A
Kugelfunktionen und infinitesimale Drehungen
321
Nun beachten wir erneut, dass R3 (ϕ)R2 (θ )e3 der Punkt mit den Kugelkoordinaten (ϕ, θ ) ist. Wegen der Invarianz des H AARschen Maßes führt (∗) daher zu
ψl (R) f (R −1 R3 (ϕ)R2 (θ )e3 ) dR
f (ϕ, θ ) = (2l + 1) G = (2l + 1)
˜ 3 ) d R, ˜ ψl (R3 (ϕ)R2 (θ ) R˜ −1 ) f ( Re
G
und der Integrand im letzten Integral ist bei festem R˜ eine analytische Funktion der Variablen (ϕ, θ ), denn nach Konstruktion sind die Matrixelemente von Fl (R) Polynomfunktionen der Matrixelemente von R. Da der Integrationsbereich G kompakt ist, sagt ein klassischer Satz über Integrale mit Parameter nun, dass f ∈ Hs sogar analytisch ist, erst recht also C ∞ . Nun sei l ∈ N0 gegeben. Mit Hilfe der Operatoren aus Satz 24.3 bestimmen wir kanonischen Basis eines irreduziblen Teilraumes die Basisvektoren f ml (ϕ, θ ) einer Hs mit T H ∼ Fl , also T H ∼ Fl . Nach Satz 23.9 sind diese Basisvektoren s s Eigenvektoren des Operators J3 , d. h. nach (24.10) gilt −i
∂ l f (ϕ, θ ) = m f ml (ϕ, θ ), ∂ϕ m
−l ≤ m ≤ l,
(24.13)
woraus sofort die Gestalt l f ml (ϕ, θ ) = eimϕ gm (θ ),
−l ≤ m ≤ l
(24.14)
folgt. Nach Wahl des Winkels ϕ muss f ml (ϕ, θ ) 2π -periodisch in ϕ sein, was dadurch gewährleistet ist, dass m ganzzahlig ist. Ferner ist nach Satz 23.11b jeder Vektor f ∈ Hs Eigenvektor des C ASIMIR-Operators J 2 zum Eigenwert l(l + 1): J 2 f = l(l + 1) f
für alle f ∈ Hs .
Mit den Formeln (24.12) für J 2 und (24.14) für die Basisfunktionen f ml folgt daraus l : folgende Differentialgleichung für die Funktionen gm 1 d sin θ dθ
sin θ
> d l m2 l gm gm (θ ) + l(l + 1) − (θ ) = 0. dθ sin2 θ
(24.15)
Diese Differentialgleichung ist aus der klassischen Feldtheorie wohlbekannt (vgl. etwa [34], Kap. 30 und 31), denn durch die Substitution x = cos θ geht (24.15) über in die zugeordnete L EGENDRE-Differentialgleichung, so dass l gm (θ ) = Plm (cos θ )
322
24 Einige Anwendungen
gelten muss, wobei Plm die entsprechende zugeordnete L EGENDRE-Funktion bezeichnet. Somit ist f ml proportional zu der üblichen Kugelflächenfunktion Ylm . Wir haben also Ylm (ϕ, θ ) = clm eimϕ Plm (cos θ ),
−l ≤ m ≤ l
(24.16)
mit den Proportionalitätsfaktoren clm
= (−1)
m
(l − m)! (l + m)!
1/2 (l + 1/2)1/2 ,
(24.17)
die so eingerichtet sind, dass Ylm = 1 ist. Aus T H ∼ Fl folgt also s
Hs = LH Ylm − l ≤ m ≤ l , und insbesondere ist Hs durch l eindeutig bestimmt, d. h. der Äquivalenztyp Fl kommt in der Zerlegung von T nur einmal vor. Wir fassen zusammen: Satz 24.5 a. Die Darstellung T von SO(3) aus (24.3) wird durch die orthogonale direkte Zerlegung L 2 (S) =
∞
⊥
Hl
mit Hl = LH Ylm − l ≤ m ≤ l
l=0
in irreduzible Teildarstellungen zerlegt. Die Teildarstellung auf Hl ist dabei zu der Darstellung Fl aus Satz 23.2 äquivalent. b. Zu gegebenem l bilden die Funktionen Ylm (ϕ, θ ) eine kanonische Basis des (2l + 1)-dimensionalen irreduziblen Teilraumes Hl ⊆ L 2 (S) zur Darstellung T aus (24.6) von so(3). Die Elemente von Hl nennt man Kugelflächenfunktionen der Ordnung l. Die wohlbekannte Tatsache, dass die Ylm in L 2 (S) ein vollständiges orthonormales System bilden, findet so eine darstellungstheoretische Erklärung. Auch andere Eigenschaften der Kugelfunktionen, wie etwa die Additionstheoreme, kann man aus ihrer darstellungstheoretischen Rolle ableiten. Ähnliches trifft auf praktisch alle speziellen Funktionen zu, die in der Physik eine Rolle spielen – allerdings muss man hierfür andere L IE-Gruppen und L IE-Algebren heranziehen. Wir können nicht näher darauf eingehen und verweisen z. B. auf [58, 94].
B
Rotationssymmetrie eines Zwei-Teilchen-Systems
323
B Rotationssymmetrie eines Zwei-Teilchen-Systems Wir betrachten ein quantenmechanisches 2-Teilchen-System. Nach der Axiomatik der Quantenmechanik ist sein Zustandsraum H = L 2 (R3 ) ⊗ L 2 (R3 ) ∼ = L 2 (R6 )
(24.18)
(vgl. auch Satz 7.22). Wir schreiben (x 1 , x 2 ) = (x1 , y1 , z 1 , x2 , y2 , z 2 ) für die Variable in R6 , so dass x j die Position des j-ten Teilchens bezeichnet ( j = 1, 2). Liegt keine Wechselwirkung vor, so ist der H AMILTONoperator H = H1 + H2 , H j = − 2m1 j Δ j + V j (x j ),
j = 1, 2 ,
(24.19)
wobei der dreidimensionale L APLACEoperator Δ j nur auf die Variable x j wirkt. Genau genommen ist also H = H1 ⊗ I + I ⊗ H2 , wobei jedes H j ein Operator in L 2 (R3 ) ist. Wir setzen voraus, dass beide Potentiale invariant unter SO(3) sind, d. h. V j (Rx j ) = V j (x j ),
R ∈ SO(3), j = 1, 2.
(24.20)
Wir betrachten nun die Gruppe G := SO(3) × SO(3), d. h. das direkte Produkt von SO(3) mit sich selbst (vgl. Aufgabe 17.2 und den Schluss von Abschn. 19B). Auf H = L 2 (R6 ) wird dann durch [S(R1 , R2 )ψ] (x 1 , x 2 ) := ψ(R1−1 x 1 , R2−1 x 2 )
(24.21)
eine unitäre Darstellung von G definiert. Wie in Satz 20.16 zeigt man, dass H mit allen Operatoren S(R1 , R2 ) vertauschbar ist, d. h. G = SO(3) × SO(3) ist eine Symmetriegruppe von H . Nach Satz 20.17 ist die Kenntnis der irreduziblen Darstellungen von G für die Untersuchung der Eigenwerte von H wichtig. Nach Aufgabe 21.14 sind diese genau die äußeren Tensorproduktdarstellungen Sl1 ,l2 := Fl1 Fl2 , d.h. Sl1 ,l2 (R1 , R2 ) := Fl1 (R1 ) ⊗ Fl2 (R2 ) ,
(24.22)
wobei die Fl die irreduziblen Darstellungen von SO(3) gemäß Satz 23.2 sind. Sei nun λ ein Eigenwert von H . Wir nehmen an, dass der zugehörige Eigenraum Wλ Trägerraum der irreduziblen Darstellung Sl1 ,l2 aus (24.22) ist. Dann ist dim Wλ = (2l1 + 1)(2l2 + 1),
324
24 Einige Anwendungen
d. h. λ ist (2l1 + 1)(2l2 + 1)-fach entartet. l Es bezeichne {ψmj j (x j ) | −l j ≤ m j ≤ l j } eine kanonische Basis zur irreduziblen Darstellung Fl j von SO(3) gemäß Satz 23.9. Dann überlegt man sich sofort, dass {ψml11 (x 1 ) · ψml22 (x 2 ) | −l j ≤ m j ≤ l j ,
j = 1, 2}
(24.23)
eine Orthonormalbasis des G-irreduziblen Teilraums Wλ ist. Bisher haben wir ein ungekoppeltes 2-Teilchensystem betrachtet. Nun führen wir eine Wechselwirkung ein, indem wir zu dem Operator H ein Wechselwirkungspotential V hinzufügen. Der H AMILTONoperator des wechselwirkenden Systems ist also H := H + V (x 1 , x 2 ),
(24.24)
und wir setzen voraus, dass V nur vom Abstand der Teilchen abhängt, d. h. V (x 1 , x 2 ) = V (|x 1 − x 2 |).
(24.25)
Dann ist V zwar noch invariant unter der Gruppe SO(3), die gemäß R · (x 1 , x 2 ) := (Rx 1 , Rx 2 ) auf R3 × R3 operiert, aber nicht mehr invariant unter G = SO(3) × SO(3). Folglich hat der H AMILTONoperator H aus (24.24) nicht mehr G als Symmetriegruppe, sondern nur noch die Untergruppe G0 = {(R, R) | R ∈ SO(3)} ∼ = SO(3).
(24.26)
Das hat nun Konsequenzen für das Eigenwertproblem. Wir hatten angenommen, dass der Eigenraum Wλ zum Eigenwert λ des ungekoppelten Operators irreduzibel unter der Darstellung Sl1 ,l2 (R1 , R2 ) = Sl1 (R1 ) ⊗ Sl2 (R2 ) ist. Unter der Einschränkung S0l1 ,l2 (R) := Sl1 (R) ⊗ Sl2 (R) auf die Untergruppe G0 ∼ = SO(3), also der „inneren“ Tensorproduktdarstellung (Aufgabe 20.9), ist Wλ nicht mehr irreduzibel, sondern zerfällt gemäß Satz 23.4 nach der C LEBSCH-G ORDAN-Formel S0l1 ,l2 = Fl1 ⊗ Fl2 ∼ Fl1 +l2 ⊕ Fl1 +l2 −1 ⊕ · · · ⊕ F|l1 −l2 |
(24.27)
C
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem
325
in eine direkte Summe von irreduziblen SO(3)-Darstellungen. Wir fassen zusammen: Wird ein ungekoppeltes 2-Teilchensystem mit dem H AMILTON-Operator H = H1 + H2 , H j = −
1 Δ j + V j (x j ) 2m j
(24.19)
und kugelsymmetrischen Potentialen V j (x j ) durch ein Wechselwirkungspotential V (|x 1 − x 2 |) gestört, H = H + V , (24.24) so spaltet sich ein (2l1 +1)(2l2 +1)-fach entarteter Eigenwert λ von H auf in 2·min(l1 , l2 )+ 1 Eigenwerte λl , |l1 − l2 | ≤ l ≤ l1 + l2 , von H , die jeweils (2l + 1)-fach entartet sind.
C C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKARTTheorem Für praktische Anwendungen muss man etwas mehr wissen, denn um die Matrixelemente von H und H zu berechnen, braucht man einen Zusammenhang zwischen einer Basis von Fl1 ⊗ Fl2 , die sich aus kanonischen Basen von Fl1 , Fl2 durch Bildung des Tensorprodukts ergibt, auf der einen Seite, und kanonischen Basen der direkten Summanden Fl , |l1 − l2 | ≤ l ≤ l1 + l2 auf der anderen. Dieser Zusammenhang wird durch die C LEBSCH-G ORDAN-Koeffizienten hergestellt, wie wir nun ausführlicher diskutieren wollen. l (x , x ) | −l ≤ m ≤ l} eine Für irgendein l, |l1 −l2 | ≤ l ≤ l1 +l2 , bezeichne {ϕm 1 2 l1 ,l2 kanonische Basis der Fl -Teildarstellung von S0 , die wir mit den infinitesimalen J -Operatoren berechnen können, indem wir die Linearisierung von S0l1 ,l2 auf die am Schluss von Kap. 23 dargestellte Weise ausreduzieren. Andererseits gehört zur linken Seite der C LEBSCH-G ORDAN-Zerlegung Fl1 ⊗ Fl2 ∼ Fl1 +l2 ⊕ · · · ⊕ F|l1 −l2 |
(24.28)
die Basis {ψml11 (x 1 ) · ψml22 (x 2 ) | −l j ≤ m j ≤ l j ,
j = 1, 2},
(24.29)
wie wir bereits gezeigt haben. Dies ist jedoch keine kanonische Basis des Trägerraumes Wλ der Tensorproduktdarstellung, sondern diese ist l (x 1 , x 2 ) | −l ≤ m ≤ l, |l1 − l2 | ≤ l ≤ l1 + l2 }. {ϕm
(24.30)
Die Berechnung der Matrixelemente des H AMILTONoperators ist in der kanonischen Basis (24.30) wesentlich einfacher als in der Tensorproduktbasis (24.29). Jedoch kann die Basis (24.29) (z. B. mit Hilfe von Kugelfunktionen) wesentlich einfacher konstruiert werden. Für praktische Rechnungen benötigt man daher die Transformationsmatrix zwischen diesen beiden Orthonormalbasen von Wλ :
326
24 Einige Anwendungen
Definition 24.6 Es sei {ψml (x) | −l ≤ m ≤ l} kanonische Basis eines SO(3)l (x , x ) | −l ≤ m ≤ l} irreduziblen Teilraumes V l von L 2 (R3 ), und es sei {ϕm 1 2 kanonische Basis eines SO(3)-irreduziblen Teilraumes W l von L 2 (R6 ) ∼ = L 2 (R3 )⊗ 2 3 L (R ). Dann heißen die Koeffizienten C(l1 , m 1 ; l2 , m 2 | l, m) in der Entwicklung l ϕm (x 1 , x 2 ) =
m 1 ,m 2
C(l1 , m 1 ; l2 , m 2 | l, m)ψml11 (x 1 )ψml22 (x 2 )
(24.31)
die C LEBSCH-G ORDAN-Koeffizienten von SO(3) bezüglich der Zerlegung V ⊗V l1
l2
=
l 1 +l2
Wl.
(24.32)
l=|l1 −l2 |
Die aus den C LEBSCH-G ORDAN-Koeffizienten gebildete Matrix der Ordnung (2l1 + 1)(2l2 + 1) ist als Transformationsmatrix zwischen Orthonormalbasen unitär. Außerdem ist C(l1 , m 1 ; l2 , m 2 | l, m) = 0 ,
falls m = m 1 + m 2 .
(24.33)
Wendet man nämlich J3 auf (24.31) an (wobei das Ergebnis von Aufgabe 22.4b. zu beachten ist!), so erhält man l (x 1 , x 2 ) = mϕm
m 1 ,m 2
C(l1 , m 1 ; l2 , m 2 | l, m)(m 1 + m 2 )ψml11 (x 1 )ψml22 (x 2 )
und folglich m 1 ,m 2
C(l1 , m 1 ; l2 , m 2 | l, m)(m − m 1 − m 2 )ψml11 (x 1 )ψml22 (x 2 ) = 0,
woraus (24.33) durch Koeffizientenvergleich folgt. Allerdings sind die oben definierten C LEBSCH -G ORDAN-Koeffizienten nur bis auf einen Phasenfaktor eindeutig, weil die kanonischen Basen noch die Abänderung um einen Phasenfaktor gestatten (Satz 23.9). Eindeutig festgelegt werden sie durch die sog. C ONDON -S HORTLEY-Konvention, bei der die Phasenfaktoren so eingerichtet werden, dass C(l1 , l1 ; l2 , l − l1 | l, l) > 0
für |l1 − l2 | ≤ l ≤ l1 + l2
(24.34)
C
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem
327
und alle übrigen C LEBSCH -G ORDAN-Koeffizienten reell werden. Die aus ihnen gebildete Transformationsmatrix ist dann also orthogonal. Man kann sie sogar explizit berechnen, was allerdings mühsam ist (vgl. etwa [30]), und aus der gewonnenen Formel kann man einige interessante Symmetrie-Eigenschaften ablesen wie z. B. C(l1 , m 1 ; l2 , m 2 | l, m) = C(l2 , m 2 ; l1 , m 1 | l, m).
(24.35)
Weitere derartige Symmetrien werden z. B. in [30], in [94] und in der physikalischen Literatur über Drehimpulse in der Quantenmechanik diskutiert. Bemerkung Da die C(l1 , m 1 ; l2 , m 2 | l, m) für feste Werte von l1 , l2 eine orthogonale Matrix bilden, kann man (24.31) auch in der äquivalenten Form ψml11 (x 1 )ψml22 (x 2 ) =
l C(l1 , m 1 ; l2 , m 2 | l, m)ϕm (x 1 , x 2 )
l,m
anschreiben, die eigentlich besser zur Zerlegung (24.32) passt. Die Gestalt (24.31) ist jedoch aus physikalischer Sicht vorzuziehen, denn sie gibt unmittelbar wieder, wie sich die einzelnen Drehimpulse l1 , l2 bzw. die einzelnen z-Komponenten m 1 , m 2 bei Kopplung der Systeme zu einem Gesamtdrehimpuls l (bzw. zu einer Gesamtkomponente m = m 1 + m 2 in z-Richtung) zusammensetzen. Wir demonstrieren nun zunächst allgemein, wie man die Matrixelemente des H AMILTONoperators H mit SO(3) als Symmetriegruppe besonders einfach bestimmen kann. Sei also SO(3) Symmetriegruppe des H AMILTONoperators H im komplexen H ILBERTraum H. Sei {ϕn | n ∈ N} eine Orthonormalbasis von H, die im Definitionsbereich D(H ) enthalten ist. Wie in der Physik üblich, nennen wir die Zahlen ϕi | H ϕ j die Matrixelemente von H bezüglich dieser Orthonormalbasis. Nach Voraussetzung gilt für eine gewisse unitäre Darstellung T von SO(3) auf H dann T (R)H = H T (R)
für alle R ∈ SO(3).
(24.36)
Angenommen wir haben eine orthogonale direkte Zerlegung H=
kl Hl ,
l
T =
kl Fl
(24.37)
l
in irreduzible Teildarstellungen Fl , wobei Fl kl -mal auftritt. Dann versehen wir jeden der vorkommenden Teilräume j
Hl ,
1 ≤ j ≤ kl ,
falls kl = 0,
328
24 Einige Anwendungen
mit einer kanonischen Basis {ψ ljm | −l ≤ m ≤ l}. Es gilt also J 2 ψ ljm = l(l + 1)ψ ljm , l J+ ψ ljm = αm+1 ψ lj,m+1 ,
J3 ψ ljm = mψ ljm , l ψl J− ψ ljm = αm j,m−1 ,
(24.38)
wobei diese Konstruktion völlig unabhängig von dem H AMILTONoperator H ist. Jedoch ist die Berechnung der Matrixelemente k ψ ljm | H ψin
in der kanonischen Basis besonders einfach, wie wir jetzt sehen werden. Aus (24.36) folgt H J3 = J3 H
und außerdem J3∗ = J3
und daher mit (24.38) k = ψ l | H J ψ k n ψ ljm | H ψin 3 in jm l k = mψ l | H ψ k , = J3 ψ jm | H ψin jm in
Also k =0 ψ ljm | H ψin
für m = n.
(24.39)
Aus (24.36) folgt weiterhin H J2 = J2H
und außerdem
(J 2 )∗ = J 2
und daher mit (24.38), (24.39) k = ψ l | H J 2 ψ k k(k + 1) ψ ljm | H ψim jm im k = l(l + 1)ψ l | H ψ k , = J 2 ψ ljm | H ψim jm im
Also k = 0 für k = l. ψ ljm | H ψim
Schließlich gilt noch H J+ = J+ H
und J+∗ = J−
und daher folgt mit (24.38), (24.39), und (24.40) l l l αm+1 ψ lj,m+1 | H ψi,m+1 = ψ lj,m+1 | H J+ ψi,m l l l l l , = J− ψ j,m+1 | H ψi,m = αm+1 ψ j,m | H ψi,m
(24.40)
C
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem
329
Also l l ψ lj,m+1 | H ψi,m+1 = ψ lj,m | H ψi,m ,
(24.41)
d. h. die Matrixelemente sind unabhängig von m. Damit haben wir den folgenden Spezialfall des sogenannten W IGNER-E CKART-Theorems bewiesen, das Rechnungen stark vereinfacht. Satz 24.7 Sei SO(3) eine Symmetriegruppe des H AMILTONoperators H auf einem H ILBERTraum H, und sei {ψ lj,m | −l ≤ m ≤ l,
1 ≤ j ≤ kl ,
l = 0, 1, . . .}
ein kanonisches Basissystem von H bezüglich SO(3). Dann gilt für die Matrixelemente von H k ψ lj,m | H ψi,n = λli j δkl δmn ,
(24.42)
wobei λli j das sogenannte reduzierte Matrixelement ist. Diese Vereinfachung wollen wir jetzt benutzen, um für den gestörten H AMILTONoperator H = H + V
auf H = L 2 (R6 ) = L 2 (R3 ) ⊗ L 2 (R3 )
(24.43)
die Matrixelemente ψml11 ψml22 | H ψnl11 ψnl22
(24.44)
bezüglich der Tensorproduktbasis des invarianten Teilraumes Wλ zu bestimmen, auf dem SO(3) durch Sl1 ,l2 ∼ Fl1 ⊗ Fl2 dargestellt wird. Diese Bestimmung ist wichtig, denn die Tensorproduktbasis (24.29) steht wirklich zur Verfügung. Andererseits ist jedoch die Berechnung der Matrixelemente l ϕm | H ϕnk
bezüglich der kanonischen Basis (24.30) von Wλ besonders einfach, denn nach Satz 24.7 gilt l ϕm | H ϕnk = λl δkl δmn ,
(24.45)
wobei die Zahl λl nur vom Gewicht l abhängt und gerade der Eigenwert von H ist, der zu dem Eigenraum l Wλl = LH({ϕm | −l ≤ m ≤ l})
gehört.
330
24 Einige Anwendungen
Nun folgt aber aus (24.31) in Definition 24.6 ψml11 ψml22 | H ψnl11 ψnl22 = = C(l1 , m 1 ; l2 , m 2 | l, m) · C(l1 , n 1 ; l2 , n 2 | k, n) l,m k,n
(24.46)
l | H ϕk . · ϕm n
Kombinieren wir dieses Ergebnis mit (24.45), so erhalten wir: Satz 24.8 Sei {ψml | −l ≤ m ≤ l} eine kanonische Basis eines SO(3)-irreduziblen Teilraumes von L 2 (R3 ) vom Gewicht l. Hat dann ein H AMILTONoperator H auf L 2 (R3 ) ⊗ L 2 (R3 ) die Gruppe SO(3) als Symmetriegruppe, so gilt für die Matrixelemente bezüglich der Tensorproduktbasis ψml11 ψml22 | H ψnl11 ψnl22 = =
l1 +l2
l
l=|l1 −l2 | m=−l
C(l1 , m 1 ; l2 , m 2 | l, m)C(l1 , n 1 ; l2 , n 2 | l, m)λl .
(24.47)
D Axialsymmetrische Störungen eines kugelsymmetrischen Potentials Wir wollen nun als weitere Anwendung ein einfaches Störungsproblem untersuchen. Wir betrachten ein Ein-Teilchen-System mit dem H AMILTONoperator H0 = −
1 Δ + V (x) 2m
(24.48)
auf H = L 2 (R3 ). Das Potential V (x) sei invariant unter SO(3), also V (Rx) = V (x)
für R ∈ SO(3),
(24.49)
was bei einem kugelsymmetrischen Potential V (x) = V (|x|) der Fall ist. Wir wissen, dass dann SO(3) eine Symmetriegruppe von H0 ist, d. h. für die Darstellung [T (R)ψ] (x) := ψ(R −1 x),
R ∈ SO(3)
(24.50)
von SO(3) auf H gilt T (R)H0 = H0 T (R)
auf D(H0 )
(24.51)
D
Axialsymmetrische Störungen eines kugelsymmetrischen Potentials
331
für alle R ∈ SO(3). Nach Satz 20.17 ist dann jeder Eigenraum Wλ0 von H0 invariant unter T und zerfällt daher in eine direkte Summe von irreduziblen Teilräumen. Wir wollen im folgenden annehmen, dass Wλ0 bereits irreduzibel ist, so dass T W 0 ∼ Fl , λ
(24.52)
also äquivalent zu der irreduziblen SO(3)-Darstellung vom Gewicht l ist. Nach Satz 23.2 ist der Charakter dieser Darstellung gegeben durch ψl (R) =
sin(l + 12 )α , sin α2
(24.53)
wenn R ∈ SO(3) eine Drehung mit dem Drehwinkel α ist. Nun stören wir den kugelsymmetrischen H AMILTONoperator H0 durch ein Potential V1 (x): H = H0 + V1 ,
(24.54)
wobei wir annehmen, dass V1 nur noch zylindersymmetrisch, z. B. bezüglich der z-Achse, ist. Die Symmetriegruppe von V1 und damit von H ist dann die Gruppe ⎧⎛ ⎫ ⎞ ⎨ cos β sin β 0 ⎬ G = ⎝− sin β cos β 0⎠ | 0 ≤ β ≤ 2π ∼ = SO(2), ⎩ ⎭ 0 0 1
(24.55)
also eine echte Untergruppe G von SO(3), die isomorph zu SO(2) ist. Schränken wir die irreduzible Darstellung Fl von SO(3) auf die Untergruppe G ein, so ist dies i. A. keine irreduzible Darstellung von G, sondern zerfällt in eine direkte Summe von irreduziblen SO(2)-Darstellungen Dm . Die irreduziblen Darstellungen von SO(2) ∼ = U(1) sind uns aus Beispiel 21.19 bekannt. Es handelt sich um die eindimensionalen Darstellungen Dm (R3 (α)) = eimα
mit m ∈ Z.
(24.56)
Wir haben damit eine direkte Zerlegung der Form 2l+1 ? Fl G = Dm j ,
Wλ0 =
j=1 2l+1 ? j=1
wobei Vm j Trägerraum von Dm j ist.
(24.57) Vm j ,
dim Vm j = 1,
332
24 Einige Anwendungen
Um festzustellen, welche m j in (24.57) vorkommen, vergleichen wir die Charaktere. Es ist χm j (R3 (α)) = eim j α ,
(24.58)
und daraus folgt dann mit (24.53) und (24.57) nach Satz 20.8 2l+1 sin(l + 12 )α = eim j α . α sin 2 j=1
Mit der Summenformel für die endliche geometrische Reihe bestätigt man aber sofort die folgende elementare Beziehung: l
eimα =
m=−l
sin(l + 12 )α , sin α2
und da die linke Seite die F OURIER-Entwicklung der rechten Seite ist, sind die vorkommenden Werte m j = j hierbei auch eindeutig bestimmt. Damit sind die Darstellungen Dm j eindeutig festgelegt, und die Zerlegung lautet: l Fl G = Dm .
(24.59)
m=−l
Somit haben wir folgendes Ergebnis: Die axialsymmetrische Störung V1 des kugelsymmetrischen H AMILTONoperators H0 spaltet einen (2l +1)-fach entarteten Eigenwert λ von H0 in 2l +1 Eigenwerte von H = H0 +V1 auf.
Im Allgemeinen werden dies einfache Eigenwerte von H1 sein. Der analoge Effekt der Aufspaltung der Energieniveaus, der sich im Falle eines äußeren Magnetfelds ergibt, ist als Z EEMAN-Effekt bekannt.
Aufgaben zu Kap. 24 24.1 Sei E3 die Gruppe der euklidischen Bewegungen von R3 wie in Aufgabe 19.16, und sei (P1 , P2 , P3 , L 1 , L 2 , L 3 ) die dort angegebene Basis ihrer L IE-Algebra. Auf dem Vektorraum V := C ∞ (R3 ) haben wir zu jedem Element Q ∈ L(E3 ) den linearen Operator D(Q) mit d f (x · exp(t Q)) [D(Q) f ](x) := , dt t=0
Aufgaben
333
wobei die Rechtsoperation x · (A, v) := A−1 (x − v) von E3 = SO(3) × R3 zu Grunde gelegt ist. a. Man bestimme die Differentialoperatoren D(P j ) und D(L j ) für j = 1, 2, 3. b. Man weise nach, dass D eine Darstellung der L IE-Algebra L(E3 ) ist. c. Man beweise, dass die Operatoren D(P j ) , D(L j ) mit dem L APLACE-Operator vertauschen und folgere, dass W := { f ∈ C ∞ (R3 ) | Δf = 0} ein D-invarianter Teilraum ist. d. Sei m ∈ N fest und Vm ⊆ C ∞ (R3 ) der Teilraum der Polynome in drei Variablen, deren Grad nicht größer als m ist. Man gebe eine Darstellung von E3 auf Vm an, deren Linearisierung mit D übereinstimmt. 24.2 Es sei G = SO(3), und S = S2 sei die Einheitssphäre im dreidimensionalen Raum. Zu gegebenem m ∈ Z bilden wir den Raum Hm := { f ∈ L 2 (G) | f (R3 (α)A) = eimα f (A) für alle A ∈ G, α ∈ R}. Man zeige: a. Hm ist ein abgeschlossener Teilraum von L 2 (G), der unter der rechtsregulären Darstellung (21.37) von G invariant ist. b. Sind f, g ∈ Hm , so ist durch h(Ae3 ) := f (A)g(A) eine Funktion h auf S wohldefiniert, und es gilt 1 f | g = 4π
hdσ, S
wobei dσ = ω S das euklidische Oberflächenelement bezeichnet. c. Ist l ≥ |m|, so definiert Z lm (A) := Ylm (Ae3 ) eine Funktion aus Hm . Der Raum Hm hat also unendliche Dimension. Bemerkung Die Darstellung, die durch Einschränken der rechtsregulären Darstellung auf Hm entsteht, ist induziert von der eindimensionalen Darstellung #m (R3 (α))z = eimα z ,
z∈C
334
24 Einige Anwendungen
der zu U(1) isomorphen Untergruppe (24.55). Vgl. auch die Aufgaben 20.14 und 20.15. 24.3 Wir übernehmen die Bezeichnungen aus den Aufgaben 23.2 und 23.3, ferner die aus Abschn. A Betrachte ein festes l ∈ N0 . a. Man zeige: Die Einschränkung von homogenen Polynomen auf die Einheitssphäre, also die Abbildung ρ : W3,l −→ C(S) , f −→ f S , ist eine injektive lineare Abbildung, die mit den gegebenen Darstellungen D und T von G = SO(3) verträglich ist, d. h. es gilt: ρ ◦ D(R) = T (R) ◦ ρ
∀ R ∈ G.
(Hinweis: Man beachte R −1 = R T .) b. Für D := D∗ berechne man die Differentialoperatoren J1 , J2 , J3 , J+ , J− . c. Für das Polynom v(x1 , x2 , x3 ) := (x1 + ix2 )l (das zu V3,l gehört, wie wir aus Aufgabe 23.3 wissen!) weise man nach, dass J3 v = lv
und
J+ v = 0.
j
d. Definiere ηl, j := J− v für j = 0, 1, . . . , 2l. Man zeige, dass stets ηl, j ∈ V3,l ist. (Hinweis: Man muss nicht rechnen. Der Raum V3,l ist ja D∗ -invariant (wieso?).) e. Man folgere: für 0 ≤ j ≤ 2l ist ηl, j S proportional zur Kugelflächenfunktion l− j
Yl . (Hinweis: Man beachte, dass die kanonische Basis bis auf einen Proportionalitätsfaktor eindeutig bestimmt ist.)
Literaturverzeichnis
1. N.I. Achieser, I.M. Glasmann, Theorie der linearen Operatoren im Hilbert-Raum (Deutsch, Frankfurt a. M., 1977) 2. J.F. Adams, Lectures on Lie-Groups (W. A. Benjamin, New York, NY, 1969) 3. H.W. Alt, Lineare Funktionalanalysis: Eine anwendungsorientierte Einführung, 5. Auflg. (Springer, Berlin, 2006) 4. W.O. Amrein, Non-relativistic Quantum Dynamics (Reidel, Dordrecht, 1981) 5. A.O. Barut, R. Raczka, Theory of Group Representations and Applications, 2. Auflg. (World Scientific Publishing, Singapore, 1986) 6. H. Bauer, Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie, 3. Auflg. (de Gruyter, Berlin, 1978) 7. F.A. Berezin, M.A. Shubin, The Schrödinger Equation (Kluwer, Dordrecht, 1991) 8. R. Berndt, Representations of Linear Groups – An Introduction Based on Examples from Physics and Number Theory (Vieweg, Wiesbaden, 2007) 9. M.Sh. Birman, M.Z. Solomjak, Spectral Theory of Self-Adjoint Operators in Hilbert Space (Springer, Berlin, 1987) 10. N.N. Bogoliubov, A.A. Logunov, I.T. Todorov, Introduction to Axiomatic Quantum Field Theory (W. A. Benjamin, Reading, MA, 1975) 11. O. Bratteli, D.W. Robinson, Operator Algebras and Quantum Statistical Mechanics I, II, 2. Auflg. (Springer, New York, NY, 1987/1996) 12. Th. Bröcker, T. tom Dieck, Representations of Compact Lie Groups (Springer, New York, NY, 2003) 13. M. Carmeli, Representations of the Rotation and Lorentz Groups: An Introduction (Dekker, New York, NY, 1976) 14. M. Carmeli, Group Theory and General Relativity (McGraw-Hill, New York, NY, 1977) 15. P. Carruthers, Unitary Symmetry of Strong Interactions (Wiley, New York, NY, 1966) 16. R. Carter, G. Segal, I. MacDonald, Lectures on Lie Groups and Lie Algebras (Cambridge University Press, Cambridge, 1995) 17. J.B. Conway, A Course in Functional Analysis (Springer, New York, NY, 1985) 18. J.F. Cornwell, Group Theory and Physics I, II, III (Academic Press, New York, NY, 1984) 19. J.F. Cornwell, Group Theory in Physics – An Introduction (Academic Press, Cambridge, 1997) 20. M.L. Curtis, Matrix Groups (Springer, New York, NY, 1979) 21. H.L. Cycon, R.E. Froese, W. Kirsch, B. Simon, Schrödinger Operators – With Applications to Quantum Mechanics and Global Geometry (Springer, New York, NY, 1987) 22. B.A. Dubrovin, A.T. Fomenko, S.P. Novikov, Modern Geometry – Methods and Applications I, II, III (Springer, New York, NY, 1984) 23. N. Dunford, J. Schwartz, Linear Operators I (Interscience, New York, NY, 1958) 24. N. Dunford, J. Schwartz, Linear Operators II (Interscience, New York, NY, 1969) 25. J.P. Elliott, P.G. Dawber, Symmetry in Physics I, II (Oxford University Press, Oxford, 1972) K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2, C Springer-Verlag Berlin Heidelberg 2010
335
336
Literaturverzeichnis
26. G.G. Emch, Algebraic Methods in Statistical Mechanics and Quantum Field Theory (Wiley, New York, NY, 1972) 27. G.G. Emch, C. Liu, The Logic of Thermostatistical Physics (Springer, Berlin, Heidelberg, 2002) 28. Th. Frankel, The Geometry of Physics, 2.Auflg. (Cambridge University Press, Cambridge, 2004) 29. W. Fulton, J. Harris, Representation Theory. A First Course (Springer, New York, NY, 2004) 30. I.M. Gelfand, R.A. Minlos, Z.Y. Shapiro, Representations of the Rotation and Lorentz Groups and their Applications (Pergamon Press, New York, NY, 1963) 31. I.M. Gelfand, N.Ya. Vilenkin, Generalized Functions, vol. IV (Academic Press, New York, NY, 1964) 32. J. Glimm, A. Jaffe, Quantum Physics: A Functional Integral Point of View (Springer, New York, NY, 1987) 33. M. Göckeler, T. Schücker, Differential Geometry, Gauge Theories and Gravity (Cambridge University Press, Cambridge, 1997) 34. K.-H. Goldhorn, H.-P. Heinz, Mathematik für Physiker I, II, III (Springer, Berlin, 2007/2008) 35. S.J. Gustafson, I.M. Sigal, Mathematical Concepts of Quantum Mechanics (Springer, Berlin, 2003) 36. R. Haag, Local Quantum Physics: Fields, Particles, Algebras (Springer, Berlin, 1996) 37. W. Hein, Einführung in die Struktur- und Darstellungstheorie der klassischen Gruppen (Springer, Berlin, 1990) 38. E. Hewitt, K.A. Ross, Abstract Harmonic Analysis I, II (Springer, Berlin, 1963) 39. J. Hilgert, K.H. Neeb, Lie-Gruppen und Lie-Algebren (Vieweg, Braunschweig, 1991) 40. F. Hirzebruch, W. Scharlau, Einführung in die Funktionalanalysis (BI, Mannheim, 1971) 41. P. Hislop, I.M. Sigal, Introduction to Spectral Theory. With Applications to Schrödinger Operators (Springer, New York, NY, 1996) 42. W.Y. Hsiang, Lectures on Lie Groups (World Scientific Publishing, Singapore, 2000) 43. Jing-Song Huang, Lectures on Representation Theory (World Scientific Publishing, Singapore, 1999) 44. W. Jantscher, Hilberträume (Akadem. Verlagsges., Wiesbaden, 1977) 45. J.M. Jauch, Foundations of Quantum Mechanics (Addison-Wesley, Redding, MA, 1968) 46. R.V. Kadison, J.R. Ringrose, Fundamentals of the Theory of Operator Algebras I–IV (Academic Press, New York, NY, 1983–1992) 47. T. Kato, Perturbation Theory for Linear Operators (Springer, Berlin, 1988) 48. Y.S. Kim, M.E. Noz, Theory and Application of the Poincaré Group (Reidel, Dordrecht, 1986) 49. S. Kobayashi, K. Nomizu, Foundations of Differential Geometry I, II (Wiley, New York, NY, 1963/1969) 50. E. Kreyszig, Introductory Functional Analysis with Applications (Wiley, New York, NY, 1978) 51. J.M. Lee, Introduction to Smooth Manifolds (Springer, New York, NY, 2006) 52. E.H. Lieb, M. Loss, Analysis (Amer. Math. Soc., Providence, RI, 1997) 53. W. Ludwig, C. Falter, Symmetries in Physics (Springer, Berlin, 1998) 54. G.W. Mackey, Mathematical Foundations of Quantum Mechanics (W. A. Benjamin, New York, NY, 1963) 55. G.W. Mackey, Induced Representations of Groups in Quantum Mechanics (W. A. Benjamin, New York, NY, 1968) 56. G.W. Mackey, The Theory of Unitary Group Representations (University of Chicago Press, Chicago, IL, 1976) 57. R. Meise, D. Vogt, Einführung in die Funktionalanalysis (Vieweg, Braunschweig, 1992) 58. W. Miller, Symmetry Groups and their Applications (Academic Press, New York, NY, 1973) 59. G.L. Naber, Topology, Geometry, and Gauge Fields I: Foundations (Springer, New York, NY, 1997) 60. G.L. Naber, Topology, Geometry, and Gauge Fields II: Interactions (Springer, New York, NY, 2000) 61. M.A. Naimark, A.I. Stern, Theory of Group Representations (Springer, New York, NY, 1982)
Literaturverzeichnis
337
62. M. Nakahara, Geometry, Topology and Physics, 2. Auflg. (Taylor & Francis, Boca Raton, FL, 2003) 63. P.J. Olver, Applications of Lie Groups to Differential Equations (Springer, New York, NY, 1986) 64. E. Prugoveˇcki, Quantum Mechanics in Hilbert Space (Academic Press, New York, NY, 1971) 65. J. Rauch, Partial Differential Equations (Springer, New York, NY, 1991) 66. M. Reed, B. Simon, Methods of Modern Mathematical Physics II: Fourier Analysis. SelfAdjointness (Academic Press, London, 1975) 67. M. Reed, B. Simon, Methods of Modern Mathematical Physics IV: Analysis of Operators (Academic Press, London, 1978) 68. M. Reed, B. Simon, Methods of Modern Mathematical Physics III: Scattering Theory (Academic Press, London, 1979) 69. M. Reed, B. Simon, Methods of Modern Mathematical Physics I: Functional Analysis, 2. Auflg. (Academic Press, London, 1980) 70. F. Riesz, B. Sz.-Nagy, Vorlesungen über Funktionalanalysis, 4. Auflg. (Deutsch, Thun, 1982) 71. W. Rossmann, Lie Groups – An Introduction through Linear Groups (Oxford University Press, Oxford, 2002) 72. W. Rudin, Reelle und komplexe Analysis (Oldenbourgh, München, 1999) 73. W. Rudin, Functional Analysis (Tata-McGraw Hill, New Delhi, 1979) 74. A.A. Sagle, R.E. Walde, Introduction to Lie Groups and Lie Algebras (Academic Press, New York, NY, 1973) 75. D.H. Sattinger, O.L. Weaver, Lie Groups and Algebras with Applications to Physics, Geometry, and Mechanics (Springer, New York, NY, 1986) 76. M. Schechter, Operator Methods in Quantum Mechanics (North Holland, New York, NY, 1981) 77. B.F. Schutz, Geometrical Methods of Mathematical Physics (Cambridge University Press, Cambridge, 1980) 78. G.L. Sewell, Quantum Theory of Collective Phenomena (Clarendon Press, Oxford, 1986) 79. G.L. Sewell, Quantum Mechanics and Its Emergent Macrophysics (Princeton University Press, Princeton, NJ, 2002) 80. R.U. Sexl, H.K. Urbantke, Relativität, Teilchen, Gruppen (Springer, New York, NY, 1975) 81. B. Simon, Bull. Amer. Math. Soc. 7, 447 (1982) 82. B. Simon, Representations of Finite and Compact Groups (Amer. Math. Soc., Providence, RI, 1996) 83. E. Stiefel, A. Fässler, Gruppentheoretische Methoden und ihre Anwendungen (Teubner, Stuttgart, 1979) 84. R.F. Streater, A.S. Wightman, PCT, Spin, Statistics and All That (W. A. Benjamin, New York, NY, 1974) 85. A.S. Svarc, Topology for Physicists (Springer, Berlin, Heidelberg, 1994) 86. K. Tapp, Matrix Groups for Undergraduates (Amer. Math. Soc., Providence, RI, 2005) 87. B. Thaller, The Dirac Equation (Springer, New York, NY, 1992) 88. W. Thirring, Lehrbuch der mathematischen Physik I–IV (Springer, Wien, 1979) 89. V.S. Varadarajan, Geometry of Quantum Theory, 2. Auflg. (Springer, New York, NY, 1985) 90. J. von Neumann, Mathematical Foundations of Quantum Mechanics, 12. Auflg. (Princeton University Press, Princeton, NJ, 1996) 91. J. Weidmann, Linear Operators in Hilbert Spaces (Springer, New York, NY, 1980) 92. D. Werner, Funktionalanalysis, 6. Auflg. (Springer, Berlin, 2007) 93. E. Wigner, Gruppentheorie und ihre Anwendung auf die Quantenmechanik der Atomspektren (Vieweg, Braunschweig, 1977) 94. W.K. Tung, Group Theory in Physics (World Scientific Publishing, Singapore, 1985) 95. K. Yosida, Functional Analysis (Springer, Berlin, 1965) 96. D.P. Zelobenko, Compact Lie Groups and Their Representations (Amer. Math. Soc. Transl., Providence, RI, 1973)
Sachverzeichnis
A abelsche Gruppe, 118 abgeschlossener Operator, 4 abschließbar, 6 Abschluss (eines linearen Operators), 6 adjungierte Darstellung, 203, 211, 278 adjungierter Operator, 18 Algebrenhomomorphismus, 56 allgemeine L ORENTZgruppe, 149 Assoziativgesetz, 54, 118 Ausreduzieren, 307 Automorphismengruppe, 119 Automorphismus, 142 B Bahn, 145 BAKER-C AMPBELL-H AUSDORFF-Formel, 274 BANACHalgebra, 54 mit Eins, 54 Bikommutant, 89 Bikommutantensatz, 89 C C ∗ -Algebra, 54 C ASIMIR-Operator, 273, 308 C AYLEY-Transformierte, 27 Charakter, 212 C LEBSCH -G ORDAN-Zerlegung, 261 C ONDON -S HORTLEY-Konvention, 326 D Darstellung, 56, 107, 136, 207, 208 ∗-, 56 adjungierte, 211, 278 einer L IE-Algebra, 272 induzierte, 226, 231 irreduzible, 215 linksreguläre, 251
lokale, 281 natürliche, 209 rechtsreguläre, 251 reduzible, 215 stetige, 239 triviale, 209 unitäre, 212 vollreduzible, 216 Darstellungen äquivalente, 212, 273 Darstellungsmodul, 208 Defektindizes, 27 Defekträume, 27 dicht definiert, 7 Dichtematrix, 64 Diedergruppe, 127 Differentialoperator formal selbstadjungierter, 26 D IRACgleichung, 16 direkte Summe (von Darstellungen), 214 direktes Produkt, 141 E Eichtransformationen, 139 Eigenfunktionen verallgemeinerte, 94 eigentliche L ORENTZ-Gruppe, 151 eigentliche orthochrone L ORENTZ-Gruppe, 151 Ein-Parameter-Untergruppe, 184, 188 einfach-zusammenhängend, 287 Einschränkung, 72 Einselement, 54 endliche Gruppe, 118 Entartung, 87 Epimorphismus (von Gruppen), 124 erste Resolventengleichung, 14 Erweiterung, 6
339
340 F formal adjungiert, 23 formal selbstadjungiert, 26 Funktionalkalkül, 67 messbarer, 77 stetiger, 70 G Generator infinitesimaler, 97 Generatoren infinitesimale, 195, 197, 198 Generatoren (der L ORENTZgruppe), 155 Gewicht (einer Darstellung von SU(2)), 294 Gitter, 141 G-Modul, 219 G-Morphismus, 219 Graph eines linearen Operators, 4 Graphennorm, 3 Gruppe, 118 abelsche, 118 endliche, 118 orthogonale, 121 spezielle orthogonale, 122 symplektische, 122 unimodulare, 237 unitäre, 122 Gruppenalgebra, 227 Gruppenhomomorphismus, 124 lokaler, 280 H H AAR-Integral linkes, 232 normiertes, 236 rechtes, 232 H AARsches Maß, 232 H AMILTONoperator Symmetriegruppe des, 220 harmonische Analyse, 259 H EISENBERGgruppe, 263 H ILBERTsche Summe, 43 homogener Raum, 317 I immersierte L IE-Gruppen, 193 Index (einer Untergruppe), 143 induzierte Darstellung, 226, 231 infinitesimale Generatoren, 195, 197, 198 infinitesimaler Generator, 97 innerer Automorphismus, 125 invariant, 134 unter einer Darstellung, 215
Sachverzeichnis invariante Teilräume, 72 invers-invariant, 232 Inverses Element, 118 Inversion, 231 Involution, 54 irreduzibel, 215 irreduzible Darstellung einer L IE-Algebra, 272 Isomorphismus von L IE-Algebren, 194 von Gruppen, 124 isotypisch, 309 K kanonische Basis, 306, 309, 310 Klassenfunktion, 268 Klassenzahl, 269 Kommutant, 89 kommutativ, 54 Kommutativgesetz, 118 Kommutatorprodukt, 182 komplexes Maß, 44 Komplexifizierung, 313 kongruent, 126 konjugierte Gruppenelemente, 145 konjugierte Quaternion, 170 Konjugiertenklasse, 145 kristallographische Punktgruppe, 171 Kugelflächenfunktion, 322 L L IE-Algebra, 182 einer linearen L IE-Gruppe, 183 L IE-Algebren-Homomorphismus, 194 L IE-Gruppe lokale, 174 L IE-Gruppe allgemeine, 180 lineare, 177 L IE-Teilalgebra, 183 L IE-Untergruppe, 193 lineare L IE-Gruppe, 177 Linearisierung, 277, 283 linkes H AAR-Integral, 232 Links-Aktion, 129 Links-Nebenklasse, 143 linksinvariant, 232 Linksoperation, 129 linksreguläre Darstellung, 251 Linkstranslation, 231 Logarithmus (einer Matrix), 177 lokale Darstellung, 281 lokaler Gruppenhomomorphismus, 280 L ORENTZ-Gruppe eigentliche, 151
Sachverzeichnis eigentliche orthochrone, 151 orthochore, 151 orthochrone, 151 L ORENTZgruppe allgemeine, 149 L ORENTZtransformation, 149 orthochrone, 150 M Matrixdarstellung, 209 einer L IE-Algebra, 272 triviale, 209 Matrixelement reduziertes, 329 Matrixelemente, 45, 84, 327 messbarer Funktionalkalkül, 77 messbarer Raum, 42 Modularfunktion, 237 Monomorphismus (von Gruppen), 124 Multiplikation, 53 Multiplizität, 87 μ-summierbar (bzgl. eines komplexen Maßes), 44
341 P PAULIsche Spinmatrizen, 160 Permutationen, 119 P OINCARÉgruppe, 202 Polarisationsgleichung, 45 Polarzerlegung, 109 positiv semidefinit, 74, 111 Produkt direktes, 141 Q quadratische Form, 45 Quaternionen, 166 rein-imaginäre, 170
N natürliche Darstellung, 209 Neutrales Element, 118 normierte Algebra, 54 mit Eins, 54
R Raumspiegelung, 151 Realisierung, 8 maximale, 9 minimale, 9 Realteil (einer Quaternion), 170 rechtes H AAR-Integral, 232 rechts-invariant, 232 Rechts-Nebenklasse, 143 rechtsreguläre Darstellung, 251 Rechtstranslation, 231 reduzibel, 215 reduziertes Matrixelement, 329 Resolventengleichung erste, 14
O Operator H ERMITEscher, 25 abgeschlossener, 4 abschließbarer, 6 adjungierter, 18 positiver, 74, 111 selbstadjungierter, 25 symmetrischer, 25 wesentlich selbstadjungierter, 25 Operatorkonvergenz starke, 81 Orbit, 145 Ordnung einer Gruppe, 118 eines Gruppenelements, 142 Ordnungsrelation, 63 orthochore L ORENTZ-Gruppe, 151 orthochrone L ORENTZ-Gruppe, 151 orthogonale direkte Summe, 43 orthogonale Gruppe der Signatur ( p, q), 121 Ortsoperator, 8
S Satz vom abgeschlossenen Graphen, 5 Satz von C AYLEY-H AMILTON, 108 Satz von S TONE, 101 Satz von S TONE –W EIERSTRASS, 260 schiefadjungierte Darstellung einer L IE-Algebra, 272 Schiefkörper, 166 schwache Stetigkeit, 101 selbstadjungiert, 25, 56 selbstadjungierte Darstellung einer L IE-Algebra, 272 S OBOLEWraum, 10 Spektraldarstellung, 87 Spektraler Abbildungssatz, 73 Spektralintegral, 50, 59 Spektralmaß, 39 Spektralmaß, 42 Spektralräume, 80 Spektralsatz, 76, 89 Spektralschar, 52, 95 spezielle orthogonale Gruppe der Signatur ( p, q), 122
342 spezielle unitäre Gruppe der Signatur ( p, q), 122 Stabilisator, 146, 317 Standarddarstellung, 209 starke Operatorkonvergenz, 81 stetiger Funktionalkalkül, 70 S TONE –W EIERSTRASS Satz von, 260 S TONEsche Formel, 112 Strukturkonstanten, 194 Symmetriegruppe, 126, 130 Symmetriegruppe des H AMILTONoperators, 220 symmetrische Gruppe, 119 symplektische Gruppe, 122 System von Imprimitivitäten, 227 T Teilalgebra, 56 Teilraum T -invarianter, 51 irreduzibler, 215 reduzibler, 215 Tensoroperator, 211, 292 Tensorprodukt von Darstellungen, 214, 242 Torus, 200 Totalspiegelung, 151 Träger eines Spektralmaßes, 78 Trägerraum, 208 Transformationen G-orthogonale, 121 G-unitäre, 121 transitiv, 146 Transposition, 138 triviale Darstellung, 209 triviale Matrixdarstellung, 209 T ROTTERsche Produktformel, 276
Sachverzeichnis U Überlagerung, 271, 287 Überlagerungsabbildungen, 165 unimodular, 237 unitäre Darstellung, 212 unitäre Gruppe, 120 unitäre Gruppe der Signatur ( p, q), 122 unitäre Transformationsgruppe, 97 universelle Überlagerung, 165, 290 Untergruppe, 118 V Vektorteil (einer Quaternion), 170 Vektorzustand, 64 verallgemeinerte Eigenfunktionen, 94 Verknüpfung, 118 vertauschbar, 94 Vertauschbarkeit, 51 Vertauschungsrelationen, 196 Vielfachheit, 87 vollreduzibel, 216 vollreduzible Darstellung einer L IE-Algebra, 272 W wesentlich selbstadjungiert, 25 W EYL-Operator, 244 W EYL-Relationen, 106 W IGNER-E CKART-Theorem, 329 Z Zeitspiegelung, 151 Zentrum, 142 zusammenhängend, 148 Zusammenhangskomponente, 148 der Eins, 189 Zusammenhangskomponenten der L ORENTZgruppe, 151 Zustand, 64 zyklischer Vektor, 225