A mia figlia Bianca, perch´e un giorno ne possa scrivere uno migliore se, come suo padre, sar`a affascinata dalla musica e dall’armonia del linguaggio con cui ci appare scritto l’universo Fisico: la Matematica.
Valter Moretti
IZdg^V HeZiigVaZ Z BZXXVc^XV FjVci^hi^XV DeZgVidg^ ^c heVo^ Y^ =^aWZgi
Valter Moretti Dipartimento di Matematica Università di Trento
ISBN 978-88-470-1610-1 DOI 10.1007/978-88-470-1611-8
e-ISBN 978-88-470-1611-8
© Springer-Verlag Italia 2010 Quest’opera è protetta dalla legge sul diritto d’autore e la sua riproduzione è ammessa solo ed esclusivamente nei limiti stabiliti dalla stessa. Le fotocopie per uso personale possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto dall’art. 68. Le riproduzioni per uso non personale e/o oltre il limite del 15% potranno avvenire solo a seguito di specifica autorizzazione rilasciata da AIDRO, Corso di Porta Romana n. 108, Milano 20122, e-mail
[email protected] e sito web www.aidro.org. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all’utilizzo di illustrazioni e tabelle, alla citazione orale, alla trasmissione radiofonica o televisiva, alla registrazione su microfilm o in database, o alla riproduzione in qualsiasi altra forma (stampata o elettronica) rimangono riservati anche nel caso di utilizzo parziale. La violazione delle norme comporta le sanzioni previste dalla legge. L’utilizzo in questa publicazione di denominazioni generiche, nomi commerciali, marchi registrati, ecc. anche se non specificatamente identificati, non implica che tali denominazioni o marchi non siano protetti dalle relative leggi e regolamenti.
AVndji XdeZgi^cV/ Beatrice %. (Milano) Impaginazione: PTP-Berlin, Protago TEX-Production GmbH, Germany (www.ptp-berlin.eu) Stampa: Signum, Bollate (MI) HiVbeVid ^c >iVa^V Springer-Verlag Italia S.r.l., Via Decembrio 28, I-20137 Milano Springer-Verlag fa parte di Springer Science+Business Media (www.springer.com)
Prefazione
Dovevo avere otto o nove anni e mio padre, di formazione letteraria, ma interdisciplinarmente colto e curioso, mi raccont`o: “Un grandissimo scienziato, Albert Einstein, ha scoperto che non `e possibile viaggiare pi` u velocemente della luce”. Io rimasi incredulo e cercai di controbattere: “Ma no, non `e vero, se corro alla velocit`a della luce e poi accelero un po’, la velocit`a della luce la supero sicurmente, no?” Ma mio padre fu irremovibile: “No, `e impossibile, `e un fatto noto della fisica”. Dopo un po’ aggiunsi:“Quel signore, Einstein, ha fatto tante prove . . . come si dice, tanti esperimenti?” Ma la risposta che mi arriv` o fu del tutto inattesa: “No, nemmeno uno, ha usato la matematica!” Cosa c’entravano i numeri e le figure geometriche con l’impossibilit`a di superare la velocit`a della luce? Come si poteva sostenere una cosa tanto apparentemente assurda, ma vera (mi fidavo di quanto mi raccontava mio padre) come l’esistenza di una velocit`a limite usando solo la matematica? Come poteva la matematica avere tanto potere sul mondo materiale? E poi la fisica? Che roba era e che relazione aveva con la matematica? Era una delle cose pi` u incredibilmente intriganti che avessi mai ascoltato fino a quel momento . . . dovevo saperne di pi` u. Una parte di questo libro `e stata in realt`a scritta, in forma preliminare, quando ero studente del corso di laurea in Fisica all’Universit` a degli Studi di Genova. Il corso obbligatorio di Istituzioni di Fisica Teorica, al terzo anno, era il secondo scoglio quasi insormontabile per molti studenti (il primo era il famigerato corso di Fisica II che includeva la termodinamica insieme all’elettrodinamica classica). La Meccanica Quantistica, insegnata in quel corso, necessitava un modo di pensare nuovo e difficile e lo sforzo era davvero notevole per noi volenterosi studenti: ci si muoveva per molti mesi in un contesto nebbioso ed insicuro, senza capire cosa fosse davvero importante nelle nozioni fisiche che – con molta difficolt`a – cercavamo di imparare insieme ad un formalismo del tutto nuovo: quello della teoria degli operatori lineari su spazi di Hilbert. In realt` a, all’epoca, non comprendevamo ancora che stavamo lavorando con tale teoria matematica, e per molti dei miei colleghi la cosa sarebbe stata, forse a ragione,
VI
Prefazione
del tutto irrilevante; i vettori bra di Dirac erano vettori bra di Dirac e basta! E non gli elementi del duale dello spazio di Hilbert. La nozione di spazio di Hilbert e di spazio duale non aveva ancora diritto di cittadinanza nella classe degli strumenti matematici della quasi totalit` a dei miei colleghi, anche se sarebbe entrata a breve dal corso di Metodi Matematici della Fisica. La matematica, la formalizzazione matematica della fisica, era sempre stato il mio cavallo di battaglia per superare tutte le difficolt`a insite nello studio della fisica, tanto che alla fine (ma dopo avere preso anche un dottorato in fisica teorica) sono istituzionalmente diventato un matematico. Armato delle mie nozioni di matematica – imparate in un percorso extracurriculare che coltivavo parallelamente agli studi di fisica da sempre – e preparandomi ad impararne nuove per l’occasione, cercai di formalizzare anche le nozioni nelle quale mi stavo imbattendo, in questo nuovo ed interessantissimo corso di fisica. In parallelo portavo avanti una analogo progetto riguardante la formalizzazione matematica della teoria della Relativit`a Generale, non sapendo ancora che lo sforzo dedicato alla Meccanica Quantistica sarebbe stato incommensurabilmente superiore. La formulazione del teorema spettrale pi` u o meno come `e presentata nel capitolo 9 di questo libro `e la stessa con la quale arrivai a sostenere l’esame del corso di Istituzioni di Fisica Teorica che fu, di conseguenza, un po’ un discorso tra sordi. Successivamente i miei interessi si spostarono verso la teoria quantistica dei campi, argomento di cui mi occupo ancora oggi, nel contesto un po’ pi` u generale della teoria quantistica dei campi su spaziotempo curvo. Tuttavia il mio interesse per la formulazione elementare della MQ non `e andato scemando negli anni e, di tanto in tanto, ho continuato ad aggiungere qualche altra parte all’opera iniziata da studente. L’occasione di insegnare queste cose in vari corsi per matematici e per fisici, nelle lauree specialistiche e nei dottorati, infliggendo ai miei poveri studenti i risultati dei miei sforzi di sintesi, si `e rivelata fondamentale per per migliorare l’opera, trascrivendo il testo in LATEX, ma anche correggendolo in vari punti, accogliendo le numerose osservazioni che mi sono giunte da varie persone. Vorrei a tal proposito ringraziare vari colleghi, diversi amici di discussione sui newsgroups: it.scienza.fisica, it.scienza.matematica e free.it.scienza.fisica e molti studenti, alcuni dei quali diventati oggi miei colleghi, che hanno contribuito a migliorare le diverse versioni preliminari di questo trattato, direttamente o indirettamente nel corso di vari anni: S. Albeverio, P. Armani, S. Bonaccorsi, G. Bramanti, A. Cassa, B. Cocciaro, M. Dalla Brida, L. Di Persio, S. Doplicher, E. Fabri, C. Fontanari, A. Franceschetti, R. Ghiloni, A. Giacomini, V. Marini, E. Pagani, E. Pelizzari, G. Tessaro, M. Toller, L. Tubaro, D. Pastorello, A. Pugliese, F. Serra Cassano, S. Zerbini, G. Ziglio. Sono debitore, per vari motivi legati anche a questo libro, al mio compianto collega Alberto Tognoli. Ringrazio in particolare R. Aramini, D. Cadamuro e C. Dappiaggi che mi hanno segnalato errori di vario genere in varie versioni del libro, dopo averlo letto accuratamente.
Prefazione
VII
Sono grato ai miei amici e collaboratori R. Brunetti, C. Dappiaggi e N. Pinamonti per varie discussioni tecniche nel corso degli anni, diversi suggerimenti su molti degli argomenti trattati e per avermi segnalato importanti riferimenti bibliografici. Infine desidero ringraziare E. Gregorio per il suo puntuale e preziosissimo aiuto tecnico con il LATEX. Sar` o grato a chiunque voglia segnalarmi le (sicuramente numerose) imprecisioni, mancanze e gli errori che quest’opera possiede ancora. Sono conscio del fatto che ci siano evidenti limitazioni nel contenuto: non sono trattati gli aspetti matematici di importantissimi argomenti di fisica, primo fra tutti la teoria della diffusione quantistica. Inoltre – per ironia della sorte, dato che la mia attivit` a di ricerca concerne le teorie relativistiche – tutta la trattazione si sviluppa ad un livello non relativistico e la trattazione quantistica della simmetria di Poincar´e rimane del tutto trascurata. D’altra parte alcuni argomenti chiave per la fisica, quali la nozione di simmetria (anche in relazione al problema della dinamica) oppure le propriet` a delle funzioni di operatori autoaggiunti, sono affrontati con una certa profondit` a ed ampiezza. Trento, febbraio 2010
Valter Moretti
Indice
1
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Sul libro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Scopi e struttura del libro . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Prerequisiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Convenzioni generali valide per tutto il libro . . . . . . . . . . 1.2 Sulla Meccanica Quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 La MQ come teoria matematica . . . . . . . . . . . . . . . . . . . . . 1.2.2 La MQ nel panorama della fisica attuale . . . . . . . . . . . . . .
1 1 1 3 4 5 5 7
Parte I Elementi di teoria degli operatori lineari 2
Spazi normati e spazi di Banach, esempi e applicazioni . . . . . 2.1 Richiami di topologia generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Spazi e algebre normate e di Banach . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Spazi normati e loro propriet` a topologiche elementari . . . 2.2.2 Spazi di Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Un esempio: lo spazio di Banach C(K; Kn ) e il teorema di Arzel` a-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Algebre normate, algebre di Banach ed esempi vari . . . . . 2.3 Operatori, spazi di operatori, norme di operatori . . . . . . . . . . . . . 2.4 I teoremi fondamentali negli spazi di Banach . . . . . . . . . . . . . . . . 2.4.1 Il teorema di Hahn-Banach e le sue conseguenze elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Il teorema di Banach-Steinhaus o principio della limitatezza uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Topologie deboli. Completezza ∗-debole di X . . . . . . . . . 2.4.4 Breve digressione: spazi metrici, spazi localmente convessi metrizzabili e spazi di Fr´echet . . . . . . . . . . . . . . . 2.4.5 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal teorema di Baire . . . . . . . . . . . . . . . .
13 14 17 17 22 25 29 36 45 45 49 51 56 59
X
Indice
2.4.6 Teorema del grafico chiuso . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Proiettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Norme equivalenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Il teorema del punto fisso e applicazioni . . . . . . . . . . . . . . . . . . . . . 2.7.1 Il teorema del punto fisso di Banach-Caccioppoli . . . . . . . 2.7.2 Applicazione del teorema del punto fisso: il teorema di esistenza e unicit`a locale per sistemi di equazioni differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63 65 67 70 70
75 79
3
Spazi di Hilbert e operatori limitati . . . . . . . . . . . . . . . . . . . . . . . . 87 3.1 Nozioni elementari, teorema di Riesz e riflessivit`a . . . . . . . . . . . . 88 3.1.1 Spazi con prodotto scalare e spazi di Hilbert . . . . . . . . . . 88 3.1.2 Il teorema di Riesz e le sue conseguenze . . . . . . . . . . . . . . 93 3.2 Basi hilbertiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.3 Nozione di aggiunto hermitiano e applicazioni . . . . . . . . . . . . . . . 112 3.3.1 L’operazione di coniugazione hermitiana o aggiunzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 3.3.2 ∗ -algebre e C ∗ -algebre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.4 Proiettori ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 3.6 La trasformata di Fourier-Plancherel . . . . . . . . . . . . . . . . . . . . . . . 132 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4
Propriet` a elementari degli operatori compatti, di Hilbert-Schmidt e di classe traccia . . . . . . . . . . . . . . . . . . . . . . 151 4.1 Operatori compatti in spazi normati e di Banach . . . . . . . . . . . . . 152 4.1.1 Compatti in spazi normati (infinitodimensionali) . . . . . . . 152 4.1.2 Operatori compatti in spazi normati . . . . . . . . . . . . . . . . . 154 4.2 Operatori compatti in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . 159 4.3 Operatori di Hilbert-Schmidt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 4.4 Operatori di classe traccia (o nucleari) . . . . . . . . . . . . . . . . . . . . . . 179 4.5 Introduzione alla teoria di Fredholm delle equazioni integrali . . 188 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
5
Operatori non limitati con domini densi in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 5.1 Operatori non limitati con dominio non massimale . . . . . . . . . . . 204 5.1.1 Operatori non limitati con dominio non massimale in spazi normati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 5.1.2 Operatori chiusi e chiudibili . . . . . . . . . . . . . . . . . . . . . . . . . 205
Indice
XI
5.1.3 Il caso degli spazi di Hilbert: struttura di H ⊕ H e operatore τ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 5.1.4 Propriet` a generali dell’operatore aggiunto hermitiano . . . 207 5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 5.3.1 L’operatore posizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 5.3.2 L’operatore impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 5.4 Criteri di esistenza e unicit`a per le estensioni autoaggiunte . . . . 220 5.4.1 La trasformata di Cayley e gli indici di difetto . . . . . . . . . 220 5.4.2 Il criterio di Von Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . 225 5.4.3 Il criterio di Nelson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
Parte II Teoria Spettrale e formalismo della Meccanica Quantistica 6
Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 6.1 Generalit`a sui sistemi quantistici . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 6.2 Alcune propriet` a particellari delle onde elettromagnetiche . . . . . 241 6.2.1 Effetto Fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 6.2.2 Effetto Compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 6.3 Cenni di Meccanica Ondulatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 6.3.1 Onde di de Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 6.3.2 Funzione d’onda di Schr¨ odinger e interpretazione probabilistica di Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 6.4 Principio di Indeterminazione di Heisenberg . . . . . . . . . . . . . . . . . 248 6.5 Le grandezze compatibili e incompatibili . . . . . . . . . . . . . . . . . . . . 250
7
I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 7.2 Stati classici come misure di probabilit` a sulla σ-algebra delle proposizioni elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 7.2.1 Misure di probabilit` a, misure di Borel . . . . . . . . . . . . . . . . 256 7.2.2 Stati come misure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 7.2.3 Proposizioni, insiemi e stati come misure su di esse . . . . . 259 7.2.4 Interpretazione insiemistica dei connettivi logici . . . . . . . 259 7.2.5 Proposizioni “infinite” e grandezze fisiche . . . . . . . . . . . . . 260 7.2.6 Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle proposizioni elementari . . . . . . . . . . . . . . 263
XII
Indice
7.3 Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert . . . . . 267 7.4 Le proposizioni e gli stati relativi a sistemi quantistici . . . . . . . . 276 7.4.1 Assiomi A1 e A2: proposizioni, stati di sistemi quantistici e il teorema di Gleason . . . . . . . . . . . . . . . . . . . 276 7.4.2 Stati puri, stati misti, ampiezze di transizione . . . . . . . . . 284 7.4.3 Assioma A3: stati successivi ai processi di misura e preparazione degli stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 7.4.4 Regole di superselezione e settori coerenti . . . . . . . . . . . . . 293 7.5 Le osservabili come Misure a Valori di Proiezione su R . . . . . . . . 296 7.5.1 Assioma A4: la nozione di osservabile . . . . . . . . . . . . . . . . 296 7.5.2 Operatori autoaggiunti associati a osservabili: motivazioni fisiche e esempi elementari . . . . . . . . . . . . . . . 299 7.5.3 Misure di probabilit` a associate a coppie stato osservabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 8
Teoria Spettrale I: generalit` a e operatori normali di B(H) in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 8.1 Spettro e risolvente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 8.1.1 Nozioni fondamentali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 8.1.2 Algebre di Banach: teorema di Gelfand-Mazur, raggio spettrale, formula di Gelfand . . . . . . . . . . . . . . . . . . . . . . . . 315 8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 8.3 Misure a Valori di Proiezione (PVM) . . . . . . . . . . . . . . . . . . . . . . . 331 8.3.1 Misure a Valori di Proiezione (PVM) dette anche misure spettrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 8.3.2 Integrale di funzioni misurabili limitate rispetto a una PVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 8.3.3 Propriet` a degli operatori ottenuti integrando funzioni limitate rispetto a PVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 8.4 Teorema spettrale per operatori normali in B(H) . . . . . . . . . . . . 348 8.4.1 Teorema di decomposizione spettrale per operatori limitati normali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 8.4.2 Teorema di rappresentazione spettrale per operatori normali in B(H) e teorema di Fuglede . . . . . . . . . . . . . . . . 357 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
9
Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373 9.1 Teorema spettrale per operatori autoaggiunti non limitati . . . . . 374
Indice
XIII
9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati . . . . . . . . . . . . . . . . . . . . . . . . . . . 389 9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 9.1.4 Un esempio a spettro continuo: gli operatori posizione e impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati e misure congiunte . . . . . . . . . . 405 9.2 Esponenziale di operatori non limitati: vettori analitici . . . . . . . 409 9.3 Gruppi unitari a un parametro fortemente continui . . . . . . . . . . . 413 9.3.1 Gruppi unitari a un parametro fortemente continui, teorema di von Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 9.3.2 Gruppi unitari a un parametro generati da operatori autoaggiunti e teorema di Stone . . . . . . . . . . . . . . . . . . . . . 418 9.3.3 Commutativit`a di operatori e misure spettrali . . . . . . . . . 426 9.4 Prodotto tensoriale hilbertiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 9.4.1 Prodotto tensoriale di spazi di Hilbert . . . . . . . . . . . . . . . . 430 9.4.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro propriet` a spettrali . . . . . . . . . . . . . . . . . . . . 436 9.4.3 Un esempio: il momento angolare orbitale . . . . . . . . . . . . . 440 9.5 Teorema di decomposizione polare per operatori non limitati . . 443 9.5.1 Propriet` a degli operatori A∗ A, radici quadrate di operatori autoaggiunti positivi non limitati . . . . . . . . . . . . 444 9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 9.6 I teoremi di Kato-Rellich e di Kato . . . . . . . . . . . . . . . . . . . . . . . . . 450 9.6.1 Il teorema di Kato-Rellich . . . . . . . . . . . . . . . . . . . . . . . . . . 450 9.6.2 Un esempio: l’operatore −Δ + V e il teorema di Kato . . 453 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460 10
La formulazione matematica della Meccanica Quantistica non relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 10.1 Riepilogo e commenti sugli assiomi A1, A2, A3, A4 della MQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 10.2 Assioma A5: sistemi elementari non relativistici . . . . . . . . . . . . . 471 10.2.1 Le Relazioni di Commutazione Canonica (CCR) . . . . . . . 473 10.2.2 Il Principio di Indeterminazione di Heisenberg come teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 10.3 Le relazioni di Weyl, il teorema di Stone-von Neumann e il teorema di Mackey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 10.3.1 Famiglie irriducibili di operatori e lemma di Schur . . . . . 476 10.3.2 Le relazioni di Weyl dalle CCR . . . . . . . . . . . . . . . . . . . . . . 478
XIV
Indice
10.3.3 Il teorema di Stone-von Neumann e il teorema di Mackey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 10.3.4 La ∗-algebra di Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489 10.3.5 Dimostrazione dei teoremi di Stone-von Neumann e di Mackey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 10.3.6 Estensione del “principio di Heisenberg” agli stati misti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501 10.3.7 Commenti finali sul teorema di Stone-von Neumann: il gruppo di Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 10.4 Il principio di corrispondenza di Dirac . . . . . . . . . . . . . . . . . . . . . . 506 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509 11
Introduzione alle Simmetrie Quantistiche . . . . . . . . . . . . . . . . . 511 11.1 Nozione e caratterizzazione delle simmetrie quantistiche . . . . . . 512 11.1.1 Qualche esempio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 11.1.2 Simmetrie in presenza di regole di superselezione . . . . . . . 515 11.1.3 Simmetrie nel senso di Kadison . . . . . . . . . . . . . . . . . . . . . . 516 11.1.4 Simmetrie nel senso di Wigner . . . . . . . . . . . . . . . . . . . . . . . 518 11.1.5 Teoremi di Wigner e di Kadison . . . . . . . . . . . . . . . . . . . . . 520 11.1.6 Azione duale delle simmetrie sulle osservabili . . . . . . . . . . 532 11.2 Introduzione ai gruppi di simmetria . . . . . . . . . . . . . . . . . . . . . . . . 538 11.2.1 Rappresentazioni proiettive, unitarie proiettive . . . . . . . . 538 11.2.2 Unitariet` a o antiunitariet` a delle rappresentazioni unitarie proiettive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543 11.2.3 Estensioni centrali e gruppo quantistico associato a un gruppo di simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544 11.2.4 Gruppi di simmetria topologici . . . . . . . . . . . . . . . . . . . . . . 547 11.2.5 Rappresentazioni unitarie proiettive fortemente continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551 11.2.6 Il caso notevole del gruppo topologico R . . . . . . . . . . . . . . 554 11.2.7 Richiami sui gruppi e algebre di Lie . . . . . . . . . . . . . . . . . . 560 11.2.8 Gruppi di simmetria di Lie, teoremi di Bargmann, G˚ arding, Nelson, FS3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570 11.2.9 Un esempio: il gruppo di simmetria SO(3) e lo spin . . . . 582 11.2.10Il gruppo di Galileo e le sue rappresentazioni unitarie proiettive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 11.2.11La regola di Bargmann di superselezione della massa . . . 594 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597
12
Alcuni argomenti pi` u avanzati di Meccanica Quantistica . . 603 12.1 La dinamica quantistica e le sue simmetrie . . . . . . . . . . . . . . . . . . 604 12.1.1 Assioma A6: l’evoluzione temporale . . . . . . . . . . . . . . . . . . 604 12.1.2 Simmetrie dinamiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 12.1.3 L’equazione di Schr¨ odinger e gli stati stazionari . . . . . . . . 610
Indice
XV
12.1.4 L’azione del gruppo di Galileo in rappresentazione posizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 618 12.1.5 L’evolutore temporale in assenza di omogeneit`a temporale e la serie di Dyson . . . . . . . . . . . . . . . . . . . . . . . . 621 12.1.6 Inversione del tempo antiunitaria . . . . . . . . . . . . . . . . . . . . 625 12.1.7 L’osservabile tempo ed il teorema di Pauli. Un accenno alle POVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 12.2 Relazione tra simmetrie dinamiche e costanti del moto . . . . . . . . 631 12.2.1 La rappresentazione di Heinsenberg e le costanti del moto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631 12.2.2 Un accenno al teorema di Ehrenfest e ai problemi matematici a esso connessi . . . . . . . . . . . . . . . . . . . . . . . . . . 636 12.2.3 Costanti del moto associate a gruppi di Lie di simmetria e il caso del gruppo di Galileo . . . . . . . . . . . . . . 639 12.3 Sistemi composti e loro propriet` a . . . . . . . . . . . . . . . . . . . . . . . . . . 644 12.3.1 Assioma A7: sistemi composti . . . . . . . . . . . . . . . . . . . . . . . 645 12.3.2 Stati entangled e il cosiddetto “paradosso EPR” . . . . . . . 646 12.3.3 Impossibilit`a di trasmettere informazione tramite le correlazioni EPR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 12.3.4 Assioma A8: sistemi di sottosistemi identici . . . . . . . . . . . 653 12.3.5 Bosoni e Fermioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658 Appendice A Relazioni d’ordine, topologia, gruppi . . . . . . . . . . . 661 A.1 Relazioni d’ordine, insiemi parzialmente ordinati, lemma di Zorn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661 A.2 Richiami di topologia generale elementare . . . . . . . . . . . . . . . . . . . 662 A.3 Richiami di teoria dei gruppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666 Appendice B Elementi di geometria differenziale . . . . . . . . . . . . . 669 B.1 Variet`a differenziabili, variet`a differenziabili prodotto, funzioni differenziabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669 B.2 Spazio tangente e cotangente. Campi vettoriali covarianti e controvarianti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674 B.3 Differenziali, curve e vettori tangenti . . . . . . . . . . . . . . . . . . . . . . . 676 B.4 Pushforward e pullback . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677 Appendice C Teoria della misura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679 C.1 Misure positive σ-additive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679 C.2 Misura di Lebesgue su Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684 C.3 Misura prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 686 C.4 Derivazione sotto il segno di integrale . . . . . . . . . . . . . . . . . . . . . . . 687 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 689 Indice analitico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 693
1 Introduzione La scienza `e una cosa meravigliosa. . . per chi non deve guadagnarsi da vivere con essa. Albert Einstein
1.1 Sul libro 1.1.1 Scopi e struttura del libro Uno degli scopi di questo libro `e quello di esporre i fondamenti matematici della Meccanica Quantistica (MQ) in modo matematicamente rigoroso. Tuttavia si tratta di un testo di (Fisica-)Matematica e non di un manuale di Meccanica Quantistica. Escludendo alcune parti del libro, la fenomenologia fisica sar`a lasciata sullo sfondo per concentrarci sugli aspetti logico-formali della teoria. In ogni caso saranno presentate numerose esemplificazioni fisiche del formalismo, per non perdere il contatto con la realt`a dei fisici. Alternativamente ed indipendentemente dalla formulazione matematica della Meccanica Quantistica, questo libro pu` o essere considerato come un testo introduttivo, ma che raggiunge argomenti abbastanza avanzati, di analisi funzionale lineare sugli spazi di Hilbert, con particolare enfasi su alcuni risultati di teoria spettrale – come le varie formulazioni del teorema spettrale per operatori normali limitati ed autoaggiunti non necessariamente limitati. Questo `e – di fatto – un ulteriore scopo del libro. La formalizzazione matematica della MQ `e “confinata” nei capitoli 6, 7, 10, 11 e 12 da cui i rimanenti capitoli sono logicamente indipendenti, anche se motivazioni per talune definizioni matematiche si possono trovare nei capitoli 7, 10, 11 e 12. Un terzo scopo del libro `e quello di raccogliere in un unico testo diversi utili risultati rigorosi, ma pi` u avanzati di quanto si trova nei manuali di fisica quantistica, sulla struttura matematica della Meccanica Quantistica. Molti di questi risultati sono noti da tempo, ma sparsi nella letteratura avanzata. Possiamo menzionare il teorema di Gleason, i teoremi di Stone-von Neumann e di Mackey, il teorema di Kadison, oltre che il pi` u noto teorema di Wigner; oppure argomenti di teoria degli operatori, come il teorema di decomposizione polare per operatori chiusi non limitati (che ha grande rilevanza nella teoria di Tomita-Takesaki e in meccanica quantistica statistica, in riferimento alla condizione KMS), oppure alcuni risultati, dovuti a Nelson, sulle propriet` a Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
2
1 Introduzione
di autoaggiunzione di operatori simmetrici come conseguenza all’esistenza di insiemi densi di vettori analitici ed anche, infine, alcuni risultati dovuti a Kato (ma non solo) sull’essenziale autoaggiunzione di certi tipi di operatori e sui loro limiti dal basso dello spettro (risultati in massima parte basati sul teorema di Kato-Rellich). Alcuni capitoli del libro, da soli, coprono una buona parte degli argomenti di un corso avanzato di Metodi Matematici della Fisica, in un corso di laurea “magistrale” in Fisica, o dottorato di ricerca, assumendo che lo studente sia gi`a familiare con le nozioni, i risultati e le tecniche elementari della teoria della misura. Il testo pu` o anche essere adoperato in un corso di Fisica Matematica avanzato, che tratti argomenti fondazionali di Meccanica Quantistica. Lo sforzo dell’autore, rivolgendosi agli studenti dei corsi di laurea magistrale o dottorandi in fisica con interessi nei metodi matematici, oppure agli studenti dei corsi di laurea magistrale o dottorandi in matematica con propensione verso le applicazioni alla fisica, `e stato quello di scrivere un testo per quanto possibile autoconsistente, anche in virt` u di alcune appendici riguardanti la topologia generale, la geometria differenziale e la teoria della misura. La maggior parte dei capitoli sono corredati da esercizi, molti dei quali esplicitamente risolti. Il libro pu` o essere utile ai ricercatori per l’organica e rigorosa esposizione di vari risultati avanzati, noti, ma sparsi nella letteratura. Il volume `e diviso in due parti. La prima parte, che termina con il capitolo 5 incluso, contiene la teoria generale degli operatori in spazi di Hilbert, introducendo per`o anche diverse nozioni valide per contesti pi` u generali, quali gli spazi di Banach e provando risultati generali fondamentali, quali il teorema di Baire, di Hahn-Banach e Banach-Steinhaus, ma anche il teorema del punto fisso di Banach-Caccioppoli, il teorema di Arzel`a-Ascoli ed il teorema dell’alternativa di Fredholm, ed alcune loro conseguenze elementari. In questa prima parte vengono richiamate ed usate diverse nozioni topologiche elementari. L’idea `e che questo modo di procedere possa tornare utile agli studenti dei corsi di laurea in fisica, la cui preparazione in topologia generale `e a volte disomogenea e lacunosa, essendo l’insegnamento della topologia generale disperso in vari corsi e non concentrato in corsi curriculari come accade, viceversa, nei corsi di laurea in matematica. Nella seconda parte viene sviluppata la teoria spettrale in termini di misure a valori di proiezione, fino ad enunciare e provare i teoremi di decomposizione spettrale per operatori autoaggiunti non limitati in spazi di Hilbert, includendo le propriet` a delle funzioni di operatori (calcolo funzionale) per funzioni misurabili e non necessariamente limitate, studiandone con cura la propriet` a spettrali generali e le propriet` a dei loro domini. Con tali strumenti viene quindi sviluppato tutto il formalismo matematico fondazionale della Meccanica Quantistica. Nei capitoli relativi alla formulazione matematica generale della Meccanica Quantistica, dopo una discussione ed una motivazione di carattere fisico, si assume come punto di partenza matematico l’idea, dovuta a von Neumann,
1.1 Sul libro
3
che le proposizioni sui sistemi fisici quantistici siano descritte dal reticolo dei proiettori ortogonali su uno spazio di Hilbert complesso. Insiemi massimali di proposizioni fisicamente compatibili (in senso quantistico) sono descritte da reticoli distributivi, ortocomplementati, limitati e σ-completi. In questa ottica, la definizione quantistica di osservabile in termini di operatore autoaggiunto risulta essere estremamente naturale come, d’altra parte, la formulazione del teorema di decomposizione spettrale. Gli stati quantistici vengono introdotti come misure sul reticolo di tutti i proiettori ortogonali, che cessa di essere distributivo (per l’esistenza di proposizioni ed osservabili quantisticamente incompatibili). Tramite il teorema di Gleason, si caratterizzano gli stati come operatori positivi di classe traccia con traccia unitaria. Gli stati puri (i raggi dello spazio di Hilbert del sistema fisico) si ottengono come elementi estremali del corpo convesso degli stati. In questo contesto, e tra diversi altri argomenti, si discute la nozione di simmetria quantistica e di gruppo di simmetria in modo approfondito (riferendosi sia alla nozione dovuta a Wigner, ma anche a quella dovuta a Kadison), includendo lo studio delle simmetrie dinamiche e la versione quantistica del teorema di N¨ other. Come gruppo di simmetria di riferimento, che useremo nelle varie esemplificazioni della teoria delle rappresentazioni unitarie proiettive, ci riferiremo al gruppo di Galileo ed alle sue estensioni centrali ed ai sottogruppi di tale gruppo. Daremo anche una dimostrazione del teorema di Bargmann sull’esistenza di rappresentazioni unitarie per gruppi di Lie semplicemente connessi la cui algebra di Lie soddisfa una certa condizione coomologica. Discuteremo la regola di superselezione della massa dovuta a Bargamnn. Discuteremo anche alcuni utili risultati sulle rappresentazioni unitarie proiettive di gruppi di Lie di simmetrie dovuti a G˚ arding e Nelson. Tratteremo anche alcuni argomenti importanti, ma presentati in modo poco approfondito sui manuali, come le formulazioni relative all’unicit` a delle rappresentazioni unitarie delle relazioni di commutazione canonica (teoremi di Stone-von Neumann e Mackey) oppure la difficolt` a teorica nel definire operatore tempo come operatore coniugato all’operatore energia (l’hamiltoniano). Discuteremo brevemente le difficolt` a matematiche che si incontrano nel voler rendere rigoroso l’enunciato del teorema di Ehrenfest. Le appendici, in fondo al libro, richiamano le nozioni elementari di topologia generale, geometria differenziale (utile nel capitolo 11) e teoria della misura. La scelta dell’autore `e stata di non trattare alcuni argomenti, sia pure importanti, come la teoria degli spazi di Hilbert attrezzati (le famose triplette di Gelfand), perch´e ci`o avrebbe richiesto l’introduzione di ulteriore materiale, specialmente riguardante la teoria delle distribuzioni. 1.1.2 Prerequisiti Prerequisiti matematici necessari per comprendere il contenuto di questo libro sono essenzialmente (oltre ai contenuti di un normale corso completo di algebra lineare, che includa elementi di teoria dei gruppi e delle loro rappresen-
4
1 Introduzione
tazioni) gli argomenti fondamentali di analisi elementare per funzioni di una e di pi` u variabili, i fondamenti della teoria della misura su σ-algebre [Rud82] (riassunti in appendice a fine libro), qualche nozione elementare di teoria delle funzioni analitiche di una variabile complessa. Dal punto di vista fisico `e necessaria la conoscenza di alcuni argomenti dei corsi universitari elementari di argomento Fisico. Pi` u precisamente alcune nozioni elementari di Fisica Meccanica, corredati di alcuni elementi di Meccanica Analitica (i primi rudimenti della formulazione di Hamilton della dinamica) unitamente ad alcune nozioni di Elettromagnetismo (propriet` a elementari delle Onde Elettromagnetiche e fenomeni ondulatori principali quali interferenza, diffrazione, diffusione). Alcune nozioni meno elementari ed alcuni concetti utili solo in alcune parti del libro saranno comunque riassunte brevemente nel testo (anche negli esempi), presentando i risultati sufficienti per proseguire nella lettura. In una sezione del capitolo 11 si far`a uso della nozione di gruppo di Lie e di alcune propriet` a e risultati fondamentali della teoria corrispondente. Per tali argomenti ci riferiamo ai testi [War75, NaSt84]. Come gi`a detto, in appendice a fine libro, sono richiamati con un certo dettaglio alcuni risultati di geometria differenziale utili in tale contesto. 1.1.3 Convenzioni generali valide per tutto il libro 1. 2. 3. 4. 5.
6.
7.
8. 9.
10.
Il simbolo := significa “uguale per definizione”. Il simboli di inclusione ⊂, ⊃ ammettono la possibilit`a =. Il simbolo indica l’unione di insiemi disgiunti. N indica l’insieme dei numeri naturali includendo lo zero, mentre R+ := [0, +∞). Se non `e precisato altrimenti, il campo degli scalari di uno spazio vettoriale, normato, di Banach, di Hilbert, sar` a sempre quello di complessi C. Similmente, prodotto scalare significa prodotto scalare hermitiano, se non `e precisato altrimenti. Il complesso coniugato di un numero c sar`a indicato con c. Lo stesso simbolo `e anche usato per denotare la chiusura di insiemi o di operatori; ci` o non dovrebbe comunque creare fraintendimenti e, dove fosse necessario, un commento preciser`a quale deve essere l’interpretazione del simbolo. Il prodotto scalare tra due vettori ψ, φ di uno spazio di Hilbert sar` a indicato con (ψ|φ) per distinguerlo dalla coppia ordinata (ψ, φ). L’entrata di sinistra del prodotto scalare `e quella antilineare: (αψ|φ) = α(ψ|φ). Operatore sottintende lineare anche se talvolta questa specificazione `e omessa. Un operatore lineare U : H → H , dove H e H sono spazi di Hilbert, che sia isometrico e suriettivo sar`a detto unitario, anche se in altri testi la terminologia `e riservata al solo caso in cui valga anche H = H . La locuzione sottospazio vettoriale sar`a riservata ai sottospazi rispetto alla semplice struttura di spazio vettoriale anche nel caso in cui esista
1.2 Sulla Meccanica Quantistica
11.
12.
13.
14.
5
un’ulteriore struttura (spazio di Hilbert, Banach o altro) nello spazio ambiente. L’operazione di coniugazione hermitiana sar`a sempre indicata con ∗ e operatore hermitiano, operatore simmetrico, operatore autoaggiunto non saranno considerati sinonimi. Biettivo significa insieme iniettivo e suriettivo. La nozione di isomorfismo, qualunque sia la struttura algebrica considerata, richiede la suriettivit` a dell’isomorfismo e non solo l’iniettivit`a. Il carattere grassetto nel testo delle definizioni (ma anche fuori da esse) `e solitamente utilizzato quando si definisce un termine matematico per la prima volta. I corollari, le definizioni, gli esempi, i lemmi, le notazioni, le osservazioni, le proposizioni, i teoremi, sono tutti labellati con un’unica comune numerazione per facilitarne l’individuazione nel testo.
1.2 Sulla Meccanica Quantistica 1.2.1 La MQ come teoria matematica Dal punto di vista matematico la Meccanica Quantistica rappresenta una rara sintesi di eleganza matematica e profondit` a descrittiva del contesto fisico. La teoria usa essenzialmente tecniche di analisi funzionale lineare, ma con intrusioni e intersezioni con la teoria della misura, la teoria della probabilit` a e la logica matematica. Esistono (almeno) due possibili formulazioni rigorose (matematiche) della Meccanica Quantistica elementare. La pi` u antica in ordine storico, dovuta essenzialmente a von Neumann (1932), `e formulata usando il linguaggio della teoria degli spazi di Hilbert e della teoria spettrale degli operatori non limitati su tali spazi. La formulazione pi` u recente ed avanzata, sviluppata da diversi autori anche nel tentativo di risolvere alcuni problemi fisico-matematici della teoria quantistica dei campi, `e presentata nel linguaggio delle algebre astratte (∗-algebre e C ∗ -algebre) costruite sul modello delle algebre di operatori definite e studiate dallo stesso von Neumann (oggi note come W ∗ algebre o algebre di von Neumann), ma emancipandosi dalla struttura di spazio di Hilbert (vedi per es. il testo classico sulle algebre di operatori [BrRo02]). Tale formulazione ha il suo centro nel famoso teorema GNS (Gelfand-Naimark-Segal) [Haa96, BrRo02]. La seconda formulazione, in un senso molto specifico che non possiamo chiarire qui, pu` o considerarsi un’estensione della prima formulazione, anche per i nuovi contenuti fisici introdotti e la possibilit` a di trattare sistemi fisici con infiniti gradi di libert`a: i campi quantistici. In particolare essa permette di dare un senso matematicamente preciso alla richiesta di localit` a e covarianza delle teorie di campo quantistiche relativistiche [Haa96] e permette l’estensione delle teorie quantistiche di campo in spaziotempo curvo.
6
1 Introduzione
La formulazione algebrica in MQ elementare non `e strettamente necessaria anche se possibile e molto elegante (vedi per esempio [Str05]). In questo libro ci occuperemo unicamente della prima formulazione, che ha comunque una complessit`a matematica notevole, accompagnata da una notevole eleganza formale. Uno strumento matematico fondamentale per sviluppare la MQ `e il cosiddetto teorema spettrale per operatori autoaggiunti (generalmente non limitati) definiti in sottospazi densi in uno spazio di Hilbert. Tale teorema, che pu` o essere esteso al caso di operatori normali, fu dimostrato per la prima volta proprio da von Neumann nel suo libro fondamentale sulla struttura matematica della MQ [Neu32], che pu` o considerarsi una pietra miliare della fisica matematica oltre che della matematica pura del XX secolo1 . Il legame tra MQ e teoria spettrale `e dovuto al seguente fatto. Nell’interpretazione standard della MQ si vede in modo naturale che le grandezze fisiche misurabili su sistemi quantistici possono essere associate ad operatori autoaggiunti non limitati in un opportuno spazio di Hilbert. Lo spettro di ciascuno di questi operatori coincide con l’insieme dei valori assumibili dalla grandezza associata. La procedura di costruzione delle grandezze fisiche a partire dalle propriet` a o proposizioni elementari del tipo “il valore della grandezza cade nell’intervallo (a, b]”, che nello schema matematico adottato corrispondono a proiettori ortogonali, non `e altro che una procedura di integrazione su una appropriata misura spettrale a valori di proiezione. Il teorema spettrale in sostanza altro non `e che un metodo che permette di costruire operatori pi` u complessi partendo da proiettori o, viceversa, di decomporre operatori in termini di misure a valori di proiezione. La formulazione moderna della teoria spettrale `e sicuramente differente da quella originale di von Neumann, che per` o conteneva tutti gli elementi fondamentali. Ancora oggi il testo di von Neumann (che `e stato scritto nel lontano 1932) rivela una profondit`a impressionante specie nei problemi pi` u difficili dell’interpretazione fisica del formalismo della MQ di cui, leggendo il libro, si evince che von Neumann era chiaramente conscio, a differenza di molti dei suoi colleghi. Sarebbe interessante fare un paragone tra il testo di von Neumann e il, molto pi` u famoso, testo di Dirac [Dir30] sui fondamenti della MQ, cosa che lasciamo al lettore interessato. In ogni caso la profondit`a dell’impostazione data da von Neumann alla MQ comincia anche ad essere riconosciuta da chi si occupa di fisica sperimentale ed in particolare di misure quantistiche [BrKh95]. Le cosiddette Logiche Quantistiche nascono dal tentativo di formulare la MQ partendo dal punto di vista pi` u radicale possibile, attribuendo alla stessa logica usata nel trattare i sistemi quantistici, alcune propriet` a differenti da quelle della logica classica e modificando la teoria dell’interpretazione. Per esempio, sono usati pi` u di due valori di verit` a e il reticolo booleano delle pro1
La definizione del concetto di spazio di Hilbert infinito dimensionale e gran parte della teoria generale degli spazi di Hilbert cos`ı come la conosciamo oggi sono anch’essi dovuti a von Neumann e alla sua formulazione della MQ.
1.2 Sulla Meccanica Quantistica
7
posizioni `e rimpiazzato da una struttura non distributiva pi` u complessa. Nella prima formulazione della logica quantistica, oggi denominata Logica Quantistica Standard, proposta da Von Neumann e Birkhoff nel 1936, la struttura dell’algebra booleana delle proposizioni era rimpiazzata con quella di un reticolo ortomodulare che, di fatto, ha come modello l’insieme dei proiettori ortogonali su uno spazio di Hilbert ovvero, l’insieme dei sottospazi chiusi su cui proiettano i proiettori [Bon97], unitamente ad alcune regole di composizione. ` noto che, a dispetto della sua eleganza, tale modellizzazione contiene diversi E difetti quando si cerca di tradurla in termini operativi fisici (o pi` u precisamente operazionali). Accanto alle diverse formulazioni delle Logiche Quantistiche [Bon97, DCGi02, EGL09], esistono oggi formulazioni fondazionali alternative basate su altri punti di vista (come la teoria dei topos). 1.2.2 La MQ nel panorama della fisica attuale La Meccanica Quantistica – genericamente parlando la teoria della fisica del mondo atomico e sub atomico – insieme alla Teoria della Relativit` a Speciale e Generale (RSG) – genericamente parlando la teoria fisica della gravit`a, del mondo macroscopico e della cosmologia – costituiscono i due paradigmi attraverso i quali si `e sviluppata la fisica del XX secolo e quella dell’inizio del secolo attuale. I due paradigmi si sono fusi in vari contesti dando luogo a teorie quantistiche relativistiche, in particolare alla Teoria Quantistica Relativistica dei Campi [StWi00, Wei99], che ha avuto uno sviluppo impressionante con straordinari successi esplicativi e predittivi nel contesto della teoria delle particelle elementari e delle forze fondamentali. A titolo d’esempio tale teoria ha previsto, all’interno del cosiddetto modello standard delle particelle elementari, l’unificazione della forza debole ed elettromagnetica che `e poi stata confermata sperimentalmente alla fine degli anni ’80 con un esperimento spettacolare al C.E.R.N. di Ginevra in cui si sono osservate le particelle Z0 e W ± previste dalla teoria dell’unificazione elettrodebole. La previsione del valore di una grandezza fisica, che `e stata poi confermata con una delle maggiori precisioni di tutta la storia della Fisica, si `e avuta nell’elettrodinamica quantistica. Si tratta del valore del cosiddetto rapporto giromagnetico dell’elettrone g. Tale grandezza fisica `e un numero puro. Il valore previsto dall’elettrodinamica quantistica per a := g/2 − 1 `e: 0.001159652359 ± 0.000000000282 , quello ottenuto sperimentalmente `e risultato essere 0.001159652209 ± 0.000000000031 . Molti fisici ritengono che la MQ sia la teoria fondamentale dell’Universo (pi` u profonda delle teorie relativistiche) anche per il fatto che risulta essere valida per scale lineari di lunghezza che variano in uno spettro di ampiezza impressionante: da 1m (condensati di Bose-Einstein) almeno fino a 10−16 m (interno
8
1 Introduzione
dei nucleoni: quarks). La MQ ha avuto un enorme successo sia teorico che sperimentale anche nella scienza che studia la struttura della materia solida, nell’ottica, nell’elettronica, con diverse importantissime ricadute tecnologiche: ogni oggetto tecnologico di uso comune che sia moderatamente sofisticato (giocattoli per i bambini, telefonini, telecomandi...) da contenere qualche elemento semiconduttore sfrutta propriet` a quantistiche della materia. Tornando ai due paradigmi scientifici del XX secolo – MQ e RSG – rimangono diversi punti oscuri in cui i due paradigmi sembrano venire in conflitto, in particolare il problema della cosiddetta “quantizzazione della gravit` a” e della struttura dello spaziotempo alle scale di Planck – 10−33 cm, 10−43 s – le scale di lunghezza e di tempo che si ottengono combinando le costanti fondamentali delle due teorie: la velocit`a della luce, la costante di gravitazione universale e la costante di Planck. La necessit`a di una struttura discontinua dello spaziotempo a scale ultramicroscopiche `e suggerita anche da alcune difficolt` a matematiche (ma anche concettuali) non completamente risolte dalla cosiddetta teoria della Rinormalizzazione quantistica, dovute all’apparire di infiniti che si incontrano nei calcoli dei processi dovuti alle interazioni fondamentali tra le particelle elementari. Dal punto di vista puramente matematico, l’apparire di questi infiniti `e in realt` a connesso al problema, intrinsecamente ambiguo, della definizione del prodotto di distribuzioni: gli infiniti non sono la radice del problema, sono solo un modo di esplicitare il problema. Tali questioni irrisolte o parzialmente risolte hanno dato luogo a recenti ed importanti sviluppi teorici, che hanno avuto influenze nello sviluppo della stessa matematica pura, come la teoria delle (super) stringhe (e brane) e le varie versioni di Geometria non commutativa, prima fra tutte quella di A. Connes. La difficolt`a nel decidere quale di queste teorie abbia un senso fisico e descriva l’Universo alle scale piccolissime `e anche di natura tecnologica: la tecnologia attuale non `e in grado di preparare esperimenti che permettano il discernimento tra le varie teorie proposte. Altri punti di contrasto tra MQ e RSG, su cui la discussione `e oggi un po’ pi` u pacata rispetto al passato, riguardano il rapporto della MQ con concetti di localit` a di natura relativistica (paradosso Einstein-Podolsky-Rosen [Bon97]) in relazione ai fenomeni di entanglement della MQ. Ci` o `e dovuto in particolare all’analisi di Bell alla fine degli anni ’60 ed ai celebri esperimenti di Aspect che hanno dato torto alle aspettative di Einstein, ragione all’interpretazione di Copenaghen, ed hanno provato che la nonlocalit` a `e una caratteristica della Natura, indipendentemente dall’accettazione o meno dell’interpretazione standard della MQ. Sembra ormai condivisa dalla maggior parte dei fisici l’idea che l’esistenza di processi fisici non locali, prevista teoricamente dalla MQ, non implichi alcuna reale violazione dei fondamenti della Relativit`a (l’entanglement quantistico non coinvolge trasmissione superluminare di informazioni e violazione della causalit` a [Bon97]). Nell’interpretazione standard della MQ detta di Copenaghen, rimangono punti fisicamente e matematicamente poco chiari, ma di estremo interesse concettuale. In particolare, a dispetto di diverse ed interessanti proposte, non
1.2 Sulla Meccanica Quantistica
9
`e ancora chiaro come la meccanica classica si possa ottenere come sotto caso o caso limite della MQ e come si possa fissare un limite (anche provvisorio o impreciso) tra i due mondi. Ulteriormente rimane aperto il problema della descrizione fisica e matematica del cosiddetto processo di misura quantistica, di cui parleremo pi` u avanti, e che `e strettamente connesso a quello del limite classico della MQ. Anche prendendo spunto da questo problema sono nate altre interpretazioni del formalismo della MQ, profondamente differenti dall’interpretazione di Copenaghen. Tra queste pi` u recenti interpretazioni, una volta considerate eretiche, di grande interesse `e in particolare quella a variabili nascoste di Bohm [Bon97, Des80]. Talvolta vengono sollevate riserve sulla formulazione Meccanica Quantistica e sul fatto che non sia veramente comprensibile, ma che si tratti semplicemente di un elenco di procedure che “materialmente funzionano”, mentre la ` opinione dell’auvera essenza sia qualcosa di inaccessibile, di “noumenico”. E tore che dietro a questo punto di vista ci sia un pericoloso errore epistemologico. Basato sulla credenza che “spiegare” un fenomeno significhi ridurlo alle categorie dell’esperienza quotidiana. Come se queste fossero qualcosa di pi` u profondo della realt` a stessa. L’opinione dell’autore `e che sia il esattamente il contrario: le categorie dell’esperienza quotidiana sono state costruite con l’esperienza quotidiana senza, conseguentemente, alcuna pretesa di profondit`a metafisica. Dietro quel semplice “materialmente funziona” ci potrebbe essere un mare filosofico profondo che ci avvicina alla realt` a invece che allontanarcene. La Meccanica Quantistica ci ha insegnato a pensare in un modo differente ed `e stata (anzi `e), per questo, un opportunit` a incredibile per l’esperienza umana. Voltarle le spalle dicendo che non l’abbiamo compresa, perch´e si rifiuta di ricadere nelle nostre categorie usuali, significa chiudere una porta su qualcosa di enorme. Questo `e il parere dell’autore, che `e fermamente convinto che il principio di indeterminazione di Heisenberg (ridotto a semplice teorema nella formulazione moderna) sia una delle massime vette raggiunte dall’intelletto umano.
Parte I
Elementi di teoria degli operatori lineari
2 Spazi normati e spazi di Banach, esempi e applicazioni Sono persuaso che la matematica sia il pi` u importante strumento di conoscenza fra quelli lasciatici in eredit` a dall’agire umano, essendo la fonte di tutte le cose. Cartesio
In questo capitolo iniziale presenteremo alcune nozioni ed alcuni risultati fondamentali della teoria generale degli spazi normati e degli spazi di Banach. Introdurremo anche alcune strutture algebriche modellizzate su algebre naturali di operatori sugli spazi di Banach. Le algebre di Banach di operatori svolgono un ruolo di grande importanza nelle formulazioni moderne della Meccanica Quantistica. Questo capitolo serve essenzialmente ad introdurre il linguaggio e gli strumenti topologici elementari della teoria degli spazi di operatori lineari. Pertanto, anche se questo capitolo `e (escludendo alcuni esempi) autoconsistente, non `e assolutamente esaustivo nei confronti dell’enorme letteratura sulle propriet`a fondamentali degli spazi di normati e di Banach. Si rimanda a [Rud82, Rud91] per trattazioni esaustive. Nei capitoli successivi specializzeremo la discussione al caso degli operatori su spazi di Hilbert complessi, con una piccola parentesi pi` u generale, nel capitolo 4, in riferimento agli operatori compatti. Le nozioni pi` u importanti di questo capitolo sono sicuramente la nozione di operatore limitato e le varie nozioni di topologia (indotta da norme o da seminorme) negli spazi di operatori. L’importanza di questi strumenti matematici deriva dal fatto che il linguaggio degli operatori lineari su spazi lineari `e il linguaggio con cui `e formulata la Meccanica Quantistica. In questo contesto la classe degli operatori limitati riveste un ruolo tecnico centrale anche se, per motivi di carattere fisico, in Meccanica Quantistica ci si trova costretti ad introdurre e lavorare anche con operatori non limitati come vedremo nella seconda parte del libro. Nella prima parte di questo capitolo ricorderemo alcune nozioni di topologia generale utili in tutto il libro. Nella seconda parte introdurremo le nozioni elementari di spazio normato e di spazio di Banach e delle loro propriet` a topologiche elementari, fornendo qualche importante esempio, come lo spazio delle funzioni continue sullo spazio topologico compatto K, C(K), e dimostrando l’importante teorema di Arzel`a-Ascoli in tale caso. Negli esempi dimostreremo anche qualche teore-
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
14
2 Spazi normati e spazi di Banach, esempi e applicazioni
ma chiave come quello relativo alla completezza degli spazi Lp (teorema di Fischer-Riesz). Nella terza parte passeremo a presentare la nozione di norma operatoriale e delle propriet`a pi` u utili di tale nozione. Nella quarta parte discuteremo i teoremi fondamentali generali degli spazi di Banach, nelle versioni pi` u elementari. Il teorema di Hahn-Banach, il teorema di Banach-Steinhaus, il teorema dell’applicazione aperta (partendo dal teorema di Baire). Faremo ci`o dimostrando anche diverse utili conseguenze tecniche dei teoremi menzionati (teorema delloperatore inverso continuo e del grafico chiuso). Infine presenteremo brevemente le varie topologie operatoriali che entrano in gioco nella teoria degli operatori, accennando brevemente alla nozione di spazio di Fr´echet. La quinta parte sar`a dedicata alla nozione di proiettore negli spazi normati, nozione che specializzeremo nel capito successivo a quella, pi` u utile per i nostri scopi, di proiettore ortogonale. Le ultime due parti, saranno dedicate a due argomenti elementari, ma importanti: la nozione di norma equivalente (includendo la dimostrazione del fatto che gli spazi normati di dimensione n finita, sono di Banach e omeomorfi ad un corrispondente Cn con norma standard), e la teoria delle mappe di contrazione in spazi normati completi (includendo, negli esempi, una dimostrazione del teorema di esistenza ed unicit`a locale per le equazioni differenziali del prim’ordine su Rn o Cn ). Assumeremo d’ora in poi che il lettore sia completamente familiare con la teoria elementare degli spazi vettoriali e delle applicazioni lineari [Ser94I]. Per comprendere appieno alcuni degli esempi che presenteremo, il lettore dovrebbe conoscere alcune nozioni e risultati fondamentali della teoria della misura. Nozioni topologiche generali e di teoria della misura generale sono riassunte in appendice in fondo al libro.
2.1 Richiami di topologia generale Nel caso del tutto generale, le nozioni di insieme aperto e insieme chiuso vengono caratterizzati dalla definizione generale che ricordiamo di seguito [Ser94II]. Definizione 2.1. Una coppia (X, T ), con X insieme e T classe di sottoinsiemi di X, si dice spazio topologico se valgono i seguenti fatti: (i) ∅, X ∈ T , (ii) l’unione di elementi (in quantit` a arbitraria) di T `e elemento di T , (iii) l’intersezione di un numero finito di elementi di T `e elemento di T . In questo caso T `e detta topologia su X e gli elementi di T sono detti (insiemi) aperti in X. Valgono le seguenti ulteriori definizioni. (a) Una base topologica di (X, T ) `e un sottoinsieme B ⊂ T tale che ogni elemento di T `e unione di elementi di B.
2.1 Richiami di topologia generale
15
(b) Un intorno aperto di p ∈ X `e un qualsiasi A ∈ T tale che p ∈ A. (c) Gli insiemi chiusi in X sono i complementi, X \ A, degli aperti A ∈ T . Un sottoinsieme S ⊂ X di uno spazio topologico (X, T ) eredita una struttura di spazio topologico da (X, T ), definendo una topologia su S come TS := {S ∩ A | A ∈ T }. Tale topologia (si verifica immediatamente che la definizione `e soddisfatta) `e detta topologia indotta su S da (X, T ). La maggior parte degli spazi topologici che incontreremo in questo libro saranno spazi di Hausdorff, cio`e spazi topologici in cui la classe degli aperti permette di distinguere i punti di una qualsiasi coppia di punti dello spazio. Definizione 2.2. Uno spazio topologico (X, T ) e la sua topologia sono detti di Hausdorff se soddisfano la seguente propriet` a di Hausdorff: per ogni coppia di punti x, x ∈ X esistono due insiemi aperti, A, A ∈ T , tali che A ∩ A = ∅ e x ∈ A, x ∈ A . Osservazioni 2.3. (1) Per un generico spazio topologico (X, T ), gli insiemi X e ∅ risultano essere contemporaneamente aperti e chiusi. (2) Per un generico spazio topologico (X, T ), gli insiemi chiusi soddisfano propriet` a “duali” rispetto a quelle degli aperti, come segue immediatamente dalla loro definizione: (i) ∅, X sono chiusi, (ii) l’intersezione di chiusi (in quantit` a arbitraria) `e ancora un chiuso, (iii) l’unione di un numero finito di chiusi `e ancora un chiuso. (3) L’esempio pi` u semplice di topologia di Hausdorff `e dato dalla classe di insiemi su R costituiti da unioni arbitrarie di intervalli aperti. La classe degli intervalli aperti `e una base per la topologia nel senso della definizione 2.1. Questa topologia, e l’analoga che si ottiene su Rn (e Cn ) rimpiazzando la base degli intervalli aperti con la base delle palle aperte di centro e raggio arbitrari, viene detta topologia euclidea o topologia standard di Rn (e Cn ). Si tratta della topologia usuale alla quale ci si riferisce nei corsi di analisi elementare. Diverse nozioni utili che ricorreranno molto nel seguito del libro sono le seguenti. Definizione 2.4. Se (X, T ) `e uno spazio topologico, la chiusura, S, di un sottoinsieme S ⊂ X `e l’insieme: S := ∩{C ⊃ S , C ⊂ X | C `e chiuso} .
(2.1)
S `e detto essere denso in X se S = X. (X, T ) `e detto separabile se ammette un sottoinsieme S denso e numerabile. Dalla definizione data risultano facilmente le propriet` a seguenti.
16
2 Spazi normati e spazi di Banach, esempi e applicazioni
Proposizione 2.5. Sia (X, T ) uno spazio topologico e sia S ⊂ X. Allora vale quanto segue. (a) S `e un insieme chiuso. (b) S = S. (c) Se T ⊂ X, allora S ⊂ T implica S ⊂ T . (d) S `e chiuso se e solo se S = S. Passiamo ora alle nozioni di convergenza e continuit` a. Per prima cosa ricordiamo le nozioni di convergenza di una successione e di punto di accumulazione. Definizione 2.6. Sia (X, T ) uno spazio topologico. (a) Una successione {xn }n∈N ⊂ X `e detta convergere ad un punto x ∈ X, che `e detto il limite della successione e si scrive: x = lim xn = x n→+∞
e anche
xn → x
per n → +∞
se e solo se, per ogni intorno aperto A di x esiste NA ∈ R tale che xn ∈ A se n > NA . (b) Un punto x ∈ X `e detto punto di accumulazione di un insieme S ⊂ X se ogni intorno A di x contiene un punto di S \ {x}. Osservazione 2.7. Dovrebbe essere evidente dalle definizioni date, che il limite di una successione `e unico quando lo spazio topologico `e di Hausdorff. Inoltre se x `e limite di una successione di punti xn ∈ S con xn = x per ogni n, allora x `e punto di accumulazione di S (in generale non `e per` o vero che i punti di accumulazione sono tutti di questo tipo per uno spazio topologico generico). Il legame tra punti di accumulazione e chiusura di un insieme `e sancito dal seguente classico risultato di topologia generale. Proposizione 2.8. Sia (X, T ) uno spazio topologico e sia S ⊂ X. S coincide con l’unione di S e dell’insieme dei punti di accumulazione di S. La definizione di funzione continua e di funzione continua in un punto, nel caso generale, `e ricordata di seguito. Definizione 2.9. Siano (X, T ) e (X , T ) spazi topologici e si consideri una funzione f : X → X . (a) f `e detta continua, se f −1 (A ) ⊂ T quando A ∈ T . (b) f `e detta continua in p ∈ X se, per ogni intorno aperto Af(p) di f(p), esiste un intorno aperto Ap di p tale che f(Ap ) ⊂ Af(p) . (c) f `e detta essere un omeomorfismo se valgono insieme le seguenti condizioni: (i) f `e continua, (ii) f `e biettiva, (iii) f −1 : X → X `e continua. In questo caso gli spazi topologici X e X sono detti essere omeomorfi (secondo f).
2.2 Spazi e algebre normate e di Banach
17
Osservazioni 2.10. (1) Si verifica immediatamente che f : X → X `e continua se e solo se `e continua in ogni punto p ∈ X. (2) Le definizione (b) si riduce alla definizione elementare “-δ” quando gli spazi X e X siano spazi Rn (o Cn ) dotati della topologia standard, tenendo conto che: (a) gli intorni aperti possono sempre essere scelti come palle aperte di raggi δ ed e che (b) ogni intorno aperto di un punto include una palla aperta centrata in quel punto. Definizione 2.11. Se {(Xi , Ti )}i∈F `e una classe finita di spazi topologici, la topologia prodotto su X := ×i∈F Xi `e l’unica topologia i cui gli aperti sono ∅ e le unioni di tutti i possibili prodotti cartesiani ×i∈F Ai , con Ai ∈ Ti per ogni i ∈ F . Nel caso in cui F non sia finito, la definizione di topologia prodotto richiede un’opportuna generalizzazione (vedi appendice in fondo al libro).
2.2 Spazi e algebre normate e di Banach Dopo aver specializzato al caso degli spazi normati le nozioni di topologia generale introdotte nella sezione precedente, passeremo ad introdurre gli spazi di Banach, per poi concludere introducendo le algebre normate e di Banach, arricchendo la struttura algebrica con la presenza di un prodotto interno. 2.2.1 Spazi normati e loro propriet` a topologiche elementari Le prime nozioni che diamo sono quella di norma, di spazio normato e di funzione continua tra due spazi normati. Esempi di spazi normati, che sono moltissimi in analisi funzionale e nelle sue applicazioni alla fisica, saranno esibiti successivamente, specialmente nella prossima sezione. Definizione 2.12. Sia X uno spazio vettoriale sul campo K = C o R. Un’applicazione N : X → R si dice norma su X e (X, N ) si dice spazio normato, quando N soddisfa le seguenti propriet` a: N0. N (u) ≥ 0 per u ∈ X, N1. N (λu) = |λ|N (u) per λ ∈ K e u ∈ X, N2. N (u + v) ≤ N (u) + N (v), per u, v ∈ X, N3. N (u) = 0 ⇒ u = 0, per u ∈ X. Se N0, N1 e N2 sono soddisfatte ma non lo `e necessariamente N3, N si dice seminorma. Osservazioni 2.13. ` chiaro che da N1 discende che N (0) = 0, mentre da N2 segue la (1) E disuguaglianza: |N (u) − N (v)| ≤ N (u − v)
se u, v ∈ X.
(2.2)
18
2 Spazi normati e spazi di Banach, esempi e applicazioni
(2) La propriet` a N1 `e nota come omogeneit` a, la propriet` a N2 `e nota come (propriet` a della) disuguaglianza triangolare oppure subadditivit` a, le propriet` a N0 e N3 insieme sono note come positivit` a. Se si lascia cadere N3, la propriet` a N0 da sola `e, a volte, chiamata semi positivit` a. Notazione 2.14. Nel seguito || || e p( ), aggiungendo eventuali indici quando necessari, indicheranno sempre rispettivamente norme e seminorme. Useremo comunque, anche qualche altro simbolo se conveniente. Una nozione matematica elementare, ma fondamentale `e la nozione di palla aperta. Definizione 2.15. Sia (X, || ||) uno spazio normato. Una palla aperta di centro x0 ∈ X e raggio r > 0 `e l’insieme: Br (x0 ) := {x ∈ X | ||x − x0 || < r} . Un insieme A ⊂ X `e detto essere limitato, se esiste una palla aperta Br (x0 ) (quindi di raggio finito!) tale che Br (x0 ) ⊃ A. Si osservi che potremmo dare la stessa definizione rimpiazzando la norma || || con una seminorma p e faremo ci`o pi` u avanti. Due propriet` a utili delle palle aperte (valide anche per le palle aperte definite tramite una seminorma), che seguono subito da N2 e dalla definizione di palla aperta, sono le seguenti: Bδ (y) ⊂ Br (x) Br (x) ∩ Br (x ) = ∅
se y ∈ Br (x) e 0 < δ + ||y − x|| < r. se 0 < r + r < ||x − x ||.
(2.3) (2.4)
Passiamo a definire la topologia naturale di uno spazio normato. Definizione 2.16. Si consideri uno spazio normato (X, || ||). (a) A ⊂ X `e aperto se A = ∅ oppure A `e unione di palle aperte. (b) La topologia naturale di X `e la famiglia degli insiemi aperti di X. Osservazioni 2.17. (1) In virt` u di (2.3), risulta subito che: A ⊂ X `e aperto se e solo se: ∀x ∈ A, ∃rx > 0 tale che Brx (x) ⊂ A.
(2.5)
(2) Dalla definizione di insieme aperto e da (2.3) e (2.5) segue subito che gli aperti definiti nel senso della definizione 2.16 sono anche aperti nel senso generale della definizione 2.1. Pertanto la classe degli aperti di uno spazio normato `e effettivamente una topologia nel senso generale. Lo spazio normato X, dotato della famiglia degli aperti suddetti, `e uno spazio topologico in senso proprio. Infine la classe delle palle aperte, di centri e raggi arbitrari, costituisce una base per la topologia naturale dello spazio normato (X, || ||). (3) Ogni spazio normato (X, || ||) soddisfa la propriet` a di Hausdorff della definizione 2.2 (ed `e quindi uno spazio topologico di Hausdorff). La prova
2.2 Spazi e algebre normate e di Banach
19
segue subito da (2.4) scegliendo A = Br (x) e A = Br (x ) avendo fissato r + r < ||x − x||, che deve risultare differente da 0, se x = x , per la propriet` a N3 delle norme. Si noti che se definissimo la topologia adoperando palle aperte definite da una seminorma (invece che una norma), la propriet` a di Hausdorff non sarebbe automaticamente garantita. Teniamo ora conto dei seguenti due fatti validi in ogni spazio normato: (a) gli intorni aperti dei punti possono sempre essere scelti come palle aperte (di raggi e δ) e (b) ogni intorno aperto di un punto include una palla aperta centrata in tale punto (ci` o segue facilmente dalla definizione di aperto in uno spazio normato e dalla (2.3)). Da (a) e (b) si ha immediatamente che, negli spazi normati, la definizione 2.9 di funzione continua pu` o essere equivalentemente enunciata come segue. Definizione 2.18. Un’applicazione f : X → Y, con (X, || ||X ) e (Y, || ||Y ) spazi normati, `e detta continua in x0 ∈ X se, per ogni > 0 esiste un corrispondente δ > 0 tale che ||f(x) − f(x0 )||Y < se ||x − x0 ||X < δ. Una funzione f : X → Y `e detta essere continua se `e continua in ogni punto di X. Nello stesso modo, negli spazi normati, la nozione di successione convergente (definizione 2.6) si specializza nel modo seguente. Definizione 2.19. Se (X, ||||) `e uno spazio normato, una successione {xn }n∈N ⊂ X `e detta convergere ad un vettore x ∈ X, detto il limite della successione, e si scrive: xn → x
per
n → +∞
e anche
limn→+∞ xn = x ,
se e solo se, per ogni > 0 esiste N ∈ R tale che ||xn − x|| < se n > N ; cio`e se e solo se: lim ||xn − x|| = 0 . n→+∞
Osservazione 2.20. Se (X, || ||) `e uno spazio normato e A ⊂ X, allora x ∈ A `e un punto di accumulazione di A se e solo se esiste una successione {xn }n∈N ⊂ A \ {x} tendente a x. Infatti, se x `e punto di accumulazione di A, allora ogni palla aperta B1/n (x), dove n = 1, 2, . . ., contiene almeno un xn ∈ A \ {x}. Allora, per costruzione, xn → x per n → +∞. Viceversa, se {xn }n∈N ⊂ A \ {x} tende a x, dato che, per (2.5), ogni intorno aperto B di x contiene una palla B (x) centrata in x, la definizione di serie convergente implica che B (x) – e quindi B – contiene ogni xn con n > N per qualche N ∈ R. Dunque x `e punto di accumulazione di A Una classe importante di funzioni lineari continue `e quella delle isometrie definite nel seguito.
20
2 Spazi normati e spazi di Banach, esempi e applicazioni
Definizione 2.21. Se (X, || ||X) e (Y, || ||Y ) sono spazi normati sullo stesso campo C o R, un’applicazione lineare L : X → Y `e detta isometria se `e isometrica, cio`e: ||L(x)||Y = ||x||X per ogni x ∈ X. Se l’isometria L : X → Y `e anche suriettiva, L `e detta isomorfismo di spazi normati. Se esiste un isomorfismo di spazi normati (L) dallo spazio normato X allo spazio normato Y, tali spazi si dicono isomorfi (secondo L). Osservazioni 2.22. ` chiaro che ogni isometria L : X → Y `e iniettiva per N3, ma pu` (1) E o non essere suriettiva. Se X = Y, l’assenza di suriettivit`a implica che la dimensione dello spazio X non sia finita. (2) Dato che la controimmagine di una palla aperta secondo un’isometria `e una palla aperta, ogni isometria f : X → Y tra due spazi normati X, Y `e continua rispetto alle topologie dei due spazi normati. (3) Se un’isometria f : X → Y `e anche suriettiva (cio`e se `e un isomorfismo), la sua inversa f −1 : Y → X `e ancora un’applicazione lineare isometrica ed `e quindi f −1 `e un isomorfismo da Y a X. Evidentemente un isomorfismo di spazi normati `e un omeomorfismo (lineare) tra i due spazi. (4) A volte si trova in letteratura una definizione alternativa, e non equivalente a quella da noi adottata, di isomorfismo di spazi normati. Tale definizione richiede solo che un isomorfismo sia un’applicazione lineare bicontinua (cio`e un ` chiaro che un isomorfismo nel senso della definizione omeomorfismo lineare). E definizione 2.21 lo `e anche rispetto a questa seconda definizione, tuttavia non vale il viceversa, perch`e la richiesta di bicontinuit` a `e molto pi` u debole della richiesta di preservare le norme. Per esempio la funzione f : X x → ax ∈ X, dove a = 0 `e una costante fissata, `e un isomorfismo dallo spazio normato X in X nel senso della seconda definizione, ma non in quella adottata da noi. Un ulteriore risultato tecnico elementare che citiamo `e il seguente, che vale negli spazi normati esattamente come accade nello spazio normato elementare R dotato della norma naturale del valore assoluto. Proposizione 2.23. Una funzione f : X → Y tra due spazi normati, X, Y, `e continua in un punto x ∈ X se e solo se `e sequenzialmente continua in quel punto, cio`e f(xn ) → f(x) per n → +∞, per ogni successione {xn }n∈N ⊂ X tale che xn → x se n → +∞. Dimostrazione. Se f `e continua in x, sia {xn }n∈N ⊂ X tendente a x. Dato che f `e continua, per ogni > 0, esiste δ > 0 tale che ||f(xn ) − f(x)||Y < se ||xn − x||X < δ. Dato che ||xn − x|| → 0, concludiamo che, per ogni > 0 esiste N ∈ R tale che ||f(xn ) − f(x)||Y < se n > N . Abbiamo provato che e f `e sequenzialmente continua in x se `e continua in x. Supponiamo ora che f non sia continua in x0 , mostriamo che non pu`o essere sequenzialmente continua in x. Nelle ipotesi fatte, deve esistere > 0, tale che per ogni n = 1, 2, . . ., esiste xn ∈ X tale che ||xn − x||X < 1/n ma ||f(x) − f(xn )||Y > . La successione
2.2 Spazi e algebre normate e di Banach
21
{xn }n=1,2,... costruita in questo modo tende a x, ma la corrispondente successione {f(xn )}n=1,2,... non tende a f(x) in Y. Pertanto f non `e sequenzialmente continua in x. Per ultimo vogliamo discutere le propriet` a di continuit` a delle operazioni di spazio vettoriale rispetto alle topologie naturali presenti sugli spazi normati. Se (X, || ||X ) e (Y, || ||Y ) sono spazi normati sullo stesso campo K = C o R, possiamo considerare lo prodotto cartesiano Y × X dotato della topologia prodotto indotta da quella dei fattori X e Y, presentata nella definizione 2.11. Tale topologia `e quella per cui gli aperti sono, a parte l’insieme vuoto, le unioni di prodotti cartesiani di tutte le palle aperte negli spazi fattore: X e Y. Nel caso in cui Y = X, ci` o permette di studiare la continuit` a dell’operazione di somma di due vettori in X × X, pensata come: + : X × X (u, v) → u + v ∈ X , dove X × X `e dotato della topologia prodotto. Dalla propriet` a N2 delle norme: ||u + v|| ≤ ||u|| + ||v|| segue immediatamente che + `e una funzione congiuntamente continua nei due argomenti rispetto alle topologie naturali; in altre parole, `e continua rispetto alla topologia prodotto nel dominio ed a quella standard nell’immagine. Infatti dalla disuguaglianza triangolare segue che, fissato (u0 , v0 ) ∈ X × X e > 0, allora u +v ∈ B (u0 +v0 ) se (u, v) ∈ Bδ (u0 )×Bδ (v0 ) con 0 < δ < /2. Nel caso in cui Y sia il campo K = R oppure C dello spazio normato X, pensato come spazio normato con la norma del valore assoluto, possiamo studiare la continuit` a dell’operazione di prodotto di scalare e vettore in K × X, pensata come: K × X (α, u) → αu ∈ X , dove il primo membro `e dotato della topologia prodotto. Dalle propriet` a N2 e N1 delle norme, essendo la seconda: ||αu|| = |α| ||u|| , segue immediatamente che il prodotto di uno scalare per un vettore `e una funzione congiuntamente continua nei due argomenti rispetto alle topologie naturali; in altre parole, `e continua rispetto alla topologia prodotto nel dominio ed a quella standard nell’immagine. Anche in questo caso la prova `e immediata: dall’identit` a di sopra e da N2 si ha che, fissato (α0 , u0 ) ∈ K × X, e (K) > 0, allora αu ∈ B (α0 u0 ) se (α, u) ∈ Bδ (α) × Bδ (u0 ) con 0 < δ < /(2α0 ) (K) e 0 < δ < /(2(||u0|| + δ)). (Sopra Bδ (α) indica una palla aperta in K, considerato come spazio normato.)
22
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.2.2 Spazi di Banach Alcune delle propriet` a e nozioni viste precedentemente si possono in realt`a generalizzare a spazi topologici del tutto generali. Viceversa esistono propriet`a, quali la completezza che andiamo a discutere ora, che sono proprie della teoria degli spazi normati (e pi` u in generale, degli spazi topologici metrizzabili che non considereremo, se non marginalmente, in un altro capitolo). Un fatto ben noto gi` a dalla teoria elementare su Rn `e il seguente. Se (X, ||||) `e uno spazio normato e {xn }n∈N ⊂ X `e una successione convergente, allora essa soddisfa anche la cosiddetta propriet` a di Cauchy: per ogni > 0 esiste N ∈ R tale che, se n, m > N , allora ||xn − xm || < . Infatti: se ||xn − x|| → 0 per n → +∞, allora ||xk − x|| < se k > N e quindi ||xn − xm || ≤ ||xn − x|| + ||xm − x|| < se n, m > N/2 . Una successione che soddisfa la propriet`a di Cauchy `e detta successione di Cauchy. L’idea intuitiva della dimostrazione di sopra `e che, se una successione converge a qualche punto, allora i termini della successione si devono avvicinare ` interessante porsi la domanda se sia vero anche sempre di pi` u tra di essi. E il viceversa: una successione di vettori che si avvicinano sempre di pi` u tra di essi ammette sempre un limite? Come ben noto dai corsi di analisi elementare, se X = R, dotato della norma del valore assoluto, la risposta `e positiva (e, di conseguenza, continua ad esserlo su C e su spazi vettoriali costruiti in modo ovvio sui prodotti cartesiani Rn o Cn ed adoperando le norme standard su questi spazi). Ci`o `e garantito dal fatto che R soddisfa il cosiddetto assioma di completezza. Gli spazi normati in cui ogni successione di Cauchy `e una successione convergente sono detti spazi normati completi. In generale, uno spazio normato non `e completo: gli spazi normati completi sono “pochi” e di conseguenza, sono, per loro natura, interessanti. Tali spazi presentano notevoli propriet` a matematiche, moto utili anche per le applicazioni in fisica, che saranno oggetto di gran parte del seguito di questo libro. Definizione 2.24. Uno spazio normato si dice spazio di Banach quando `e completo: cio`e ogni successione di Cauchy di elementi dello spazio converge a qualche elemento dello spazio. Osservazione 2.25. ` chiaro che la propriet` (1) E a di completezza `e invariante per isomorfismi di spazi normati, ma non lo `e sotto omeomorfismi (applicazioni continue con inversa continua, non necessariamente lineari). Un controesempio `e dato dalla coppia di spazi R e (0, 1) entrambi dotati della norma valore assoluto. I due spazi sono connessi da un omeomorfismo ma il primo `e completo, mentre il secondo non lo `e. ` facile provare che ogni sottospazio M chiuso di uno spazio di Banach B (2) E `e a sua volta uno spazio di Banach rispetto alla restrizione della norma: ogni
2.2 Spazi e algebre normate e di Banach
23
successione di Cauchy di M `e tale anche rispetto a B e quindi deve convergere a qualche punto di B. Tale punto deve appartenere a M perch´e M `e chiuso e quindi contiene i suoi punti di accumulazione. Gli spazi Cn e Rn dotati della norma standard: n |ck |2 ||(c1 , . . . , cn )|| = k=1
sono sicuramente l’esempio pi` u ovvio di spazio di Banach finitodimensionale, complesso e reale, rispettivamente. Si pu`o inoltre provare che ogni spazio di Banach finitodimensionale complesso `e omeomorfo ad un corrispondente Cn dotato della norma detta sopra. Proveremo questo risultato nella sezione 2.6, ma daremo esempi espliciti di spazi di Banach a partire dalla prossima sezione. Vale comunque un importante risultato generale per ogni spazio normato: ogni spazio normato pu` o essere completato producendo uno spazio di Banach determinato dallo spazio di partenza, che risulta esser denso nello spazio pi` u grande completo. Teorema 2.26. (Del completamento per spazi di Banach). Sia (X, || ||) uno spazio vettoriale sul campo K = C o R. (a) Esiste uno spazio di Banach (Y, N ) su K, detto completamento di X, tale che X si identifica isometricamente con un sottospazio denso di Y tramite un’applicazione lineare iniettiva J : X → Y. In altre parole, esiste un’applicazione lineare iniettiva J : X → Y con J(X) = Y
e
N (J(x)) = ||x|| per ogni x ∈ X.
(b) Se la terna (J1 , Y1 , N1 ) con J1 : X → Y1 lineare isometrica e (Y1 , N1 ) spazio di Banach su K `e tale che (X, || ||) si identifica isometricamente con un sottospazio denso di Y1 tramite J1 , allora esiste ed `e unico un isomorfismo di spazi normati φ : Y → Y1 tale che J1 = φ ◦ J. Schema della dimostrazione. Diamo solo l’idea generale della dimostrazione che `e molto simile ad una possibile procedura che si usa per completare i razionali nei reali. (a) Conviene considerare lo spazio C delle successioni di Cauchy di elementi di X e definire la relazione di equivalenza in C: xn ∼ xn
⇔
esiste
lim ||xn − xn || = 0 .
n→∞
` chiaro che X ⊂ C/∼ identificando ogni x di X con la classe di equivalenza E della successione costante xn = x. L’applicazione che definisce tale identificazione la indicheremo con J. Si prova facilmente che C/∼ `e uno spazio vettoriale su K normato rispetto alla struttura indotta naturalmente da quella di X. Si prova infine che C/∼ `e completo, che J `e lineare, isometrica (e quindi iniettiva)
24
2 Spazi normati e spazi di Banach, esempi e applicazioni
e che J(X) `e denso in Y := C/∼. (b) J1 ◦ J −1 : J(X) → Y1 `e una trasformazione lineare isometrica continua definita su un insieme denso J(X) ⊂ Y a valori in uno spazio di Banach Y1 , e pertanto si estende unicamente ad una trasformazione φ lineare continua ed isometrica su Y (vedi gli esercizi 2.14 e 2.15). Essendo φ isometrica, `e anche iniettiva. La stessa cosa si pu` o dire per l’estensione φ di J ◦J1−1 : J1 (X) → Y e per costruzione (J ◦J1−1 )◦(J1 ◦J −1 ) = idJ(X) . Estendendo per continuit`a su J(X) = Y troviamo che φ ◦ φ = idY e con un analogo ragionamento troviamo anche che φ ◦ φ = idY1 . Concludiamo che φ e φ sono anche suriettive ed in particolare φ `e un isomorfismo di spazi normati e che per costruzione vale J1 = φ ◦ J. L’unicit` a di un isomorfismo φ : Y → Y che soddisfa J1 = φ ◦ J si ha facilmente notando che ogni altro siffatto isomorfismo di spazi normati ψ : Y → Y1 , per linearit` a deve soddisfare J − J = (φ − ψ) ◦ J e quindi (φ − ψ) J(X) = 0. L’unicit` a dell’estensione dell’applicazione (φ − ψ) J(X) , continua con dominio J(X) denso, a J(X) = Y prova che φ = ψ. Un criterio per verificare se uno spazio normato `e di Banach `e espresso dalla seguente utile proposizione. Proposizione 2.27. Sia (X, || ||) uno spazio normato. Si supponga che +∞ ogni serie e n=0 xn di elementi di X che converge assolutamente (cio` +∞ e uno n=0 ||xn|| < +∞) converga a qualche elemento di X. Allora (X, || ||) ` spazio di Banach. Dimostrazione. Si consideri una successione di Cauchy {vn }n∈N ⊂ X. Mostriamo che, se vale la propriet`a scritta sopra, allora tale successione converge ad un elemento di X. Dato che al successione `e di Cauchy, per ogni k = 0, 1, 2, . . ., esiste Nk tale che ||vn − vm || < 2−k se n, m ≥ Nk . Scegliamo i numeri Nk in modo tale che Nk+1 > Nk ed estraiamo la sottosuccessione {vNk }k∈N . Infine definiamo i vettori: z0 := vN1 e zk := vNk+1 − vNk e costruiamo la +∞ k serie k=0 zk . Si osservi che vNk = k =0 zk . Per costruzione ||zk || < 2−k e pertanto la serie suddetta converger`a assolutamente. Nelle ipotesi fatte sullo spazio normato, esister`a v ∈ X tale che: lim vNk = lim
k→+∞
k→+∞
k
zk = v .
k =0
Concludiamo che la sottosuccessione {vNk }k∈N della successione di Cauchy {vn }n∈N converge a v ∈ X. Per concludere `e sufficiente provare che tutta la successione {vn }n∈N converge a tale limite. Valendo: ||vn − v|| ≤ ||vn − vNk || + ||vNk − v|| , per un fissato > 0, possiamo trovare N per cui ||vn − vNk || < /2 se n, Nk > N , dato che la successione {vn }n∈N `e di Cauchy. D’altra parte, possiamo trovare M tale che ||vNk −V || < /2 se k > M , dato che vNk → v. Concludendo: prendendo k > M abbastanza grande, in modo tale che Nk > N ,
2.2 Spazi e algebre normate e di Banach
25
abbiamo che ||vn − v|| < se n > N . Dato che > 0 era arbitrario, questo significa che vn → v se n → +∞. 2.2.3 Un esempio: lo spazio di Banach C(K; Kn ) e il teorema di Arzel` a-Ascoli Ricordiamo preventivamente la seguente definizione topologica generale. Definizione 2.28. Sia (X, T ) spazio topologico e K ⊂ X (eventualmente K = X). (a) K `e detto compatto se ogni ricoprimento di aperti di K ammette un sotto ricoprimento finito1 . (b) K `e detto relativamente compatto se K `e compatto. (c) X `e detto localmente compatto se ogni suo punto ammette un intorno aperto relativamente compatto. Le propriet` a degli insiemi compatti sono molteplici [Ser94II] e non ce ne occuperemo in questa sede (torneremo su tale nozione nel capitolo 4), eccetto che per le due seguenti propriet` a elementari. Proposizione 2.29. Se K = C o R, si denoti la norma standard di Kn con: n |ck |2 , (c1 , . . . , cn ) ∈ Kn . (2.6) ||(c1 , . . . , cn )|| := k=1
Sia f : X → Kn , una funzione continua dallo spazio topologico (X, T ) allo spazio normato (Kn , || ||) (complesso o reale a seconda del caso). Se K ⊂ X `e compatto allora la restrizione di f a K `e limitata, cio`e esiste M ∈ R tale che ||f(x)|| ≤ M per ogni x ∈ K. Dimostrazione. Dato che f `e continua in ogni punto p ∈ K, vale ||f(x)|| ≤ Mp ∈ R per ogni x ∈ Ap intorno aperto di p. Dato che K `e compatto, possiamo estrarre un sotto ricoprimento finito {Apk }k=1,...,N dal ricoprimento di aperti {Ap }p∈K di K. Il numero M := maxk=1,...,N Mk soddisfa la tesi. Nel caso in cui X sia Rn (oppure Cn ), il famoso teorema di Heine-Borel [Ser94II] assicura che: i compatti in Rn dotato della topologia standard sono tutti e soli i sottoinsiemi chiusi e limitati. In tal caso la proposizione 2.29 non `e altro che la parte fondamentale dell’enunciato del noto teorema di Weierstrass dell’analisi elementare. In riferimento alla nozione di topologia indotta (vedi la sezione 2.1), abbiamo che la propriet` a di compattezza `e una propriet` a ereditaria, nel senso della seguente proposizione, di dimostrazione immediata dalla definizione 2.28. 1 In altre parole: se {Ai }i∈I ⊂ T con ∪i∈I Ai ⊃ K allora esiste J ⊂ I, J finito, con ∪i∈J Ai ⊃ K.
26
2 Spazi normati e spazi di Banach, esempi e applicazioni
Proposizione 2.30. Se (X, T ) `e uno spazio topologico, K ⊂ X `e compatto se e solo se `e compatto come spazio topologico (K, TK ), dove TK `e la topologia indotta su K da (X, T ). Uno degli esempi pi` u semplici di spazio di Banach non ovvio e, generalmente parlando, infinito dimensionale, `e quello dello spazio C(K; Kn ) delle funzioni continue a valori su Kn con K = C oppure R, definite su un comune spazio topologico compatto K ed assumendo come norma quella dell’estremo superiore ||f||∞ := supx∈K ||f(x)||. Si osservi che tale norma `e sempre finita se f ∈ C(K; Kn ) proprio per la proposizione 2.29. Proposizione 2.31. Sia K = C o R e si consideri lo spazio normato (Kn , || ||) con norma data in 2.6. Se K `e uno spazio topologico compatto, lo spazio vettoriale C(K; Kn ) delle funzioni continue da K a Kn , dotato della norma: ||f||∞ := sup ||f(x)|| , x∈X
`e uno spazio di Banach (complesso o reale a seconda del caso). Dimostrazione. Sia {fn }n∈N ⊂ C(K; K) una successione di Cauchy. Vogliamo dimostrare che esiste f ∈ C(K; K) tale che ||fn − f||∞ → 0 per n → +∞. Dato che {fn }n∈N `e di Cauchy, per ogni fissato x ∈ K, `e di Cauchy anche la successione delle n-ple: fn (x) ∈ Kn . In questo modo, dato che Kn `e completo, punto per punto viene definita la funzione: f(x) := lim fn (x) . n→+∞
Vogliamo ora provare che f ∈ C(K; K) e che ||fn − f||∞ → 0 per n → +∞. Dato che la successione {fn }n∈N `e di Cauchy, per ogni > 0, esiste N tale che, se n, m > N ||fn (x) − fm (x)|| < ,
per tutti gli x ∈ K.
D’altra parte, dalla definizione di f, per un fissato x ∈ K e per ogni x > 0, esister`a Nx,x tale che, se m > Nx,x vale ||fm (x) − f(x)|| < x . Usando entrambi i fatti abbiamo subito che, se n > N : ||fn (x) − f(x)|| ≤ ||fn (x) − fm (x)|| + ||fm (x) − f(x)|| < + x dove abbiamo scelto m > max(N , Nx,x ). In definitiva, se n > N , vale ||fn (x) − f(x)|| < + x ,
per ogni x > 0.
Dato che x > 0 `e arbitrario, la disuguaglianza di sopra vale anche per x = 0, eventualmente diventando un’uguaglianza. In questo modo si perde la dipendenza da x. In definitiva, per ogni > 0 esiste N ∈ N tale che, se n > N ||fn (x) − f(x)|| ≤ , per tutti gli x ∈ K. (2.7)
2.2 Spazi e algebre normate e di Banach
27
Quindi {fn } converge a f uniformemente. Dato che (2.7) vale per ogni x ∈ K, vale anche prendendo l’estremo superiore degli x in K: per ogni > 0 esiste N ∈ N tale che supx∈K ||fn (x) − f(x)|| < , se n > N . In altre parole ||fn − f||∞ → 0 ,
se n → +∞.
Per concludere mostriamo che f deve essere anche continua. Fissato x ∈ K, per ogni > 0 esibiremo δ > 0, tale che ||f(x ) − f(x)|| < se ||x − x|| < δ. A tal fine, sfruttando l’uniforme convergenza provata, scegliamo n tale che, per il valore di fissato, ||f(z) − fn (z)|| < /3 per ogni z ∈ K. Ulteriormente, dato che fn `e continua, esiste δ > 0 tale che ||fn (x ) − fn (x)|| < /3 se ||x − x|| < δ. Mettendo tutto insieme, e facendo uso della disuguaglianza triangolare, possiamo concludere che, come volevamo, se ||x − x|| < δ, allora: ||f(x ) − f(x)|| ≤ ||f(x ) − fn (x )|| + ||fn (x ) − fn (x)|| + ||fn (x) − f(x)|| < /3 + /3 + /3 = . Dunque f ∈ C(K; K).
Notazione 2.32. Nel seguito useremo la notazione C(K) := C(K; C).
Nel caso particolare in cui K sia un compatto che contiene un sottoinsieme denso e numerabile, lo spazio di Banach C(K) ha una propriet` a interessante espressa dall’enunciato del teorema di Arzel` a-Ascoli nella sua forma pi` u elementare che riportiamo sotto. Anche se tale teorema non `e strettamente legato al contenuto di questo libro, per la sua importanza (specie le sue generalizzazioni) e per la caratteristica procedura di dimostrazione merita di essere menzionato e provato. Definizione 2.33. Una successione {fn }n∈N di funzioni fn : X → C, con (X, || ||) spazio normato2 , si dice equicontinua se, per ogni > 0 esiste δ > 0 tale che valga |fn (x) − fn (x )| < se ||x − x || < δ, per ogni n ∈ N e per ogni x, x ∈ X. Teorema 2.34. (Di Arzel` a-Ascoli.) Si consideri uno spazio topologico K compatto e separabile (definizione 2.4). Sia {fn }n∈N ⊂ C(K) una successione di funzioni che soddisfa le seguenti due condizioni: (a) `e equicontinua, (b) esiste C ∈ R con ||fn ||∞ < C per ogni n ∈ N. Allora esiste una sottosuccessione {fnk }k∈N che converge a qualche f ∈ C(K) nella topologia della norma || ||∞. Dimostrazione. Si considerino i punti q di un insieme denso numerabile Q ⊂ K etichettati su N. Se q1 `e il primo dei punti detti, consideriamo i valori |fn (q1 )|. Tali valori cadono in un compatto [0, C] e quindi, o sono finiti e quindi 2
La definizione si estende banalmente agli spazi metrici.
28
2 Spazi normati e spazi di Banach, esempi e applicazioni
fn (q1 ) = x1 ∈ C per uno stesso valore x1 e per infiniti valori di n, oppure i numeri fn (q1 ) ammetteranno un punto di accumulazione x1 ∈ C. In entrambi i casi, esister`a una sottosuccessione {fnk }k∈N per cui fnk (q1 ) → x1 ∈ C per qualche x1 ∈ C. Poniamo f1n := fnk . Possiamo ripetere la procedura considerando i valori |f1n (q2 )|, dove q2 `e il secondo punto di Q, estraendo una sottosuccessione {f2n }n∈N dalla successione {f1n }n∈N. Per costruzione, f2n (q1 ) → x1 e f2n (q2 ) → x2 ∈ C se n → +∞. Procedendo in questo modo, per ogni k ∈ N, possiamo costruire una sottosuccessione {fkn }n∈N di {fn }n∈N tale che converge quando valutata su q1 , q2 , . . . , qk ∈ Q. Consideriamo la sottosuccessione di {fn }n∈N costruita prendendo tutti i termini diagonali delle sottosuccessioni costruite come detto: {fnn }n∈N. Mostriamo che tale sottosuccessione `e di Cauchy rispetto alla norma || ||∞, concludendo la dimostrazione. Fissiamo > 0 e ricaviamo il δ > 0 corrispondente ad /3 in riferimento alla propriet` a di equicontinuit` a, quindi ricopriamo K di palle di raggio δ centrate in ogni punto di K e, sfruttando la compattezza di K, estraiamo un (1) (2) (N) sottoricoprimento finito di palle di raggio δ, Bδ , Bδ , . . . , Bδ e scegliamo (j) (j) q (j) ∈ Bδ ∩ Q, per ogni j = 1, . . . , N . Se consideriamo un qualsiasi x ∈ Bδ , avremo allora che: |fnn (x) − fmm (x)| ≤ |fnn (x) − fnn (q (j))| + |fnn (q (j)) − fmm (q (j) )| + |fmm (q (j) ) − fmm (x)| . Il primo ed il terzo termine sono inferiori a /3 per costruzione. Dato che fnn (q (j) ) converge in C se n → +∞, il secondo termine `e inferiore (j) (j) a /3 se n, m > M per qualche M ≥ 0. Per costruzione, se M = (j) maxj=1,...,N M : |fnn (x) − fmm (x)| <
se n, m > M , per ogni x ∈ K.
In altre parole: ||fnn − fmm ||∞ < se n, m > M . Questa `e la tesi che volevamo provare.
Osservazioni 2.35. (1) Il teorema si applica in particolare al caso in cui K `e la chiusura di un aperto non vuoto e limitato A ⊂ Rn , notando che un insieme denso numerabile di K `e l’insieme dei punti di K di coordinate razionali con segno. Inoltre il teorema vale, con la stessa dimostrazione (e con banali modifiche), anche nel caso in cui si sostituisca C(K) con C(K; Kn ). (2) Dimostreremo nel capitolo 4, nella proposizione 4.3, che in uno spazio normato (X, || ||), un sottoinsieme A ⊂ X `e relativamente compatto (cio`e la sua chiusura `e compatta) se da ogni successione di punti di A `e possibile estrarre una sotto successione convergente. In base a questo risultato, il teorema di Arzel`a-Ascoli afferma quanto segue. Se K `e uno spazio topologico compatto separabile, ogni sottoinsieme equicontinuo di C(K) che sia limitato nella norma ||||∞ `e anche relativamente compatto in (C(K), || ||∞ ).
2.2 Spazi e algebre normate e di Banach
29
(3) Esiste un importante teorema di analisi funzionale [Mrr01], detto Teorema di Banach-Mazur, che citiamo senza provare, che dimostra che ogni spazio di Banach complesso separabile `e isometricamente isomorfo ad un corrispondente sottospazio chiuso di (C([0, 1]), || ||∞). Presenteremo diversi esempi di spazi di Banach alla fine della sezione seguente, dopo avere introdotto la nozione di algebra normata e di Banach.
2.2.4 Algebre normate, algebre di Banach ed esempi vari Come vedremo tra poco, in molte applicazioni esiste uno stretto legame tra algebre e spazi normati, tale legame passa per la nozione di operatore lineare su uno spazio normato. Infatti le algebre normate pi` u importanti nelle applicazioni alla fisica sono quelle costituite da operatori. La nozione di algebra e di algebra normata `e comunque del tutto indipendente da quella di operatore. La nozione di algebra si ottiene arricchendo la struttura di spazio vettoriale con un prodotto interno associativo, che sia distributivo rispetto alla somma di vettori e si comporti in modo associativo rispetto al prodotto tra vettori e scalari. La nozione di algebra normata si ottiene aggiungendo, alla struttura di algebra, una norma che renda lo spazio vettoriale uno spazio normato e che si comporti “bene” rispetto al prodotto dell’algebra. Le definizioni principali riguardante le menzionate strutture sono riassunte nella seguente definizione. Definizione 2.36. Un’algebra A sul campo K = C o R `e uno spazio vettoriale su K dotato di un’ulteriore applicazione, ◦ : A × A → A, detta prodotto dell’algebra, che sia associativa: (a ◦ b) ◦ c = a ◦ (b ◦ c)
per ogni terna a, b, c ∈ A
(2.8)
e tale che, rispetto alla struttura di spazio vettoriale soddisfi: A1. a ◦ (b + c) = a ◦ b + a ◦ c per a, b, c ∈ A, A2. (b + c) ◦ a = b ◦ a + c ◦ a per a, b, c ∈ A, A3. α(a ◦ b) = (αa) ◦ b = a ◦ (αb) per α ∈ K e a, b ∈ A. L’algebra (A, ◦) `e detta: commutativa o abeliana se A4. a ◦ b = b ◦ a per ogni coppia a, b ∈ A; algebra con unit` a se contiene un elemento I, detto unit` a dell’algebra, tale che: A5. I ◦ u = u ◦ I = u per ogni a ∈ A; algebra normata ovvero algebra normata con unit` a se `e uno spazio vettoriale normato con norma || || che soddisfi la relazione A6. ||a ◦ b|| ≤ ||a||||b|| per a, b ∈ A;
30
2 Spazi normati e spazi di Banach, esempi e applicazioni
e, nel caso di algebra normata con unit` a, valga anche: A7. ||I|| = 1; algebra di Banach ovvero algebra di Banach con unit` a se A `e spazio di Banach e rispettivamente algebra normata, o algebra normata con unit` a rispetto alla stessa norma. Un omomorfismo di algebre (con unit` a, normate, di Banach), φ : A1 → A2 `e una funzione lineare che preserva i prodotti delle algebre e le unit` a, se presenti. Con ovvie notazioni: φ(a ◦1 b) = φ(a) ◦2 φ(b)
se a, b ∈ A,
φ(I1 ) = I2 .
Un omomorfismo di algebre `e detto isomorfismo di algebre (con unit` a, normate, di Banach) se `e anche biettivo. Se esiste un isomorfismo φ : A → A , le algebre A e A (con unit` a, normate, di Banach) sono dette isomorfe. Osservazioni 2.37. (1) Si dimostra immediatamente che l’unit`a, se esiste `e unica: se I e I soddisfano entrambi A5, allora I = I ◦ I = I. (2) Nel caso di algebre normate, dagli assiomi dati risulta immediatamente che tutte le operazioni dell’algebra sono continue rispetto alle topologie naturali coinvolte. Abbiamo gi` a mostrato alla fine della sezione 2.2.1 che questo `e vero per le operazioni di somma di vettori e di prodotto di scalari e vettori. Anche l’operazione di prodotto ◦ `e congiuntamente continua negli argomenti (cio`e nella topologia prodotto di A × A) valendo: ||a ◦ b|| ≤ ||a|| ||b|| . (3) Si osservi che la nozione di norma non viene coinvolta nella definizione di omomorfismo e isomorfismo di algebre con unit` a, normate, di Banach. (4) La nozione di sottoalgebra (con unit` a, normata, di Banach) `e quella ovvia: si tratta di un sottoinsieme A1 ⊂ A, di un’algebra A (normata, con unit` a, di Banach), che continua ad essere un’algebra (dello stesso tipo di A) rispetto alle ovvie restrizioni delle operazioni di algebra (con la stessa unit` a di A se esiste, dotata della restrizione della norma di A se presente, e A1 deve essere completa se A `e di Banach). Notazione 2.38. Nel seguito, se ci`o non dar` a luogo a fraintendimenti, indicheremo il prodotto di due elementi di un’algebra con ab, semplicemente, invece che con a◦b, oppure, in altri casi, con il semplice puntino: f ·g, specialmente lavorando con algebre di funzioni. Esempi 2.39. Diamo ora diversi esempi di spazi di Banach e di algebre di Banach. Alcuni esempi richiedono, in alcuni punti, nozioni di teoria della misura astratta per le quali si rimanda alla bibliografia indicata ed all’appendice a fine libro. (1) I campi C e R sono banalmente algebre commutative di Banach con unit` a. In entrambi i casi la norma `e l’operazione di estrazione del valore assoluto o modulo.
2.2 Spazi e algebre normate e di Banach
31
(2) Se X `e un insieme qualsiasi e K = C o R, indichiamo con L(X) l’insieme di tutte le funzioni f : X → K limitate, cio`e supx∈X |f(x)| < ∞. L(X) ha una struttura naturale di spazio vettoriale su K rispetto alla solita operazione di composizione lineare di funzioni: se α, β ∈ C e f, g ∈ L(X), (αf + βg)(x) := αf(x) + βg(x)
per ogni x ∈ X.
Possiamo aggiungere un prodotto che rende L(X) un’algebra: se f, g ∈ L(X), (f · g)(x) := f(x)g(x)
per ogni x ∈ X.
Si osservi che l’algebra `e commutativa e con unit`a (data dalla funzione che vale sempre 1). Una norma che rende L(X) algebra di Banach commutativa `e quella dell’estremo superiore: ||f||∞ := supx∈X |f(x)|. La dimostrazione `e del tutto elementare (si basa sulla completezza di C, lavorando punto per punto per x ∈ X) ed `e data nella soluzione degli esercizi a fine capitolo. (3) Se sull’insieme X di sopra definiamo una σ-algebra, Σ, la sottoalgebra delle funzioni Σ-misurabili, Mb (X) ⊂ L(X), `e un insieme chiuso in L(X) rispetto alla topologia della norma dell’estremo superiore. Quindi Mb (X) `e a sua volta un’algebra di Banach commutativa. Ci`o segue immediatamente dall’esempio precedente, tenendo conto del fatto che il limite puntuale di funzioni misurabili `e ancora una funzione misurabile. (4) Se X `e uno spazio topologico, lo spazio vettoriale delle funzioni continue a valori nel campo C si indica con C(X), abbiamo gi` a usato tale notazione, nel caso in cui X sia un compatto, nella sezione 2.2.3. Cb (X) ⊂ C(X) denota il sottospazio delle funzioni continue limitate. Cc(X) ⊂ Cb (X) denota il sottospazio delle funzioni continue a supporto compatto. Nel caso X sia compatto i tre spazi coincidono evidentemente. I tre spazi sono sicuramente algebre commutative rispetto alle operazioni dette nell’esempio (2). C(X) e Cb (X) sono algebre con unit` a data dalla funzione costante di valore 1, mentre non lo `e Cc (X) quando X non `e compatto. Valgono i seguenti risultati generali. (a) Cb (X) `e algebra di Banach rispetto alla norma dell’estremo superiore || ||∞. (b) Se X = K `e compatto, allora Cc(K) = C(K) `e un’algebra di Banach con unit` a rispetto alla norma dell’estremo superiore || ||∞, come abbiamo ` un risultato importante delle teorie delle algebre visto nella sezione 2.2.3. E di Banach [Rud91] che: ogni algebra di Banach commutativa, con unit` a, con campo C, `e isomorfa ad un’algebra C(K) con K compatto. (c) Se X `e uno spazio topologico: 1. di Hausdorff, che sia anche 2. localmente compatto,
32
2 Spazi normati e spazi di Banach, esempi e applicazioni
allora, completando lo spazio normato Cc (X) si ottiene un’algebra di Banach (senza unit` a) commutativa indicata con C0 (X). Tale algebra di Banach si chiama l’algebra delle funzioni continue che tendono a zero all’infinito in X [Rud82]. Si tratta delle funzioni continue f : X → C, tali che, per ogni > 0 esiste un compatto K ⊂ X (dipendente da f in generale) con |f(x)| < se x ∈ X \ K . (5) Se X `e spazio di Hausdorff compatto, consideriamo in C(X) una sottoalgebra A che soddisfi i seguenti requisiti: contenga l’unit`a (data dalla funzione che vale ovunque 1) e sia chiusa rispetto alla coniugazione complessa – se f ∈ A allora f ∗ ∈ A, dove f ∗ (x) := f(x) per ogni x ∈ X in cui la barra indica la coniugazione complessa. Diremo che A separa i punti di X, se per ogni coppia x, y ∈ X con x = y esiste f ∈ A con f(x) = f(y). Il teorema di Stone-Weierstrass [Rud91], prova quanto segue. Teorema 2.40. (Di Stone-Weierstrass). Sia X spazio di Hausdorff compatto e si consideri l’algebra di Banach con unit` a (C(X), || ||∞). Ogni sottoalgebra A ⊂ C(X) che contenga l’unit` a, sia chiusa rispetto alla coniugazione complessa e separi i punti, `e tale che la sua chiusura rispetto alla norma || ||∞ coincide con C(X) stessa. Un esempio tipico `e quello in cui X `e un compatto di Rn e A `e l’algebra dei polinomi complessi ad n variabili (le coordinate standard di Rn ) ristretti ad X. Dal teorema di Stone-Weierstrass si ricava che con i polinomi possiamo approssimare uniformemente ogni funzione complessa continua definita su X. Tale risultato `e utile nella teoria degli spazi di Hilbert per costruire basi hilbertiane, come diremo pi` u avanti. (6) Sia (X, Σ, μ) uno spazio con misura positiva. In altre parole [Rud82], X `e un insieme, Σ `e una σ-algebra di sottoinsiemi di X e μ : Σ → [0, +∞) ∪ {+∞} `e una misura σ-additiva (vedi l’appendice in fondo al libro). Valgono la disuguaglianza di H¨ older e la disuguaglianza di Minkowski, rispettivamente:
1/p
1/q p q |f(x)g(x)|dμ(x) ≤ |f(x)| dμ(x) |g(x)| dμ(x) (2.9) X
X
X
X
1/p
1/p
1/p p p p |f(x) + g(x)| dμ(x) ≤ |f(x)| dμ(x) + |g(x)| dμ(x) X
X
(2.10) dove f, g : X → C sono funzioni misurabili e p, q > 0 con 1/p + 1/q = 1 nel caso della disuguaglianza di H¨ older, mentre p ≥ 1 nel caso della disuguaglianza di Minkowski [Rud82]. Tali disuguaglianze sono dimostrate nelle soluzioni di due esercizi a fine capitolo. Indichiamo con Lp (X, Σ, μ) o, pi` u brevemente, con Lp(X, μ), l’insieme contenente tutte le funzioni f : X → C che sono Σ-misurabili e tali che
2.2 Spazi e algebre normate e di Banach
33
|f(x)|p dμ(x) < ∞. Usando la disuguaglianza di Minkowski, si prova facilmente che Lp (X, μ) `e uno spazio vettoriale rispetto alle solite composizioni lineari di funzioni e che Pp definita sotto `e effettivamente una seminorma: X
Pp (f) :=
1/p |f(x)| dμ(x) . p
X
(2.11)
Dato che Pp(f) = 0 se e solo se f = 0 quasi ovunque rispetto alla misura μ, per ottenere una vera norma, cio`e per avere che sia soddisfatta N3, bisogna fare in modo da identificare con la funzione nulla ogni funzione che differisce da essa per un insieme di misura nulla. A tal fine si pu` o definire la relazione di equivalenza su Lp (X, μ) data da f ∼ g se e solo se f − g `e nulla quasi ovunque rispetto a μ. Si indica con Lp (X, μ) lo spazio quoziente Lp (X, μ)/∼. Questo spazio eredita naturalmente una struttura di spazio vettoriale su C da quella di Lp (X, μ) semplicemente definendo: [f] + [g] := [f + g]
e
α[f] := [αf] per ogni α ∈ C e ogni f, g ∈ Lp (X, μ).
Si verifica facilmente che, in tali definizioni, i secondi membri sono indipendenti dai rappresentanti scelti nelle classi di equivalenza a primo membro. Si riesce a provare che Lp (X, μ) `e spazio di Banach rispetto alla norma:
1/p |f(x)|p dμ(x) , (2.12) ||[f]||p := X
dove f `e un rappresentante arbitrario di [f] ∈ Lp (X, μ). Nel seguito, con qualche impropriet` a di notazione, useremo sempre il simbolo ||f||p, invece di Pp(f), anche lavorando con funzioni e non con classi di equivalenza. Teorema 2.41. (Di Fischer-Riesz.) Se 1 ≤ p < +∞ e (X, Σ, μ) `e uno spazio con misura positiva σ-additiva, lo spazio normato associato Lp (X, μ) `e uno spazio di Banach. Dimostrazione. Nel seguito indicheremo con la semplice lettera, per es. f, e senza le parentesi quadre, gli elementi di Lp (X, μ), identificandoli, quando conveniente, con funzioni (individuate a meno di insiemi di misura nulla). Per provare la tesi, in virt` u della proposizione 2.27, `e sufficiente verificare +∞ che se la serie di funzioni di Lp(X, μ), n=0 fn converge assolutamente, cio`e +∞ +∞ n=0 ||fn ||p ≤ K < +∞, allora n=0 fn = f quasi ovunque per qualche f ∈ Lp (X, μ) nel senso della topologia di || ||p. Per provare ci` o `e conveniente N definire la seguente successione ausiliaria di funzioni: gN (x) := n=1 |fn (x)|, N dove N = 1, 2, . . .. Per costruzione ||gN ||p ≤ n=1 ||fn ||p ≤ K per ogni N = 1, 2, . . .. Vogliamo ora provare che esiste finito il limite limN→+∞ gN (x) per quasi tutti gli x ∈ X. Per provare ci`o si osservi che la successione delp le funzioni integrabili gN `e non negativa e non decrescente per costruzione p e vale X gN (x) dμ(x) < K p per ogni N . Il teorema della convergenza mop notona (vedi appendice) implica allora che il limite gp delle gN (che esiste,
34
2 Spazi normati e spazi di Banach, esempi e applicazioni
p come funzione a valori in [0, +∞], dato che la successione delle gN ≥ 0 `e non p decrescente) deve avere integrale finito, e quindi g ≥ 0 dovr` a essere finita a meno di un eventuale insieme di misura nulla. Dato che p ≥ 0, nei punti x ∈ X in cui g(x)p < +∞, risulter` a anche limN→+∞ g N (x) = g(x) < +∞. Per costruzione, nei punti x in cui g(x) `e finita, la serie +∞ a assolun=0 fn (x) sar` tamente convergente. Pertanto converger`a a corrispondenti numeri f(x) ∈ C. Definendo f(x) = 0 nei punti nei quali la serie delle fn non converge, abbia+∞ mo ottenuto che la serie n=0 fn converge quasi ovunque ad una funzione f : X → C (misurabile perch´e limite quasi ovunque di funzioni misurabili). N La funzione f appartiene a Lp (X, μ). Infatti, posto fN (x) := n fn (x), la successione delle |fN |p `e una successione di funzioni non negative tali che p p di Fatou (vedi appendice) X |fN (x)| dμ(x) < K per ogni N . Per il lemma p f ∈ L (X, μ). Per concludere proviamo che X |fN (x) − f(x)|p dμ(x) → 0 per n → +∞. Come `e facile provare (vedi la nota di fondo pagina relativa alla soluzione dell’esercizio 2.12), |fN (x) − f(x)|p ≤ 2p (|fN (x)|p + |f(x)|p ). Dato che, per costruzione, |fN |p + |f|p ≤ |g|p + |f|p ∈ L1 (X, μ), possiamo applicare il teorema della convergenza dominata (vedi appendice) alla successione delle funzioni |fN − f|p che sappiamo convergere quasi ovunque a 0, otte nendo X |fN (x) − f(x)|p dμ(x) → 0 per n → +∞. Abbiamo provato che la +∞ serie iniziale di funzioni di Lp (X, μ), n=0 fn , che supponevamo convergere +∞ assolutamente, deve soddisfare n=0 fn = f quasi ovunque per la funzione f ∈ Lp (X, μ) costruita sopra, nel senso della topologia di ||||p. Questo conclude la dimostrazione.
La dimostrazione del teorema di Fischer-Riesz implica in realt`a, un risultato tecnico, molto utile nelle applicazioni, che merita essere citato a parte. Proposizione 2.42. Sia 1 ≤ p < +∞ e (X, Σ, μ) uno spazio con misura positiva σ-additiva. Se {fn }n∈N ⊂ Lp (X, μ) soddisfa fn → f per n → +∞ nella topologia di || ||p , allora esiste una sottosuccessione {fnk }k∈N tale che fnk → f quasi ovunque rispetto a μ. Dimostrazione. La successione {fn }n∈N `e convergente ed `e quindi di Cauchy, possiamo allora estrarre una sottosuccessione {fnk }k∈N tale che ||fnk+1 − +∞ fnk || ≤ 2−k . Definiamo sk := fnk+1 − fnk . La serie fn0 + k=1 sk `e allora +∞ +∞ −k assolutamente convergente, essendo: k=1 ||sk ||p < k=1 2 < +∞. Procedendo come nella dimostrazione del teorema 2.41, concludiamo che (a) esiste la somma s ∈ Lp (X, μ) della serie nel senso della convergenza nella topologia di || ||p, (b) la serie converge anche puntualmente quasi ovunque a s trovata: +∞ fn0 (x) + k∈N sk (x) = s(x). Essendo fn0 (x) + k=1 sk (x) = fnk (x), abbiamo p in realt` a trovato che fnk → s ∈ L (X, μ) sia puntualmente μ-quasi ovunque, sia nel senso di || ||p . Dato che per ipotesi vale anche fnk → f ∈ Lp (X, μ) nel senso di || ||p, deve essere ||f − s||p = 0 e quindi f(x) = s(x) quasi ovunque rispetto a μ e dunque fnk (x) → f(x) quasi ovunque rispetto a μ. Per concludere questo esempio osserviamo che lo spazio di Banach Lp (X, μ), in generale, non `e un’algebra (con l’operazione di prodotto dato dal solito
2.2 Spazi e algebre normate e di Banach
35
prodotto puntuale di funzioni) dato che il prodotto puntuale di funzioni di Lp(X, μ) non `e, in generale, elemento dello stesso spazio. (7) In riferimento all’esempio (6), consideriamo il caso particolare in cui X `e un insieme non necessariamente numerabile, Σ `e l’insieme delle parti di X e μ `e la misura che conta i punti: se S ⊂ X, μ(S) = numero di elementi di S, con μ(S) = ∞ se S contiene infiniti punti. In questo caso lo spazio Lp (X, μ) si indica semplicemente con p (X). I suoi elementi sono le “successioni” {zx }x∈X di complessi etichettati su X, tali che: |zx |p < ∞ , x∈X
dove la somma `e definita come: sup |zx|p x∈X0
X0 ⊂ X, X0 finito .
Si osservi che, nel caso X sia numerabile, X = N o Z in particolare, la definizione data sopra, di somma di un insieme di numeri positivi etichettati su X, si riduce a quella solita di somma di una serie (vedi definizione 3.20 e proposizione 3.22). Pertanto p (N) `e, per esempio, lo spazio delle successioni {cn }n∈N ⊂ C tali che: +∞ |cn |p < +∞ . n=0
(8) Sempre in riferimento a (X, Σ, μ), consideriamo la classe L∞ (X, μ) delle funzioni misurabili complesse f : X → C tali che |f(x)| < Mf quasi ovunque rispetto a μ, per qualche Mf ∈ R (dipendente da f). L∞ (X, μ) possiede una naturale struttura di spazio vettoriale e quindi di algebra commutativa con unit` a (la funzione che vale ovunque 1), definendo le solite nozioni di combinazione lineare e prodotto di funzioni punto per punto dell’esempio (2). Possiamo dotare L∞ (X, μ) di una seminorma: P∞ (f) := ess sup|f| , dove l’estremo superiore essenziale di f ∈ L∞ (X, μ) `e definito come: ess sup|f| := inf {r ∈ R | μ ({x ∈ X | |f(x)| > r}) = 0 } .
(2.13)
In parole intuitive, si tratta del “pi` u piccolo” maggiorante dei valori assunti da |f| trascurando quello che succede sugli insiemi di misura nulla. Si osservi che risulta in particolare che (lo si provi per esercizio): P∞ (f · g) ≤ P∞ (f)P∞ (g)
se f, g ∈ L∞ (X, μ) .
36
2 Spazi normati e spazi di Banach, esempi e applicazioni
Lavorando come per gli spazi Lp , identificando funzioni che differiscono su insiemi di misura nulla, `e possibile passare ad uno spazio vettoriale complesso di classi di equivalenza L∞ (X, μ) sul quale `e ben definito anche il prodotto: [f] · [g] := [f · g]
se f, g ∈ L∞ (X, μ).
Esattamente come per gli spazi Lp , la seminorma P∞ diventa (evidentemente) una norma su L∞ (X, μ): ||[f]||∞ := ess sup|f| . Esattamente come per gli spazi Lp , L∞ (X, μ) `e uno spazio di Banach e quindi anche un’algebra di Banach. Teorema 2.43. (Di Fischer-Riesz, caso L∞ .) Se (X, Σ, μ) `e uno spazio con misura positiva σ-additiva, lo spazio normato associato L∞ (X, μ) `e uno spazio di Banach. Dimostrazione. Nel seguito indicheremo con la semplice lettere, per es. f, e senza le parentesi quadre, gli elementi di L∞ (X, μ), identificandoli, quando conveniente, con funzioni (individuate a meno di insiemi di misura nulla). Sia {fn }n∈N ⊂ L∞ (X, μ) una successione di Cauchy rispetto a || ||∞. Definiamo gli insiemi, per k, m, n ∈ N Ak := {x ∈ X | |fk (x)| > ||fk ||∞ } e Bn,m := {x ∈ X | |fn (x) − fm (x)| > ||fn − fm ||∞ }. Per costruzione E := ∪k∈N ∪n,m∈N Ak ∪ Bn,m deve avere misura nulla e, in X \ E, la successione delle fn converge uniformemente ad una funzione f, che conseguentemente risulta essere limitata. Estendiamo f su tutto X definendola come la funzione nulla su X \ E. In questo modo f ∈ L∞ (X, μ) ed anche ||fn − f||∞ → 0 se n → +∞. (9) In riferimento all’esempio (8), nel caso particolare in cui Σ `e l’insieme delle parti di X e μ `e la misura che conta i punti, lo spazio L∞ (X, μ) si indica semplicemente con ∞ (X). I suoi elementi sono le “successioni” {zx }x∈X di complessi etichettati su X tali che supx∈X |zx | < +∞. (Per cui, in riferimento alla notazione usata nell’esempio (2), ∞ (X) = L(X).) Notazione 2.44. Nella letteratura corrente prevale l’uso del simbolo f per denotare la classe di equivalenza [f] ∈ Lp (X, μ), con 1 ≤ p ≤ ∞. Noi seguiremo tale uso nelle situazioni in cui ci`o non produrr` a confusione.
2.3 Operatori, spazi di operatori, norme di operatori Introduciamo, con la prossima definizione, le nozioni di operatore lineare e di funzionale lineare, che saranno di centrale importanza in tutto il resto del libro. Assumeremo, d’ora in poi, che il lettore conosca la teoria elementare degli operatori lineari (matrici) tra spazi vettoriali finitodimensionali, di cui useremo qualche risultato senza menzionarlo esplicitamente
2.3 Operatori, spazi di operatori, norme di operatori
37
Definizione 2.45. Siano X e Y spazi vettoriali sullo stesso campo K := R o C. (a) T : X → Y `e detto operatore lineare (o semplicemente operatore) da X in Y se `e lineare: T (αf + βg) = αT (f) + βT (g)
per ogni α, β ∈ K e f, g ∈ X.
L(X, Y) denota l’insieme degli operatori lineari da X in Y. Quando X e Y sono normati, B(X, Y) ⊂ L(X, Y) denota il sottoinsieme degli operatori lineari continui. In particolare L(X) := L(X, X) e B(X) := B(X, X). (b) T : X → K `e detto funzionale lineare (o semplicemente funzionale) su X se `e lineare. (c) Lo spazio X∗ := L(X, K) `e detto duale algebrico di X mentre, se K `e inteso come uno spazio normato rispetto alla norma indotta dal valore assoluto, X := B(X, K) `e detto duale topologico (o semplicemente duale) di X. Notazione 2.46. Come di consueto nei testi di algebra lineare, useremo spesso la notazione T u in luogo di T (u), quando T : X → Y `e un operatore lineare e u ∈ X. Al solito se T, S ∈ L(X, Y) e α, β ∈ K, la combinazione lineare αT + βS `e definita come l’applicazione: (αT +βS)(u) := α(T u)+β(Su) per ogni u ∈ X. αT + βS `e quindi ancora un elemento di L(X, Y). Dato che ogni combinazione lineare di funzioni continue `e una funzione continua, vale quanto segue. Proposizione 2.47. Siano X e Y spazi vettoriali sullo stesso campo K := R o C. L(X, Y), L(X), X∗ , B(X, Y), B(X) e X , sono spazi vettoriali su K. La seconda fondamentale nozione che vogliamo introdurre `e quella di operatore (e funzionale) limitato. Tale nozione viene introdotta partendo da un elementare ma importante risultato. Teorema 2.48. Siano (X, || ||X ), (Y, || ||Y ) spazi normati sullo stesso campo K = C o R. Si consideri T ∈ L(X, Y). (a) Le seguenti due condizioni sono equivalenti: (i) esiste K ∈ R tale che ||T u||Y ≤ K||u||X per ogni u ∈ X, u||Y (ii) supu∈X\{0} ||T < +∞. ||u||X (b) Se vale la condizione (i) o (ii) allora:
||T u||Y
sup u ∈ X \ {0} = inf {K ∈ R | ||T u||Y ≤ K||u||X ||u||X per ogni u ∈ X} . Dimostrazione. (a) Se vale (i), per costruzione supu∈X\{0} Se vale (ii) posto A :=
u||Y supu∈X\{0} ||T , ||u||X
||T u||Y ||u||X
K := A soddisfa (i).
≤ K < +∞.
38
2 Spazi normati e spazi di Banach, esempi e applicazioni
(b) Detto I l’estremo inferiore dell’insieme dei K che soddisfano (i), valendo: ||T u||Y ≤K, u∈X\{0} ||u||X sup
||T u||Y ≤ I. ||u||X ||T u||Y supu∈X\{0} ||u||X
deve essere supu∈X\{0}
Se se i due membri sono diversi allora deve
esistere K0 con < K0 < I, da cui: ||T u||Y < K0 ||u||X per ogni u = 0 e quindi ||T u||Y ≤ K0 ||u||X per ogni u ∈ X. K0 soddisfa allora la condizione (i) e dunque I ≤ K0 per definizione di I, che contraddice K0 < I supposto sopra. Notazione 2.49. Nel seguito ometteremo gli indici nelle norme per denotare gli spazi su cui sono definite se ci` o sar` a ovvio dal contesto. Definizione 2.50. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) `e detto limitato se valgono le due condizioni equivalenti in (a) nel teorema 2.48. In tal caso il numero ||T u|| ||u||=0 ||u||
||T || := sup
(2.14)
`e detto norma (operatoriale) di T . Osservazioni 2.51. (1) Dalla definizione di ||T || si ha subito che se T : X → Y `e limitato vale l’utile propriet` a: ||T u|| ≤ ||T || ||u|| ,
per ogni u ∈ X .
(2.15)
(2) Evidentemente la nozione di limitatezza di un operatore lineare introdotta sopra non pu` o corrispondere alla nozione di funzione limitata. Questo `e dovuto al fatto che l’immagine di una funzione lineare, definita su uno spazio vettoriale, non pu` o essere limitata, proprio per la linearit` a della funzione. La proposizione 2.52 sotto mostra per`o che ha ancora senso interpretare la “limitatezza” nel senso di limitatezza dell’immagine dell’operatore, quando si restringe il dominio ad un insieme limitato. La norma operatoriale pu` o essere calcolata anche in altri modi talvolta utili nelle dimostrazioni. Vale la seguente proposizione in proposito. Proposizione 2.52. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) `e limitato se e solo esiste finito uno dei secondi membri delle tre identit` a di sotto ed in tal caso tali identit` a sono verificate. ||T || = sup ||T u|| , ||u||=1
(2.16)
2.3 Operatori, spazi di operatori, norme di operatori
39
ovvero ||T || = sup ||T u|| ,
(2.17)
||T || = inf {K ∈ R | ||T u|| ≤ K||u|| per ogni u ∈ X} .
(2.18)
||u||≤1
ovvero
Dimostrazione. Il fatto che T sia limitato se e solo se il secondo membro di (2.16) esista finito e la stessa identit`a (2.16) seguono immediatamente dalla linearit` a di T e dalla propriet` a N1 delle norme. Il fatto che T sia limitato se e solo se il secondo membro di (2.17) esista finito e la stessa identit`a (2.17) seguono facilmente dal seguente ragionamento. Dato che l’insieme degli u con ||u|| ≤ 1 include l’insieme degli u con ||u|| = 1, vale sup||u||≤1 ||T u|| ≥ sup||u||=1 ||T u||. D’altra parte, se ||u|| ≤ 1, vale ||T u|| ≤ ||T v|| per qualche v con ||v|| = 1 (qualunque v suddetto se u = 0 e v = u/||u|| altrimenti). Quindi vale anche sup||u||≤1 ||T u|| ≤ sup||u||=1 ||T u||, da cui si ottiene sup||u||≤1 ||T u|| = sup||u||=1 ||T u|| che dimostra quanto volevamo. Il fatto che T sia limitato se e solo se il secondo membro di (2.18) esista e sia finito e la stessa identit`a (2.18) seguono subito da (b) del teorema 2.48. Esiste un legame tra continuit` a e limitatezza per operatori e funzionali lineari. Tale legame rende importantissima la propriet`a di limitatezza. Il seguente elementare teorema prova, tra l’altro, che gli operatori limitati sono tutti e soli quelli continui. Teorema 2.53. Sia T ∈ L(X, Y) con X, Y spazi normati sul medesimo campo. I seguenti fatti sono equivalenti: (i) T `e continuo in 0, (ii) T `e continuo, (iii) T `e limitato. Dimostrazione. (i) ⇔ (ii). La continuit` a implica banalmente la continuit` a in 0. Mostriamo che la continuit`a in 0 implica la continuit` a. Valendo (T u)−(T v) = T (u − v) si ha che (limu→v T u) − T v = limu→v (T u − T v) = lim(u−v)→0 T (u − v) = 0 per la continuit` a in 0. (i) ⇒ (iii). Dalla continuit` a in 0, esiste δ > 0 tale che, se ||u|| < δ allora ||T u|| < 1. Scelto δ > 0 con δ < δ, se v ∈ X \ {0}, u = δ v/||v|| ha norma inferiore a δ per cui ||T u|| < 1, che in termini di v si scrive ||T v|| < (1/δ )||v||. Vale allora la condizione (a) del teorema 2.48 con K = 1/δ e pertanto, per la definizione 2.50 T `e limitato. (iii) ⇒ (i). Si tratta di un fatto ovvio. Se T `e limitato allora ||T u|| ≤ ||T ||||u|| da cui la continuit` a in 0. Il nome “norma” per ||T || non `e casuale; in effetti la norma di operatori rende a tutti gli effetti B(X, Y), e quindi in particolare B(X) e X , uno spazio normato come proveremo tra poco. Pi` u precisamente, vedremo che B(X, Y) `e
40
2 Spazi normati e spazi di Banach, esempi e applicazioni
uno spazio di Banach se Y `e di Banach e quindi, in particolare, X `e sempre spazio di Banach. Il teorema che segue riguarda anche un altro importante fatto in relazione alla struttura di algebra. Cominciamo con l’osservare che la composizione di operatori di L(X), rispettivamente B(X), produce operatori nello stesso spazio (in particolare perch´e la composizione di funzioni continue produce funzioni continue). Ulteriormente, `e immediato provare che lo spazio vettoriale L(X), rispettivamente B(X), soddisfa gli assiomi A1, A2 e A3 della definizione di algebra quando il prodotto dell’algebra `e definito come la composizione di operatori. In questo modo risulta chiaro che L(X) e B(X) possiedono una struttura naturale di algebra con unit` a, quest’ultima data dalla funzione identit` a I : X → X, inoltre B(X) risulta essere una sottoalgebra di L(X). Nell’ultima parte del teorema seguente si rafforza ulteriormente il risultato, provando che B(X) `e sempre un’algebra normata con unit` a rispetto alla norma operatoriale ed `e ulteriormente algebra di Banach se X `e uno spazio di Banach. Teorema 2.54. Siano X, Y spazi normati sullo stesso campo. (a) L’applicazione || || : T → ||T ||, dove ||T || `e definita da (2.14) per T ∈ B(X, Y), `e una norma su B(X, Y) e rende B(X, Y) spazio normato. (b) Sull’algebra con unit` a B(X) valgono le ulteriori relazioni che la rendono algebra normata con unit` a: (i) ||T S|| ≤ ||T ||||S|| e T, S ∈ B(X), (ii) ||I|| = 1. (c) Se Y `e completo B(X, Y) `e uno spazio di Banach. In particolare: (i) se X `e uno spazio di Banach, B(X) `e un’algebra di Banach con unit` a (data dall’operatore identit` a); (ii) X `e sempre uno spazio di Banach rispetto alla norma dei funzionali, anche se X non `e completo. Dimostrazione. (a) `e diretta conseguenza della definizione di norma di un operatore: le propriet` a definitorie della norma N0, N1, N2, N3 per la norma operatoriale possono essere immediatamente verificate usando le stesse propriet` a N0. N1, N2, N3 per la norma dello spazio Y, la formula (2.16) per la norma operatoriale e la definizione di estremo superiore. (b) Il punto (i) `e immediata conseguenza della (2.15) e della (2.16). (ii) `e di immediata verifica usando l’espressione per la norma operatoriale (2.16). Passiamo a provare la parte (c). Proviamo che se Y `e completo allora B(X, Y) `e uno spazio di Banach. Sia {Tn } ⊂ B(X, Y) una successione di Cauchy rispetto alla norma operatoriale. Da (2.15) segue che ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| , il fatto che {Tn } sia di Cauchy implica che sia di Cauchy la successione dei vettori Tn u. Essendo Y completo, per ogni fissato u ∈ X esister`a un vettore di Y: T u := lim Tn u . n→∞
2.3 Operatori, spazi di operatori, norme di operatori
41
X u → T u `e un operatore lineare essendo tali tutti gli operatori Tn . Mostriamo, per concludere, che T ∈ B(X, Y) e che ||T − Tn || → 0 per n → ∞. Essendo {Tn } una successione di Cauchy, se > 0, varr` a ||Tn − Tm || ≤ per n, m sufficientemente grandi e quindi anche ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| ≤ ||u||. Allora: ||T u − Tm u|| = || lim Tn u − Tm u|| = lim ||Tn u − Tm u|| ≤ ||u|| n→+∞
n→+∞
se m `e grande a sufficienza. Dalla stima ottenuta, essendo ||T u|| ≤ ||T u − Tm u|| + ||Tm u|| ed usando (2.15), segue ancora che ||T u|| ≤ ( + ||Tm ||)||u|| . Ci`o dimostra che T `e limitato e quindi T ∈ B(X, Y) per il teorema 2.53. Valendo, come provato sopra, ||T u−Tmu|| ≤ ||u|| si ha anche che ||T −Tm || ≤ dove pu` o essere scelto arbitrariamente piccolo pur di scegliere m grande a sufficienza. In altre parole ||T − Tn || → 0 se n → ∞. La prova dei sottocasi (i) e (ii) `e immediata. (i) segue dal fatto che B(X) = B(X, X) e (ii) segue dal fatto che X := B(X, K) ed il campo di X, K = C o R `e completo come spazio normato. Come ultima nozione introduciamo quella di operatore coniugato o aggiunto in spazi normati. Si noti che esiste una nozione differente di operatore coniugato, specifica negli spazi di Hilbert e che vedremo nel prossimo capitolo. Consideriamo un operatore T ∈ B(X, Y), con X e Y spazi normati. Possiamo costruire un operatore che lavora tra gli spazi duali in verso opposto, T ∈ L(Y , X ), imponendo che: (T f)(x) = f(T (x)) per ogni x ∈ X, se f ∈ Y . Si osservi che la definizione `e ben posta e, per ogni f ∈ Y , la definizione individua una funzione T f : X → C che `e lineare per costruzione, coincidendo con la composizione delle funzioni lineari f e T . Ulteriormente la funzione T : Y f → T f ∈ X `e anch’essa lineare: (T (af + bf))(x) = (af + bg)(T (x)) = af(T (x)) + bg(T (x)) = a(T f)(x) + b(T g)(x)
per ogni x ∈ X .
Si osservi infine che T `e limitato, con ovvio significato delle norme: |(T f)(x)| = |f(T (x))| ≤ ||f||||T ||||x|| , di conseguenza:
||T f|| = sup |T f(x)| ≤ ||f||||T || , ||x||=1
e quindi, prendendo ancora l’estremo superiore del primo membro sulla classe degli f ∈ Y con ||f|| = 1: ||T || ≤ ||T || . (2.19) Nel seguito, dopo aver dimostrato il teorema di Hahn-Banach, mostreremo che, in realt` a ||T || = ||T || se X e Y sono spazi di Banach.
42
2 Spazi normati e spazi di Banach, esempi e applicazioni
Definizione 2.55. Siano X, Y spazi normati e T ∈ B(X, Y). L’operatore coniugato o aggiunto di T , nel senso degli spazi normati, `e l’operatore T ∈ B(Y , X) individuato dalla richiesta: (T f)(x) = f(T (x))
per ogni x ∈ X e T ∈ B(X, Y).
(2.20)
Osservazione 2.56. L’applicazione B(X, Y) T → T ∈ B(Y , X ) `e lineare come si prova immediatamente: (aT + bS) = aT + bS
per ogni a, b ∈ C e ogni T, S ∈ B(X, Y).
Prima di passare a dare qualche esempio di spazio duale topologico, enunciamo un risultato elementare, ma di grande importanza nelle applicazione, che riguarda l’unicit` a dell’estensione di operatori (e funzionali) limitati, inizialmente definiti su un sottospazio denso. Proposizione 2.57. (Sull’estensione di un operatore limitato.) Siano X, Y spazi normati con Y spazio di Banach. Se S ⊂ X `e un sottospazio denso in X e T : S → Y `e un operatore lineare limitato su S, allora vale quanto segue. ˜ S= T . (a) Esiste un unico operatore lineare limitato T˜ : X → Y tale che T ˜ (b) Vale ||T || = ||T ||. Dimostrazione. La dimostrazione `e data nella soluzione agli esercizi 2.14 e 2.15. Esempi 2.58. (1) Le misure complesse permettono di costruire tutti i funzionali lineari limitati su C0 (X), dove X `e uno spazio topologico di Hausdorff localmente compatto, pertanto richiamiamo brevemente la definizione e le principali propriet` a di tali misure. Una misura complessa su X [Rud82] `e un’applicazione μ : Σ → C, che associa un numero complesso ad ogni elemento di una σ-algebra Σ su X, in modo tale che: (i) μ(∅) = 0 e +∞ (ii) μ(∪n∈N En ) = n=0 μ(En ), indipendentemente dall’ordine di somma, per ogni classe {En }n∈N ⊂ Σ con En ∩ Em = ∅ se n = m. La richiesta (ii) `e equivalente a dire che la convergenza della serie deve valere in valore assoluto. Le misure con segno si intendono qui un sottocaso di quelle complesse. Si pu` o associare una misura positiva finita ad ogni misura complessa nel modo che segue. Se E ∈ Σ, diremo che {Ei }i∈I ⊂ Σ `e una partizione di E se: I `e finito o numerabile, ∪i∈I Ei = E e Ei ∩ Ej = ∅ per i = j. La misura positiva σ-additiva su Σ, |μ|, detta variazione totale di μ, `e definita come:
|μ|(E) := sup |μ(Ei )| {Ei }i∈I partizione di E per ogni E ∈ Σ.
i∈I
2.3 Operatori, spazi di operatori, norme di operatori
43
|μ| soddisfa ovviamente |μ|(E) ≥ |μ(E)| se E ∈ Σ. Inoltre si prova che |μ|(X) < +∞ [Rud82]. |μ| `e quindi una misura (positiva σ-additiva) finita su Σ per ogni misura complessa μ. Dal Teorema di Radon-Nikodym segue in particolare il seguente risultato [Rud82]. Teorema 2.59. (Di caratterizzazione delle misure complesse). Per ogni misura complessa μ sullo spazio misurabile X esiste, ed `e unica a meno di ridefinizione su insiemi di misura nulla, una funzione misurabile h:X→C con |h| = 1 su X, che sia in L1 (X, |μ|) e tale che μ(E) = E h d|μ|. Se f ∈ L1 (X, |μ|) si definisce pertanto: fdμ := fh d|μ| . X
X
Consideriamo X spazio topologico di Hausdorff localmente compatto dotato di una misura complessa μ, definita sulla σ-algebra di Borel di X. Sappiamo che l’algebra normata (Cc(X), || ||∞) ha come completamento nella norma dell’estremo superiore l’algebra di Banach (C0 (X), || ||∞ ) delle funzioni che si annullano all’infinito ((4) in esempi 2.39). Nelle ipotesi fatte definiamo ||μ|| := |μ|(X). Se verifica facilmente che || || definisce una norma sullo spazio delle misure di Borel complesse su X. Inoltre, `e chiaro che, se f ∈ C0 (X), |Λμf| ≤ ||μ||||f||∞ dove Λμ f := fdμ , X
e dove, al solito, ||f||∞ = supx∈X |f(x)|. Da tale fatto segue subito che ogni misura complessa di Borel μ definisce un elemento Λμ del duale (topologico) di C0 (X). Il teorema di Riesz per misure complesse [Rud82] prova che questo `e in realt`a il caso generale, precisando anche qualcosa in pi` u. Per enunciare il teorema di Riesz, ricordiamo che, se μ `e una misura di Borel positiva σ-additiva sullo spazio di Hausdorff localmente compatto X, μ `e detta regolare se, per ogni boreliano E, valgono le seguenti condizioni: (i) μ(E) = sup{μ(K) | K ⊂ E , K compatto}, (ii) μ(E) = inf{μ(V ) | V ⊃ E , V aperto}. Una misura di Borel complessa, μ, `e detta regolare se `e tale la misura di Borel positiva finita data dalla sua variazione totale |μ|. Teorema 2.60. (Di Riesz per misure complesse regolari). Sia X uno spazio topologico di Hausdorff localmente compatto. Se Λ : C0 (X) → C `e un funzionale lineare continuo, allora esiste un’unica misura di Borel complessa regolare μΛ tale che, per ogni f ∈ C0 (X): Λ(f) = fdμΛ . X
Vale inoltre ||Λ|| = ||μΛ ||.
44
2 Spazi normati e spazi di Banach, esempi e applicazioni
Dato che ogni misura di Borel complessa regolare individua un funzionale limitato su C0 (X) tramite l’integrale rispetto alla misura considerata, il teorema ha il seguente importante corollario. Corollario 2.61. Se X `e uno spazio topologico di Hausdorff localmente compatto, il duale topologico C0 (X) dello spazio di Banach (C0 (X), || ||∞) si identifica con lo spazio vettoriale reale delle misure di Borel complesse μ regolari su X, dotato della norma ||μ|| := |μ|(X): l’applicazione che associa ad ogni misura complessa suddetta μ il funzionale Λμ : C0 (X) → R, con Λμ f := X fdμ, `e un isomorfismo di spazi normati. Si osservi anche che, essendo Cc (X) denso in C0 (X), un funzionale continuo sul primo spazio ne individua univocamente uno sul secondo, per cui il teorema caratterizza anche i funzionali continui rispetto alla norma dell’estremo superiore su Cc (X). Si osservi ancora che, se X `e tale che ogni aperto sia unione numerabile di compatti, la parola regolare si pu` o omettere nell’ipotesi del teorema 2.60 di Riesz. Risulta infatti che (teorema 2.18 in [Rud82]), se ν `e una misura di Borel positiva sullo spazio di Hausdorff localmente compatto X in cui ogni aperto `e unione numerabile di compatti3 e i compatti hanno misura finita (come nel caso in esame, essendo la misura |μ| finita), allora ν `e regolare. In particolare vale il seguente teorema. Teorema 2.62. (Di Riesz per misure complesse su Rn ). Se K ⊂ Rn oppure K ⊂ C `e un compatto (rispetto alla topologia standard di Rn oppure C) e Λ : C0 (K) → C `e un funzionale lineare continuo, allora esiste un’unica misura di Borel complessa μΛ su K (che risulta essere regolare) tale che, per ogni f ∈ C0 (K): Λ(f) =
fdμΛ . K
(2) Un’altra importante classe di spazi duali topologici di spazi di Banach `e quello degli spazi Lp in riferimento all’esempio (6) in esempi 2.39. Vale a tal proposito la seguente proposizione [Rud82]. Proposizione 2.63. Sia (X, Σ, μ) uno misurabile con misura positiva. Se 1 ≤ p < +∞ e 1/p+1/q = 1, il duale dello spazio di Banach Lp (X, μ) risulta essere Lq (X, μ), nel senso che l’applicazione lineare: Lq (X, μ) [g] → Λg dove Λg (f) := X fg dμ per ogni f ∈ Lp (X, μ) `e un isomorfismo di spazi normati da Lq (X, μ) a (Lp (X, μ)) . Nello stesso modo il duale di L1 (X, μ) si identifica con L∞ (X, μ), nel senso che l’applicazione lineare: L∞ (X, μ) [g] → Λg dove Λg (f) := X fg dμ per ogni f ∈ L1 (X, μ) `e un isomorfismo di spazi normati da L∞ (X, μ) a (L1 (X, μ)) .
3 Ci` o accade in Rn in cui gli aperti sono unione numerabile delle chiusure di palle aperte di raggio finito.
2.4 I teoremi fondamentali negli spazi di Banach
45
2.4 I teoremi fondamentali negli spazi di Banach In questa sezione dimostreremo i teoremi fondamentali della teoria degli spazi normati e di Banach nella versione pi` u elementare possibile e ne esaminiamo le pi` u importanti conseguenze generali. Discuteremo il teorema di Hahn-Banach, quello di Banach-Steinhaus e quello dell’applicazione aperta, studiandone anche qualche immediata conseguenza importante. Le applicazioni del secondo teorema, quello di Banach-Steinhaus, forniscono l’occasione per introdurre diverse topologie negli spazi di operatori. Tali topologie rivestono un ruolo importantissimo in Meccanica Quantistica quando lo spazio di Banach di partenza `e lo spazio di Hilbert della teoria, l’algebra di operatori limitati di interesse `e costituita da (alcune) osservabili della teoria, mentre le propriet`a elementari del sistema quantistico associate ai processi di misura sono una sottoclasse della classe degli operatori di proiezione ortogonale. Per passare con continuit`a dall’algebra delle osservabili a quella dei proiettori sono necessarie topologie pi` u deboli rispetto a quella standard. Questo genere di problematiche che discuteremo pi` u oltre hanno portato alla nozione di algebra (di operatori) di von Neumann. 2.4.1 Il teorema di Hahn-Banach e le sue conseguenze elementari Il primo teorema `e il famosissimo teorema di Hahn-Banach che si occupa del problema dell’estensione di un funzionale lineare continuo, da un sottospazio dello spazio ambiente, ad un funzionale continuo definito tutto lo spazio e che conservi la norma iniziale. Esistono in realt`a versioni molto pi` u elaborate e potenti di tale teorema che si possono trovare, per esempio, in [Rud91]. Noi ci limiteremo qui alla situazione pi` u elementare possibile. Per enunciare il teorema, notiamo che se X `e uno spazio normato e M ⊂ X un suo sottospazio (rispetto alla sola struttura di spazio vettoriale di X), la restrizione della norma di X a M definisce su M una struttura di spazio normato. In questo senso si pu`o parlare di operatori o funzionali definiti su M e continui (ossia limitati rispetto alla struttura di spazio normato indotta da quella di X). Teorema 2.64. (Di Hahn-Banach per spazi normati.) Sia M un sottospazio (non necessariamente chiuso) di uno spazio normato X con campo K = C o R. Se g : M → K `e un funzionale lineare continuo, esiste un funzionale lineare f : X → K continuo tale che f M = g e ||f||X = ||g||M. Dimostrazione. Seguiremo essenzialmente la dimostrazione in [Rud82]. Partiamo dal caso in cui K = R. Se g = 0, un’estensione che soddisfa la tesi `e f = 0. Supponiamo dunque che g = 0 e, senza perdere generalit` a, assumiamo anche che ||g|| = 1. Costruiamo l’estensione f come segue. Sia x0 ∈ X \ M e sia: M1 := {x + λx0 | x ∈ M , λ ∈ R} .
46
2 Spazi normati e spazi di Banach, esempi e applicazioni
Se, per ν ∈ R fissato, definiamo g1 : M1 → R come g1 (x + λx0 ) = g(x) + λν , o sempre scegliere ν in abbiamo un’estensione di g a M1 . Proviamo che si pu` modo tale che ||g1|| = 1. A tal fine `e sufficiente che ν sia scelto in modo che valga: |g(x) + λν| ≤ ||x + λx0 || ,
per ogni x ∈ M e λ ∈ R \ {0}.
(2.21)
Sostituiamo −λx a x e dividiamo i due membri di (2.21) per |λ|, ottenendo la condizione equivalente alla (2.21): |g(x) − ν| ≤ ||x − x0 || ,
per ogni x ∈ M.
(2.22)
Poniamo quindi: ax := g(x) − ||x − x0 || e
bx := g(x) + ||x − x0 ||.
(2.23)
La (2.22), e quindi ||g1|| = 1, vale se ν si fissa in modo tale da soddisfare ` sufficiente dunque provare che gli intervalli ax ≤ ν ≤ bx per ogni x ∈ M. E [ax, bx], con x ∈ M, hanno un punto in comune, cosa che `e equivalente a dimostrare che per ogni x, y ∈ M, vale: ax ≤ b y .
(2.24)
D’altra parte: g(x) − g(y) = g(x − y) ≤ ||x − y|| ≤ ||x − x0 || + ||y − x0 || e la (2.24) `e conseguenza della (2.23). Abbiamo ottenuto che si pu`o fissare ν in modo tale che ||g1 || = 1 come volevamo. Consideriamo ora la famiglia P di tutte le coppie (M , g ) tali che M ⊃ M sia un sottospazio di X e g : M → R sia lineare, estenda g e valga ||g || = 1. Sappiamo che P non `e vuoto dato che contiene almeno (M1 , g1). Possiamo ordinare parzialmente P (vedi l’Appendice A anche per il seguito) definendo (M , g ) ≤ (M , g ) quando M ⊃ M e g estende g e ||g || = ||g || = 1. Si dimostra facilmente che ogni sottoinsieme totalmente ordinato di P ammette un maggiorante in P. Il lemma di Zorn implica allora che esiste un elemento massimale in P che denoteremo con (M1 , f 1 ). Si osservi ora che deve essere necessariamente M1 = X, altrimenti esisterebbe x0 ∈ X\M1 e, con la procedura vista all’inizio, potremmo costruire un’estensione propria di f 1 al sottospazio generato da x0 e M1 che rispetti la richiesta sulla norma, in contraddizione con la massimalit`a di (M1 , f 1 ). Concludiamo che f := f 1 `e l’estensione cercata nella tesi. Passiamo infine al caso K = C. Premettiamo il seguente lemma.
2.4 I teoremi fondamentali negli spazi di Banach
47
Lemma 2.65. Sia Y uno spazio vettoriale complesso. Vale quanto segue. (a) Se u(x) = Reg(x) per ogni x ∈ Y con g : Y → C funzionale lineare complesso, allora la funzione u : Y → R `e un funzionale lineare reale su Y e: f(x) := u(x) − iu(ix)
per ogni x ∈ Y.
(2.25)
(b) Se u : Y → R `e un funzionale lineare reale su Y e se g `e definito da (2.25), allora g `e un funzionale lineare complesso su Y. (c) Se Y `e spazio normato e se g e u sono legati dalla (2.25), risulta ||g|| = ||u||. Dimostrazione. (a) e (b) si provano immediatamente per computo diretto. Riguardo a (c), osserviamo che, nelle ipotesi fatte: |u(x)| ≤ |g(x)| = |u(x)|2 + |u(ix)|2 e quindi ||u|| ≤ ||g||. D’altra parte, se x ∈ Y, esiste α ∈ C con |α| = 1, tale che αg(x) = |g(x)|. Di conseguenza: |g(x)| = g(αx) = u(αx) ≤ ||u|| ||αx|| = ||u|| ||x|| e dunque ||g|| ≤ ||u||. Torniamo alla dimostrazione principale. Se u : M → R `e la parte reale di g, deve essere g(x) = u(x) − iu(ix) e anche ||g|| = ||u|| dal lemma appena provato. Sappiamo, dal caso reale, che esiste un’estensione lineare U : X → R di u con ||U || = ||u|| = ||g||. Ma allora, se definiamo l’applicazione lineare f : X → C come: f(x) := U (x) − iU (ix) ,
per ogni x ∈ X,
abbiamo che f estende g a tutto X e soddisfa ||f|| = ||U || = ||g||.
Una delle pi` u utili conseguenze del teorema di Hahn-Banach `e il seguente corollario. Ricordiamo che, se X `e uno spazio normato, X indica il suo duale topologico B(X, C). Corollario 2.66. (Del Teorema di Hahn-Banach.) Sia X spazio normato e x0 ∈ X con x0 = 0. Esiste f ∈ X con ||f|| = 1 tale che f(x0 ) = ||x0||. Dimostrazione. Si scelga M := {λx0 | λ ∈ K} e g : λx0 → λ||x0 ||. Sia f ∈ X il funzionale limitato che estende g secondo il teorema di Hahn-Banach. Per costruzione f(x0 ) = g(x0 ) = ||x0|| e ||f||X = ||g||M = 1. Una conseguenza immediata di questo corollario `e la seguente proposizione sulla norma dell’operatore coniugato T ∈ B(Y , X ) di T ∈ B(X, Y) (vedi la definizione 2.55). Proposizione 2.67. Se T ∈ B(X, Y), dove X e Y sono spazi di Banach, allora: ||T || = ||T || . Dimostrazione. Dato che, nel caso generale di X, Y spazi normati, vale (vedi la (2.19)) ||T || ≥ ||T ||, dobbiamo solo provare ||T || ≤ ||T || se X e Y sono spazi
48
2 Spazi normati e spazi di Banach, esempi e applicazioni
x di Banach. Se x ∈ X e T x = 0, definiamo y0 := ||TT x|| ∈ Y. Evidentemente ||y0 || = 1. Per il corollario 2.66, esiste g ∈ Y tale che ||g|| = 1 e g(y0 ) = 1 e quindi g(T x) = ||T x||. Dato che:
||T x|| = g(T x) = |T (g(x))| ≤ ||T g|| ||x|| ≤ ||T || ||g|| ||x|| = ||T || ||x|| , abbiamo ottenuto: ||T || ≤ ||T || come volevamo.
Un altro risultato, che ha importanti conseguenze nella teoria delle algebre di Banach, `e il seguente. Corollario 2.68. (Del Teorema di Hahn-Banach.) Sia X = {0} spazio normato. Gli elementi di X sono separanti per X. Cio`e, se x1 = x2 sono punti di X allora esiste f ∈ X per cui f(x1 ) = f(x2 ). Dimostrazione. Basta scegliere nel corollario 2.66 x0 := x1 − x2 ottenendo f(x1 ) − f(x2 ) = f(x1 − x2 ) = ||x1 − x2 || = 0. Se x ∈ X e f ∈ X con ||f|| = 1, allora |f(x)| ≤ 1||x|| per cui sup{|f(x)| | f ∈ X , ||f|| = 1} ≤ ||x|| . Il corollario 2.66 consente di rafforzare il risultato provando immediatamente che sup{|f(x)| | f ∈ X , ||f|| = 1} = max{|f(x)| | f ∈ X , ||f|| = 1} = ||x|| . Questo fatto apparentemente non molto profondo ha invece una certa rilevanza in una questione importante che nasce nella teoria degli spazi normati infinito-dimensionali, quando la si confronta con quella nel caso finito dimensionale. ` noto, dalla teoria elementare degli spazi vettoriali, che lo spazio (X∗ )∗ , E duale algebrico del duale algebrico di uno spazio vettoriale X di dimensione finita, ha la notevole propriet` a di essere naturalmente isomorfo a X stesso. L’isomorfismo `e dato dalla applicazione lineare che associa ad x ∈ X il funzionale lineare su X∗, I(x), definito da (I(x))(f) := f(x) per ogni f ∈ X∗ . Nel caso infinito dimensionale I identifica X con un sottospazio di (X∗ )∗ , ma non, in generale con tutto (X∗ )∗ . C’`e qualche proposizione generale a riguardo che vale lavorando con spazi normati infinito dimensionali considerando per` o i duali in senso topologico? Si noti che (X ) `e il duale topologico di uno spazio normato (X , la cui norma `e quella operatoriale). Di conseguenza (X ) `e uno spazio normato a sua volta, la norma essendo ancora una volta quella operatoriale. Consideriamo ancora la trasformazione lineare naturale I : X → (X )∗ che associa a x ∈ X l’elemento I(x) ∈ (X )∗ , cio`e la funzione lineare I(x) : X → K, definita come (I(x))(f) := f(x) per ogni f ∈ X e x ∈ X .
2.4 I teoremi fondamentali negli spazi di Banach
49
` chiaro per costruzione che I(x) `e un funzionale lineare su X per cui (E effettivamente I(x) ∈ (X )∗ ). Il fatto che sup{|f(x)| | f ∈ X , ||f|| = 1} = ||x|| ha due implicazioni immediate: (1) I(x) `e un funzionale limitato, per cui appartiene a (X ) e (2) ||I(x)|| = ||x||. Per cui la trasformazione lineare I : X → (X ) `e un’isometria e quindi in particolare `e iniettiva. In definitiva si ha l’inclusione isometrica X ⊂ (X ) data dall’isometria I : X → (X ) . Abbiamo provato il seguente corollario. Corollario 2.69. (Del Teorema di Hahn-Banach.) Sia X spazio normato. La trasformazione lineare I : X → (X ) definita da: (I(x))(f) := f(x)
per ogni x ∈ X e f ∈ X ,
(2.26)
`e un’isometria. In tal modo X si identifica isometricamente con un sottospazio di (X ) . Si possono trovare esempi, nel caso infinito dimensionale, in cui X non ricopre tutto (X ) . Ci` o porta a dare la seguente definizione. Definizione 2.70. Uno spazio normato X `e detto riflessivo se l’isometria (2.26) `e suriettiva (cio`e `e un isomorfismo di spazi normati). In altre parole X `e riflessivo quando X e (X ) sono isometricamente isomorfi tramite l’isomorfismo naturale I. Vedremo nel capitolo 3 che, se X `e uno spazio di Hilbert, la riflessivit` a `e assicurata. Esempio 2.71. Gli spazi di Banach Lp (X, μ) introdotti negli esempi 2.39 sono riflessivi se 1 < p < ∞. La dimostrazione `e immediata: dato che Lp (X, μ) = Lq (X, μ) con 1/p + 1/q = 1, scambiando q con p si trova: Lq (X, μ) = Lp (X, μ). Mettendo tutto insieme: (Lp (X, μ) ) = Lp (X, μ). 2.4.2 Il teorema di Banach-Steinhaus o principio della limitatezza uniforme Passiamo al teorema di Banach-Steinhaus nella formulazione pi` u elementare ed alle sue conseguenze immediate. Tale teorema `e noto anche come principio della limitatezza uniforme. Il motivo `e chiaro direttamente dall’enunciato del teorema che mostra che, rimarcabilmente, l’equilimitatezza puntuale implichi la limitatezza uniforme per una famiglia di operatori definiti su uno spazio di Banach. Teorema 2.72. (Di Banach-Steinhaus.) Siano X spazio di Banach e Y spazio normato. Se {Tα }α∈A ⊂ B(X, Y) `e una famiglia di operatori che soddisfa: sup ||Tα x|| < +∞ per ogni x ∈ X , α∈A
50
2 Spazi normati e spazi di Banach, esempi e applicazioni
allora esiste K ≥ 0 che limita uniformemente la famiglia di operatori: ||Tα || ≤ K per ogni α ∈ A . Dimostrazione. La dimostrazione si ottiene provando che esiste una palla aperta Bρ (z) ⊂ X per cui esiste M ≥ 0 con ||Tα (x)|| ≤ M per ogni α ∈ A e ogni x ∈ Bρ (z). Infatti, essendo x = (x + z) − z, si avrebbe: ||Tα(x)|| ≤ ||Tα (x + z)|| + ||Tα(z)|| ≤ 2M ,
per ogni α ∈ A e ogni x ∈ Bρ (0) ,
e quindi: ||Tα || ≤ 2M/ρ per ogni α ∈ A, dimostrando la tesi. Proviamo, per assurdo, che Bρ (z) suddetta esiste davvero. Assumiamo che non esista alcuna Bρ (z) con le propriet` a suddette. Allora, per una palla aperta Br0 (x0 ) fissata arbitrariamente, deve esistere x1 ∈ Br0 (x0 ) per cui ||Tα1 (x1 )|| > 1, per qualche α1 ∈ A. Dato che Tα1 `e continuo, possiamo trovare una seconda palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ Br0 (x0 ) e con 0 < r1 < r0 tale che ||Tα1 (x)|| ≥ 1 se x ∈ Bα1 (x1 ). Questa procedura pu` o essere iterata all’infinito in modo da ottenere una successione di palle aperte in X, {Brk (xk )}k∈N, che soddisfano: (i) Brk (xk ) ⊃ Brk+1 (xk+1 ), (ii) rk → 0 per k → +∞, (iii) per ogni k ∈ N c’`e un αk ∈ A tale che ||Tαk (x)|| ≥ k se x ∈ Brk (xk ). Si verifica subito, che (i) e (ii) implicano che la successione {xk }k∈N deve essere di Cauchy. Per la completezza di X, esiste y ∈ ∩k∈N Brk (xk ); d’altra parte, la condizione (iii) implica che ||Tαk (y)|| ≥ k per ogni k ∈ N contraddicendo l’ipotesi che, per ogni x ∈ X, vale supn∈N ||Tα x|| < +∞. Abbiamo ottenuto un assurdo che conclude la dimostrazione. Un immediato ed utile corollario del teorema di Banach-Steinhaus `e il seguente. Corollario 2.73. (Del Teorema di Banach-Steinhaus.) Nelle stesse ipotesi del teorema di Banach-Steinhaus la famiglia di operatori {Tα }α∈A `e equicontinua: per ogni > 0 esiste δ > 0 tale che, se x, x ∈ X e ||x − x || < δ, allora ||Tα x − Tα x || < per ogni α ∈ A. Dimostrazione. Nel seguito Cγ := {x ∈ X | ||x|| ≤ γ} per ogni γ > 0. Fissiamo > 0, dobbiamo trovare il δ > 0 che soddisfa la propriet` a scritta nella tesi. Per il teorema di Banach-Steinhaus ed usando la proposizione 2.52, ||Tαx|| ≤ K < +∞ per ogni α ∈ A e x ∈ C1 . Se K = 0 non c’`e nulla da provare, assumiamo pertanto K > 0. Scegliamo δ > 0 per cui Cδ ⊂ C/K . Con le scelte fatte, se ||x − x || < δ, vale K(x − x )/ ∈ CKδ/ ⊂ C1 e quindi:
K(x − x )
Tα ||Tα x − Tα x || = ||Tα (x − x )|| =
< K K = K
per ogni α ∈ A.
2.4 I teoremi fondamentali negli spazi di Banach
51
Abbiamo infine il seguente ulteriore corollario che riguarda lo spazio duale topologico X . Corollario 2.74. (Del Teorema di Banach-Steinhaus.) Sia X uno spazio normato sul campo C o R. Se S ⊂ X `e debolmente limitato, cio`e: per ogni f ∈ X esiste cf ≥ 0 tale che |f(x)| ≤ cf per ogni x ∈ S allora S `e limitato rispetto alla norma di X. Dimostrazione. Consideriamo gli elementi x ∈ S ⊂ X come funzionali del duale di X , (X ) facendo uso della trasformazione isometrica I : X → (X ) definita nel corollario 2.69 del teorema di Hahn-Banach. La famiglia di funzionali su X , S ⊂ (X ) `e limitata su ogni f ∈ X per ipotesi essendo (scriviamo x in luogo di I(x)) |x(f)| = |f(x)| ≤ cf . Dato che X `e completo possiamo applicare il teorema di Banach-Steinhaus, concludendo che sup{|x(f)| | ||f|| = 1} ≤ K < +∞ per ogni x ∈ S ossia (essendo I un’isometria) ||x|| ≤ K < +∞ per ogni x ∈ S. 2.4.3 Topologie deboli. Completezza ∗-debole di X Per introdurre l’ultimo corollario del teorema di Banach-Steinhaus dobbiamo introdurre qualche nuova nozione topologica generale e poi applicarla, in particolare, agli spazi di operatori gi` a incontrati. Ci`o permetter`a di introdurre alcune nozioni, estremamente utili nelle applicazioni, sui tipi di convergenze di successioni di operatori. Per prima cosa riconsideriamo la nozione di palla aperta, ma questa volta consideriamo anche il caso in cui tali palle siano definite in termini di seminorme e non solo di norme. Notazione 2.75. Se δ > 0 e p `e una seminorma sullo spazio vettoriale X, sul campo K = C o R, e x ∈ X, indicheremo con Bp,δ (x) la palla aperta associata alla seminorma p, centrata sul vettore x e di raggio δ: Bp,δ (x) := {z ∈ X | p(z − x) < δ} . Nel caso in cui x = 0 scriveremo semplicemente Bp,δ in luogo di Bp,δ (0). Se A ⊂ X, B ⊂ X, x ∈ X e α, β ∈ K, nel seguito useremo anche le notazioni: x + βA := {x + βu | u ∈ A} e αA + βB := {αu + βv | u ∈ A , v ∈ B} .
Si prova subito che le palle Bp,δ con δ > 0 sono: (i) insiemi convessi, cio`e se x, y ∈ Bp,δ allora (1 − λ)x + λy ∈ Bp,δ per λ ∈ [0, 1], (ii) insiemi bilanciati (detti anche equilibrati), cio`e λx ∈ Bp,δ se x ∈ Bp,δ e 0 ≤ λ ≤ 1,
52
2 Spazi normati e spazi di Banach, esempi e applicazioni
(iii) insiemi assorbenti, cio`e ogni x ∈ X soddisfa λ−1 x ∈ Bp,δ per qualche λ > 0. Queste propriet` a sono evidentemente invarianti per intersezione, per cui anche insiemi ottenuti intersecando palle centrate nell’origine, ma ottenute da seminorme differenti, godono di tali propriet` a. Definizione 2.76. Se P := {pi }i∈I `e una famiglia di seminorme sullo spazio vettoriale X sul campo K = C o R, la topologia su X generata o indotta da P, T (P), `e l’unica che ammette come base (definizione 2.1) la classe degli insiemi: x + Bpi1 ,δ1 ∩ · · · ∩ Bpin ,δn (2.27) per ogni scelta dei centri x ∈ X, di n = 1, 2, . . ., degli indici i1 , . . . , in ∈ I e dei numeri δ1 > 0, . . . δn > 0. La coppia (X, P), dove X `e contemporaneamente uno spazio vettoriale ed uno spazio topologico dotato della topologia indotta dalla classe di seminorme P, `e detta spazio vettoriale (topologico) localmente convesso. In altri termini, la topologia T (P) `e quella per cui gli insiemi aperti sono ∅ e tutte le possibili le unioni di insiemi (2.27), per ogni scelta dei centri x ∈ X, dei numeri n = 1, 2, . . ., degli indici i1 , . . . , in ∈ I e dei raggi δ1 > 0, . . . δn > 0. ` chiaro che se la classe P si riduce ad un unico elemento Osservazione 2.77. E dato da una norma, la topologia indotta da P `e la solita topologia indotta da una norma studiata all’inizio del capitolo. Nel caso in cui tale unico elemento sia una seminorma, si ha ancora una topologia simile a quella indotta da una norma, ma con l’importante differenza che non `e garantita la validit` a della propriet` a di Hausdorff. Dato che le operazioni di somma di vettori e prodotto di vettore e scalare sono continue rispetto a ciascuna seminorma (la dimostrazione `e la stessa che abbiamo dato nel caso di una norma), segue subito che tali operazioni sono continue anche rispetto alla topologia generata da una famiglia P di seminorme nel senso detto sopra. In altre parole, la struttura di spazio vettoriale `e compatibile con la topologia generata da P. Uno spazio vettoriale dotato di topologia compatibile con la struttura di spazio vettoriale `e detto spazio vettoriale topologico. Uno spazio localmente convesso `e quindi uno spazio vettoriale topologico. Tenendo conto della definizione 2.6 si prova facilmente che vale la seguente proposizione. Proposizione 2.78. Una successione {xn }n∈N ⊂ X converge a x0 ∈ X nella topologia T (P) se e solo se, per ogni pi ∈ P, pi (xn ) → pi (x0 ) quando n → +∞. Il primo esempio di topologia indotta da seminorme `e quella che si costruisce su uno spazio normato X, usando il suo duale X .
2.4 I teoremi fondamentali negli spazi di Banach
53
Definizione 2.79. Se X `e uno spazio normato, la topologia debole su X `e quella indotta dalla classe di seminorme pf su X, definite come, per ogni f ∈ X : pf (x) := |f(x)| se x ∈ X. Se consideriamo coppie di spazi normati e gli insiemi di operatori costruiti su tali spazi, con la nozione di topologia indotta da una classe di seminorme, si possono definire alcune topologie “standard” sugli spazi vettoriali: L(X, Y), B(X, Y) e sul duale X , rendendoli spazi vettoriali topologici localmente convessi. Una di queste topologie (e la corrispondente sul duale) la conosciamo gi`a perch´e `e quella indotta dalla norma operatoriale. Definizione 2.80. Siano X, Y spazi normati sullo stesso campo K = C o R. (a) Si definiscono su L(X, Y) e B(X, Y) le seguenti topologie operatoriali. (i) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme px,f , definite come, per fissati x ∈ X e f ∈ Y : px,f (T ) := |f(T (x))|
se T ∈ L(X, Y) (rispettivamente B(X, Y),
che `e detta topologia debole su L(X, Y) (rispettivamente B(X, Y)); (ii) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme px , definite come, per ogni fissato x ∈ X: px (T ) := ||T (x)||Y
se T ∈ L(X, Y) (rispettivamente B(X, Y)),
che `e detta topologia forte su L(X, Y) (rispettivamente B(X, Y)); (iii) La topologia indotta su B(X, Y) dalla norma operatoriale (2.14) `e detta topologia uniforme su B(X, Y). (b) Se Y = K – e quindi stiamo considerando possibili topologie su X – la topologia uniforme definita in (iii) prende il nome di topologia (duale) forte di X e le topologie debole e forte definite in (i) e (ii), che risultano coincidere, prendono il nome di topologia ∗ -debole di X . La topologia topologia ∗ -debole su X `e dunque indotta dalla classe di tutte le seminorme p∗x , definite come, per ogni fissato x ∈ X: p∗x(f) := |f(x)|
se f ∈ X .
Osservazioni 2.81. (1) Si prova facilmente che, su uno spazio normato, gli aperti della topologia debole sono aperti anche nella topologia standard, ma non vale il viceversa. Similmente, in L(X, Y), gli aperti della topologia debole sono aperti anche nella topologia forte ma non vale il viceversa. Questo fatto si enuncia, sinteticamente, dicendo che: la topologia standard su X e forte su L(X, Y) sono, sui rispettivi spazi, pi` u fini (o pi` u forti) delle corrispondenti deboli sui rispettivi spazi X e L(X, Y). Nello stesso modo, riferendosi agli spazi di operatori, si prova facilmente che: la topologia uniforme `e pi` u fine (o pi` u forte) della topologia forte.
54
2 Spazi normati e spazi di Banach, esempi e applicazioni
Per gli spazi duali vale ovviamente l’analoga propriet` a: la topologia forte `e pi` u fine (cio`e pi` u forte) della topologia ∗ -debole. (2) Dalla proposizione 2.78 si ha subito che valgono le seguenti proposizioni. Proposizione 2.82. Sia {xn }n∈N ⊂ X con X spazio normato. Vale xn → x ∈ X, per n → +∞, nella topologia debole, se e solo se: f(xn ) → f(x) ,
per n → +∞, per ogni scelta di f ∈ X .
Proposizione 2.83. Se {Tn }n∈N ⊂ L(X, Y) (o B(X, Y)) e T ∈ L(X, Y) (risp. B(X, Y)), vale Tn → T , per n → +∞, nella topologia debole, se e solo se: f(Tn (x)) → f(T (x)) ,
per n → +∞, per ogni scelta di x ∈ X e f ∈ Y .
Proposizione 2.84. Tn → T per n → +∞, nella topologia forte se e solo se: ||Tn (x) − T (x)||Y → 0 ,
per n → +∞, per ogni scelta di x ∈ X.
` chiaro allora che: E (a) La convergenza di una successione di vettori di uno spazio normato X in senso standard (cio`e rispetto alla topologia indotta dalla norma) implica la convergenza della stessa successione in senso debole (cio`e rispetto alla topologia debole). (b) La convergenza di una successione di operatori di B(X, Y) in senso uniforme (cio`e rispetto alla topologia uniforme) implica la convergenza della stessa successione in senso forte (cio`e rispetto alla topologia forte). (c) La convergenza di una successione di operatori di L(X, , Y) o B(X, Y) in senso forte implica la convergenza della stessa successione in senso debole (cio`e rispetto alla topologia debole). (3) Dalla proposizione 2.78 segue ancora che: Proposizione 2.85. Data una successione di funzionali {fn }n∈N ⊂ X e un funzionale f ∈ X , vale fn → f, per n → +∞, nella topologia ∗ -debole se e solo se: fn (x) → f(x) ,
per n → +∞ per ogni scelta di x ∈ X.
` chiaro allora che: la convergenza di una successione di funzionali di X E in senso forte (cio`e rispetto alla topologia duale forte) implica la convergenza della stessa successione in senso ∗ -debole (cio`e rispetto alla topologia ∗ -debole). (4) Su X `e possibile definire un’ulteriore topologia debole, ottenuta pensando X come spazio sul quale agisce (X ) . In tal caso le seminorme che inducono la topologia sono definite come: ps (f) := |s(f)|
2.4 I teoremi fondamentali negli spazi di Banach
55
per ogni s ∈ (X ) . Se X non `e riflessivo, questa topologia debole non coincide in generale con la topologia ∗-debole vista sopra, dato che X si identifica solo con un sottospazio proprio di (X ) e pertanto le seminorme della topologia ∗-debole sono meno di quelle della topologia debole. La topologia topologia debole `e pi` u fine di quella ∗-debole: in altre parole, un aperto per la topologia debole `e anche aperto per la topologia ∗-debole ma non `e detto che valga il viceversa. Similmente, la convergenza di successioni in X nella topologia debole implica quella nella topologia ∗-debole, ma non vale il viceversa. Notazione 2.86. Per denotare i limiti rispetto alle topologie forti e deboli negli spazi di operatori solitamente si usano le seguenti convenzioni notazionali, che adotteremo anche in questo testo. T = s- lim Tn significa che T `e il limite nella topologia forte della successione di operatori {Tn }n∈N . La stessa notazione si usa nel caso in cui gli operatori coinvolti siano funzionali e la topologia `e quella duale forte. T = w- lim Tn significa che T `e il limite nella topologia debole della successione di operatori {Tn }n∈N . f = w ∗ - lim fn significa che f `e il limite nella topologia ∗ -debole della successione {fn }n∈N . Le nozioni topologiche acquisite permettono di provare l’ultimo rilevante corollario del teorema di Banach-Steinhaus. Sappiamo gi` a che, se X `e uno spazio normato, allora X `e completo rispetto alla topologia duale forte come provato in (ii) di (c) del teorema 2.54. Si pu` o provare che la completezza, nel senso che segue, sussiste anche rispetto alla topologia ∗ -debole purch´e X sia spazio di Banach. Corollario 2.87. (Del Teorema di Banach-Steinhaus.) Se X `e spazio di Banach su K = C o R, allora X `e completo rispetto alla topologia ∗-debole nel senso che segue. Se {fn }n∈N ⊂ X `e tale che, per ogni x ∈ X, {fn (x)}n∈N `e una successione di Cauchy, allora esiste f ∈ X tale che f = w ∗ -limfn . Dimostrazione. Il campo di X `e completo per ipotesi, di conseguenza, per ` immediato verificare ogni x ∈ X esister`a f(x) ∈ K con fn (x) → f(x). E che f : X x → f(x) definisce un funzionale lineare. Per concludere la dimostrazione proviamo che f `e continuo. Per ogni x ∈ X, fn (x) `e limitata (perch´e di Cauchy) per cui, dal teorema di B-S, |fn (x)| ≤ K < +∞ per ogni x ∈ X con ||x|| ≤ 1. Facendo il limite a n → +∞ segue che |f(x)| ≤ K se ||x|| ≤ 1 da cui ||f|| ≤ K < +∞ e pertanto, dal teorema 2.53, f `e continuo.
56
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.4.4 Breve digressione: spazi metrici, spazi localmente convessi metrizzabili e spazi di Fr´ echet Facciamo qui una brevissima digressione su alcune importanti propriet` a degli spazi localmente convessi in relazione al problema della metrizzabilit`a. Ricordiamo la seguente nozione che dovrebbe essere nota dai corsi elementari. Definizione 2.88. Uno spazio metrico `e un insieme M dotato di una funzione, detta distanza o metrica, d : M × M → R soddisfacente: D1. d(x, y) = d(y, x), D2. d(x, y) ≥ 0, dove = vale se solo se x = y, D3. d(x, z) ≤ d(x, y) + d(y, x) per x, y, z ∈ M. Osservazioni 2.89. (1) La propriet` a D1 `e nota come simmetria, la propriet` a D2 `e nota come positivit` a e propriet` a D3 `e nota come (propriet` a della) disuguaglianza triangolare. (2) Ogni spazio normato (X, || ||) (e quindi in particolare Rn e Cn ) ammette una naturale struttura di spazio metrico (X, d) definendo d(x, x) := ||x − x || se x, x ∈ X. In questo caso, evidentemente, vale: d(x + z, y + z) = d(x, y) comunque si scelgano x, y, z ∈ X,
in questo senso, la distanza d `e invariante per traslazioni.
Nel caso generale, la struttura di spazio metrico `e molto pi` u semplice di quella di spazio normato, dato che la struttura di spazio vettoriale `e del tutto assente negli spazi metrici. Abbiamo comunque la seguente definizione, del tutto analoga a quella per gli spazi normati. Definizione 2.90. In uno spazio metrico (M, d), una palla metrica aperte con centro x e raggio r > 0 `e l’insieme: Bδ (x) := {y ∈ M | d(x, y) < δ} .
(2.28)
Similmente agli spazi normati, gli spazi metrici hanno una topologia naturale in cui gli aperti sono, oltre all’insieme vuoto ∅, le unioni di palle metriche aperte con centri e raggi arbitrari. Definizione 2.91. Si consideri uno spazio metrico (M, d). (a) A ⊂ M `e aperto se A = ∅ oppure A `e unione di palle aperte. (b) La topologia naturale di M `e la famiglia degli insiemi aperti di X. Osservazioni 2.92. (1) Come per gli spazi normati risulta immediatamente, verificando gli assiomi corrispondenti, che la topologia naturale `e una topologia nel senso generale e che le palle metriche aperte sono una base di essa. Inoltre la topologia naturale degli spazi metrici `e banalmente di Hausdorff come nel caso degli spazi normati.
2.4 I teoremi fondamentali negli spazi di Banach
57
(2) Se uno spazio metrico (X, d) `e separabile, cio`e esiste S ⊂ X denso e numerabile, allora `e uno spazio topologico a base numerabile: ammette una base topologica B numerabile. B `e la famiglia delle palle aperte, centrate nei punti di S, di raggio razionale. Si pu` o provare che vale anche il viceversa: uno spazio metrico `e a base numerabile se e solo se `e separabile [KoFo80]. (3) Si noti che, per uno spazio normato (X, || ||), le palle aperte costruite con la norma || || coincidono con le palle aperte costruite con la metrica d(x, x) := ||x − x ||. Pertanto le due topologie su X, pensato come spazio normato oppure come spazio metrico, coincidono. Esattamente come negli spazi normati, negli spazi metrici, la definizione 2.9 di funzione continua pu` o essere equivalentemente enunciata come segue. Definizione 2.93. Un’applicazione f : M → N, con (M, dM) e (N, dN ) spazi metrici, `e detta continua in x0 ∈ M se, per ogni > 0 esiste un corrispondente δ > 0 tale che dN(f(x), f(x0 )) < se dM (x, x0) < δ. Una funzione f : M → N `e detta essere continua se `e continua in ogni punto di M. Esattamente come per gli spazi normati, la nozione di successione convergente (definizione 2.6) si specializza nel modo seguente negli spazi metrici. Definizione 2.94. Se (M, d) `e uno spazio metrico, una successione {xn }n∈N ⊂ M `e detta convergere ad un vettore x ∈ M, detto il limite della successione, e si scrive: xn → x
per
n → +∞
e anche
lim xn = x ,
n→+∞
se e solo se, per ogni > 0 esiste N ∈ R tale che d(xn , x) < se n > N , altrimenti scritto come: lim d(xn , x) = 0 . n→+∞
Come nel caso degli spazi normati, risulta che le successioni convergenti rispetto alla topologia naturale di uno spazio metrico sono successioni di Cauchy (vedi sotto), ma non vale il viceversa nel caso generale. Vale la seguente definizione. Definizione 2.95. Sia (M, d) spazio metrico. (a) Una successione {xn }n∈N ⊂ M `e detta di Cauchy se: per ogni > 0 esiste N ∈ R tale che d(xn , xm) < se n, m > N . (a) (M, d) `e detto essere completo se ogni successione di Cauchy converge a qualche punto dello spazio. Una questione tecnicamente importante `e quella di capire se uno spazio topologico, in particolare uno spazio vettoriale topologico localmente convesso, ammetta una funzione distanza (che in generale non esiste, se la topologia `e indotta da seminorme), la cui topologia metrica coincida con quella preesistente dello spazio topologico. Quando questo accade, lo spazio topologico di partenza `e detto essere metrizzabile.
58
2 Spazi normati e spazi di Banach, esempi e applicazioni
Consideriamo uno spazio vettoriale localmente convesso X. Nel caso generale, la topologia indotta da una seminorma o da una classe di seminorme P = {pi }i∈I su X non sar` a di Hausdorff. Si vede facilmente che la propriet`a di Hausdorff vale se e solo se ∩i∈I p−1 i (0) = 0, il secondo 0 essendo il vettore nullo di X. In particolare ci` o accade se almeno una delle pi `e una norma. Tornando agli spazi vettoriali topologici, si prova che ogni spazio vettoriale localmente convesso (X, P) che soddisfi entrambe le richieste: (a) P = {pn }n=1,2,... cio`e P `e numerabile, (b) ∩n=1,2,...p−1 n (0) = 0 `e, non solo di Hausdorff, ma `e addirittura metrizzabile: la topologia associata alle seminorme coincide con la topologia naturale dello spazio metrico (X, d), precisando in modo opportuno la distanza d : X × X → R+ . In particolare, tale distanza pu` o essere sempre scelta (risultando in tal modo invariante per traslazioni) come: +∞ 1 pn (x − y) d(x, y) := . 2n 1 + pn (x − y) n=1 Si osservi che, in generale, questa non `e l’unica distanza possibile che riproduca la topologia di X indotta dalle sue seminorme. Per esempio moltiplicando d per un fissato numero positivo, la nuova distanza riproduce la stessa topologia della vecchia. Uno spazio di Fr´ echet `e uno spazio X localmente convesso la cui topologia `e di Hausdorff, `e indotta da una classe finita o numerabile di seminorme, e, come spazio metrico, (X, d) `e completo. Si prova che una successione {xn }n∈N ⊂ X `e di Cauchy rispetto ad una distanza d di uno spazio localmente convesso metrizzabile X, se e solo se `e di Cauchy rispetto ad ogni seminorma (p) p della classe generante la topologia: per ogni > 0 esiste N ∈ R tale che (p) p(xn − xm ) < se n, m > N . Di conseguenza la propriet` a di completezza non dipende, in realt` a, dalla distanza usata per generare la topologia dello spazio localmente convesso. Gli spazi di Fr´echet, di cui non ci occuperemo in questo libro, sono di fondamentale importanza nella fisica teorica e matematica per quanto concerne le teorie quantistiche dei campi. Ovviamente ogni spazio di Banach `e un caso elementare di spazio di Fr´echet. Esempio 2.96. Un esempio importante di spazio di Fr´echet `e dato dallo spazio di Schwartz. Per definirlo introduciamo le seguenti notazioni, che useremo anche alla fine del capitolo 3. I punti di Rn saranno indicati con singole lettere e le componenti con la stessa lettera ed un indice basso, in tal modo x = (x1 , . . . , xn ). Diremo multindice ogni n-pla, α = (α 1n, . . . , αn ) con αi = 0, 1, 2, . . . e indicheremo con |α| la somma |α| := i=1 αi . Useremo infine le seguenti notazioni: ∂ |α| ∂xα := . α1 n ∂x1 · · · ∂xα n
2.4 I teoremi fondamentali negli spazi di Banach
59
Lo spazio di Schwartz S(Rn ), come spazio vettoriale complesso `e il sottospazio di C ∞ (Rn ) (lo spazio vettoriale complesso delle funzioni su Rn , infinitamente differenziabili, a valori complessi) delle funzioni f che si annullano all’infinito, con tutte le derivate, pi` u velocemente di qualsiasi potenza inversa n 2: di |x| := x i=1 i pN (f) := sup sup (1 + |x|2)N |(∂xα f)(x)| < +∞ per ogni N = 0, 1, 2, . . . |α|≤N x∈Rn
Le funzioni definite sopra pN : S(Rn ) → R+ sono seminorme, che soddisfano evidentemente la richiesta ∩N∈N p−1 e una norma. N (0) = 0, dato che p0 = || ||∞ ` In questo modo S(Rn ), dotato della topologia indotta dalla famiglia di norme {pN }N∈N , acquista la struttura di spazio localmente convesso. Si dimostra facilmente che S(Rn ) `e uno spazio di Fr´echet [Rud91]. Gli elementi del duale topologico S(R) di S(R), cio`e i funzionali lineari da S(Rn ) in C che sono continui rispetto alla topologia generata dalla classe di seminorme {pN }N∈N , sono le famose distribuzioni di Schwartz. 2.4.5 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal teorema di Baire Concludiamo la sezione con l’ultimo importante teorema generale, quello dell’applicazione aperta, che avr` a come conseguenza il teorema dell’operatore inverso continuo. Per provare tali teoremi vogliamo introdurre il minimo indispensabile della teoria degli spazi di Baire. Ricordiamo alcune definizioni di topologia generale. Definizione 2.97. Sia (X, T ) uno spazio topologico e S ⊂ X. (a) L’interno, Int(S), di S `e l’insieme: Int(S) := {x ∈ X | ∃A ⊂ X , A aperto e x ∈ A ⊂ S} . (b) S si dice ovunque non denso (nowhere dense) se Int(S) = ∅. (c) S `e detto insieme di prima categoria o anche insieme magro (meager set), se `e l’unione di una classe numerabile di insiemi ovunque non densi. (d) S `e detto insieme di seconda categoria o anche insieme non magro se non `e di prima categoria. Si provano immediatamente i seguenti risultati. (1) L’unione numerabile di insiemi di prima categoria `e ancora di prima categoria. (2) Se h : X → X `e un omeomorfismo di spazi topologici, allora S ⊂ X `e di prima (seconda) categoria se e solo se h(S) `e di prima (risp. seconda) categoria. (3) Se A ⊂ B ⊂ X e B `e di prima categoria nello spazio topologico X, allora A `e di prima categoria. (4) Se B ⊂ X `e un insieme chiuso dello spazio topologico X e Int(B) = ∅, allora B `e di prima categoria in X.
60
2 Spazi normati e spazi di Banach, esempi e applicazioni
Vale infine l’importante teorema di Baire (si tenga conto delle definizioni 2.88 e 2.95). Teorema 2.98. (Di Baire.) Sia (X, d) uno spazio metrico completo, valgono i fatti seguenti. (a) Se {Un }n∈N `e una famiglia numerabile di aperti di X, ciascuno denso in X, allora anche ∩n∈NUn `e un insieme denso in X. (b) X `e di seconda categoria. Dimostrazione. (a) Sia A ⊂ X un insieme aperto. Se fosse U0 ∩ A = ∅, avremmo che z ∈ A ammette un intorno aperto di che non interseca U0 che, di conseguenza, non potrebbe essere denso in X. Quindi U0 ∩ A `e un aperto (in quanto intersezione di aperti) non vuoto. Esiste allora una palla metrica aperta Br0 (x0 ) di raggio r0 > 0 (2.28) e centro x0 ∈ X (vedi la 2.28) tale che Br0 (x0 ) ⊂ U0 ∩ A. Possiamo ripetere la procedura usando Br0 (x0 ) al posto di A, U1 al posto di U0 , e trovando una nuova palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ U1 ∩ Br0 (x0 ). Iterando la procedura, troviamo una classe numerabile di palle aperte Brn (xn ) con 0 < rn < 1/n, tali che Brn (xn ) ⊂ Un ∩ Brn−1 (xn−1 ). Dato che xn ∈ Brm (xm ) quando m ≥ n, la successione {xn }n∈N deve essere di Cauchy. Essendo X completo, xn → x ∈ X se n → +∞. Per costruzione, per ogni n ∈ N, x ∈ Brn−1 (xn−1 ) ⊂ Brn (xn ) ⊂ · · · ⊂ U0 ∩ A ⊂ A. Concludiamo che x ∈ A ∩ Un per ogni n ∈ N e pertanto (∩n∈NUn ) ∩ A = ∅ per ogni sottoinsieme aperto A ⊂ X. Di conseguenza ∩n∈N Un `e denso in X, dato che interseca ogni intorno aperto di ogni elemento di X. (b) Supponiamo ora che {Ek }k∈N sia una collezione numerabile di insiemi Ek ⊂ X ovunque non densi. Se Vk `e il complemento di Ek , per ogni k ∈ N, Vk deve essere aperto (perch´e complemento di un chiuso) e denso in X (perch´e `e aperto e l’interno del suo complemento `e vuoto). La prima parte del teorema dimostra che ∩k∈N Vn = ∅ e quindi, prendendo il complemento X = ∪k∈NEk ed, a maggior ragione, X = ∪k∈N Ek . Per cui X non `e di prima categoria ed `e dunque di seconda categoria. Osservazioni 2.99. (1) Il teorema di Baire afferma tra le altre cose che: ogni classe, finita o infinita numerabile, di aperti densi in uno spazio metrico completo ha sempre intersezione non vuota (oltre che densa). Nel caso finito `e sufficiente specializzare l’enunciato alla situazione in cui Un = Um per n, m ≥ N per qualche N . (2) Il teorema di Baire, vale anche nel caso in cui X sia uno spazio topologico di Hausdorff localmente compatto. La dimostrazione della prima parte `e simile a quella della prima parte del caso dello spazio metrico completo [Rud91], la seconda `e identica alla corrispondente. (3) Il teorema di Baire si applica ovviamente agli spazi di Banach pensandoli come spazi metrici completi, usando la distanza associata alla norma. Passiamo ad enunciare e provare il teorema dell’applicazione aperta. Ricordiamo che una funzione f : X → Y tra due spazi normati (pi` u in generale,
2.4 I teoremi fondamentali negli spazi di Banach
61
tra spazi topologici) `e detta aperta se f(A) `e aperto in Y quando A ⊂ X `e (Z) aperto. Nell’enunciato, al solito, Br (z) indica la palla aperta di raggio r e centro z nello spazio normato (Z, || ||Z). Teorema 2.100. (Dell’applicazione aperta di Banach-Schauder.) Siano X e Y due spazi di Banach sullo stesso campo C o R. Se T ∈ B(X, Y) `e suriettivo, allora: (X)
(Y)
T (B1 (0)) ⊃ Bδ (0)
se δ > 0 `e abbastanza piccolo .
(2.29)
Conseguentemente T `e una funzione aperta. (X)
Dimostrazione. Definiamo in X la palla aperta Bn := B2−n (0), di raggio 2−n e centrata nell’origine. Proveremo che esiste un intorno aperto W0 dell’origine 0 ∈ Y con: W0 ⊂ T (B1 ) ⊂ T (B0 ) . (2.30) Questo risultato implica immediatamente la tesi. Per provare (2.30), notiamo che, come si prova facilmente B1 ⊃ B2 −B2 (dove, d’ora in poi, facciamo uso delle notazioni in notazione 2.75) e quindi T (B1 ) ⊃ T (B2 ) − T (B2 ) ed infine T (B1 ) ⊃ T (B2 ) − T (B2 ). D’altra parte valendo A + B ⊃ A + B se A, B ⊂ Y con Y spazio normato (provarlo per esercizio), abbiamo trovato che: T (B1 ) ⊃ T (B2 ) − T (B2 ) ⊃ T (B2 ) − T (B2 ) .
(2.31)
La prima inclusione di (2.30) (partendo da sinistra) risulta quindi essere vera se T (B2 ) ha interno non vuoto: se z ∈ Int(T (B2 )) allora z ⊂ A ⊂ T (B2 )) con A aperto e quindi 0 ∈ W0 := A − A ⊂ T (B2 ) − T (B2 ) ⊂ T (B1 ) dove W0 `e ancora aperto. Per provare che Int(T (B2 )) = ∅, notiamo che, nelle nostre ipotesi: Y = T (X) =
+∞
kT (B2 ) ,
(2.32)
k=1
dal momento che B2 `e un intorno aperto di 0. Dato che Y `e di seconda categoria, almeno uno dei kT (B2 ) deve essere di seconda categoria (se fossero tutti di prima categoria, Y sarebbe di prima categoria e questo non pu`o accadere per la seconda affermazione nel teorema 2.98 di Baire essendo Y completo). Dato che y → ky `e un omeomorfismo da Y a Y, T (B2 ) deve essere di seconda categoria in Y. Concludiamo che la chiusura di T (B2 ) ha interno non vuoto. Questo prova la prima inclusione in (2.30). Per provare la rimanente inclusione in (2.30) (la seconda, partendo da sinistra), usiamo una successione di elementi yn ∈ Y costruita induttivamente come segue. Fissiamo y1 ∈ T (B1 ). Assumiamo quindi n ≥ 1 e che yn sia stato
62
2 Spazi normati e spazi di Banach, esempi e applicazioni
scelto in T (Bn ) e passiamo a definire yn+1 tenendo conto delle considerazioni che seguono. Quanto abbiamo provato per T (B1 ) vale similmente modo per T (Bn+1 ), e dunque T (Bn+1 ) contiene un intorno aperto dell’origine. Allora: yn − T (Bn+1 ) ∩ T (Bn ) = ∅ . (2.33) Questo implica che esiste xn ∈ Bn tale che: T (xn ) ∈ yn − T (Bn+1 ) .
(2.34)
Definiamo allora: yn+1 := yn − T xn . Si noti che yn+1 ∈ T (Bn+1 ), e la costruzione induttiva procede in questo modo ad ogni passo. Dato che ||xn || < 2−n , per n = 1, 2, . . ., la somma x1 + · · · + xn forma una successione di Cauchy che converge a qualche x ∈ X, per la completezza di X, e vale ||x|| < 1. Quindi x ∈ B0 . Dal momento che: m n=1
T xn =
m
(yn − yn+1 ) = y1 − ym+1 ,
(2.35)
n=1
e dato che ym+1 → 0 per m → +∞ (per continuit` a di T ), concludiamo che y1 = T x ∈ T (B0 ). Dato che y1 era un generico elemento di T (B1 ), questo risultato dimostra la seconda inclusione in (2.30) e conclude la dimostrazione della prima affermazione. Passiamo alla seconda affermazione. (2.29) e la linearit`a di T implicano che (X) l’immagine secondo T di qualunque palla aperta B (x) = x + B1 (0) centrata in qualunque punto x ∈ X, contiene la palla aperta di Y centrata in (Y) (Y) T x: Bδ (0) := T x + Bδ (0) (per δ > 0 sufficientemente piccolo). Quindi (X)
l’immagine secondo T di un qualsiasi aperto di X, A = ∪x∈A Bx (x) risulta (Y) essere un aperto di Y: T (A) = ∪x∈A Bδ (T x). In altre parole, la funzione T `e x aperta. La conseguenza elementare pi` u importante del teorema dell’applicazione aperta `e sicuramente il Teorema di Banach dell’operatore inverso nel caso di spazi di Banach (esiste una versione che usa solo l’ipotesi di spazi vettoriali metrici completi). Teorema 2.101. (Di Banach dell’operatore inverso.) Siano X e Y due spazi di Banach sullo stesso campo C o R. Se T ∈ B(X, Y) `e iniettivo e suriettivo, allora valgono i seguenti due fatti. (a) T −1 : Y → X `e un operatore limitato cio`e T −1 ∈ B(Y, X). (b) Esiste c > 0 tale che: ||T x|| ≥ c||x|| ,
per ogni x ∈ X.
(2.36)
Dimostrazione. (a) Il fatto che T −1 sia lineare `e di immediata verifica. Bisogna solo provare che T −1 `e continuo. Essendo T aperta, la controimmagine di un
2.4 I teoremi fondamentali negli spazi di Banach
63
aperto di X secondo T −1 `e un aperto, quindi T −1 `e continua. (b) Dato che T −1 `e limitata, esiste K ≥ 0 tale che ||T −1y|| ≤ K||y|| per ogni y ∈ Y. Notare che K > 0, altrimenti varrebbe T −1 = 0 e di conseguenza T −1 e T non sarebbero biettive. Per ogni x ∈ X definiamo y = T x. Sostituendo in ||T −1 y|| ≤ K||y|| troviamo la (2.36) ponendo c = 1/K. 2.4.6 Teorema del grafico chiuso Per concludere passiamo a dimostrare un utilissimo teorema in teoria degli operatori chiamato il teorema del grafico chiuso. Notazione 2.102. (1) Se X `e spazio vettoriale e ∅ = X1 , . . . , Xn ⊂ X, allora: < X1 , · · · , Xn > denota il sottospazio generato dagli insiemi Xi , cio`e il sottospazio vettoriale di X contenente tutte le combinazioni lineari finite di elementi degli insiemi Xi . (2) Se X `e spazio vettoriale e ∅ = X1 , . . . , Xn ⊂ X sono sottospazi di X, Y = X1 ⊕ · · · ⊕ Xn significa che Y ⊂ X `e somma diretta degli spazi Xi , cio`e valgono insieme: (i) Y =< X1 , · · · , Xn > (quindi Y `e sottospazio di X) e (ii) Xi ∩ Xj = {0} per ogni coppia di indici i, j = 1, . . . , n con i = j. Come noto dai corsi elementari, (i) e (ii) insieme equivalgono al fatto che: x ∈ Y ⇒ x = x1 + · · · + xn con xk ∈ Yk unicamente determinato da x per k = 1, . . . , n. (3) Se X1 , . . . , Xn sono spazi vettoriali sullo stesso campo K = C o R, possiamo dotare X1 × · · · × Xn di una struttura di spazio vettoriale su K definendo: α(x1 , . . . , xn ) := (αx1 , . . . , αxn) e (x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ) per ogni scelta di α ∈ K e (x1 , . . . , xn ), (y1 , . . . , yn ) ∈ X1 × · · · × Xn . Se: ΠXk : (x1 , . . . , xk−1, xk , xk+1 , . . . , xn) → (0, . . . , 0, xk, 0, . . . , 0) , denota la k-esima proiezione canonica, lo spazio vettoriale costruito su X1 ×· · ·×Xn risulta coincidere con Ran(ΠX1 )⊕· · ·⊕Ran(ΠXn ). Dato che ogni Xk si identifica naturalmente con il corrispondente Ran(ΠXk ), noi useremo la notazione X1 ⊕ · · · ⊕ Xn per indicare la struttura naturale di spazio vettoriale di X1 × · · · × Xn costruita come detto sopra, anche nel caso in cui gli spazi vettoriali Xk non siano a priori sottospazi di un comune spazio vettoriale assegnato.
64
2 Spazi normati e spazi di Banach, esempi e applicazioni
Per enunciare e dimostrare il teorema abbiamo bisogno di introdurre alcuni risultati elementari. Prima di tutto notiamo che se (X, NX ) e (Y, NY ) sono spazi normati sullo stesso campo K = C o R, possiamo considerare lo spazio X ⊕ Y nel senso di (3) in notazione 2.102. X ⊕ Y `e dotato naturalmente della topologia prodotto indotta da quella di X e Y e presentata nella definizione 2.11. Le operazioni della struttura di spazio vettoriale di X⊕Y sono continue rispetto alla topologia prodotto di X e Y come `e facile provare (la prova `e la stessa che abbiamo usato per provare che, in uno spazio normato, le operazioni di somma di due vettori e di prodotto di scalare e vettore sono continue nelle corrispondenti topologie naturali). Infine le proiezioni canoniche ΠX : X⊕Y → X e ΠY : X⊕Y → Y sono continue nella topologia prodotto nel dominio e quella di X e, rispettivamente, di Y nel codominio, come si prova immediatamente. La topologia prodotto di X ⊕ Y `e normabile: cio`e esiste un norma su X ⊕ Y la cui topologia associata `e proprio la topologia prodotto di X ⊕ Y. Una possibile norma `e: ||(x, y)|| := max{NX (x), NY (y)} per ogni (x, y) ∈ X ⊕ Y .
(2.37)
Il fatto che questa norma generi la topologia prodotto, cio`e gli insiemi aperti siano unione di prodotti delle palle aperte di X e Y, si prova come segue. Consideriamo l’intorno aperto di (x0 , y0 ) dato dal prodotto di due palle aperte (X) (Y) Bδ (x0 )×Bμ (y0 ) rispettivamente in X e Y. La palla aperta di X⊕Y centrata ancora in (x0 , y0 ): {(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < min{δ, μ}/2} (X)
(Y)
(X)
(Y)
`e contenuta in Bδ (x0 )×Bμ (y0 ). Viceversa, il prodotto Bδ (x0 )×Bδ (y0 ), che contiene il punto (x0 , y0 ), `e incluso nella palla aperta centrata in (x0 , y0 ) {(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < } , se > δ. Questo conclude la prova, perch´e ne segue che ogni unione di prodotti di palle metriche di X e Y `e anche unione di palle metriche della norma (2.37) ed ogni unione di palle metriche della norma (2.37) `e anche unione di prodotti di palle metriche di X e Y. Quindi le due topologie coincidono. Si prova immediatamente che (X ⊕ Y, || ||) `e uno spazio di Banach se sono tali (X, NX ) e (Y, NY ). (Questo fatto implica, in base alla proposizione 2.110 provata nel seguito, che qualunque norma che generi la topologia prodotto rende X⊕Y spazio di Banach.) Sia infatti {(xn , yn )} una successione di Cauchy in X⊕Y, allora {xn } e {yn } risultano essere di Cauchy in X e Y rispettivamente dalla stessa definizione di norma su X ⊕ Y data sopra. Siano x ∈ X e y ∈ Y i limiti di queste due successioni, che esistono essendo X e Y spazi di Banach. Se > 0, esistono Nx e Ny interi positivi tali che, se n > max{Nx , Ny } allora: ||(x, y) − (xn , yn )|| < , e quindi (xn , yn ) → (x, y) per n → +∞ nella topologia indotta dalla norma di X ⊕ Y. Tale spazio `e quindi spazio di Banach.
2.5 Proiettori
65
Definizione 2.103. Siano X, Y spazi normati sullo stesso campo C o R. T ∈ L(X, Y) `e detto chiuso se il grafico dell’operatore T , cio`e il sottospazio di X ⊕ Y: G(T ) := {(x, T x) ∈ X ⊕ Y | x ∈ X} , `e chiuso nella topologia prodotto. Ci` o equivale a dire che T `e chiuso se e solo se verifica la seguente propriet` a. Per ogni successione {xn }n∈N ⊂ X tale che {xn }n∈N e {T xn }n∈N convergono in X e Y rispettivamente, vale: lim T (xn ) = T ( lim xn ) .
n→∞
n→∞
L’equivalenza asserita nella seconda parte della definizione segue immediatamente dal risultato topologico generale che un insieme (G(T ) nel nostro caso) `e chiuso se e solo se coincide con la sua chiusura, e cio`e se e solo se contiene i suoi punti di accumulazione, esplicitando tale requisito in termini della topologia prodotto. Possiamo enunciare e dimostrare il teorema dell’operatore chiuso o grafico chiuso. Teorema 2.104. (Dell’operatore chiuso o del grafico chiuso.) Siano (X, || ||X ) e (Y, || ||Y ) spazi di Banach sullo stesso campo K = C. T ∈ L(X, Y) `e limitato se e solo se `e chiuso. Dimostrazione. Se T `e limitato allora `e banalmente chiuso come segue dalla definizione di operatore chiuso. Supponiamo che T sia chiuso e mostriamo che `e limitato. Consideriamo l’applicazione lineare biettiva M : G(T ) (x, T x) → x ∈ X. G(T ) `e per ipotesi un sottospazio chiuso nello spazio di Banach X ⊕ Y, per cui `e a sua volta uno spazio di Banach rispetto alla restrizione della norma || || (2.37). Dalla definizione di tale norma troviamo che vale banalmente ||M (x, T x)||X = ||x||X ≤ ||(x, T x)|| per cui M `e limitato. Per il teorema dell’inverso limitato di Banach M −1 : X → G(T ) ⊂ X ⊕ Y `e limitato. Dato che la proiezione canonica di ΠY : X ⊕ Y → Y `e continua, concludiamo che l’applicazione lineare ΠY ◦ M −1 : x → T x `e continua ossia limitata.
2.5 Proiettori Introduciamo, usando il teorema del grafico chiuso, la nozione e le propriet`a elementari di alcuni operatori continui detti proiettori. La nozione di proiettore giocher` a il ruolo centrale nella formulazione della Meccanica Quantistica quando lo spazio normato sar` a uno spazio di Hilbert. Definizione 2.105. Sia (X, || ||) spazio normato sul campo C o R. P ∈ B(X) `e detto proiettore se `e idempotente, cio`e se PP = P .
(2.38)
M := P (X) `e detto spazio di proiezione di P e si dice anche che P proietta su M.
66
2 Spazi normati e spazi di Banach, esempi e applicazioni
I proiettori sono naturalmente associati ad una decomposizione diretta (somma diretta) di X in una coppia di sottospazi chiusi. Proposizione 2.106. Sia P ∈ B(X) un proiettore sullo spazio normato (X, || ||). Vale quanto segue. (a) Se Q : X → X `e l’applicazione lineare che soddisfa Q+P =I ,
(2.39)
P Q = QP = 0 ,
(2.40)
Q `e proiettore e: dove 0 `e l’operatore nullo (quello che trasforma nel vettore 0 ogni vettore di X). (b) Gli spazi di proiezione M := P (X) ed N := Q(X) sono sottospazi chiusi di X e vale: X = M⊕N. (2.41) Dimostrazione. (a) Q `e continuo perch´e somma di operatori continui, QQ = (I − P )(I − P ) = I − 2P + P P = I − 2P + P = I − P = Q. P Q = P (I − P ) = P − P P = P − P = O, (I − P )P = P − P P = P − P = O. (b) Se P (xn) → y per n → +∞ allora, dalla continuit` a di P : P P (xn) → P (y). Per (2.38) questo si scrive P (xn ) → P (y) da cui y = P (y) per l’unicit` a del limite (essendo X di Hausdorff). In definitiva y ∈ M implica y ∈ M(⊂ M) per cui M = M ed M `e dunque un insieme chiuso. Con lo stesso ragionamento si prova che N `e chiuso. Il fatto che M ed N siano sottospazi `e immediata conseguenza della linearit`a di P e Q rispettivamente. Sia ora x ∈ X, dalla definizione di Q vale x = P (x) + Q(x) , di conseguenza X =< M, N >. Per concludere basta provare che M ∩ N = {0}. Sia x ∈ M∩ N. Allora x = P (x) e dunque x = Q(x) per (2.38) (se x ∈ M allora x = P z per qualche z ∈ X, ma allora P x = P P z = P z = x). Applicando Q all’identit` a x = P x e tenendo conto di x = Qx si ha: x = Q(x) = QP (x) = 0 per (2.40), e quindi x = 0. Il teorema del grafico chiuso prova che la proposizione 2.106 pu` o essere invertita come segue, assumendo l’ulteriore ipotesi che lo spazio ambiente sia di Banach. Proposizione 2.107. Sia (X, || ||) spazio di Banach e M, N ⊂ X due sottospazi chiusi tali che X = M ⊕ N. Si considerino le applicazioni P : X → M e Q : X → N che associano a x ∈ M i rispettivi elementi di M ed N secondo la decomposizione diretta X = M ⊕ N. Allora vale quanto segue. (a) P e Q sono proiettori che proiettano rispettivamente su M ed N. (b) Valgono le identit` a (2.39) e (2.40).
2.6 Norme equivalenti
67
Dimostrazione. Per ipotesi, se x ∈ X allora vale la decomposizione x = uM +uN con uM ∈ M e un ∈ N e tale decomposizione `e l’unica possibile rispetto a tale coppia di sottospazi. L’unicit` a ed il fatto che M ed N sono rispettivamente chiusi per combinazioni lineari implicano che le funzioni P : x → uM e Q : x → uN siano lineari e che valga P P = P e QQ = Q. Si noti anche che P (X) = M e Q(X) = N per costruzione e che (2.39) vale in quanto X =< M, N >, mentre (2.40) vale perch´e M ∩ N = {0}. Per concludere la dimostrazione bisogna solo provare che P e Q sono continui. Mostriamo che P `e chiuso, il teorema dell’operatore chiuso implica allora che P `e continuo. La dimostrazione per Q `e analoga. Sia {xn } ⊂ X una successione che converge a x ∈ X e tale che {P xn} converge anch’essa ad un elemento di X. Proviamo che: P x = lim P xn . n→+∞
Dato che N `e chiuso: N Qxn = xn − P xn → x − lim P xn = z ∈ N . n→+∞
Abbiamo ottenuto che: x = lim P xn + z , n→+∞
con z ∈ N, ma anche limn→+∞ P xn ∈ M, perch´e M `e chiuso e P xn ∈ M per ogni n. D’altra parte sappiamo che vale anche x = P x + Qx . Per l’unicit` a della decomposizione di x come somma di vettori in N ed M deve essere P x = lim P xn n→+∞
e z = Qx, quindi l’operatore P `e chiuso ed `e pertanto continuo.
2.6 Norme equivalenti Un’interessante applicazione del teorema dell’operatore inverso di Banach `e un criterio per stabilire quando due norme sullo stesso spazio vettoriale, che risulta essere completo per entrambe, sono associate alla stessa topologia. Introduciamo qualche nozione prima di enunciare il criterio detto nella proposizione 2.110. Concluderemo la sezione con la dimostrazione del fatto che tutte le norme sugli spazi vettoriali di dimensione finita sono equivalenti e rendono tali spazi spazi di Banach. Definizione 2.108. Due norme N1 e N2 sullo stesso spazio vettoriale X (su C o R) si dicono equivalenti se esistono due costanti c, c > 0 tali che: cN2 (x) ≤ N1 (x) ≤ c N2 (x) ,
per ogni x ∈ X.
(2.42)
68
2 Spazi normati e spazi di Banach, esempi e applicazioni
Osservazioni 2.109. (1) Si osservi che (2.42) `e equivalente all’analoga disuguaglianza che si ottiene scambiando N1 con N2 e sostituendo c, c con 1/c , 1/c rispettivamente. (2) Si prova immediatamente, dalla definizione e dall’osservazione precedente, che: se uno spazio normato `e completo allora `e tale ogni altro spazio normato sullo stesso spazio vettoriale dotato di una norma equivalente. (3) Se due norme sullo stesso spazio sono equivalenti allora generano la stessa topologia. La proposizione di sotto prova che vale anche il viceversa. (4) Nello spazio delle norme su un fissato spazio vettoriale, la nozione di norma equivalente definisce una relazione di equivalenza. La prova di ci`o `e immediata dalle definizioni date. Proposizione 2.110. Sia X uno spazio vettoriale su C o R. Le norme N1 e N2 su X sono equivalenti se e solo se l’applicazione identica I : (X, N2 ) x → x ∈ (X, N1 ) `e un omeomorfismo (che equivale a dire che le topologie metriche generate dalle due norme coincidono). Dimostrazione. Bisogna solo dimostrare che se I `e omeomorfismo allora le norme sono equivalenti. L’altra implicazione `e ovvia dalla definizione di norme equivalenti. Se I `e un omeomorfismo allora `e continuo nell’origine e quindi, in particolare, la palla aperta rispetto alla norma N1 di raggio 1 e centrata in 0 deve contenere completamente una palla aperta rispetto alla norma N2 centrata in 0 di raggio δ > 0 sufficientemente piccolo. Ossia N2 (x) ≤ δ ⇒ N1 (x) < 1. In particolare, per x = 0, N2 (δx/N2 (x)) ≤ δ per cui: N1 (δx/N2 (x)) < 1 ossia δN1 (x) ≤ N2 (x). Per x = 0 vale banalmente l’uguaglianza. Abbiamo provato che esiste c = 1/δ > 0 per cui N1 (x) ≤ c N2 (x) per ogni x ∈ X. L’altra parte della (2.42) si prova analogamente scambiando il ruolo dei due spazi. Proposizione 2.111. Sia X uno spazio vettoriale su C o R. Si supponga che X sia spazio di Banach rispetto ad entrambe le norme N1 , N2 . Se esiste c > 0 tale che, per ogni x ∈ X: cN2 (x) ≤ N1 (x) allora le due norme sono equivalenti. Dimostrazione. Si consideri la funzione identit` a I : x → x. Tale funzione `e lineare e continua quando la pensiamo come I : (X, N1 ) → (X, N2 ) perch´e N2 (x) ≤ (1/c)N1 (x) per ogni x ∈ X. Per il punto (b) nella tesi del teorema di Banach della funzione inversa esister`a c > 0 tale che N1 (x) ≤ c N2 (x) per ogni x ∈ X. N1 e N2 soddisfano allora la (2.42). Come ultima proposizione diamo il seguente importante risultato, che vale anche per spazi reali (scambiando C con R usando la stessa dimostrazione). Proposizione 2.112. Sia X uno spazio vettoriale sul campo C di dimensione finita. Tutte le norme su X sono a due a due equivalenti ed ognuna di esse definisce una struttura di spazio di Banach su X.
2.6 Norme equivalenti
69
` chiaro che possiamo ridurci a studiare il caso dello spazio Dimostrazione. E Cn , visto che ogni spazio vettoriale complesso di dimensione finita n `e isomorfo a Cn . Come conseguenza delle osservazioni (2) e (4) di sopra, `e sufficiente provare che ogni norma su Cn `e equivalente alla norma standard. Si tenga in particolare conto del fatto, noto dall’analisi elementare, che Cn con la norma standard `e completo e quindi ogni altra norma equivalente ad essa rende lo spazio vettoriale uno spazio di Banach in virt` u di (2) nelle osservazioni2.109. Sia N una norma su Cn e sia e1 , · · · , en la base canonica di Cn . Se x = i xi ei e y = i yi ei sono elementi generici di Cn , dalla propriet` a di positivit` a (N0), dalla disuguaglianza triangolare (N2) e dalla propriet` a di omogeneit` a (N1) della definizione di norma: 0 ≤ N (x − y) ≤
n
|xi − yi |N (ei ) ≤ Q
i=1
dove Q := su Cn
i
n
|xi − yi | ,
i=1
N (ei ). D’altra parte vale banalmente, se ||·|| `e la norma standard
n |xj − yj | ≤ M ax{|xi − yi | | i = 1, 2, · · · , n} ≤ |xi − yi |2 = ||x − y|| , i=1
da cui 0 ≤ N (x − y) ≤ nQ||x − y|| . Questo prova che N `e continua rispetto alla topologia della norma standard. Se S := {x ∈ Cn | ||x|| = 1} e N `e una seconda norma su Cn , che quindi sar`a continua rispetto alla topologia della norma standard, la funzione S x → f(x) :=
N (x) N (x)
sar`a continua perch´e rapporto di funzioni continue con denominatore mai nullo. Dato che S `e compatto nella topologia della norma standard, esisteranno il minimo m ed il massimo M di f. In particolare M ≥ m > 0 perch´e N, N sono strettamente positive su S e i valori m, M sono assunti da f per opportuni vettori xm , xM in S. Per costruzione: mN (x) ≤ N (x) ≤ M N (x) ,
per ogni x ∈ S .
Questa disuguaglianza vale in realt` a per ogni vettore x ∈ Cn dato che x = λx0 con x0 ∈ S e λ ≥ 0 e quindi, moltiplicando per λ ≥ 0 i membri della disuguaglianza trovata valutata in x0 ed usando la propriet` a N1 delle norme: mN (x) ≤ N (x) ≤ M N (x) per ogni x ∈ Cn . Scegliendo N := || · || si conclude che ogni norma su Cn `e equivalente a quella standard.
70
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.7 Il teorema del punto fisso e applicazioni Per concludere il capitolo, ci occuperemo di un teorema elementare che ha importanti conseguenze in analisi, in particolare per la teoria delle equazioni differenziali: il teorema del punto fisso. Enunciamo il teorema per spazi metrici completi e poi specializzeremo il risultato agli spazi di Banach. 2.7.1 Il teorema del punto fisso di Banach-Caccioppoli Partiamo da una definizione che si riferisce alla nozione di spazio metrico introdotta con la definizione 2.88. Definizione 2.113. Sia (M, d) uno spazio metrico. Una funzione, G : M → M `e detta mappa di contrazione, se esiste un numero reale λ ∈ [0, 1) per cui: d(G(x), G(y)) ≤ λd(x, y) .
(2.43)
Ricordando che gli spazi normati (X, ||||) sono spazi metrici, quando si definisce la distanza naturale d(x, y) := ||x − y|| (e la topologia metrica indotta da d coincide con la topologia naturale associata alla norma || || come discusso nella sezione 2.4.4), possiamo specializzare la definizione precedente al caso degli spazio normati come segue. Definizione 2.114. Sia (Y, || ||) uno spazio normato e X ⊂ Y un sottoinsieme chiuso (eventualmente coincidente con Y stesso). Una funzione, G : X → X `e detta mappa di contrazione, se esiste un numero reale λ ∈ [0, 1) per cui: ||G(x) − G(y)|| ≤ λ||x − y|| .
(2.44)
Osservazioni 2.115. (1) Notare che `e esplicitamente escluso il valore λ = 1. (2) La richiesta (2.43) implica immediatamente che ogni mappa di contrazione `e continua nella topologia naturale dello spazio metrico (M, d). La richiesta (2.44) implica immediatamente che ogni mappa di contrazione `e continua sull’insieme X rispetto alla topologia indotta dalla topologia naturale dello spazio normato (Y, || ||). (3) Si osservi che, nella definizione 2.114: (a) la funzione G non `e richiesta essere lineare e (b) X non `e richiesto essere un sottospazio di Y, ma solo un sottoinsieme. Le strutture lineari non giocano alcun ruolo fondamentale. Passiamo ad enunciare e provare il teorema del punto fisso (di BanachCaccioppoli) per spazi metrici. Teorema 2.116. (Del punto fisso per spazi metrici.) Sia G : M → M una mappa di contrazione sullo spazio metrico completo (M, d). Esiste ed, `e unico, un elemento z ∈ M, detto punto fisso, tale che: G(z) = z .
(2.45)
2.7 Il teorema del punto fisso e applicazioni
71
Se pi` u debolmente G : M → M non `e una mappa di contrazione, ma lo `e una sua potenza positiva: Gn = G ◦ · · · ◦ G (dove la composizione `e eseguita n volte) per qualche fissato n = 1, 2, . . ., allora G ammette comunque un unico punto fisso. Dimostrazione. Cominciamo a provare che il punto fisso z esiste. Si consideri la successione, dove x0 ∈ M `e arbitrario, definita per induzione da xn+1 = G(xn ). Vogliamo provare che questa successione `e di Cauchy. Proveremo infine che tale limite `e un punto fisso di G. Assumiamo, senza perdere generalit`a che valga m ≥ n. Se m = n, banalmente, d(xm , xn ) = 0, se m > n possiamo usare ripetutamente la disuguaglianza triangolare ottenendo: d(xm , xn ) ≤ d(xm , xm−1 ) + d(xm−1 , xm−2 ) + · · · + d(xn+1 , xn) .
(2.46)
Consideriamo il generico termine a secondo membro: d(xp+1 , xp ). Vale: d(xp+1 , xp ) = d(G(xp), G(xp−1 )) ≤ λd(xp , xp−1 ) = λd(G(xp−1 ), G(xp−2 )) ≤ λ2 d(xp−1 , xp−2 ) ≤ · · · ≤ λp d(x1 , x0) . Quindi, per ogni p = 1, 2, . . . vale la disuguaglianza d(xp+1 , xp ) ≤ λp d(x1 , x0 ). Inserendo questa nel secondo membro di (2.46) otteniamo la stima: m−1
d(xm , xn ) ≤ d(x1 , x0)
m−n−1 n
p
λ = d(x1 , x0)λ
p=n
λp
p=0
+∞ λn ≤ λn d(x1 , x0 ) λp ≤ d(x1 , x0) 1−λ p=0
dove abbiamo usato il fatto che, se 0 ≤ λ < 1, Concludiamo che: λn d(xm , xn) ≤ d(x1 , x0 ) . 1−λ
+∞ p=0
λp = (1 − λ)−1 . (2.47)
Nelle nostre ipotesi |λ| < 1 per cui d(x1 , x0 )λn /(1 − λ) → 0 se n → +∞. Quindi d(xm , xn ) pu` o essere reso piccolo a piacere scegliendo sufficientemente grande il pi` u piccolo tra m ed n. Questo risultato implica immediatamente che la successione {xn }n∈N sia di Cauchy. Dato che M `e completo, sar`a limn→+∞ xn = x ∈ M per qualche x. Dato che G `e continua essendo una mappa di contrazione:
G(x) = G lim xn = lim G(xn ) = lim xn+1 = x , n→+∞
n→+∞
per cui G(x) = x come volevamo provare.
n→+∞
72
2 Spazi normati e spazi di Banach, esempi e applicazioni
Proviamo che il punto fisso trovato `e unico. Supponiamo che x e x soddisfino entrambi G(x) = x e G(x ) = x . Vale allora d(x, x) = d(G(x), G(x)) ≤ λd(x, x ) . Se fosse d(x, x) = 0, dividendo il primo e l’ultimo membro per d(x, x ), otterremmo la disuguaglianza 1 ≤ λ che `e impossibile per ipotesi. Quindi deve essere d(x, x) = 0 da cui x = x per la stretta positivit` a della distanza. Passiamo a provare l’esistenza ed unicit`a sotto l’ipotesi che B := Gn sia una mappa di contrazione. In tal caso, sfruttando la dimostrazione precedente, B ammette un unico punto fisso z. Chiaramente, se G ammette un punto fisso, questo deve coincidere con z. Bisogna solo dimostrare che z `e un punto fisso di G. Se z `e il punto fisso di B, allora: G(z) = G(B k (z)) = B k (G(z)) = B k (z0 ) → z
per k → +∞,
dato che, essendo B una contrazione, la successione B(z0 ), B 2 (z0 ), B 3 (z0 ), . . . converge al punto fisso z, qualunque sia z0 ∈ M, come visto nella precedente parte della dimostrazione. Di conseguenza: G(z) = z. Passando agli spazi normati, il teorema precedente ha come conseguenza il seguente teorema usando come distanza la distanza naturale dello spazio normato: d(x, y) := ||x − y||. Teorema 2.117. (Del punto fisso per spazi normati.) Sia G : X → X una mappa di contrazione, sull’insieme chiuso X ⊂ B con B spazio di Banach sul campo R o C. Esiste ed, `e unico, un elemento z ∈ X, detto punto fisso, tale che: G(z) = z . (2.48) Se pi` u debolmente G : X → X non `e una mappa di contrazione, ma lo `e una sua potenza positiva: Gn = G ◦ · · · ◦ G (dove la composizione `e eseguita n volte) per qualche fissato n = 1, 2, . . ., allora G ammette comunque un unico punto fisso. Dimostrazione. Definiamo M := X e d(x, y) := ||x − y|| per x, y ∈ X. In tal modo X diventa spazio metrico. (X, d) `e anche completo. Infatti, se {xn }n∈N ⊂ X `e una successione di Cauchy rispetto a d, lo `e anche rispetto a || ||, come `e immediato verificare. Dato che (Y, || ||) `e completo, esiste il limite x ∈ Y della successione {xn }n∈N. Dato che X `e un chiuso di Y, x ∈ X. Quindi ogni successione di Cauchy di (X, d) ammette limite in X e quindi (X, d) `e completo. A questo punto la dimostrazione si conclude usando il teorema precedente per lo spazio metrico (X, d). L’importanza del teorema del punto fisso, tra le altre cose, `e data dal fatto che esso viene usato spesso per costruire teoremi di esistenza ed unicit`a per equazioni di vario genere, specialmente integrali e differenziali, mostrando che
2.7 Il teorema del punto fisso e applicazioni
73
l’equazione di cui si cerca la soluzione z pu` o essere scritta come un’equazione del punto fisso G(z) = z in qualche opportuno spazio di Banach (o spazio metrico completo). Un caso abbastanza elementare (dato che la funzione G che considereremo sar`a lineare) `e dato da (1) nei prossimi esempi, ma l’esempio successivo riguarda un caso generalmente non lineare. Esempi 2.118. Diamo di seguito due esempi elementari dell’uso della teoria del punto fisso. L’esempio pi` u importante sar`a trattato separatamente nella prossima sezione. (1) Si consideri l’equazione di Volterra omogenea su C([a, b]) nell’incognita data dalla funzione f ∈ C([a, b]): x f(x) = K(x, y)f(y)dy , (2.49) a
dove K `e una funzione continua e limitata da M ≥ 0. Lavoriamo dunque nello spazio di Banach C([a, b]) con norma dell’estremo superiore || ||∞. L’equazione pu` o essere riscritta nella forma f = Af, dove A : C([a, b]) → C([a, b]) `e l’operatore integrale individuato dal nucleo integrale K sopra scritto: x (Af)(x) := K(x, y)f(y)dy per ogni f ∈ C([a, b]). (2.50) a
` chiaro che ogni soluzione, se esiste, non `e altro che un punto fisso di A. Non E solo, ma `e anche un punto fisso di ogni operatore An per ogni scelta della potenza n = 1, 2, . . .. Mostriamo ora che `e possibile fissare n in modo tale che An sia una contrazione. Questo risultato, in base al teorema 2.117 del punto fisso assicura che l’equazione di Volterra omogenea ammette una ed una sola soluzione. Il calcolo diretto mostra che:
x
|(Af)(x)| = K(x, y)f(y)dy
≤ M (x − a)||f||∞ . a
Iterando la procedura si trova: |(A2 f)(x)| ≤ M 2
(x − a)2 ||f||∞ , 2
|(An f)(x)| ≤ M n
(x − a)n ||f||∞ , n!
e, per n iterazioni:
da cui: ||Anf||∞ ≤ M n
(b − a)n ||f||∞ , n!
e dunque: ||An|| ≤ M n
(b − a)n . n!
74
2 Spazi normati e spazi di Banach, esempi e applicazioni
Risulta allora chiaro che, per n abbastanza grande, comunque siano stati fissati a, b, M , risulta: (b − a)n Mn <1. n! Possiamo concludere che, per qualche numero positivo λ < 1, vale: ||An f − An f ||∞ ≤ λ||f − f ||∞ , e quindi, per il teorema del punto fisso, l’equazione di Volterra omogenea in C([a, b]) ammette una ed una sola soluzione, che non pu`o che coincidere con il vettore nullo. Il risultato ha anche la seguente conseguenza: l’operatore A definito in (2.50) non pu` o ammettere autovalori differenti dall’autovalore nullo. Infatti, l’equazione agli autovalori per A altro non `e che: Aψ = λψ
per qualche λ ∈ C e qualche ψ = 0.
(2.51)
Se λ = 0, tale equazione `e equivalente a: 1 Aψ = ψ λ
per qualche λ ∈ C \ {0} e qualche ψ = 0.
L’operatore λ−1 A `e un operatore di Volterra associato al nucleo integrale λ−1 K(x, y) e pertanto possiamo applicare il risultato gi`a trovato per A ottenendo che deve essere ψ = 0 e quindi, se λ = 0, l’equazione agli autovalori (2.51) non ha soluzioni. Nel capitolo 4, questo risultato sar`a generalizzato al caso in cui si lavori in uno spazio di Hilbert ed avr` a una conseguenza importante nello studio delle soluzioni dell’equazione di Volterra non omogenea, una volta provato il teorema di Fredholm sulle equazioni integrali. (2) Consideriamo il problema dell’esistenza ed unicit`a di una funzione continua y = f(x) quando si conosca solo una relazione implicita F (x, y(x)) = 0 rispetto ad una funzione sufficientemente regolare F assegnata. Daremo qui una versione semplificata, ma con il pregio di vedere il teorema di BanachCaccioppoli al lavoro, di un risultato che cade nella classe di quei teoremi chiamati popolarmente teorema del Dini, teorema della funzione implicita e teorema della funzione inversa [Giusti03II, Ser94II]. Assumiamo che sia assegnata una funzione F : [a, b] × R → R, dove a < b, che sia continua ed ammetta derivata nella variabile y che soddisfi 0 < m ≤ | ∂F ∂y | ≤ M < +∞ se (x, y) ∈ [a, b] × R. Vogliamo far vedere che, sotto tali ipotesi, esiste ed `e unica, una funzione continua f : [a, b] → R tale che: F (x, f(x)) = 0
per ogni x ∈ [a, b].
2.7 Il teorema del punto fisso e applicazioni
75
L’idea `e quella di definire una funzione G : C([a, b]) → C([a, b]) che sia una mappa di contrazione ed in modo tale che la funzione f richiesta sia il punto fisso. Definiamo: (G(ψ))(x) := ψ(x) −
1 F (x, ψ(x)) per ogni ψ ∈ C([a, b]) e ogni x ∈ [a, b]. M
Tale funzione `e ben definita su C([a, b]) e, se `e una mappa di contrazione, il suo unico punto fisso f soddisfa: f(x) = f(x) −
1 F (x, ψ(x)) per ogni x ∈ [a, b]. M
Cio`e: F (x, f(x)) = 0
per ogni x ∈ [a, b],
ed `e quindi la funzione cercata. Il fatto che G sia una mappa di contrazione segue facilmente dal teorema di Lagrange: (G(ψ))(x) − (G(ψ ))(x) = ψ(x) − ψ (x) −
1 (F (x, ψ(x)) − F (x, ψ (x))) M
e quindi, per qualche numero z tra ψ(x) e ψ (x), abbiamo: 1 ∂F (ψ(x) − ψ (x)) |(x,z) , M ∂y
(G(ψ))(x) − (G(ψ ))(x) = ψ(x) − ψ (x) − e quindi:
1 ∂F
|(G(ψ))(x) − (G(ψ ))(x)| ≤ |ψ(x) − ψ (x)| 1 − |(x,z)
. M ∂y
Tenendo conto del fatto che i valori assunti dalla derivata sono tutti nell’intervallo di numeri positivi [m, M ]: ||G(ψ) − G(ψ )||∞ ≤ ||ψ − ψ ||∞ (1 − Per ipotesi (1 −
m M)
m ). M
< 1 e pertanto G `e una mappa di contrazione.
2.7.2 Applicazione del teorema del punto fisso: il teorema di esistenza e unicit` a locale per sistemi di equazioni differenziali L’applicazione pi` u importante del teorema del punto fisso `e sicuramente il teorema di esistenza ed unicit`a locale per sistemi di equazioni differenziali del prim’ordine scrivibili in forma normale (cio`e esplicitando a primo membro la derivata di ordine pi` u alto, in questo caso la prima, come in (2.53) sotto). Tale risultato si estende facilmente al caso di soluzioni globali e nel caso di sistemi di equazioni differenziali di ordine superiore [Giusti03I, Giusti03II]. Abbiamo bisogno di una definizione preliminare. Nel seguito K indicher` a il campo completo R oppure C indifferentemente e || ||Kp `e la norma standard di Kp .
76
2 Spazi normati e spazi di Banach, esempi e applicazioni
Definizione 2.119. Siano r ≥ 0 e n, m > 0 naturali fissati e Ω ⊂ Kr × Kn aperto non vuoto. F : Ω → Km `e detta localmente lipschitziana (nella variabile x ∈ Kn se r > 0), se per ogni p ∈ Ω esiste una costante Lp ≥ 0 tale che, in un aperto Op p: ||F (z, x) − F (z, x)||Km ≤ Lp ||x − x ||Kn ,
per ogni coppia (z, x), (z, x) ∈ Op , (2.52)
Ogni F : Ω → Km di classe C 1 `e localmente lipschitziana nella variabile x, come discuteremo tra poco. Passiamo ad enunciare e provare il teorema. Teorema 2.120. (Esistenza ed unicit` a locale per sistemi di equazioni differenziali del prim’ordine.) Sia f : Ω → Kn una funzione continua e localmente lipschitziana nella variabile x ∈ Kn sull’aperto Ω ⊂ R × Kn e si consideri il problema di Cauchy del primo ordine (scritto in forma normale), dove (t0 , x0 ) ∈ Ω: dx = f (t, x(t)) , (2.53) dt x(t0 ) = x0 . Esiste un intervallo aperto I t0 in cui esiste, ed `e unica, la soluzione di (2.53). Inoltre tale soluzione `e necessariamente una funzione in C 1 (I). Dimostrazione. Prima di tutto notiamo che ogni soluzione x = x(t) di (2.53) `e necessariamente di classe C 1 . Infatti `e sicuramente continua in quanto difdx ferenziabile, ma allora, direttamente da dx dt = f (t, x(t)) concludiamo che dt deve essere continua essendo il secondo membro dell’equazione una funzione continua di t in quanto composizione di funzioni continue. Passiamo all’esistenza ed all’unicit`a. Supponiamo che x : I → Kn sia differenziabile e soddisfi (2.53). Tenendo conto del secondo teorema fondamentale del calcolo ed integrando (2.53) (la derivata di x(t) `e continua), x : I → Kn deve soddisfare, t x(t) = x0 + f (τ, x(τ )) dτ , per ogni t ∈ I. (2.54) t0
Viceversa, se x : I → Kn `e continua e soddisfa (2.54) allora, per il primo teorema fondamentale del calcolo (f `e continua), x = x(t) `e differenziabile e soddisfa (2.53). Concludiamo che funzioni continue x = x(t), definite su un intervallo aperto I t0 e che risolvono l’equazione integrale (2.54), sono tutte e sole le soluzioni di (2.53) definite sullo stesso intervallo I. Invece di risolvere (2.53) risolviamo il problema integrale equivalente (2.54). Cominciamo a provare l’esistenza della soluzione. Fissiamo, una volta per tutte, un insieme aperto Q (t0 , x0 ) a chiusura compatta e con Q ⊂ Ω. Prendendo Q sufficientemente piccolo possiamo sfruttare anche la locale lipschitzianit`a di f nella variabile x. Nel seguito || || indicher` a la norma standard in Kn e porremo:
2.7 Il teorema del punto fisso e applicazioni
77
(i) 0 ≤ M := max{||f(t, x)|| | (t, x) ∈ Q}, (ii) L ≥ 0 `e la costante per cui ||f(t, x) − f(t, x )|| ≤ L||x − x || se (t, x), (t, x) ∈ Q, (iii) B (x0 ) := {x ∈ Kn | ||x − x0 || ≤ } per > 0. Consideriamo un intervallo chiuso Jδ = [t0 −δ, t0 +δ] con δ > 0 e consideriamo lo spazio di Banach (vedi la proposizione 2.31) C(J; Kn ) delle funzioni continue X : Jδ → Kn , con norma || ||∞ . In questo spazio definiamo la funzione G, che associa ad ogni funzione X la nuova funzione G(X) definita da: t G(X)(t) := x0 + f (τ, X(τ )) dτ , per ogni t ∈ Jδ . t0
Si osservi che G(X) ∈ C(Jδ ; Kn ) se X ∈ C(Jδ ; Kn ) per la continuit` a della funzione integrale come funzione dell’estremo superiore quando l’integrando `e continuo. Mostriamo che G `e una mappa di contrazione su un sottoinsieme chiuso di C(Jδ ; Kn )4 : n M(δ) := {X ∈ C(Jδ ; K ) | ||X(t) − x0 || ≤ , ∀t ∈ Jδ }
se 0 < δ < min{/M, 1/L} e δ, > 0 sono piccoli a sufficienza da soddisfare la richiesta Jδ × B (x0 ) ⊂ Q. (In tutto il seguito assumeremo quindi sempre di (δ) aver scelto > 0 e δ > 0 in modo che valga Jδ × B (x0 ) ⊂ Q.) Se X ∈ M vale:
t
||G(X)(t) − x0 || ≤
f (τ, X(τ )) dτ
t0 t
≤
t0 (δ)
(δ)
t
||f (τ, X(τ ))|| dτ ≤
M dτ ≤ δM . t0 (δ)
se 0 < δ < /M . Se X, X ∈ M
Quindi G(M ) ⊂ M t ∈ Jδ :
G(X)(t) − G(X )(t) =
t
si ha, per ogni
[f (τ, X(τ )) − f (τ, X (τ ))] dτ ,
t0
t
||G(X)(t) − G(X )(t)|| ≤
[f (τ, X(τ )) − f (τ, X (τ ))] dτ
t0 t ≤ ||f (τ, X(τ )) − f (τ, X (τ ))|| dτ .
t0
Dato che nelle nostre ipotesi vale la maggiorazione lipschitziana ||f(t, x) − f(t, x )|| < L||x − x || , 4
(δ)
M = {X ∈ C(Jδ ; Kn ) | ||X − X0 ||∞ ≤ }, dove X0 indica la funzione (δ) costantemente x0 su Jδ . Pertanto M `e la chiusura della palla aperta di raggio n centrata in X0 in C(Jδ ; K ).
78
2 Spazi normati e spazi di Banach, esempi e applicazioni
si ha ancora:
t
||G(X)(t) − G(X )(t)|| ≤ L t0
||X(τ ) − X (τ )|| dτ ≤ δL||X − X ||∞ .
Infine, prendendo l’estremo superiore anche del primo membro si ha: ||G(X) − G(X )||∞ ≤ δL||X − X ||∞ . (δ)
(δ)
Se, in aggiunta alle richieste di sopra, δ < 1/L, G : M → M `e una (δ) mappa di contrazione sull’insieme chiuso M . Per il teorema 2.117 esister`a un punto fisso per G, cio`e una funzione continua x = x(t) ∈ Kn con t ∈ Jδ , che soddisfa la (2.54) per definizione di G. La restrizione di x all’intervallo aperto I := (t0 − δ, t0 + δ) `e una soluzione del problema di Cauchy (2.53). Passiamo all’unicit` a. Consideriamo, nell’intervallo I := (t0 − δ, t0 + δ), una seconda soluzione x = x (t) dell’equazione integrale (2.54) a priori differente dalla soluzione x = x(t). Per costruzione, per ogni intervallo chiuso Jδ := (J ) (J ) [t0 − δ , t0 + δ ] con 0 < δ < δ la funzione G : M δ → M δ `e ancora una mappa di contrazione e x = x (t) `e un suo punto fisso e pertanto coincide con la restrizione x = x(t) all’intervallo Jδ , per l’unicit` a del punto fisso. Dato che δ `e arbitrario in (0, δ), le due soluzioni coincidono su I = (t0 − δ, t0 + δ). Per completezza notiamo che il teorema precedente si applica al caso in cui f sia una funzione di classe C 1 , come conseguenza della seguente proposizione elementare. Usiamo le solite notazioni x = (x1 , . . . , xn), z = (z1 , . . . , zl ) e, per una funzione arbitraria F : Ω → Rm con Ω = A × B con A ⊂ Rl e B ⊂ Rn aperti non vuoti, usiamo la notazione F (z, x) = (F1 (z, x), . . . , Fm (z, x)). Proposizione 2.121. Sia Ω = A × B con A ⊂ Rl e B ⊂ Rn aperti non vuoti. La funzione F : Ω → Rm `e localmente lipschitziana nella variabile x se, per ogni z ∈ A, tutte le funzioni B x → Fk (z, x) sono differenziabili e le derivate parziali, al variare di (z, x), definiscono funzioni continue su Ω. Dimostrazione. Sia q = (z0 , x0 ) ∈ Ω e siano B ⊂ Rl , B ⊂ Rn palle aperte centrate rispettivamente in z0 e x0 con B ×B ⊂ Ω. Allora x(t) = p+t(r −p) ∈ B per t ∈ [0, 1], se p, r ∈ B. Fissiamo z ∈ B e applichiamo il teorema di Lagrange alla funzione [0, 1] t → Fk (z, x(t)):
n ∂Fk
(rj − pj ) , Fk (z, r) − Fk (z, p) = Fk (z, x(1)) − Fk (z, x(0)) = ∂xj (z,x(ξ)) j=1 dove (z, x(ξ)) ∈ B × B. Applicando la disuguaglianza di Schwarz:
2 n
n
∂F
k
|Fk (z, r) − Fk (z, p)| ≤ |rj − pj |2
∂xi
j=1
i=1
(z,x(ξ))
Esercizi
79
2 n
∂F
k ≤ ||r − p||
≤ Mk ||r − p|| se (z, r), (z, p) ∈ B × B ,
∂xi (z,x(ξ)) i=1
Mk < +∞ esiste dato che le funzioni sotto radice sono continue sul compatto B × B. Dato che B × B `e un intorno aperto del punto generico (z0 , x0 ) ∈ Ω, la funzione F `e localmente lipschitziana nella variabile x, valendo: m ||F (z, x1) − F (z, x2 )|| ≤ Mk2 ||x1 − x2 || se (z, x1 ), (z, x2 ) ∈ B × B . k=1
Osservazione 2.122. Questa dimostrazione del teorema di esistenza ed unicit`a per il problema di Cauchy richiede la validit`a della condizione di Lipschitz locale sulla funzione f in (2.53), per poter usare il teorema del punto fisso. In realt` a tale richiesta, per il solo problema di esistenza non `e necessaria. Un teorema di esistenza pi` u generale, dovuto a Peano, pu` o essere dimostrato (usando il teorema 2.34 di Arzel` a-Ascoli) assumendo la sola continuit`a di f [KoFo80]. La non validit` a della propriet` a di Lipschitz pregiudica per` o, in generale, l’unicit` a della soluzione, come `e evidente per il controesempio classico: dx = f(x(t)) , x(0) = 0 dt √ dove la funzione f : R → R, definita come f(x) = 0 se x ≤ 0 e f(x) = x per x > 0, `e continua ma non `e localmente lipschitziana in x = 0. Tale problema di Cauchy ammette due soluzioni (entrambe massimamente estese): (1) x1 (t) = 0 per ogni t ∈ R (2) x2 (t) = 0 se t ≤ 0, ma x2 (t) = t2 /4 se t > 0.
Esercizi 2.1. Provare che ogni seminorma p soddisfa p(x) = p(−x). 2.2. Dimostrare che se S `e uno spazio vettoriale di funzioni limitate sull’insieme X a valori in C (oppure tutte a valori in R), allora l’applicazione: S f → ||f||∞ := sup |f(x)| x∈X
definisce una norma su S. 2.3. Dimostrare che lo spazio delle funzioni complesse limitate L(X) e quello delle funzioni complesse misurabili e limitate Mb (X) (vedi gli esempi 2.39) sullo spazio topologico X, sono spazi di Banach rispetto alla norma || ||∞.
80
2 Spazi normati e spazi di Banach, esempi e applicazioni
Soluzione. Facciamo la dimostrazione per Mb (X), dato che quella per L(X) ´e uguale. Sia {fn }n∈N ⊂ Mb (X) una successione di Cauchy, mostriamo che converge uniformemente a f ∈ Mb (X). Per ipotesi, la successione dei numeri {fn (x)}n∈N sar`a di Cauchy, per ogni x ∈ X. In questo modo esister`a f : X → C tale che fn (x) → f(x) se n → +∞ per ogni x ∈ X. Tale funzione sar`a misurabile perch`e limite di funzioni misurabili. Non resta da dimostrare che f deve essere una funzione limitata e che fn → f in senso uniforme. Partiamo dalla prova della seconda propriet` a. Vale: |f(x) − fm (x)| = lim |fn (x) − fm (x)| ≤ lim ||fn − fm ||∞ , n→+∞
n→+∞
ma, usando il fatto che la successione iniziale `e di Cauchy nella norma || ||∞, abbiamo che, per ogni > 0 esiste N tale che: lim ||fn − fm ||∞ < se m > N .
n→+∞
Quindi: |f(x) − fm (x)| < se m > N e per qualsiasi x ∈ X. In altre parole ||f −fm ||∞ → 0 per m → +∞ come volevamo. A questo punto, la limitatezza di f `e ovvia: sup |f(x)| ≤ sup |f(x) − fm (x)| + sup |fm (x)| < + ||fm ||∞ < +∞ .
x∈X
x∈X
x∈X
2.4. Dimostrare che gli spazi di Banach (L(X), || ||∞) e (Mb (X), || ||∞) (vedi gli esempi 2.39) sono algebre di Banach con unit` a. Traccia della soluzione. Evidentemente l’unit` a `e la funzione che vale ovunque 1. La propriet` a ||f · g||∞ ≤ ||f||∞||g||∞ segue dalla definizione di || ||∞, tutte le altre richieste sono banalmente soddisfatte. 2.5. Dimostrare che lo spazio delle funzioni complesse continue che si annullano all’infinito C0 (X) (vedi gli esempi 2.39) sullo spazio topologico X, `e un’algebra di Banach rispetto alla norma || ||∞. Discutere se tale algebra contiene o no l’unit` a. Soluzione. Sia {fn }n∈N ⊂ C0 (X) una successione di Cauchy, mostriamo che converge uniformemente a f ∈ C0 (X). Per ipotesi, la successione dei numeri {fn (x)}n∈N sar`a di Cauchy, per ogni x ∈ X. In questo modo esister`a f : X → C tale che fn (x) → f(x) se n → +∞ per ogni x ∈ X. La prova del fatto che ||f − fn ||∞ → 0 se n → +∞ `e la stessa che per l’esercizio 2.3. Dato che il limite uniforme di funzioni continue `e una funzione continua, non resta che verificare che f ∈ C0 (X). Fissato > 0, sia n tale che ||f − fn || < /2 e sia K ⊂ X un compatto con |fn (x)| < /2 se x ∈ X \ K . Per costruzione: |f(x)| ≤ |f(x) − fn (x)| + |fn (x)| < se x ∈ X \ K .
Esercizi
81
Le propriet`a che rendono lo spazio di Banach trovato un’algebra di Banach rispetto alle solite operazioni si dimostrano banalmente. Per costruzione l’unit` a, se esiste deve essere la funzione che vale ovunque 1. Se X `e compatto, la funzione che vale ovunque 1 appartiene a allo spazio. Se X non `e compatto, non pu` o appartenere allo spazio, perch´e gli elementi dello spazio C0 (X) si possono rimpicciolire a piacimento fuori dai compatti in X e questo non `e possibile per una funzione costante. 2.6. Dimostrare che lo spazio delle funzioni complesse continue e limitate Cb (X) (vedi gli esempi 2.39) sullo spazio topologico X, `e uno spazio di Banach rispetto alla norma || ||∞ ed `e anche un’algebra di Banach con unit` a. 2.7. Dimostrare che nella proposizione 2.27 vale in realt`a il “se e solo se”. In altre parole, dimostrare che la proposizione detta pu`o essere completata come segue. Sia (X, || ||) unospazio normato. (X, || ||) `e uno spazio di Banach se e so+∞ lo se ogni serie n=0 xn di elementi di X che converge assolutamente (cio`e +∞ n=0 ||xn|| < +∞) converge a qualche elemento di X. +∞ Soluzione. Si consideri una serie n=0 xn di elementi di X che sia assolutamente convergente. Allora la successione delle ridotte delle norme dovr`e essere una successione di Cauchy. In altre parole, per ogni > 0, esiste M > 0 con
n m
||xj || − ||xj ||
< , se n, m > M .
j=0 j=0 Supponendo n ≥ m sar`a allora:
n
||xj ||
< ,
j=m+1
se n, m > M .
Di conseguenza:
m n
n
n
xj − x j
=
x j
≤ ||xj || <
j=m+1
j=m+1
j=0 j=0
se n, m > M .
Abbiamo in questo modo provato che la successione delle somme parziali n x ` e di Cauchy. Dato che lo spazio `e completo, la serie converger`a a n j=0 un elemento di X. 2.8. Dimostrare che lo spazio delle funzioni complesse continue a supporto compatto Cc(X) (vedi gli esempi 2.39) sullo spazio topologico X, non `e, in generale, uno spazio di Banach rispetto alla norma || ||∞ e non `e nemmeno denso in Cb (X) se X non `e compatto.
82
2 Spazi normati e spazi di Banach, esempi e applicazioni
Traccia di soluzione. Nel primo caso `e sufficiente esibire un controesempio per X = R. Per esempio si consideri la successione di funzioni continue fn : R → C, n = 1, 2, . . . , definite come segue: fn (x) := sinx x se 0 < |x| < 2nπ, fn (0) = 1 e fn (x) = 0 nei rimanenti punti di R. Evidentemente questa successione di funzioni converge puntualmente alla funzione continua che vale sinx x su tutto R\ {0} e 1 nell’origine. La convergenza `e anche uniforme come `e facile provare. La funzione detta non ha supporto compatto. Per quanto riguarda la seconda questione, si osservi che ogni funzione costante c = 0 appartiene a Cc(X) in ogni caso, ma, se X non `e compatto ||f − c||∞ ≥ |c| > 0, per ogni funzione f ∈ Cc (X) a causa dei valori assunti dalle funzioni considerate fuori dal supporto di f. 2.9. Sia A un’algebra di Banach senza unit` a. Si consideri lo spazio vettoriale somma diretta A ⊕ C e si definisca su di esso il prodotto: (x, c) · (y, c ) := (x ◦ y + cy + c x, cc)
se (x , c ), (x, c) ∈ A ⊕ C
dove ◦ `e il prodotto in A. Si definisca anche la norma: ||(x, c)|| := ||x|| + |c| se (x, c) ∈ A ⊕ C. Mostrare che lo spazio vettoriale A ⊕ C dotato del prodotto e della norma definita sopra `e un’algebra di Banach con unit` a. 2.10. Si consideri un’algebra di Banach A con unit` a I ed un elemento a ∈ A con ||a|| < 1. Dimostrare che I − a ammette inverso, cio`e esiste b ∈ A tale che b(I − a) = (I − a)b = I. +∞ Suggerimento. Si consideri la serie n=0 an con a0 := I. Si dimostri che converge nella topologia di A e che la somma `e l’inverso di I − a. 2.11. (Difficile.) Dimostrare la disuguaglianza di H¨older:
|f(x)g(x)|dμ(x) ≤ X
dove p, q > 0 soddisfano 1 = misura positiva su X.
1/p
1/q q |f(x)| dμ(x) |g(x)| dμ(x) p
X 1 p
X
+ 1q , f e g sono funzioni misurabili e μ una
|f(x)| |g(x)|dμ(x), A := X 1/p 1/q q e B := . Se A (o B) `e nullo X |f(x)| dμ(x) X |g(x)| dμ(x) oppure infinito (adottando la convenzione che ∞ · 0 = 0 · ∞ = 0), la disuguaglianza `e banalmente vera. Mettiamoci allora nel caso che 0 < A, B < +∞ e definiamo: F (x) := |f(x)|/A, G(x) := |g(x)|/B. In questo modo
1 1 1 1 ln(F (x)G(x)) = ln(F (x)p ) + ln(G(x)q ) ≤ ln F (x)p + G(x)q , p q p q
Soluzione. p
Nel
seguito:
I
:=
Esercizi
83
dove, nell’ultimo passaggio, abbiamo usato il fatto che la funzione logaritmo `e una funzione convessa. Esponenziando abbiamo che: F (x)G(x) ≤
1 1 F (x)p + G(x)q . p q
Integrando e tenendo conto che l’integrale a secondo membro coincide con 1/p + 1/q = 1 si trova immediatamente la disuguaglianza di H¨older nella forma: |f(x)g(x)|dμ(x) X 1/p 1/q ≤ 1 . p q X |f(x)| dμ(x) X |g(x)| dμ(x) 2.12. (Difficile.) Facendo uso della disuguaglianza di H¨ older, dimostrare la disuguaglianza di Minkowski:
1/p
1/p
1/p |f(x) + g(x)|p dμ(x) ≤ |f(x)|p dμ(x) + |g(x)|pdμ(x) X
X
X
dove p ≥ 1, f e g sono funzioni misurabili e μ una misura positiva su X. p Soluzione. Nel seguito: I := := X |f(x) + g(x)| dμ(x), A 1/p 1/p p p |f(x)| dμ(x) e B := |g(x)| dμ(x) . La disuguaglianza ` e banalX X mente vera se p = 1 oppure nel caso in cui A o B siano infiniti. Supponiamo allora che p > 1 e A, B < +∞. In questo caso anche I deve essere finito. Ci`o segue dalla disuguaglianza numerica (a + b)p ≤ 2p (ap + bp ) valida per a, b ≥ 0 e p ≥ 15 . Infine, se I = 0, la disuguaglianza di Minkowski `e banalmente vera. Pertanto restringiamoci a studiare il caso: p > 1, A, B < +∞ e 0 < I < +∞. Osserviamo che: |f + g|p = |f| |f + g|p−1 + |g| |f + g|p−1 . Applicando la disuguaglianza di H¨ older a ciascuno dei due addendi a secondo membro abbiamo che: 1/q
p (p−1)q |f(x) + g(x)| dμ(x) ≤ |f(x) + g(x)| dμ(x) X
×
1 p
X
1/p
1/p , |f(x)|p dμ(x) + |g(x)|p dμ(x) X
1 q.
dove 1 = + La disuguaglianza ottenuta, nelle notazioni usate si scrive: 1/q I ≤ I (A + B), da cui, dividendo per I 1/q si ha: I 1/p ≤ A + B , che `e la disuguaglianza di Minkowski. 5 Questa si prova osservando che (a + b) ≤ 2 max{a, b}, per cui elevando alla potenza p: (a + b)p ≤ 2p max{ap , bp } ≤ 2p (ap + bp ).
84
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.13. Si considerino due spazi normati di dimensione finita X, Y e T ∈ L(X, Y) = B(X, Y). Si fissino due basi in X e Y rispettivamente, in modo tale che T sia rappresentato da una matrice M (T ) rispetto a tali basi. Mostrare che, con una scelta naturale di basi negli spazi duali X e Y , l’operatore T `e individuato dalla matrice trasposta M (T )t . 2.14. Si consideri una coppia di spazi normati X, Y, con Y spazio di Banach, e un sottospazio S ⊂ X con S = X. Sia poi T : S → Y un operatore lineare limitato su S. Si dimostri che esiste un’unica estensione di T , T˜ : X → Y che sia continua. Soluzione. Se x ∈ X ci sar`a una successione {xn } di elementi di S che converge a x. Vale ||T xn − T xm || ≤ K||xn − xm || con K < +∞ per ipotesi. Dato che xn → x, la successione degli xn `e di Cauchy e quindi lo `e anche quella dei vettori T xn . Dato che Y `e completo, esiste dunque T˜x := limn→∞ T xn ∈ Y. Tale limite dipende solo da x e non dalla successione in S usata per approssimarlo: se S zn → x allora per la continuit` a delle norme || lim T xn − lim T zn || = lim ||T xn − T zn || ≤ lim K||xn − zn || n→+∞
n→+∞
n→+∞
n→+∞
= K||x − x|| = 0 . ˜ S = T , cio`e T˜ `e un’estensione di T e questo si prova scegliendo Ovviamente T per ogni x ∈ S la successione costante di termini xn := x che tende a x banalmente. Le propriet` a di linearit` a di T˜ sono di verifica immediata dalla stessa definizione. Infine prendendo il limite a n → +∞ ad ambo membri di ||T xn|| ≤ K||xn || si ricava che ||T˜x|| ≤ K||x|| per cui T˜ `e limitato. Veniamo alla prova dell’unicit` a. Se U `e un’altra estensione limitata di T su X allora, per ogni x ∈ X, per continuit` a T˜x − U x = limn→+∞ (T˜xn − U xn ) dove gli xn ˜ S = T = US il limite `e banale e appartengono a S (denso in X). Essendo T ˜ ˜ fornisce T x = U x per ogni x ∈ X ossia T = U . 2.15. In riferimento all’esercizio precedente, si provi che l’unica estensione limitata T˜ di T soddisfa anche ||T˜ || = ||T ||. Soluzione. Se x ∈ X e {xn } ⊂ S converge a x: ||T˜x|| = lim ||T xn || ≤ lim ||T ||||xn|| = ||T ||||x|| , n→+∞
n→+∞
per cui ||T˜ || ≤ ||T ||. Ma essendo anche S ⊂ X e T˜ S = T ,
||T˜x||
||T˜x||
˜ ||T || = sup
0 = x ∈ X ≥ sup
0 = x ∈ S ||x|| ||x||
||T x||
0 = x ∈ S . = sup ||x|| L’ultimo termine nella catena di identit` a scritta sopra `e ||T ||. Quindi ||T˜ || ≥ ||T ||. Allora ||T˜ || = ||T ||.
Esercizi
85
2.16. Dimostrare la proposizione 2.78. 2.17. Considerando lo spazio B(X) per uno spazio normato X, si provi che la topologia forte `e pi` u forte di quella debole (cio`e gli aperti della topologia debole sono aperti anche nella topologia forte) e che la topologia uniforme `e pi` u forte della topologia forte. 2.18. Dimostrare le proposizioni 2.82, 2.83, 2.84 e 2.85. 2.19. Se X `e uno spazio normato, dimostrare che se {xn }n∈N ⊂ X tende debolmente a x ∈ X (vedi proposizione 2.82), allora l’insieme {xn }n∈N `e limitato. Suggerimento. Applicare il corollario 2.74. 2.20. Provare che se B `e uno spazio di Banach e T, S ∈ B(B) allora: (i) (T S) = S T , (ii) (T )−1 = (T −1 ) se T `e biettivo. 2.21. Dimostrare che se X e Y sono spazi di Banach riflessivi e se T ∈ B(X, Y), allora (T ) = T . 2.22. Se definiamo un isomorfismo di spazi normati come un’applicazione lineare continua con inversa continua, la propriet` a di completezza di uno spazio normato `e invariante sotto isomorfismi? Suggerimento. Estendere la proposizione 2.110 al caso di due spazi normati connessi da un’applicazione lineare continua con inversa continua.
3 Spazi di Hilbert e operatori limitati Non ci sono teoremi profondi, solo teoremi che non abbiamo capito molto bene. Nicholas P. Goodman
In questa sezione introdurremo le prime nozioni matematiche relative agli spazi di Hilbert che ci serviranno per dare un fondamento matematico alla MQ. Una parte importante del capitolo sar` a dedicata alla nozione di base hilbertiana (detta anche sistema ortonormale completo), che tratteremo nel modo pi` u generale possibile, non assumendo obbligatoriamente la separabilit`a dello spazio di Hilbert. Prima di tale nozione discuteremo il teorema pi` u importante della teoria degli spazi di Hilbert: il teorema della rappresentazione di Riesz, che prova che esiste un anti isomorfismo naturale tra uno spazio di Hilbert ed il suo duale topologico. La terza parte del capitolo, sar` a dedicata a discutere la nozione di operatore aggiunto (nel caso di operatori limitati), introdotta tramite il teorema di Riesz, e tutte le sue fondamentali conseguenze nella teoria degli operatori limitati. Introdurremo in particolare la nozione di C ∗ -algebra (di operatori ed in senso astratto) e nelle esemplificazioni presenteremo la struttura di algebra di von Neumann, citando il celebre teorema del doppio commutante. In tale sezione introdurremo le classi degli operatori autoaggiunti, unitari e normali, discutendone le loro propriet` a elementari. La quarta sezione sar` a interamente dedicata alla nozione di proiettore ortogonale e alle propriet`a elementari pi` u importanti di tali tipi di operatori. La penultima sezione sar`a dedicata all’importante teorema di decomposizione polare per operatori limitati definiti su tutto lo spazio di Hilbert. Come strumento tecnico, sar`a introdotta la nozione di radice quadrata positiva di un operatore limitato. L’ultima sezione riguarder`a la teoria elementare della trasformata di Fourier e di Fourier-Plancherel, che introdurremo in modo molto rapido e conciso, senza fare riferimento (purtroppo) alla teoria delle distribuzioni di Schwartz (si vedano a tal proposito [Rud91, ReSi80, Vla81]).
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
88
3 Spazi di Hilbert e operatori limitati
3.1 Nozioni elementari, teorema di Riesz e riflessivit` a In questa sezione ci occuperemo delle nozioni e dei risultati elementari della teoria degli spazi di Hilbert partendo dalle definizioni elementari di prodotto scalare hermitiano e spazio con prodotto scalare hermitiano. 3.1.1 Spazi con prodotto scalare e spazi di Hilbert Definizione 3.1. Se X `e uno spazio vettoriale sul campo complesso, un’applicazione S : X × X → C si dice prodotto scalare hermitiano e (X, S) spazio con prodotto scalare, quando S soddisfa: H0. S(u, u) ≥ 0 per ogni u ∈ X, H1. S(u, αv + βw) = αS(u, v) + βS(u, w) per ogni α, β ∈ C e u, v, w ∈ X, H2. S(u, v) = S(v, u) per ogni u, v ∈ X, H3. S(u, u) = 0 ⇒ u = 0, per ogni u ∈ X. Se valgono H0, H1, H2 ma non necessariamente H3, S si dice semiprodotto scalare hermitiano. Due vettori u, v ∈ X si dicono ortogonali, e si scrive u ⊥ v, se S(u, v) = 0. In tal caso si dice anche che u `e ortogonale (o, equivalentemente, normale) a v e che v `e ortogonale (o, equivalentemente, normale) a u. Se ∅ = K ⊂ X, lo spazio ortogonale a K `e: K ⊥ := {u ∈ X | u ⊥ v , per ogni v ∈ K} . Osservazioni 3.2. (1) H1 e H2 implicano insieme che S sia antilineare nel primo argomento: S(αv + βw, u) = αS(v, u) + βS(w, u)
per ogni α, β ∈ C e u, v, w ∈ X.
(2) Dalla H2 segue che u `e ortogonale a v se e solo se v `e ortogonale a u. (3) Si verifica immediatamente che K ⊥ `e un sottospazio vettoriale di X per la propriet` a H1, per cui il termine spazio ortogonale `e appropriato. (4) In ogni spazio (X, S) con prodotto scalare hermitiano, dalla definizione di ortogonale, segue immediatamente l’utile propriet`a che useremo molto spesso: K ⊂ K1
⇒
K1⊥ ⊂ K ⊥
se K, K1 ⊂ X.
(5) Nel seguito, quando ci`o non sar`a fonte di fraintendimenti, “(semi) prodotto scalare” significher`a sempre “(semi) prodotto scalare hermitiano”. Proposizione 3.3. Sia X uno spazio vettoriale su C con semi prodotto scalare S. (a) Vale la disuguaglianza di Cauchy-Schwarz: |S(x, y)|2 ≤ S(x, x)S(y, y)
se x, y ∈ X ;
(3.1)
(i) in (3.1) vale il segno di uguaglianza se x e y sono linearmente dipendenti,
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
89
(ii) se S `e prodotto scalare, in (3.1) vale il segno di uguaglianza se e solo se x e y sono linearmente dipendenti. (b) Al variare di x ∈ X, p(x) := S(x, x) (3.2) definisce una seminorma, ovvero una norma se S `e un prodotto scalare, che si dice essere indotta da S. (c) p soddisfa l’identit` a del parallelogramma: p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 )
se x, y ∈ X .
(3.3)
(d) vale l’identit` a di polarizzazione: S(x, y) =
1 (p(x + y) − p(x − y) − ip(x + iy) + ip(x − iy)) 4
se x, y ∈ X . (3.4)
Dimostrazione. (a) Se α ∈ C vale, usando le propriet` a del semiprodotto scalare, 0 ≤ S(x − αy, x − αy) = S(x, x) − αS(x, y) − αS(y, x) + |α|2S(y, y) . (3.5) Supponiamo S(y, y) = 0. In tal caso, ponendo α := S(x, y)/S(y, y), da (3.5) si ottiene: 0 ≤ S(x, x) − |S(x, y)|2 /S(y, y) , che `e la tesi. Se S(y, y) = 0, da (3.5) troviamo invece che deve comunque valere, per ogni α ∈ C: 0 ≤ S(x, x) − αS(x, y) − αS(y, x) .
(3.6)
Scegliendo α ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.6) `e impossibile a meno che S(x, y)+S(y, x) = 0. Scegliendo poi α = iλ con λ ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.5) pu` o valere solo se oltre all’identit` a S(x, y) = −S(y, x) provata sopra, vale anche S(x, y) − S(y, x) = 0 e quindi S(x, y) = 0. In definitiva, se S(y, y) = 0 vale ancora (3.1) perch´e S(x, y) = 0. Se x e y sono linearmente dipendenti allora vale x = αy oppure y = αx per qualche α ∈ C. Si verifica immediatamente che in tal caso i due membri di (3.1) sono uguali. Supponiamo ora che S sia un prodotto scalare e che valga |S(x, y)|2 = S(x, x)S(y, y), proviamo che esistono α, β ∈ C non entrambi nulli, per cui αx + βy = 0. Se almeno uno dei due vettori x, y `e nullo ci` o `e banalmente vero. Mettiamoci allora nel caso in cui entrambi i vettori siano non nulli, per cui S(x, x) > 0 < S(y, y) per H3. In tal caso, ridefinendo u = x/ S(x, x) e v = y/ S(y, y), vale |S(u, v)| = 1 e quindi S(u, v) = eiη per qualche η ∈ R. Per H3, α u + β v = 0 equivale a S(α u + β v, α u + β v) = 0 e cio`e: |α |2 + |β |2 + α β eiη + β α e−iη = 0 .
90
3 Spazi di Hilbert e operatori limitati
Scegliendo α = eiμ e β = eiν in modo che −μ + ν + η = π, l’identit` a di iμ sopra risulta essere vera e quindi, come volevamo, se α := e S(y, y) e iν β := e S(x, x) allora α, β = 0 e αx + βy = 0. (b) Tutte le propriet` a delle seminorme si verificano immediatamente dalla definizione di p e dalle propriet` a del prodotto scalare, eccetto la disuguaglianza triangolare N2 che proviamo ora. Dalle propriet` a del prodotto scalare risulta subito che p(x + y)2 = p(x)2 + 2ReS(x, y) + p(y)2 , dove Re indica la parte reale. Dato che: ReS(x, y) ≤ |S(x, y)|, per la (3.1), vale anche ReS(x, y) ≤ p(x)p(y). Sostituendo nell’identit` a trovata sopra, si ottiene: p(x + y)2 ≤ p(x)2 + 2p(x)p(x) + p(y)2 , ossia p(x, y)2 ≤ (p(x) + p(y))2 , che implica N2. La propriet` a N3 segue immediatamente da H3, nel caso S sia un prodotto scalare. Gli enunciati in (c) e (d) si verificano immediatamente usando la definizione di p e le propriet` a del prodotto scalare. Osservazioni 3.4. (1) La disuguaglianza di Cauchy-Schwarz ha come diretta conseguenza il fatto che un prodotto scalare S : X × X → C sia una funzione continua sullo spazio X × X dotato della topologia prodotto, quando su X si usi la topologia indotta dalla norma associata al prodotto scalare tramite la norma (3.2). In particolare il prodotto scalare `e anche continuo nei suoi singoli argomenti separatamente. (2) Nel caso in cui il campo di X sia R invece di C, sussistono definizioni analoghe a quelle della definizione 3.1, definendo un prodotto scalare reale S : X × X → R che soddisfa H0, H1 e H3, ma rimpiazzando H2 con la condizione di simmetria: H2’. S(u, v) = S(v, u) per ogni u, v ∈ X. La nozione di semi prodotto scalare reale si ottiene ancora da quella di prodotto scalare reale lasciando cadere la condizione H3. (3) Si prova facilmente che la proposizione 3.3 continua a valere nel caso di (semi) prodotto scalare reale, con l’unico cambiamento che l’identit`a di polarizzazione `e: 1 S(x, y) = (p(x + y) − p(x − y)) , (3.7) 4 se il campo dello spazio vettoriale `e R.
Un noto risultato – ma poco spesso esplicitamente dimostrato – `e il seguente teorema dovuto a Fr´echet, von Neumann e Jordan. La dimostrazione si trova (svolta) negli esercizi 3.1-3.3.
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
91
Teorema 3.5. Sia X uno spazio vettoriale complesso e sia p : X → R una norma (seminorma). p soddisfa l’identit` a del parallelogramma (3.3) se e solo se esiste – ed in tal caso `e unico – un prodotto scalare (rispettivamente, un semi prodotto scalare) S che induce p tramite (3.2). Dimostrazione. Se la norma (seminorma) `e indotta da un prodotto scalare hermitiano allora l’identit` a del parallelogramma (3.3) `e valida per (c) in proposizione 3.3. La dimostrazione del fatto che se vale (3.3) allora esiste un prodotto scalare (semi prodotto scalare) S che induce p tramite (3.2) `e data nella soluzione degli esercizi 3.1-3.3. Passiamo a definire la nozione di isomorfismo di spazi con prodotto scalare. Definizione 3.6. Se (X, SX ) e (Y, SY ) sono spazi con prodotto scalare, un’applicazione lineare L : X → Y `e detta isometria se soddisfa: SY (L(x), L(y)) = SX (x, y)
per ogni x, y ∈ X.
Se l’isometria L : X → Y `e suriettiva `e detta isomorfismo di spazi con prodotto scalare. Se esiste un isomorfismo (L) di spazi con prodotto scalare dallo spazio X allo spazio Y, tali spazi si dicono isomorfi (secondo L). Osservazione 3.7. ` chiaro che ogni isometria L : X → Y `e iniettiva per H3, ma pu` E o non essere suriettiva (anche quando X = Y, se la dimensione dello spazio X non `e finita). Inoltre ogni isometria `e ovviamente continua rispetto alle due topologie dei due spazi normati (con norme indotte dai prodotti scalari) e, se `e suriettiva (cio`e se `e un isomorfismo), la sua inversa `e ancora un’isometria (e quindi un isomorfismo). Dato che uno spazio con prodotto scalare `e anche uno spazio normato, esistono due nozioni di isometria, in riferimento ad una trasformazione lineare L : X → Y. Una `e riferita alla conservazione del prodotto scalare ed `e quella definita sopra, l’altra `e quella valida per gli spazi normati (definizione 2.21) e corrisponde alla richiesta, riferita alle norme indotte dai prodotti scala` chiaro che il primo tipo di isometria ri: ||Lx||Y = ||x||X per ogni x ∈ X. E `e anche del secondo tipo. Dall’identit` a di polarizzazione (3.4), si dimostra immediatamente che, in realt`a, queste due nozioni sono equivalenti. Proposizione 3.8. Un operatore lineare L : X → Y, con X e Y spazi con prodotto scalare, `e un’isometria nel senso della definizione 3.6 se e solo se soddisfa: ||Lx||Y = ||x||X per ogni x ∈ X, dove le norme sono quelle associate ai prodotti scalari dei corrispondenti spazi di Hilbert.
92
3 Spazi di Hilbert e operatori limitati
Notazione 3.9. Nel seguito, se non sar`a specificato altrimenti, ( | ) denoter`a un prodotto scalare e || || la norma indotta da esso come in proposizione 3.3 Possiamo infine dare la definizione pi` u importante di tutto il libro: quella di spazio di Hilbert. Definizione 3.10. Uno spazio vettoriale sul campo complesso con prodotto scalare hermitiano si dice spazio di Hilbert se `e spazio di Banach rispetto alla norma indotta dal prodotto scalare. Un isomorfismo di spazi con prodotto scalare tra due spazi di Hilbert `e detto: (i) isomorfismo di spazi di Hilbert o, equivalentemente, (ii) trasformazione unitaria o, equivalentemente, (iii) operatore unitario. Deve essere chiaro che se U : H → H1 `e un isomorfismo di spazi con prodotto scalare, H1 `e uno spazio di Hilbert se e solo se `e tale H. In tal caso U `e una trasformazione unitaria. Vale un teorema del completamento analogo a quello visto per spazi di Banach. Teorema 3.11. (Del completamento per spazi di Hilbert.) Sia X uno spazio vettoriale sul campo C dotato di un prodotto scalare S. (a) Esiste uno spazio di Hilbert (H, ( | )), detto completamento di X, tale che X si identifica con un sottospazio denso (rispetto alla topologia di H indotta dalla norma associata al prodotto scalare ( | )) di H tramite un’applicazione lineare iniettiva J : X → H che estende il prodotto scalare S in ( | ). In altre parole, esiste un’applicazione lineare iniettiva J : X → H con J(X) = H
e
(J(x)|J(y)) = S(x, y) per ogni x, y ∈ X.
(b) Se la terna (J1 , H1 , ( | )1 ) con J1 : X → H1 lineare isometrica e (H1 , ( | )1 ) spazio di Hilbert `e tale che X si identifica con un sottospazio denso di H1 tramite J1 estendendo il prodotto scalare S in ( | )1 , allora esiste ed `e unico una trasformazione unitaria φ : H → H1 tale che J1 = φ ◦ J. Schema della dimostrazione. (a) Conviene usare il teorema del completamento per gli spazi di Banach e costruire il completamento di Banach dello spazio normato (X, N ) dove N (x) := S(x, x). Dato che S `e continuo e X `e denso nel completamento secondo la funzione lineare J, S induce un semi prodotto scalare (|) sul completamento di Banach H. In realt` a, (|) `e un prodotto scalare su H in quanto, sempre per continuit` a, risulta indurre la stessa norma dello spazio di Banach. Di conseguenza H `e spazio di Hilbert e la funzione lineare J che identifica X con un sottospazio denso di H soddisfa le propriet` a prescritte nella tesi. (b) La dimostrazione `e essenzialmente uguale a quella data nel caso di spazi di Banach.
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
93
Esempi 3.12. n (1) Cn dotato del prodotto scalare (u|v) := i=1 ui vi , dove u = (u1 , . . . , un ) e v = (v1 , . . . , vn ), `e uno spazio di Hilbert. (2) Un esempio di spazio di Hilbert estremamente importante in fisica si ricava da (6) in esempi 2.39: lo spazio L2 (X, μ), dove X `e uno spazio con misura positiva σ-additiva μ su una σ-algebra Σ. Sappiamo che L2 (X, μ) `e uno spazio di Banach rispetto alla norma: ||f||2 := f(x)f(x)dμ(x) X
essendo f un qualsiasi rappresentante della classe di equivalenza [f] ∈ L2 (X, μ) (al solito, nel seguito, scriveremo f in luogo di [f]). Se f, g ∈ L2 (X, μ), la disuguaglianza di H¨ older (vedi (6) in esempi 2.39) implica immediatamente che deve essere f(x)g(x) ∈ L1 (X, μ), pertanto: f(x)g(x)dμ(x) se f, g ∈ L2 (X, μ) (3.8) (f|g) := X
`e ben definito. Le propriet` a elementari dell’integrale provano che il secondo ` ovvio membro di (3.8) definisce un prodotto scalare hermitiano su L2 (X, μ). E 2 che tale prodotto scalare induce la norma || ||2. Quindi L (X, μ) `e uno spazio di Hilbert rispetto al prodotto scalare (3.8). (3) Nel caso in cui X = N e μ `e la misura che conta i punti (vedi (7) in esempi 2.39), si ha, come sottocaso dell’esempio precedente, lo spazio di Hilbert di successioni complesse a quadrato sommabile 2 (N) con: ( {xn }n∈N | {yn }n∈N ) :=
+∞
xn yn .
n=0
3.1.2 Il teorema di Riesz e le sue conseguenze Vogliamo arrivare a provare che gli spazi di Hilbert sono riflessivi. Per fare ci`o dobbiamo introdurre alcuni utili strumenti legati al concetto di spazio ortogonale, e dobbiamo provare il famoso teorema di Riesz. Ricordiamo la seguente definizione di insieme convesso. Definizione 3.13. Se ∅ = K ⊂ X, con X spazio vettoriale, K `e detto convesso se: λu + (1 − λ)v ∈ K
se λ ∈ [0, 1] e u, v ∈ K.
Chiaramente ogni sottospazio di X `e convesso, ma non tutti i sottoinsiemi convessi di X sono sottospazi di X: una palla aperta (di raggio finito) in spazio normato `e un insieme convesso che non `e sottospazio. Per il prossimo teorema, ricordiamo che se K ⊂ X, < K > denota il sottospazio di X generato da K e K indica la chiusura di K.
94
3 Spazi di Hilbert e operatori limitati
Teorema 3.14. Sia (H, ( | )) spazio di Hilbert e K ⊂ H un sottoinsieme non vuoto. (a) K ⊥ `e un sottospazio chiuso di H. ⊥ (b) K ⊥ =< K >⊥ = < K >⊥ = < K > . (c) Se K `e chiuso e convesso, allora per ogni x ∈ H esiste ed `e unico PK (x) ∈ K tale che ||x − PK (x)|| = min{||x − y|| | y ∈ K}, dove || || denota la norma indotta da ( | ). (d) Se K `e un sottospazio chiuso, allora ogni x ∈ H si decompone in modo unico come zx + yx con zx ∈ K e yx ∈ K ⊥ e quindi vale: H = K ⊕ K⊥ .
(3.9)
Infine risulta zx := PK (x) definito in (c). (e) (K ⊥ )⊥ = < K >. Osservazione 3.15. In realt` a (a) e (b) valgono anche se lo spazio non `e di Hilbert ma solo spazio vettoriale con prodotto scalare e la topologia `e quella indotta dal prodotto scalare. Prova del teorema 3.14. (a) K ⊥ `e sottospazio per le propriet`a di (anti)linearit` a del prodotto scalare. Dalla continuit`a del prodotto scalare segue subito che se {xn } ⊂ K ⊥ converge a x ∈ H allora (x|y) = 0 per ogni y ∈ K, per cui x ∈ K ⊥ . Quindi K ⊥ `e chiuso contenendo tutti i suoi punti di accumulazione. (b) La dimostrazione della prima identit`a (partendo da sinistra) `e ovvia per definizione di ortogonale e dalla linearit` a (antilinearit` a) del prodotto scalare. La seconda identit`a segue quindi immediatamente da (a). Riguardo all’ultima identit`a notiamo che sicuramente, essendo < K >⊂ < K > vale ⊥ ⊥ < K >⊥ ⊃ < K > . D’altra parte < K >⊥ ⊂ < K > per la continuit` a del ⊥ prodotto scalare. Di conseguenza < K >⊥ = < K > , che conclude la catena di uguaglianze avendo gi` a provato che < K >⊥ = < K >⊥ . (c) Sia 0 ≤ d = inf y∈K ||x − y||, che esiste perch´e l’insieme dei numeri ||x − y|| con y ∈ K `e limitato inferiormente e non vuoto. Sia {yn } ⊂ K una successione di punti per cui ||x − yn || → d. Mostriamo che si tratta di una successione di Cauchy. Dall’identit` a del parallelogramma (3.3), con x e y in tale formula sostituiti con x − yn e x − ym rispettivamente, segue che ||yn − ym ||2 = 2||x − yn ||2 + 2||x − ym ||2 − ||2x − yn − yn ||2 . Osserviamo ora che ||2x − yn − yn ||2 = 4||x − (yn + ym )/2||2 ≥ 4d2 , dato che yn /2+ym /2 ∈ K nell’ipotesi di convessit`a di K e che d `e l’estremo inferiore dei numeri ||x − y|| se y ∈ K. Fissato > 0, prendendo n e m grandi a sufficienza avremo che vale: ||x − yn ||2 ≤ d2 + , ||x − ym ||2 ≤ d2 + , da cui ||yn − ym ||2 ≤ 4(d2 + ) − 4d2 = 4 . Quindi la successione `e di Cauchy. Essendo H completo, yn converge a qualche y ∈ K dato che K `e chiuso. Per la continuit` a della norma d = ||x − y||.
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
95
Mostriamo che y ∈ K `e l’unico punto che soddisfa d = ||x − y||. Ogni altro y ∈ K con la stessa propriet`a soddisfa, dall’identit` a del parallelogramma: ||y − y ||2 = 2||x − y||2 + 2||x − y ||2 − ||2x − y − y ||2 ≤ 2d2 + 2d2 − 4d2 = 0 , dove abbiamo ancora usato ||2x − y − y||2 = 4||x − (y + y)/2||2 ≥ 4d2 (dato che y/2 + y /2 ∈ K nell’ipotesi di convessit`a di K e che d `e l’estremo inferiore dei numeri ||x − z|| se z ∈ K). Valendo ||y − y || = 0 deve essere y = y . Quindi PK (x) := y soddisfa tutte le richieste. (d) Sia x ∈ H e x1 ∈ K a distanza minima da x. Poniamo x2 := x − x1 e mostriamo che x2 ∈ K ⊥ . Sia y ∈ K, la funzione R t → f(t) := ||x−x1 +ty||2 ha un minimo per t = 0. Si noti che tale fatto vale nell’ipotesi che K sia sottospazio, per cui −x1 + ty ∈ K per ogni t ∈ R se x1 , y ∈ K. Quindi la sua derivata si annulla in t = 0: f (0) = lim
t→0
||x2 + ty||2 − ||x2||2 = (x2 |y) + (y|x2 ) = 2Re(x2 |y) . t
Di conseguenza Re(x2 |y) = 0. Sostituendo y con iy si ricava che anche la parte immaginaria di (x2 |y) vale zero, per cui (x2 |y) = 0 e x2 ∈ K ⊥ . Con questo abbiamo provato che < K, K ⊥ >= H. Non resta che mostrare che K ∩ K ⊥ = {0}. Ma questo `e ovvio dal fatto che se x ∈ K ∩ K ⊥ allora x deve essere ortogonale a x allora ||x||2 = (x|x) = 0 e quindi x = 0. (e) Se y ∈ K, allora y `e ortogonale ad ogni elemento di K ⊥ ; per linearit` a e continuit` a del prodotto scalare questo vale anche se y ∈ < K >. In altre parole < K > ⊂ (K ⊥ )⊥ . (3.10) Usando (d) e sostituendo al posto di K il sottospazio chiuso < K > otteniamo ⊥ che H = < K > ⊕ < K > . Ossia, tenendo conto di (b) H = < K > ⊕ K⊥ .
(3.11)
Se u ∈ (K ⊥ )⊥ , in base alla (3.11) c’`e una decomposizione fatta di vettori ortogonali ((u0 |v) = 0) u = u0 + v con u0 ∈ < K > e v ∈ K ⊥ e quindi (u|v) = (v|v). Valendo (u|v) = 0 (perch´e u ∈ (K ⊥ )⊥ e v ∈ K ⊥ ) deve essere (v|v) = 0 e dunque (K ⊥ )⊥ u = u0 ∈ < K >. Concludiamo che < K > ⊃ (K ⊥ )⊥ da cui la tesi valendo (3.10). Il teorema provato ha il seguente corollario che segue immediatamente da (b) e (d). Corollario 3.16. (Del teorema 3.14.) Se S `e un sottoinsieme di uno spazio di Hilbert H, < S > `e denso in H se e solo se S ⊥ = {0}. Possiamo ora enunciare e provare il teorema dovuto a F. Riesz, che `e sicuramente il teorema pi` u importante della teoria degli spazi di Hilbert.
96
3 Spazi di Hilbert e operatori limitati
Teorema 3.17. (Di Riesz.) Sia (H, ( | )) spazio di Hilbert. Per ogni funzionale lineare continuo f : H → C esiste ed `e unico yf ∈ H tale che: f(x) = (yf |x)
per ogni x ∈ H .
La funzione H f → yf ∈ H `e biettiva. Dimostrazione. Proviamo che per ogni f ∈ H esiste yf ∈ H suddetto. Il nucleo di f, Kerf := {x ∈ H | f(x) = 0}, `e un sottospazio chiuso dato che f `e continuo. Dato che H `e spazio di Hilbert, vale H = Kerf ⊕ (Kerf)⊥ per il teorema 3.14. Se Kerf = H definiamo yf = 0 e la dimostrazione finisce. Se Kerf = H mostriamo che (Kerf)⊥ ha dimensione 1. Sia 0 = y ∈ (Kerf)⊥ . In f(z) tal caso f(y) = 0 (y ∈ Kerf!). Per ogni z ∈ (Kerf)⊥ , il vettore z − f(y) y cade ⊥ ⊥ in (Kerf) perch´e combinazione lineare di elementi di (Kerf) , ma anche f(z) z − f(y) y ∈ Kerf come si verifica immediatamente dalla linearit` a di f. Quindi z − f(z) y ∈ Kerf ∩ (Kerf)⊥ e dunque z − f(z) y = 0. Quindi y `e una base per f(y) f(y) ⊥ (Kerf) dato che ogni altro vettore z ∈ (Kerf)⊥ `e una combinazione lineare di y: z = f(z) e come sopra, definiamo: f(y) y. Se y ` yf :=
f(y) y (y|y)
e mostriamo che yf rappresenta f nel senso voluto. Se x ∈ H, possiamo decomporre x rispetto alla decomposizione Kerf ⊕ (Kerf)⊥ ottenendo: x = n + x⊥ , dove f(x) f(x⊥ ) x⊥ = y= y f(y) f(y) per quanto provato sopra ed avendo tenuto conto del fatto che f(x⊥ ) = f(x) per linearit` a essendo f(n) = 0. Vale quindi, come si voleva:
f(y)
f(x) f(y) (y|y) (yf |x) = y n + y =0+ f(x) = f(x) . (y|y) f(y) f(y) (y|y) L’applicazione H f → yf ∈ H `e iniettiva, cio`e f individua yf univocamente: se (y|x) = (y |x) per ogni x ∈ K allora (y − y |x) = 0 per ogni x ∈ K e, scegliendo x = y − y , segue che: ||y − y ||2 = (y − y |y − y ) = 0. Da cui y = y . L’applicazione H f → yf ∈ H `e suriettiva, dato che, per ogni y ∈ H, la funzione H x → (y|x) definisce un elemento di H per linearit` a e continuit`a del prodotto scalare. Corollario 3.18. (Del teorema di Riesz.) Ogni spazio di Hilbert `e riflessivo. Dimostrazione. Prima di tutto notiamo che possiamo mettere su H un prodotto scalare definito come, se f, g ∈ H , (f|g) := (yg |yf ), dove f(x) = (yf |x)
3.2 Basi hilbertiane
97
e g(x) = (yg |x) per ogni x ∈ H. Si osservi che la norma indotta da ( | ) in H coincide con la norma naturale di H , ||f|| := sup |f(x)| , ||x||=1
rispetto alla quale H `e completo per il teorema 2.54. Infatti questa definizione si pu` o scrivere, per il teorema 3.17: ||f|| = sup |(yf |x)| ; ||x||=1
la disuguaglianza di Cauchy-Schwarz implica subito che ||f|| ≤ ||yf ||, inoltre vale |(yf |x)| = ||yf || se x = yf /||yf ||. Quindi ||f|| = ||yf ||, ma quest’ultima `e proprio, come volevamo, la norma di f indotta dal prodotto scalare ( | ) . Quindi (H , ( | ) ) `e uno spazio di Hilbert e (H ) il suo duale. Il teorema 3.17 assicura che gli elementi di (H ) , F , sono tutti e soli quelli per cui esiste qualche gF ∈ H tale che F (f) = (gF |f) per ogni f ∈ H . Ma (gF |f) = (yf |ygF ) = f(ygF ). Abbiamo cio`e che, per ogni F ∈ (H ) , esiste (ed `e unico per il corollario 2.69 del teorema di Hahn-Banach) un vettore ygF ∈ H tale che, per ogni f ∈ H : F (f) = f(ygF ) . Questa propriet` a altro non `e che la riflessivit`a di H.
Osservazione 3.19. Dalla dimostrazione del corollario, risulta che lo spazio duale topologico H dotato del prodotto scalare ( | ) , definito come (f|g) := (yg |yf ), `e uno spazio di Hilbert. L’applicazione H f → yf ∈ H risulta essere anti-lineare, iniettiva e suriettiva e preserva il prodotto scalare per costruzione. In questo senso H e H sono anti isomorfi.
3.2 Basi hilbertiane Passiamo ora ad introdurre tutto l’armamentario matematico relativo al concetto di base hilbertiana. Si tratta, come ben noto, della generalizzazione, nel caso infinito dimensionale, della nozione di base ortonormale. Noi lavoreremo nel caso completamente generale di spazio di Hilbert non necessariamente separabile in cui le basi hilbertiane possono avere cardinalit` a qualsiasi, anche non numerabile. Abbiamo bisogno di qualche risultato preliminare sul significato della somma infinita su insiemi, in generale non numerabili, di numeri non negativi. Chiameremo insieme indicizzato, e lo indicheremo con {αi }i∈I , ogni applicazione I i → αi . L’insieme I `e detto insieme degli indici; la coppia (i, αi ), indicata impropriamente come αi , `e detta elemento i-esimo dell’insieme indicizzato. Si osservi che pu`o accadere che αi = αj con i = j.
98
3 Spazi di Hilbert e operatori limitati
Definizione 3.20. Se A = {αi }i∈I `e un insieme non vuoto di numeri reali non negativi indicizzati sull’insieme I di cardinalit` a arbitraria, la somma dell’insieme indicizzato A `e il numero in [0, +∞) ∪ {+∞} definito come: ⎫ ⎧
⎬ ⎨
(3.12) αi := sup αj
F ⊂ I , F finito . ⎭ ⎩
i∈I j∈F Osservazione 3.21. D’ora in poi un insieme si dir` a numerabile quando pu` o essere messo in corrispondenza biunivoca con l’insieme dei numeri naturali N. Quindi il caso numerabile non include il caso finito. Proposizione 3.22. In riferimento alla definizione 3.20 vale quanto segue. (a) Se I `e finito onumerabile, la somma dell’insieme indicizzato A coincide con la somma i∈I αi , ovvero, rispettivamente, con la somma della se+∞ rie n=0 αin (che converge sempre, al pi` u a +∞, essendo serie di termini non negativi) indipendentemente dall’ordinamento, cio`e dalla funzione biettiva N n → in ∈ I. (b) Se la somma dell’insieme A `e finita, allora il sottoinsieme di I per cui αi = 0 `e finito o numerabile. In tal caso, restringendosi al sottoinsieme detto, la somma di A coincide con la somma su un insieme finito di indici o, rispettivamente, la somma di una serie come precisato in (a). (c) Se μ `e la misura che conta i punti di I definita sulla σ-algebra dell’insieme della parti di I (se J ⊂ I allora μ(J) ≤ +∞ `e il numero di elementi di J per definizione), allora: αi = αi dμ(i) . (3.13) i∈I
A
Dimostrazione. (a) Il caso di I finito `e ovvio; consideriamo il caso di I infinito numerabile e supponiamo di avere scelto un particolare ordinamento di I, per cui possiamo riscrivere A come A = {αin }n∈N . Mostriamo che la somma della +∞ serie di elementi {αin }n∈N , n=0 αin , coincide con la somma nel senso (3.12) che, per definizione, non dipende dall’ordinamento scelto. Vale, per (3.12): N
α in ≤
n=0
αi .
i∈I
E quindi, prendendo il limite per N → +∞, che esiste e coincide con l’estremo superiore dell’insieme delle ridotte della serie, essendo non decrescente la successione delle ridotte: +∞ α in ≤ αi . (3.14) n=0
i∈I
D’altra parte, se F ⊂ I `e finito, possiamo sempre fissare NF sufficientemente grande in modo tale che {αi }i∈F ⊂ {αi0 , αi1 , αi2 , . . . , αiNF }. In tal modo i∈F
αi ≤
NF n=0
α in .
3.2 Basi hilbertiane
99
Prendendo l’estremo superiore di entrambi i membri della disuguaglianza precedente al variare degli insiemi F ⊂ I finiti, e ricordando che l’estremo superiore dell’insieme delle ridotte coincide con la somma della serie, abbiamo: i∈I
αi ≤
+∞
α in .
(3.15)
n=0
Le (3.14) e (3.15) implicano la tesi. (b) sia S < +∞, S ≥ 0, la somma dell’insieme indicizzato A. Se S = 0, tutti gli elementi di A devono essere nulli e la tesi `e verificata banalmente. Si supponga ` chiaro che ogni αi `e contenuto in [0, S] – altrimenti la somma che S > 0. E sarebbe maggiore di S – e in particolare, se αi = 0, allora αi ∈ (0, S]. Poniamo Sn := S/n per n = 1, 2, . . .. Se Nk `e il numero di elementi i ∈ I per cui αi cade nell’intervallo (Sk+1 , Sk ], sicuramente S ≥ Sk+1 Nk e quindi Nk `e finito per ogni k. Essendo ∪+∞ k=1 (Sk+1 , Sk ] = (0, S] tutti gli αi = 0 sono contati al variare di k = 1, 2, . . .. Tali valori possono essere al pi` u una quantit` a numerabile, dato che: (i) gli intervalli (Sk+1 , Sk ] sono numerabili e (ii) ciascuno di essi contiene una quantit` a finita di αi = 0. (c) Notando che ogni funzione `e misurabile rispetto alla misura detta (dato che la σ-algebra `e l’insieme delle parti) l’identit`a (3.13) `e immediata conseguenza della definizione di integrale di una funzione positiva [Rud82]. Passiamo a definire, in vari passi, il concetto di sistema ortonormale completo anche detto base hilbertiana. Definizione 3.23. Sia (X, ( | )) spazio con prodotto scalare e ∅ = N ⊂ X. (a) N `e detto insieme ortogonale se (i) N 0 e (ii) x ⊥ y se x, y ∈ N con x = y. (b) N `e detto insieme ortonormale se `e ortogonale e (x|x) = 1 per ogni x ∈ N. Se (H, ( | )) `e spazio di Hilbert, N ⊂ H `e detto sistema ortonormale completo o, equivalentemente, base hilbertiana, se `e un insieme ortonormale e soddisfa: N ⊥ = {0} . (3.16) ` chiaro che un insieme di vettori ortogonali N `e liOsservazione 3.24. E nearmente indipendente: seF ⊂ N `e finito e 0 = x∈F αx x, allora 0 = ( x∈F αx x| y∈F αy y) = x∈F y∈F αx αy (x|y) = x∈F |αx|2 ||x||2. Dato che ||x|| > 0 e |αx|2 ≥ 0, deve necessariamente essere |αx| = 0, e quindi αx = 0, per ogni x ∈ F . Teorema 3.25. (Disuguaglianza di Bessel.) Se (X, ( | )) `e spazio con prodotto scalare e N ⊂ X `e un insieme ortonormale, vale: |(x|z)|2 ≤ ||x||2 per ogni x ∈ X . (3.17) z∈N
In particolare solo una quantit` a numerabile di elementi (x|z) sono non nulli.
100
3 Spazi di Hilbert e operatori limitati
Dimostrazione. Per la definizione 3.20 e per (b) della proposizione 3.22, la tesi `e vera se (3.17) vale per i sottoinsiemi F ⊂ N finiti. Sia dunque F = n {z1 , . . . , zn }, x ∈ X e α1 , . . . , αn ∈ C. Sviluppando la norma ||x− k=1 αk zk ||2 in termini del prodotto scalare di X e tenendo conto dell’ortonormalit`a degli elementi zp e zq e delle propriet`a di (anti-)linearit` a del prodotto scalare, si trova subito che:
2 n n n n
2 2 αk zk
= ||x|| + |αk | − αk (x|zk ) − αk (x|zk ) .
x −
k=1
k=1
k=1
k=1
Il secondo membro pu`o riscriversi come: ||x||2 −
n
|(x|zk )|2 +
k=1
n
|(x|zk )|2 − αk (x|zk ) − αk (x|zk ) + |αk |2
.
k=1
Abbiamo trovato che:
2 n n n
2 2 αk zk
= ||x|| − |(x|zk )| + | (zk |x) − αk |2 .
x −
k=1
k=1
k=1
` chiaro che il secondo membro ha un unico minimo assoluto per αk = (zk |x), E k = 1, . . . , n. In tal caso si ottiene proprio:
2 n n
0 ≤
x − (zk |x)zk
= ||x||2 − |(x|zk )|2 ,
k=1
k=1
da cui, come volevamo provare: n
|(x|zk )|2 ≤ ||x||2 .
k=1
Lemma 3.26. Sia {xn }n∈N un insieme ortogonale numerabile indicizzato su N nello spazio di Hilbert (H, ( | )). Sia || || la norma indotta da ( | ). Se +∞
||xn ||2 < +∞ ,
(3.18)
n=0
allora: (a) esiste, ed `e unico, x ∈ H tale che +∞
xn = x ,
(3.19)
n=0
dove la convergenza della serie `e intesa come convergenza della successione delle ridotte nella topologia associata a || ||.
3.2 Basi hilbertiane
101
(b) la serie in (3.20) pu` o essere riordinata, cio`e, per ogni f : N → N biettiva, +∞
xf(n) = x .
(3.20)
n=0
n a di ortonormalit` a dei Dimostrazione. (a) Sia An := k=0 xk ; dalle propriet` vettori xk e dalla definizione della norma in termini di prodotto scalare segue subito che, se n > m, allora: ||An − Am ||2 =
n
||xk ||2 .
k=m+1
Dato che la serie a secondo membro converge per ipotesi, ||An − Am ||2 =
n
||xk ||2 ≤
k=m+1
+∞
||xk ||2 → 0 per m → +∞
k=m+1
e questo implica immediatamente che la successione delle ridotte {An } sia di Cauchy. Dato che H `e completo, esister`a x ∈ H limite di tali successioni e quindi, per definizione, limite della serie. Dato che H `e spazio normato, vale la propriet` a di Hausdorff che implica l’unicit` a dei limiti e quindi in particolare quella di x. n (b) Si fissi f : N → N biettiva. Poniamo come sopra An := k=0 xn e σn := +∞ n 2 e la sue k=0 xf(n) . La serie a termini positivi k=0 ||xf(k) || converge perch´ ridotte sono maggiorate dalle ridotte della serie convergente a termini positivi +∞ 2 ||x || . Come conseguenza di (a), esister` a il limite in H delle ridotte k k=0 σn , ovvero anche la serie riordinata converger`a in H. Mostriamo che la serie riordinata converge sempre a x. Se definiamo rn := max{f(0), f(1), . . . , f(n)}, vale allora ||xk ||2 ||Arn − σn ||2 ≤ k∈Jn
dove Jn si ottiene eliminando dall’insieme {0, 1, 2, . . . , max{f(0), f(1), . . . , f(n)}} ` chiaro che, per la biettivit` i numeri f(0), f(1), . . . , f(n). E a della funzione, i numeri che rimangono corrisponderanno ad alcuni elementi dell’insieme infinito {f(n + 1), f(n + 2), . . .} . Di conseguenza ||Arn − σn ||2 ≤
k∈Jn
||xk ||2 ≤
+∞ k=n+1
||xf(k)||2 .
(3.21)
102
3 Spazi di Hilbert e operatori limitati
Dato che
+∞ k=0
||xf(k)||2 < +∞, (3.21) implica che: lim (Arn − σn ) = 0 .
n→+∞
D’altra parte vale anche rn ≥ n (dato che f `e iniettiva, se fosse: max{f(0), f(1), . . . , f(n)} < n , gli f(n) dovrebbero essere n + 1 numeri interi non negativi strettamente inferiori a n e questo `e impossibile) e quindi limn→+∞ rn = +∞ per cui: x = lim An = lim Arn = lim σn . n→+∞
n→+∞
n→+∞
Questo conclude la dimostrazione.
Possiamo quindi enunciare e dimostrare il teorema fondamentale delle basi hilbertiane. Tale teorema prova che le basi hilbertiane soddisfano propriet` a che sono dirette generalizzazioni di quelle delle basi ortonormali negli spazi vettoriali di dimensione finita dotati di prodotto scalare. La differenza `e che ora sono ammesse, usando la topologia di H, anche combinazioni lineari infinite: ogni elemento dello spazio di Hilbert pu`o essere scritto in modo univoco come una combinazione lineare infinita di elementi di una base hilbertiana. Si deve osservare che, indipendentemente dal fatto che negli spazi di Hilbert esistano tali basi hilbertiane, esistono comunque, come conseguenza del lemma di Zorn (o assioma della scelta) anche basi algebriche che non richiedono alcuna nozione topologica. La differenza tra le basi hilbertiane e quelle algebriche `e quindi che le seconde riguardano solo combinazioni lineari finite: ogni elemento dello spazio vettoriale (in questo caso di Hilbert) pu`o essere scritto in modo univoco come una combinazione lineare finita degli elementi della base (che comunque sono infiniti). Teorema 3.27. Sia (H, ( | )) spazio di Hilbert e N ⊂ H un insieme ortonormale. I seguenti fatti sono equivalenti. (a) N `e una base hilbertiana (ossia N `e insieme ortonormale e N ⊥ = {0}). (b) Fissato x ∈ H, una quantit` a al pi` u numerabile di numeri (z|x) `e non nulla per z ∈ N e vale: x= (z|x)z , (3.22) z∈N
dove la convergenza della serie `e intesa come convergenza della successione delle ridotte nella topologia indotta dal prodotto scalare. (c) Fissati x, y ∈ H, una quantit` a al pi` u numerabile di numeri (z|x), (y|z) `e non nulla se z ∈ N e vale: (x|y) = (x|z)(z|y) . (3.23) z∈N
3.2 Basi hilbertiane
103
(d) Se x ∈ H, vale, nel senso della definizione 3.20: ||x||2 =
|(z|x)|2 .
(3.24)
z∈N
(e) < N > = H, cio`e il sottospazio generato da N `e denso in H. Se vale una delle propriet` a equivalenti dette sopra, in (3.22) e (3.23) non conta l’ordine con cui si etichettano i coefficienti (x|z), (z|x) = (x|z) e (z|y) non nulli. Dimostrazione. (a) ⇒ (b). Per il teorema 3.25 solo una quantit`a al pi` u numerabile di coefficienti (z|x) `e non nullo. Indichiamo con (zn |x) tali coefficienti, n ∈ N, e N e per costruzione poniamo SN := n=0 (zn |x)zn . L’insieme {(zn |x)zn }n∈N ` ortogonale, inoltre essendo ||z || = 1 la disuguaglianza di Bessel implica che n +∞ 2 ||(z |x)z || < +∞. Usando (a) del lemma 3.26 segue che la serie (3.22) n n n=0 +∞ o esseconverge ad un unico x ∈ H con x = n=0 (zn |x)zn . Inoltre la serie pu` re riordinata pur convergendo allo stesso x per (b) di lemma 3.26. Mostriamo che x = x. Dalla linearit` a e continuit` a del prodotto scalare si ha che, se z ∈ N : (x − x |z ) = (x|z ) −
(x|z)(z|z ) = (x|z ) − (x|z ) = 0
z∈N
dove si `e tenuto conto del fatto che l’insieme dei coefficienti z costituisce un insieme ortonormale. Dato che z ∈ N `e arbitrario, x − x ∈ N ⊥ e quindi x − x = 0 in quanto N ⊥ = {0} per ipotesi. Questo prova che (3.22) vale indipendentemente dall’ordine con cui si etichettano i coefficienti (z|x) = 0. (b) ⇒ (c). Se (b) `e valida, (c) `e una sua ovvia conseguenza dovuta alla continuit` a e (anti-)linearit` a del prodotto scalare e al fatto che N `e ortonormale. (c) ⇒ (d). (d) `e un caso particolare di (c) quando y = x. (d) ⇒ (a). Se (d) `e vera e se x ∈ H `e tale che (x|z) = 0 per ogni z ∈ N , allora ||x|| = 0 ossia x = 0. In altre parole N ⊥ = {0}, cio`e vale (a). Abbiamo provato che (a),(b),(c) e (d) sono equivalenti. Per concludere notiamo che (b) implica immediatamente (e), mentre (e) implica (a): se x ∈ N ⊥ allora, per la linearit` a del prodotto scalare, x ∈ < N >⊥ ⊂ < N >⊥ . Ma per ⊥ (b) del teorema 3.14 < N >⊥ = < N > . Essendo < N > = H per ipotesi, x ∈ H⊥ = {0}. In altre parole, essendo N ⊥ = {0}, vale (a). Il fatto che la serie di numeri complessi in (3.23) pu` o essere riordinata arbitrariamente conservandone la somma si ottiene dal seguente ragionamento. Si consideri l’insieme: A := {z | (x|z) = 0 oppure (y|z) = 0} .
104
3 Spazi di Hilbert e operatori limitati
Tale insieme `e numerabile. La disuguaglianza di Cauchy-Schwarz in 2 (A) produce: |(x|z)||(z|y)| ≤ ( |(x|z)|2)1/2 ( |(y|z)|2 )1/2 < +∞ z∈A
z∈A
z∈A
o essere riordiper (d). Quindi la serie z∈N (x|z)(z|y) = z∈A (x|z)(z|y) pu` nata arbitrariamente perch´e `e assolutamente convergente. Il lemma di Zorn implica immediatamente che ogni spazio di Hilbert ammette una base hilbertiana. Teorema 3.28. Ogni spazio di Hilbert ammette una base hilbertiana. Dimostrazione. Sia H uno spazio di Hilbert. Consideriamo la classe A i cui elementi sono gli insiemi ortonormali in H. Definiamo in A la relazione d’ordine parziale data dall’inclusione insiemistica. Per costruzione ogni sottoinsieme ordinato E di A `e superiormente limitato dall’elemento costituito dall’unione degli elementi di E. Per il lemma di Zorn esiste allora in A un elemento massimale N . Con le definizioni date, la massimalit` a di N implica che non ci sono in H vettori normali a tutti gli elementi di N , non nulli e non appartenenti a N stesso. In altre parole, N `e un sistema ortonormale completo. Prima di passare al caso degli spazi di Hilbert separabili, diamo ancora un importante risultato della teoria generale. Teorema 3.29. Sia H uno spazio di Hilbert con base hilbertiana N . Valgono i seguenti fatti. (a) H `e isomorfo come spazio di Hilbert a L2 (N, μ) dove μ `e la misura positiva che conta i punti di N (vedi (6) e (7) in esempi 2.39 e (2) in esempi 3.12); la trasformazione unitaria che identifica i due spazi `e data dall’applicazione H x → {(z|x)}z∈N ∈ L2 (N, μ) .
(3.25)
(b) Tutte le basi hilbertiane di H hanno la stessa cardinalit` a (pari a quella di N ), che si dice dimensione dello spazio di Hilbert. (c) Se H1 `e spazio di Hilbert con la stessa dimensione di H, allora i due spazi sono isomorfi come spazi di Hilbert. Dimostrazione. (a) L’applicazione U : H x → {(z|x)}z∈N ∈ L2 (N, μ) `e ben definita, in quanto, se x ∈ H e N `e una base hilbertiana, allora vale la propriet` a (d) del teorema 3.27, la quale afferma proprio che {(z|x)}z∈N ∈ L2 (N, μ). Tale applicazione `e sicuramente iniettiva: se x, x ∈ H producono gli stessi coefficienti (z|x) = (z|x ) per ogni z ∈ N , allora x = x per (b) 2 del teorema 3.27. L’applicazione `e anche suriettiva: se {αz }z∈N ∈L (N, μ) e quindi z∈N |αz |2 < +∞, allora per il lemma 3.26 esiste x := z∈N αz z e (z|x) = αz per la continuit` a del prodotto scalare e l’ortonormalit`a dell’insieme N . Infine (c) del teorema 3.27 implica che U sia isometrica. Pertanto U : H →
3.2 Basi hilbertiane
105
L2 (N, μ) `e un operatore unitario e quindi H e L2 (N, μ) sono isomorfi come spazi di Hilbert. (b) Se una delle basi hilbertiane ha cardinalit` a finita c, allora essa `e anche base algebrica di H. Con la geometria elementare si prova che se esiste una base con cardinalit` a finita c, allora ogni altro insieme di vettori linearmente indipendenti M ha cardinalit` a ≤ c e = c se e solo se M genera finitamente tutto lo spazio. Tenendo conto che ogni base hilbertiana, in quanto insieme ortogonale, `e costituita da vettori linearmente indipendenti, si conclude facilmente che ogni base hilbertiana di H deve avere cardinalit` a sicuramente ≤ c e quindi = c perch´e genera (finitamente) H. Quanto detto esclude anche il caso in cui, in H, una base hilbertiana abbia cardinalit` a finita ed un’altra abbia cardinalit` a infinita. Siano dunque N e M basi hilbertiane di H entrambe di cardinalit` a infinita. Se x ∈ M , definiamo Nx := {z ∈ N | (x|z) = 0}. Dato che 1 = (z|z) = x∈M |(z|x)|2, deve accadere che per ogni z ∈ N esiste x ∈ M tale che z ∈ Nx . Quindi N ⊂ ∪x∈M Nx e allora la cardinalit` a di N sar`a inferiore o uguale a quella di ∪x∈M Nx che coincide con quella di M dato che ogni insieme Nx `e al pi` u numerabile per (b) del teorema 3.27. Quindi la cardinalit` a di N `e inferiore o uguale a quella di M . Scambiando i ruoli di N ed M si ottiene anche che la cardinalit`a di M `e inferiore o uguale a quella di N . Il teorema di Schr¨ oder-Bernstein implica infine che la cardinalit` a di M e quella di N coincidano. (c) Siano N e N1 due basi hilbertiane di H e H1 rispettivamente, e si supponga che N e N1 abbiano la stessa cardinalit` a. Allora esiste un’applicazione biettiva che identifica i punti di N con quelli di N1 e tale applicazione genera naturalmente un isomorfismo di spazi con prodotto scalare V dallo spazio L2 su N allo spazio L2 su N1 rispetto alla misura che conta i punti che `e quindi un isomorfismo tra spazi di Hilbert. Se U1 : H1 → L2 (N1 , μ) `e l’isomorfismo analogo a U : H → L2 (N, μ) descritto sopra, U V U1−1 : H1 → H `e una trasformazione unitaria per costruzione e dunque H e H1 sono isomorfi come spazi di Hilbert. Di particolare interesse in fisica sono i cosiddetti spazi di Hilbert separabili. Definizione 3.30. Uno spazio di Hilbert si dice separabile se ammette un insieme denso e numerabile. Vale un ben noto e utile teorema di caratterizzazione. Teorema 3.31. Sia H spazio di Hilbert. (a) H `e separabile se e solo se ha dimensione finita oppure ammette una base hilbertiana numerabile. (b) Se H `e separabile, tutte le basi hilbertiane sono finite con lo stesso numero di elementi pari alla dimensione dello spazio, oppure sono tutte numerabili. (c) Se H `e separabile `e isomorfo a Cn dotato del prodotto scalare hermitiano standard con n finito pari alla dimensione di H, oppure `e isomorfo a 2 (N). Dimostrazione. (a) Se lo spazio di Hilbert ammette una base hilbertiana finita o numerabile, allora, in base a (b) del teorema 3.27, tenendo conto che i
106
3 Spazi di Hilbert e operatori limitati
razionali con segno sono densi nei reali, si ha subito che esiste un insieme denso numerabile. Tale insieme `e ovviamente quello costituito dalle combinazioni lineari finite di elementi della base usando come coefficienti numeri complessi di parte reale ed immaginaria razionale con segno. Lasciamo i dettagli della facile dimostrazione al lettore. Supponiamo viceversa che uno spazio di Hilbert sia separabile. Sappiamo che, per il teorema 3.28, esistono sempre basi hilbertiane in tale spazio: mostriamo che ciascuna di esse deve essere al pi` u numerabile. Supponiamo per assurdo che N sia base hilbertiana non numerabile per lo spazio di Hilbert H separabile. Scelti z, z ∈ N con z = z , ogni punto x ∈ H `e tale che, per la disuguaglianza triangolare riferita alla norma indotta dal prodotto scalare: ||z − z || ≤ ||x − z || + ||z − x||. D’altra parte essendo {z, z } un 2 2 insieme ortonormale ||z − z ||2 = √ (z − z |z − z ) = ||z|| + ||z || + 0 = 1 + 1 = 2. Quindi ||x − z|| + ||x − z || ≥ √2. Questo risultato implica immediatamente che palle aperte di raggio < 2/2 centrate rispettivamente in z e z sono disgiunte comunque scegliamo z, z ∈ N con z = z . Sia {B(z)}z∈N una classe di tale palle disgiunte a due a due e ciascuna centrata sul rispettivo z ∈ N . Se D ⊂ H `e l’insieme denso e numerabile che esiste per l’ipotesi di separabilit`a, dovr` a accadere che, per ogni z ∈ N , esiste x ∈ D con x ∈ B(z). Dato che le palle sono disgiunte, avremo un diverso x per ogni palla. Ma la cardinalit` a di {B(z)}z∈N non `e numerabile, per cui nemmeno D pu` o essere numerabile e questo `e assurdo. (b) e (c) sono immediate conseguenze del teorema 3.29. Tuttavia, per completezza diamo una traccia di una dimostrazione di esse. (b) Come `e noto dalla teoria elementare, se una base (hilbertiana o no) ha un numero finito di elementi, allora tutte le altre basi (hilbertiane o no) hanno lo stesso numero di elementi pari alla dimensione dello spazio; inoltre, tutti gli insiemi di vettori linearmente indipendenti (come le basi hilbertiane) contengono un numero di elementi che non supera la dimensione dello spazio. Da questo fatto segue immediatamente che, se uno spazio di Hilbert `e separabile ed una sua base hilbertiana `e finita, allora tutte le basi hilbertiane dello spazio sono finite con lo stesso numero di elementi pari alla dimensione dello spazio. Nelle stesse ipotesi, se una base hilbertiana `e numerabile allora tutte le altre basi hilbertiane devono essere numerabili per (a). (c) Fissata una base hilbertiana N ed usando il teorema3.27, si verifica immediatamente che l’applicazione che trasforma H x = u∈N αu u nell’insieme (finito o infinito a seconda del caso) {αu }u∈N `e un isomorfismo di spazi con prodotto scalare da H a Cn , oppure, da H a 2 (N), a seconda che la dimensione di H sia finita oppure non lo sia. Un’altra utile proposizione per spazi di Hilbert separabili `e la seguente. Proposizione 3.32. Sia (H, ( | )) spazio di Hilbert con H = {0}. Valgono i seguenti fatti. (a) Se Y := {yn }n∈N `e un insieme di vettori linearmente indipendenti e tali che Y ⊥ := {0} o equivalentemente < Y > = H, allora H `e separabile ed
3.2 Basi hilbertiane
107
esiste una base hilbertiana di H, X := {xn }n∈N , tale che, per ogni p ∈ N, il sottospazio generato dai vettori y0 , y1 , . . . , yp coincide con quello generato dai vettori x0 , x1 , . . . , xp. (b) Se H `e separabile e S ⊂ H `e un sottospazio (non chiuso) di H denso in H, allora S contiene una base hilbertiana di H. Dimostrazione. (a) Diamo solo una traccia della dimostrazione perch´e si tratta essenzialmente della procedura di ortogonalizzazione di Gramm-Schmidt, nota dai corsi di geometria elementare [Ser94I]. Per ipotesi `e y0 = 0. Poniamo quindi x0 := y0 /||y0 ||. Successivamente consideriamo il vettore non nullo (perch´e y0 e y1 sono linearmente indipendenti) ` chiaro che x0 , z1 sono non nulli, ortogonali (quindi z1 := y1 − (x0 |y1 )x0 . E linearmente indipendenti) e generano la stesso spazio di y0 e y1 . Non resta che porre x1 := z1 /||z1 || per ottenere l’insieme ortonormale {x0 , x1 } che genera lo stesso spazio di y0 , y1 . Possiamo ora ripetere la procedura definendo induttivamente l’insieme di vettori: zn := yn −
n−1
(xk |yn )xk ,
k=0
e quindi quello dei vettori xn := zn /||zn ||. Per induzione si verifica facilmente che i vettori z0 , . . . , zk sono non nulli, ortogonali (quindi linearmente indipendenti) e generano lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk ; di conseguenza i vettori x0 , . . . , xk formano un insieme ortonormale che genera lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk . Se u ⊥ yn per ogni n ∈ N, allora vale anche (scrivendo gli xn come combinazione lineare di y0 , . . . , yn ) u ⊥ xn per ogni n ∈ N e viceversa (scrivendo ogni yn come combinazione lineare di x0 , . . . , xn). Quindi X ⊥ = Y ⊥ = {0} e dunque X `e una base hilbertiana per H. (b) S deve contenere un sottoinsieme S0 numerabile e denso in H. Sia infatti {yn }n∈N un insieme denso e numerabile in H. Per ogni yn ci sar`a una successione {xnm}m∈N ⊂ S tale che xnm → yn per m → +∞. Si verifica subito che il sottoinsieme numerabile di S, S0 := {xnm}(n,m)∈N×N , `e ancora denso in H. Rietichettiamo gli elementi di S0 sui naturali in modo che x1 = 0. Avremo dunque S0 = {xq }q∈N e dividiamo S0 in due sottoinsiemi S1 , che conterr`a almeno x1 per definizione, e S2 nel modo seguente. Se x2 `e linearmente indipendente da x1 includiamo x2 in S1 altrimenti lo includiamo in S2 . Se x3 `e linearmente indipendente dagli elementi in S1 lo includiamo in S1 altrimenti lo includiamo in S2 . Procediamo in questo modo per tutti gli elementi di S0 . S1 conterr`a, per costruzione, un insieme di generatori di S0 . In questo modo < S1 >=< S0 >⊃ S0 sar`a un insieme denso in H e composto da vettori linearmente indipendenti. Inoltre, visto che S ⊃ S1 `e sottospazio vettoriale, posto Y := S0 , avremo che la procedura di costruzione di un sistema ortonormale completo tramite combinazioni lineari finite di elementi di Y descritta in (a), produce una base hilbertiana di elementi di S stesso.
108
3 Spazi di Hilbert e operatori limitati
Esempi 3.33. (1) Consideriamo lo spazio di Hilbert L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.12), dove dx `e la solita misura di Lebesgue sui boreliani di R e L > 0. Consideriamo le funzioni misurabili (perch´e continue) definite come, per n ∈ Z e x ∈ [−L/2, L/2], 2πn ei L x fn (x) := √ . (3.26) L Si verifica immediatamente che le funzioni fn appartengono allo spazio considerato e costituiscono un insieme ortonormale rispetto al prodotto scalare di L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.12): L/2 (f|g) := f(x)g(x)dx . (3.27) −L/2
Consideriamo l’algebra di Banach di funzioni continue C([−L/2, L/2]) (che `e sottospazio di L2 ([−L/2, L/2], dx)) con norma data dalla norma dell’estremo superiore ((4) e (5) in esempi 2.39). Il sottospazio vettoriale S di C([−L/2, L/2]) generato da tutti i vettori fn , n ∈ Z, `e una sottoalgebra di C([−L/2, L/2]). S contiene 1, `e chiusa rispetto alla coniugazione complessa e, come `e facile provare, separa i punti di [−L/2, L/2] (l’insieme delle funzioni fn da solo separa i punti), per cui, per il teorema 2.40 di StoneWeierstrass, `e densa in C([−L/2, L/2]). D’altra parte `e noto che le funzioni continue di [−L/2, L/2] costituiscono uno spazio vettoriale denso in L2 ([−L/2, L/2], dx) nella topologia di quest’ultimo ([Rud82] p.85); infine la topologia di C([−L/2, L/2]) `e pi` u forte di quella di L2 ([−L/2, L/2], dx), va2 lendo (f|f) ≤ L sup |f| = L(sup |f|)2 se f ∈ C([−L/2, L/2]). Ne consegue che S `e denso in L2 ([−L/2, L/2], dx). Per (e) del teorema 3.27, i vettori fn costituiscono una base hilbertiana di L2 ([−L/2, L/2], dx), che di conseguenza risulta anche essere separabile. (2) Consideriamo lo spazio di Hilbert L2 ([0, 1], dx), dove dx `e la misura di Lebesgue. Come nell’esempio precedente l’algebra di Banach C([0, 1]) `e sottospazio denso in L2 ([0, 1], dx) nella topologia di quest’ultimo. Definiamo ora, diversamente dall’esempio precedente, per n = 0, 1, 2, . . ., x ∈ [0, 1]: gn (x) := xn .
(3.28)
Si dimostra subito che i vettori scritti sopra sono linearmente indipendenti. Il sottospazio vettoriale S di C([0, 1]) generato da tutti i vettori gn , n ∈ N, `e una sottoalgebra di C([0, 1]). S contiene 1, `e chiusa rispetto alla coniugazione complessa e separa i punti, per cui, per il teorema 2.40 di Stone-Weierstrass, `e densa in C([0, 1]) e anche in L2 ([0, 1], dx), ragionando come nell’esempio precedente. La differenza dal caso precedente `e che ora che le funzioni gn non costituiscono un insieme ortonormale. Tuttavia, usando la proposizione 3.32 si costruisce immediatamente un sistema ortonormale completo per L2 ([0, 1], dx). Gli elementi di tale base hilbertiana si chiamano i polinomi di Legendre.
3.2 Basi hilbertiane
109
(3) I due esempi precedenti esibiscono due spazi L2 separabili. Si pu` o provare che Lp (X, μ) (1 ≤ p < +∞) `e separabile se e solo se la misura μ `e separabile nel senso che segue. Si consideri lo spazio metrico (definizione 2.88) costruito sul sottoinsieme della σ-algebra Σ della misura μ contenente insiemi di misura finita, prendendo il quoziente rispetto alla relazione di equivalenza che identifica insiemi che differiscono per insiemi di misura nulla, e infine definendo la distanza come: d(A, B) := μ((A \ B) ∪ (B \ A)) . La misura μ `e detta separabile se lo spazio metrico suddetto ammette un sottoinsieme denso e numerabile. A tal fine vale la seguente proposizione sulle misure separabili [Hal69]. Proposizione 3.34. (Su misure e spazi Lp separabili.) Una misura positiva σ-additiva μ, e quindi Lp (X, μ), `e separabile se μ `e σ-finita (cio`e X `e unione numerabile di insiemi di misura finita) ed esiste una classe al pi` u numerabile di insiemi misurabili la σ-algebra generata dai quali coincide con quella della misura μ. Si osservi che, di conseguenza, vale come corollario la seguente proposizione. Proposizione 3.35. (Su misure di Borel e spazi Lp separabili.) Ogni misura di Borel σ-finita riferita ad uno spazio topologico a base numerabile produce spazi Lp separabili. In particolare questo accade per la misura di Lebesgue su Rn ristretta ai boreliani e quindi anche per gli Lp riferiti alla misura di Lebesgue stessa, dato che tali spazi Lp sono isomorfi, come spazi di Banach, ai corrispondenti ottenuti dalla misura ristretta alla σ-algebra di Borel (le eventuali funzioni misurabili aggiunte cadono nella classe di equivalenza della funzione nulla). Le misure di Borel positive σ-additive definite su spazi di Hausdorff localmente compatti si chiamano misure di Radon se sono regolari e i compatti hanno misura finita. Una misura di Radon `e σ-finita se lo spazio su cui `e definita `e σ-compatto, cio`e unione numerabile di compatti. (4) Consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione dopo avere introdotto la trasformata di Fourier e Fourier-Plancherel (proposizione 3.78): Sia f : (a, b) → C misurabile tale che (1) l’insieme {x ∈ (a, b) | f(x) = 0} ha misura nulla, (2) esistono C, δ > 0 per cui |f(x)| < Ce−δ|x| per ogni x ∈ (a, b). In questo caso lo spazio lineare finitamente generato da tutte le funzioni x → xn f(x) per n = 0, 1, 2, . . . `e denso in L2 ((a, b), dx). L’importanza di questo risultato `e che consente di costruire facilmente delle basi hilbertiane in L2 ((a, b), dx) anche se a o b sono infiniti (per cui non `e possibile usare il teorema 2.40 di Stone-Weierstrass). Infatti, la procedura di ortogonalizzazione di Gramm-Schmidt applicata ai vettori fn , con
110
3 Spazi di Hilbert e operatori limitati
fn (x) := xn f(x), fornisce una base hilbertiana, secondo la procedura illustrata in proposizione 3.32. 2 A titolo di esempio, se f(x) := e−x /2 , la procedura di Gramm-Schmidt 2 definisce la base hilbertiana di L (R, dx) delle cosiddette funzioni di Her2 mite, che hanno tutte la forma ψn (x) := Hn (x)e−x /2 dove Hn `e un polinomio di grado n = 0, 1, 2, . . . chiamato n-esimo polinomio di Hermite. Nella Meccanica Quantistica questa base hilbertiana `e importante quando si studia il sistema fisico detto oscillatore armonico unidimensionale. Il calcolo 2 diretto con procedura di Gramm-Schmidt mostra che ψ0 = π −1/4 e−x /2 e i successivi elementi sono individuati dalla la relazione di ricorrenza ψn+1 = d (2(n + 1))−1/2 (x − dx )ψn . Con la stessa procedura ed usando f(x) := e−x si trova una base hilbertiana di L2 ((0, +∞), dx) data dalle cosiddette funzioni di Laguerre, che sono della forma e−x Ln (x) con n = 0, 1, . . .. Ogni polinomio Ln `e di grado n e si dice n-esimo polinomio di Laguerre. In Meccanica Quantistica questa base hilbertiana `e importante quando si lavora con sistemi fisici con simmetria sferica, come l’atomo di idrogeno. (5) Consideriamo lo spazio di Hilbert separabile L2 (Rn , dx) (dove dx deno` un fatto noto [Vla81] ta la solita misura di Lebesgue sui boreliani di Rn ). E che gli spazi di funzioni su Rn infinitamente differenziabili, a valori reali (o complessi) e, rispettivamente, a supporto compatto oppure che decrescono all’infinito pi` u rapidamente di ogni potenza negativa di |x|, sono sottospazi di Lp (Rn , dx), (1 ≤ p < ∞) densi in questi spazi. Consegue immediatamente da (b) di proposizione 3.32 che tali sottospazi contengono basi hilbertiane di L2 (Rn , dx). (6) Costruiremo ora il cosiddetto spazio di Bargmann-Hilbert, anche noto come spazio di Bargmann-Fock. Si tratta di uno spazio di Hilbert che ha diverse applicazioni in meccanica quantistica ed in teoria quantistica dei campi. Consideriamo la seguente misura positiva σ-additiva definita sui boreliani E ⊂ C, e dove χE indica la funzione caratteristica di E (cio`e χE (z) = 1 se z ∈ E e χE (z) = 0 se z ∈ E): 2 1 μ(E) := χX (z)e−|z| dzdz . π C Sopra, come usuale in questo formalismo, abbiamo indicato con dzdz la misura di Lebesgue di R2 identificato con C. Una funzione f : C → C `e detta essere intera se `e ovunque olomorfa su C. Indichiamo con H(C) lo spazio delle funzioni intere. Andiamo ora a considerare il sottospazio vettoriale di L2 (C, μ) dato dall’intersezione L2 (C, μ) ∩ H(C) (dove gli elementi di H(C) sono qui usati per rappresentare le corrispondenti classi di equivalenza di funzioni, come `e appropriato nella definizione degli spazi Lp ). Non `e affatto ovvio che L2 (C, μ) ∩ H(C) sia un sottospazio chiuso di L2 (C, μ), perch´e non `e per nulla evidente che il limite, nel senso di L2 (C, μ), di una successione di funzioni
3.2 Basi hilbertiane
111
intere converga ad una funzione (che coincida, a meno di insiemi di misura nulla con una funzione) intera. Bargmann `e riuscito tuttavia a dimostrare [Bar61] che: se f ∈ H(C), allora: dove: fn =
C
√ n!an
|f(z)|2 dμ(z) =
+∞
|fn |2 ≤ +∞
(3.29)
n=0
con f(z) =
+∞
an z n .
(3.30)
n=0
Lo sviluppo in potenze nella (3.30) non `e altro che lo sviluppo di Taylor della funzione f, convergente assolutamente per ogni z ∈ C ed uniformemente su ogni compatto di C, e che esiste per il solo fatto che f `e intera. Si osservi che (3.29) stabilisce in particolare che la serie di termini non negativi a secondo membro converge se e solo se l’integrale della funzione non negativa a primo membro converge. Quindi f, g ∈ L2 (C, μ) ∩ H(C) se e solo se, con ovvie notazioni (vedi anche (7) in esempi 2.39 per 2 (N)) {fn }n∈N, {gn }n=1,2... ∈ 2 (N), e in tal caso, usando l’identit` a di polarizzazione (3.4) e la (3.29), risulta: f(z)g(z)dμ(z) = C
+∞
fn gn .
(3.31)
n=0
Con le notazioni di (3.30), consideriamo allora l’applicazione: J : L2 (C, μ) ∩ H(C) f → {fn }n∈N ∈ 2 (N) . Questa trasformazione lineare isometrica (e quindi iniettiva) `e in realt`a anche 2n suriettiva. Infatti, tenendo conto del fatto che la serie n∈N |z| (n!)2 converge per ogni z ∈ C, la disuguaglianza di Cauchy-Schwarz implica immediatamente che, se {cn }n∈N ∈ 2 (N), allora la serie: cn z n √ √ =: f(z) n! n! n∈N converge assolutamente per ogni z ∈ C, definendo una funzione intera f e, per costruzione, J(f) = {cn }n∈N. Essendo 2 (N) completo concludiamo che: (a) lo spazio vettoriale complesso B1 := L2 (C, μ) ∩ H(C) `e uno spazio di Hilbert, in altre parole `e un sottospazio chiuso di L2 (C, μ), (b) tale spazio di Hilbert `e isomorfo a 2 (N) (quindi in particolare `e separabile) secondo J, (c) l’insieme di funzioni intere {un }n∈N , con: zn un (z) = √ n!
per ogni z ∈ C e con n ∈ N
(3.32)
112
3 Spazi di Hilbert e operatori limitati
`e una base hilbertiana dello spazio di Hilbert B1 . Tale spazio di Hilbert `e detto spazio di Bargmann-Hilbert o di Bargmann-Fock. Per concludere possiamo osservare che tutte le costruzioni hanno una diretta generalizzazione al caso in cui si considerano n copie di C e quindi si lavora con lo spazio di Bargmann n-dimensionale Bn := L2 (Cn , dμn ) ∩ H(Cn ), dove, per ogni boreliano E ∈ Cn : n 2 1 χX (z)e− k=1 |zk | dz1 dz1 ⊗ · · · ⊗ dzn dzn , μn (E) := n π Cn e H(Cn ) `e lo spazio delle funzioni olomorfe in n variabili su tutto Cn e l’integrale `e calcolato rispetto alla misura prodotto delle varie misure μ su ciascuna copia di C.
3.3 Nozione di aggiunto hermitiano e applicazioni Esaminiamo ora una delle pi` u importanti nozioni della teoria degli operatori in uno spazio di Hilbert che discende dal teorema 3.17 di Riesz: la nozione di operatore aggiunto (hermitiano). Dobbiamo precisare che la nozione di operatore aggiunto si pu` o estendere al caso di operatori non limitati. In questa sezione considereremo solo il caso di operatori limitati. Il caso generale sar` a estensivamente trattato in un prossimo capitolo. Val la pena di precisare che una (collegata) nozione di operatore aggiunto (o operatore coniugato) `e stata data nella definizione 2.55, senza usare la struttura di spazio di Hilbert. Nel seguito non faremo pi` u uso tale nozione non hilbertiana, eccetto che in qualche osservazione. 3.3.1 L’operazione di coniugazione hermitiana o aggiunzione Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Consideriamo, per u ∈ H2 fissato, l’applicazione: H1 v → (u|T v)2 ∈ C .
(3.33)
L’applicazione di sopra `e sicuramente lineare ed anche limitata: |(u|T v)2 | ≤ ||u||2 ||T v||2 ≤ ||u||2 ||T || ||v||1 . Si tratta dunque di un elemento di H1 . Per il teorema 3.17 di Riesz, esister`a wT ,u ∈ H1 tale che (u|T v)2 = (wT ,u |v)1 ,
per ogni v ∈ H1 .
(3.34)
Possiamo ancora notare che l’applicazione H2 u → wT ,u ∈ H1 `e lineare. Infatti: (wT ,αu+βu |v)1 = (αu+βu |T v)2 = α(u|T v)2 +β(u |T v)2 = (αwT ,u +βwT ,u |v)1 ,
3.3 Nozione di aggiunto hermitiano e applicazioni
113
per cui, per ogni v ∈ H, 0 = (wT ,αu+βu − αwT ,u − βwT ,u |v)1 ; scegliendo v := wT ,αu+βu − αwT ,u − βwT ,u , si ha che deve essere wT ,αu+βu − αwT ,u − βwT ,u = 0 e quindi wT ,αu+βu = αwT ,u + βwT ,u per ogni α, β ∈ C e u, u ∈ H2 . Quindi esiste un operatore lineare: T ∗ : H2 u → wT ,u ∈ H1 . Per costruzione, questo operatore soddisfa (u|T v)2 = (T ∗ u|v)1 per ogni coppia u ∈ H2 , v ∈ H1 ed `e l’unico operatore lineare a soddisfare questa identit` a. Se ci fosse un altro operatore B ∈ L(H2 , H1 ) che soddisfa l’identit` a detta, varrebbe anche (T ∗ u|v)1 = (Bu|v)1 per ogni v ∈ H1 . Di conseguenza avremmo che ((T ∗ − B)u|v)1 = 0 per ogni v ∈ H1 . Scegliendo v := (T ∗ − B)u si ha che deve essere ||(T ∗ − B)u||21 = 0 e quindi T ∗ u − Bu = 0. Dato che u ∈ H2 `e arbitrario, deve infine valere T ∗ = B. Abbiamo in definitiva provato che vale la proposizione seguente. Proposizione 3.36. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Esiste ed `e unico un operatore lineare T ∗ : H2 → H1 tale che: (u|T v)2 = (T ∗ u|v)1 ,
per ogni coppia u ∈ H2 , v ∈ H1 .
(3.35)
Possiamo ora dare la definizione di operatore aggiunto hermitiano. Nel seguito ometteremo l’aggettivo “hermitiano”, dato che in questo testo non lavoreremo mai con operatori aggiunti non hermitiani, come precisato sopra. Definizione 3.37. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). L’unico operatore lineare T ∗ ∈ L(H2 , H1 ) che soddisfa (3.35) si chiama aggiunto (hermitiano), o anche coniugato hermitiano, dell’operatore T . Ricordiamo che dato un operatore lineare tra due spazi vettoriali, T : X → Y, Ran(T ) := {T (x) | x ∈ X} e Ker(T ) := {x ∈ X | T (x) = 0} indicano, rispettivamente, i sottospazi di Y e X detti rango (o immagine) dell’operatore T e nucleo dell’operatore T . L’operazione di coniugazione hermitiana gode delle seguenti propriet` a elementari. Proposizione 3.38. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) due spazi di Hilbert e T ∈ B(H1 , H2 ). Valgono i seguenti fatti. (a) T ∗ ∈ B(H2 , H1 ) e pi` u precisamente: ||T ∗|| = ||T || , ||T ∗T || = ||T ||2 = ||T T ∗|| .
(3.36) (3.37)
114
3 Spazi di Hilbert e operatori limitati
(b) L’operazione di coniugazione hermitiana `e involutiva: (T ∗ )∗ = T . (c) Se, rispettivamente, S ∈ B(H1 , H2 ) e α, β ∈ C, oppure S ∈ B(H1 , H), con H spazio di Hilbert, valgono le identit` a: (αT + βS)∗ = αT ∗ + βS ∗ , ∗
∗
∗
(T S) = S T .
(3.38) (3.39)
(d) Vale: Ker(T ) = [Ran(T ∗ )]⊥ ,
Ker(T ∗ ) = [Ran(T )]⊥ .
(3.40)
(e) T `e biettivo se e solo se T ∗ `e biettivo. In tal caso vale: (T ∗ )−1 = (T −1 )∗ . Dimostrazione. D’ora in poi scriveremo, per esempio, || || indifferentemente per || ||1 e || ||2 ed useremo la stessa notazione semplificata per i prodotti scalari. Quale sia la norma o prodotto scalare in uso sar` a chiaro dal contesto. (a) Per ogni coppia u ∈ H2 , x ∈ H1 vale |(T ∗u|x)| = |(u|T x)| ≤ ||u|| ||T || ||x||. Scegliendo x := T ∗ u si ha in particolare ||T ∗u||2 ≤ ||T || ||u|| ||T ∗u|| e quindi ||T ∗u|| ≤ ||T || ||u||. Quindi T ∗ `e limitato e ||T ∗|| ≤ ||T ||. Ha senso quindi definire (T ∗ )∗ ed ottenere ||(T ∗ )∗ || ≤ ||T ∗||. Questa disuguaglianza si pu` o riscrivere ||T || ≤ ||T ∗|| per (b), la cui dimostrazione usa solo il fatto che T ∗ sia limitato. Valendo ||T ∗|| ≤ ||T || e ||T || ≤ ||T ∗ ||, vale (3.36). Passiamo ` sufficiente dimostrare la prima delle due identit` a dimostrare (3.37). E a, la seconda segue dalla prima e da (3.36). Notiamo che, per (b)(i) del teorema 2.54, la cui tesi vale banalmente anche per operatori S ∈ B(Y, X), T ∈ B(Z, Y) con X, Y, Z spazi normati, ||T ∗T || ≤ ||T ∗|| ||T || = ||T ||2. D’altra parte: ||T ||2 = ( sup ||T x||)2 = sup ||T x||2 = sup (T x|T x) . ||x||≤1
||x||≤1
||x||≤1
Usando la definizione di aggiunto e poi la disuguaglianza di Cauchy-Schwarz sull’ultimo termine della catena di uguaglianze scritte sopra, troviamo che : ||T ||2 = sup (T x|T x) = sup |(T ∗ T x|x)| ≤ sup ||T ∗T x|| = ||T ∗T || . ||x||≤1
||x||≤1
||x||≤1
In definitiva abbiamo ottenuto che ||T ∗ T || ≤ ||T ||2 e ||T ||2 ≤ ||T ∗T ||, per cui vale ||T ∗T || = ||T ||2. (b) La prova segue immediatamente dall’unicit` a dell’operatore aggiunto, valendo, per le note propriet` a del prodotto scalare e per la stessa definizione di operatore aggiunto dell’operatore T : (v|T ∗ u) = (T ∗ u|v) = (u|T v) = (T v|u) . (c) Se u ∈ H2 , v ∈ H1 (u|(αT + βS)v) = α(u|T v) + β(u|Sv) = α(T ∗ u|v) + β(S ∗ u|v)
3.3 Nozione di aggiunto hermitiano e applicazioni
115
= ((αT ∗ + βS ∗ )u|v) . Per l’unicit` a dell’operatore aggiunto vale (3.38). Se v ∈ H, u ∈ H2 (u|(T S)v) = (T ∗ u|Sv) = ((S ∗ T ∗ )u|v) . Per l’unicit` a dell’operatore aggiunto vale (3.39). ` sufficiente provare la prima delle due identit`a, la seconda segue subito (d) E dalla prima usando (b). Dato che (T ∗ u|v) = (u|T v), se v ∈ Ker(T ) allora (T ∗ u|v) = 0 per ogni u ∈ H2 e quindi v ∈ [Ran(T ∗ )]⊥. Viceversa, sempre per (T ∗ u|v) = (u|T v), se v ∈ [Ran(T ∗)]⊥ , allora (u|T v) = 0 per ogni u ∈ H2 . Scegliendo u := T v segue che T v = 0 e quindi v ∈ Ker(T ). (e) Se T `e biettivo allora T −1 `e limitato per il teorema di Banach dell’operatore inverso. Di conseguenza esiste (T −1 )∗ . Vale: T −1 T = T T −1 = I. Calcolando l’aggiunto ad ambo membri, usando la seconda propriet` a in (c) e tenendo conto che I ∗ = I, abbiamo: T ∗ (T −1 )∗ = (T −1 )∗ T ∗ = I. Queste identit` a sono equivalenti a dire che T ∗ `e biettivo e che (T ∗ )−1 = (T −1 )∗ . Infine, se T ∗ `e biettivo, allora, per quanto appena provato, lo deve essere anche (T ∗ )∗ = T per (b). Osservazione 3.39. Il legame tra la nozione di aggiunto hermitiano e la nozione di operatore coniugato vista nella definizione 2.55 si ottiene nel modo che segue dalle definizioni date. Partendo da T ∈ B(H1 , H2 ) e calcolando l’operatore coniugato T ∈ B(H2 , H1 ) e l’operatore aggiunto T ∗ ∈ B(H2 , H1 ) deve valere: (T ∗ yf |x)1 = (yf |T x)2 = (T f)(x)
per ogni f ∈ H2 e ogni x ∈ H1 ,
dove f ∈ H2 e yf ∈ H2 `e l’elemento di H2 che corrisponde a f secondo il teorema 3.17 di Riesz. Per l’arbitrariet`a di x ∈ H1 possiamo allora scrivere che: T f = (T ∗ yf | )1 per ogni f ∈ H2 . (3.41) Si noti che, dato che la mappa di Riesz H2 f → yf ∈ H2 `e biettiva, la relazione scritta sopra individua completamente T quando `e assegnato T ∗ e viceversa. 3.3.2
∗
-algebre e C ∗ -algebre
L’operazione di coniugazione hermitiana consente di introdurre uno dei concetti matematici pi` u utili nelle formulazioni avanzate della Meccanica Quantistica: stiamo parlando della la struttura di C ∗ -algebra (anche detta B ∗ algebra). Torneremo ad usare tale struttura nel capitolo 8 in relazione al teorema di decomposizione spettrale. Definizione 3.40. Sia A un’algebra (commutativa, con unit` a, normata con norma || ||, di Banach) sul campo C. Se esiste un’applicazione ∗ : A → A che gode delle seguenti propriet` a:
116
3 Spazi di Hilbert e operatori limitati
I1. (antilinearit` a) (αx + βy)∗ = αx∗ + βy∗ per ogni x, y ∈ A, α, β ∈ C, I2. (involutivit` a) (x∗ )∗ = x per ogni x ∈ A, ∗ ∗ ∗ I3. (xy) = y x per ogni x, y ∈ A, tale applicazione `e detta involuzione e la struttura (A,∗ ) si dice ∗ -algebra (rispettivamente commutativa, con unit` a, normata, di Banach). Una ∗ -algebra di Banach (con unit` a) si dice C ∗ -algebra (rispettivamente con unit` a) se vale la ulteriore propriet` a: ||x∗x|| = ||x||2 .
(3.42)
Un omomorfismo tra due ∗ -algebre: f : A1 → A2 `e detto ∗ -omomorfismo se preserva l’involuzione: f(x∗1 ) = f(x)∗2 per ogni x ∈ A1 (dove ∗1 indica l’involuzione in A1 e ∗2 indica l’involuzione in A2 ), uno ∗ -omomorfismo `e detto ∗ -isomorfismo se `e anche biettivo. Un elemento x di una ∗ -algebra A `e detto: (i) normale se xx∗ = x∗ x, (ii) hermitiano o autoaggiunto se x∗ = x. u ovvia: si La nozione di sotto ∗ -algebra di una ∗ -algebra A `e quella pi` tratta di una sotto algebra che `e ancora ∗ -algebra rispetto alla restrizione dell’involuzione su di essa. Prima di tornare a B(H) (per provare che `e una C ∗ − algebra), diamo alcune immediate propriet` a generali delle ∗ -algebre che seguono dalla stessa definizione. Proposizione 3.41. Sia A una ∗ -algebra. Indicando con ∗ l’involuzione in A, vale quanto segue. (a) Se A `e C ∗-algebra con norma || || e x ∈ A `e normale, allora, per ogni m = 1, 2, . . .: ||xm || = ||x||m . (b) Se A `e C ∗ -algebra con norma || || e x ∈ A, allora ||x∗|| = ||x|| . (c) Se A ammette unit` a I, vale I∗ = I. Inoltre, x ∈ A ammette inverso se e ∗ solo se x ammette inverso ed, in tal caso, vale (x−1 )∗ = (x∗ )−1 . Dimostrazione. (a) Se ||x|| = 0 la tesi `e ovvia. Supponiamo x = 0. Usando ripetutamente (3.42), I2 e I3 e il fatto che xx∗ = x∗ x: ||x2||2 = ||(x2 )∗ x2 || = ||(x∗)2 x2 || = ||(x∗x)∗ (x∗x)|| = ||x∗x||2 = (||x||2)2 da cui ||x2 || = ||x||2 per la positivit` a della norma. Iterando la procedura si k k prova che ||x2 || = ||x||2 per ogni naturale k. Se m = 3, 4, . . . esistono due naturali n, k tali che m + n = 2k . In questo modo: ||x||m||x||n = ||x||n+m = ||xn+m|| ≤ ||xm|| ||xn || ≤ ||xm|| ||x||n ≤ ||x||m||x||n .
3.3 Nozione di aggiunto hermitiano e applicazioni
117
Ma allora tutte le disuguaglianze devono essere uguaglianze, in particolare: ||xm|| ||x||n = ||x||m||x||n e pertanto, dividendo per ||x||m (che `e non nullo perch´e x = 0 e || · || `e una norma) si ha la tesi. (b) (3.42) implica che ||x||2 = ||xx∗|| ≤ ||x|| ||x∗|| da cui ||x|| ≤ ||x∗||. Nello stesso modo ||x∗|| ≤ ||(x∗)∗ ||, ma (x∗ )∗ = x da cui la tesi. (c) II∗ = I∗ (1) per definizione di unit` a; d’altra parte II∗ = (I∗ )∗ I∗ = (I∗ I)∗ ∗ ∗ ∗ (2). Da (1) e (2) segue che I = (I I) = (I∗ )∗ = I. La seconda affermazione segue immediatamente da quanto appena provato, da I2 e dall’unicit` a dell’inverso. Esempi 3.42. (1) Le algebre di Banach di funzioni a valori complessi viste in (2),(3),(4),(8) e (9) in esempi 2.39 sono tutte C ∗ -algebre commutative in cui l’involuzione `e data dalla coniugazione complessa delle funzioni. (2) Abbiamo immediatamente che, in virt` u di (a), (b) e (c) in proposizione 3.38 vale il seguente risultato. Teorema 3.43. Se H `e spazio di Hilbert, B(H) una C ∗ -algebra con unit` a se l’involuzione `e definita come la coniugazione hermitiana. (3) Un esempio di C ∗ -algebra, fondamentale per le applicazioni di teoria quantistica dei campi (ma non solo) `e l’algebra di von Neumann che andiamo a definire in alcuni passi, dopo aver introdotto la nozione di commutate di un’algebra di operatori e dopo aver enunciato un importante teorema necessario per enunciare la definizione. Se M ⊂ B(H) `e un sottoinsieme dell’algebra degli operatori limitati sullo spazio di Hilbert complesso B(H), il commutante di M `e definito come: M := {T ∈ B(H) | T A − AT = 0
per ogni A ∈ M} .
Se M `e chiuso sotto l’operazione di coniugazione hermitiana (cio`e A∗ ∈ M se A ∈ M) il commutante M `e sicuramente una ∗-algebra con unit` a. Nel caso generale vale: M1 ⊂ M2 se M2 ⊂ M1 e anche M ⊂ (M ) , che implicano M = ((M ) ) , per cui iterando l’operazione di calcolo del commutate non si supera il secondo commutante. Dalla continuit` a del prodotto operatoriale, segue che il commutante M `e chiuso nella topologia uniforme e quindi, se M `e chiuso rispetto alla coniugazione hermitiana, il suo commutante M `e una C ∗ -algebra (sotto C ∗-algebra) di B(H). M ha altre fondamentali propriet` a topologiche nel caso generale. Si dimostra facilmente che M `e chiuso rispetto alla topologia operatoriale forte e rispetto alla topologia operatoriale debole. Il risultato vale indipendentemente dal fatto che il prodotto di operatori non `e congiuntamente continuo nei due argomenti, dato che `e sufficiente la continuit`a separatamente nei due argomenti.
118
3 Spazi di Hilbert e operatori limitati
Nel seguito, come di consuetudine nella teoria della algebre di von Neumann, scriveremo M al posto di (M ) e via di seguito. Vale il seguente fondamentale teorema dovuto a von Neumann, detto [BrRo02]. Teorema 3.44. (Del doppio commutante.) Se A `e una sotto ∗ -algebra di B(H), con H spazio di Hilbert complesso, i seguenti fatti sono equivalenti. (a) A = A . (b) A `e chiusa rispetto alla topologia operatoriale debole e I ∈ A. (c) A `e chiusa rispetto alla topologia operatoriale forte e I ∈ A. Che (a) implichi (b) che, a sua volta, implichi (c) `e abbastanza facile da provare. Il punto difficile `e dimostrare che (c) implichi (a). Siamo ora in grado di dare la definizione di algebra di von Neumann. Definizione 3.45. Un’algebra di von Neumann in B(H) `e una sotto ∗algebra di B(H) che soddisfi le propriet` a equivalenti del teorema 3.44 di von Neumann. In particolare M `e sempre un’algebra di von Neumann se M `e un sottoinsieme di B(H), valendo (M ) = M come visto sopra. Si osservi anche che, per costruzione, un’algebra di von Neumann in B(H) `e una C ∗ -algebra, pi` u precisamente una sotto C ∗-algebra di B(H). Si verifica subito che l’intersezione di due algebre di von Neumann `e ancora un’algebra di von Neumann. Se M ⊂ B(H), M risulta essere la pi` u piccola (nel senso dell’intersezione) algebra di von Neumann che include M come sottoinsieme [BrRo02]. Pertanto M si chiama algebra di von Neumann generata da M. 3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi Tornando alla C ∗ -algebra B(H) (ma anche pi` u in generale a B(H, H1 )), possiamo dare alcune definizioni riguardanti i pi` u importanti tipi di operatori che ritorneranno ricorrentemente in uso nei prossimi capitoli. Definizione 3.46. Siano (H, ( | )) e (H1 , ( | )1 ) spazi di Hilbert e si denotino con IH e IH1 , rispettivamente, gli operatori identit` a su H e H1 . (a) T ∈ B(H) `e detto normale se T T ∗ = T ∗ T . (b) T ∈ B(H) `e detto autoaggiunto se T = T ∗ . (c) T ∈ L(H, H1 ) `e detto isometrico se `e limitato e T ∗ T = IH ; equivalentemente T ∈ L(H, H1 ) `e isometrico se (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H. (d) T ∈ L(H, H1 ) `e detto unitario se `e limitato e T ∗ T = IH , T T ∗ = IH1 ; equivalentemente T ∈ L(H, H1 ) `e unitario se `e isometrico e suriettivo, cio`e `e un isomorfismo di spazi di Hilbert. (e) T ∈ L(H) `e detto positivo, e si scrive T ≥ 0, se (u|T u) ≥ 0 per ogni u ∈ H. (f ) Se U ∈ L(H), si dice che T maggiora U , e si scrive T ≥ U , se T −U ≥ 0.
3.3 Nozione di aggiunto hermitiano e applicazioni
119
Osservazioni 3.47. (1) Si osservi, a commento dell’equivalenza enunciata in (c), che se T ∈ B(H, H1 ) e T ∗ T = IH , allora vale (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H in quanto (x|y) = (x|T ∗T y) = (T x|T y)1 . Viceversa, se T ∈ L(H, H1 ) e vale (T x|T y)1 = (x|y) per ogni x, y ∈ H, allora T `e limitato (basta porre y = x) e dunque esiste T ∗ ; infine vale T ∗ T = IH perch´e (x|T ∗T y) = (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H e quindi in particolare (x|(T ∗ T − I)y) = 0 con x = (T ∗ T − I)y. A commento dell’equivalenza enunciata in (d), si osservi che ogni operatore isometrico T `e ovviamente iniettivo, perch´e T u = 0 implica ||u|| = 0 e quindi u = 0. Allora la suriettivit` a `e equivalente all’esistenza di un’inversa destra che coincida con quella sinistra, che esiste gi`a per l’iniettivit`a ed `e T ∗ . Da ci` o segue immediatamente che T ∗ T = IH e T T ∗ = IH1 insieme sono equivalenti a dire che T ∈ L(H, H1 ) `e isometrico (e quindi limitato) ed `e anche suriettivo. (La definizione data qui di operatore unitario `e quindi in accordo con la definizione 3.10). (2) Esistono operatori isometrici in B(H) che non sono operatori unitari (ovviamente ci`o non accade se H ha dimensione finita). Un esempio `e l’operatore sullo spazio 2 (N): A : (z0 , z1 , z2 , . . .) → (0, z0 , z1 , , . . .) , per ogni (z0 , z1 , z2 , . . .) ∈ 2 (N). (3) Gli operatori unitari in B(H) e quelli autoaggiunti sono operatori normali, ma non vale il viceversa in generale. Per concludere questa sezione, restringendoci a lavorare con un unico spazio di Hilbert, diamo alcune propriet` a elementari degli operatori normali, autoaggiunti, unitari e positivi nella seguente proposizione preceduta da una definizione che riportiamo bench´e dovrebbe essere gi`a nota dai corsi elementari. Definizione 3.48. Siano X spazio vettoriale sul campo K = C oppure R, e T ∈ L(X); λ ∈ K `e detto autovalore dell’operatore T se: T u = λu
(3.43)
per qualche u ∈ X\{0}. In tal caso u `e detto autovettore di T con autovalore λ (o associato all’autovalore λ). Il sottospazio di X, che contiene il vettore nullo e tutti gli autovettori con autovalore λ, `e detto autospazio di T con autovalore λ (o associato all’autovalore λ). Ecco ora la proposizione preannunciata. Proposizione 3.49. Sia (H, ( | )) spazio di Hilbert. (a) Se T ∈ B(H) `e autoaggiunto, allora: ||T || = sup {|(x|T x)| | x ∈ H , ||x|| = 1} .
(3.44)
120
3 Spazi di Hilbert e operatori limitati
Pi` u in generale, se T ∈ L(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H ed il secondo membro di (3.44) `e finito, allora T `e limitato. (b) Se T ∈ B(H) `e normale (e quindi in particolare autoaggiunto oppure unitario): (i) λ ∈ C `e autovalore di T con autovettore u se e solo se λ `e autovalore per T ∗ con lo stesso autovettore u; (ii) autospazi di T con autovalori distinti sono ortogonali. (c) Sia T ∈ L(H). Valgono i seguenti fatti: (i) se T `e positivo, i suoi possibili autovalori sono reali non negativi; (ii) se T `e limitato ed autoaggiunto, i suoi possibili autovalori sono reali; (iii) se T `e isometrico (ed in particolare unitario), i suoi possibili autovalori sono complessi con modulo uguale a 1. (d) Se T ∈ L(H) soddisfa (y|T x) = (T y|x) per ogni coppia x, y ∈ H, allora T `e limitato ed `e autoaggiunto. (e) Se T ∈ B(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H, allora T `e autoaggiunto. (f ) Se T ∈ B(H) `e positivo, allora `e autoaggiunto. (g) ≥ `e una relazione di ordine parziale in L(H) (e quindi anche in B(H)). Dimostrazione. (a) Posto Q := sup {|(x|T x)| | x ∈ H , ||x|| = 1}, dato che ||x|| = 1, |(x|T x)| ≤ ||T x||||x|| ≤ ||T x|| ≤ ||T || . Quindi: Q ≤ ||T ||. Per concludere, `e sufficiente provare che ||T || ≤ Q. Vale l’identit` a di immediata verifica: 4(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) − i(x + iy|T (x + iy)) + i(x − iy|T (x − iy)) . a e tenendo conto del fatto che (z|T z) = (T z|z) = (z|T z), si Da tale identit` ricava che 4Re(x|T y) = 2(x|T y) + 2(x|T y) pu` o essere scritto: 4Re(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) ≤ Q||x + y||2 + Q||x − y||2 = 2Q||x||2 + 2Q||y||2 . Abbiamo provato che: 4Re(x|T y) ≤ 2Q||x||2 + 2Q||y||2 . Sia y ∈ H con ||y|| = 1. Se T y = 0, allora `e ovvio che ||T y|| ≤ Q; altrimenti definiamo x := T y/||T y|| e otteniamo dalla disuguaglianza provata sopra: 4||T y|| = 4Re(x|T y) ≤ 2Q(||x||2 + ||y||2 ) = 2Q(1 + 1) = 4Q da cui, ancora, ||T y|| ≤ Q. In definitiva ||T y|| ≤ Q se ||y|| = 1 e quindi ||T || = sup{||T y|| | y ∈ H , ||y|| = 1} ≤ Q .
3.3 Nozione di aggiunto hermitiano e applicazioni
121
La seconda proposizione segue dalla seconda parte della dimostrazione di sopra (||T || ≤ Q). (b)(i) Se A `e normale ||Au||2 = (Au|Au)2 = (A∗ Au|u) = (AA∗ u|u) = (A∗ u|A∗ u) = ||A∗u||2 . Se T `e normale, T − λI `e normale con aggiunto T ∗ − λI, per cui applicando il risultato di sopra, ||T u − λu||2 = ||T ∗u − λu||2 . La tesi segue immediatamente. (ii) Sia u autovettore di T con autovalore λ e v autovettore di T con autovalore μ. Per (i), λ(v|u) = (v|T u) = (T ∗ v|u) = (μv|u) = μ(v|u) per cui (λ−μ)(v|u) = 0. Essendo λ = μ, deve essere (v|u) = 0. (c) Se T ≥ 0 e T u = λu con u = 0, allora 0 ≤ (u|T u) = λ(u|u); essendo (u|u) > 0, segue che deve essere λ ≥ 0. Sia poi T = T ∗ e T u = λu con u = 0: allora λ(u|u) = (u|T u) = (T u|u) = λ(u|u). Essendo (u|u) = 0, si ha λ = λ ossia λ ∈ R. Se invece T `e isometrico: (u|u) = (T u|T u) = |λ|2 (u|u). Essendo u = 0, si ha che |λ| = 1. (d) La tesi si prova dimostrando che T `e limitato. L’unicit` a dell’aggiunto implica allora che T = T ∗ in quanto (y|T x) = (T y|x) per ogni coppia x, y ∈ H. A causa del teorema 2.104 del grafico chiuso, per dimostrare che T `e limitato `e sufficiente provare che T `e chiuso. Sia allora {xn }n∈N ⊂ H una successione convergente a x e supponiamo che i vettori T xn definiscano una successione convergente: dobbiamo mostrare che T xn → T x. Nelle nostre ipotesi, fissato y ∈ H, si ha: (y|T xn ) = (T y|xn ) → (T y|x) = (y|T x) . Per la continuit` a del prodotto scalare e tenendo conto per ipotesi limn→+∞ T xn esiste, possiamo allora scrivere:
y lim (T x − T xn ) = 0 . n→+∞
Dato che y `e arbitrario, scegliendo proprio y := limn→+∞ (T x − T xn ) concludiamo che limn→+∞ (T x − T xn ) = 0. (e) e (f) Nelle ipotesi fatte ((T ∗ − T )x|x) = 0 per ogni x ∈ H. Per l’esercizio 3.10 deve essere T ∗ − T = 0 ossia T = T ∗ . Se T ∈ B(H) `e positivo, allora (x|T x) `e reale e coincide quindi con il suo complesso coniugato, che vale (T x|x) per le propriet` a del prodotto scalare, per cui si ricade nel caso precedente. (g) Bisogna provare tre fatti. (i) T ≥ T : questo `e ovvio perch´e significa che ((T − T )x|x) ≥ 0 per ogni x ∈ H. (ii) se T ≥ U e U ≥ S allora T ≥ S: questo si prova immediatamente notando che T − S = (T − U ) + (U − S) e quindi ((T − S)x|x) = ((T − U )x|x) + ((U − S)x|x) ≥ 0 per ogni x ∈ H, dato che T ≥ U e U ≥ S. (iii) se T ≥ U e U ≥ T allora T = U . Per provare (iii) si osservi che nelle ipotesi fatte (x|(T − U )x) = 0 per ogni x ∈ H. Per l’esercizio 3.10 deve essere T − U = 0 ossia T = U .
122
3 Spazi di Hilbert e operatori limitati
Osservazione 3.50. Si osservi che per spazi di Hilbert sul campo reale ≥ non `e una relazione d’ordine parziale, perch´e non `e vero che se A ≥ 0 e 0 ≥ A, allora A = 0. A titolo di esempio, si consideri una matrice antisimmetrica A su Rn (visto come spazio vettoriale sul campo R), dotato del prodotto scalare ordinario. Vale A ≥ 0 e anche 0 ≥ A, in quanto (x|Ax) = 0 per ogni x ∈ Rn , ma A = 0.
3.4 Proiettori ortogonali Come ultimo concetto elementare introduciamo la nozione di proiettore ortogonale, che giocher`a il ruolo centrale nel costruire il formalismo della meccanica quantistica. In riferimento alla definizione 2.105 ed alle successive proposizioni 4.5 e 5.16, possiamo dare la seguente definizione. Definizione 3.51. Se (H, ( | )) `e spazio di Hilbert, un proiettore P ∈ B(H) `e detto proiettore ortogonale se P ∗ = P . Osservazione 3.52. Quindi i proiettori ortogonali sono tutti e soli gli operatori limitati da H in H definiti dalle due condizioni P = P P (idempotenza) e P = P ∗ (autoaggiunzione). Si osservi che, come immediata conseguenza della definizione data, si ha la positivit` a dei proiettori ortogonali: per ogni x ∈ H (u|P u) = (u|P P u) = (P ∗ u|P u) = (P u|P u) = ||P u||2 ≥ 0 .
Abbiamo la seguente coppia di proposizioni che caratterizzano i proiettori ortogonali. Proposizione 3.53. Sia P ∈ B(H) un proiettore ortogonale (nello spazio di Hilbert H) che proietta su M : allora vale quanto segue. (a) Il proiettore associato Q := I − P `e ancora un proiettore ortogonale. (b) Q(H) = M ⊥ , per cui la decomposizione diretta associata a P e Q secondo (b) di proposizione 2.106 `e quella dovuta a M ed al suo ortogonale M ⊥ : H = M ⊕ M⊥ . (c) Per ogni x ∈ H, ||x − P (x)|| = min{||x − y|| | y ∈ M }. (d) Se N `e una base hilbertiana di M , allora: P = su (u| ) , u∈N
dove il simbolo “s-” indica che la serie `e calcolata nella topologia forte se la somma `e infinita. (e) I ≥ P ; inoltre, se P non `e l’operatore nullo (il proiettore su {0}), ||P || = 1.
3.4 Proiettori ortogonali
123
Dimostrazione. (a) Sappiamo gi` a che Q := I − P `e proiettore (proposizione 2.4). Per (c) di proposizione 3.38, essendo anche I ∗ = I, segue subito che Q∗ = Q, per cui Q `e proiettore ortogonale. (b) Per la (b) della proposizione 2.106, `e sufficiente provare che Q(H) = M ⊥ . A tal fine si noti che se x ∈ Q(H) e y ∈ M , allora (x|y) = (Qx|y) = (x|Qy) = (x|y − P y) = (x|y − y) = 0, per cui Q(H) ⊂ M ⊥ . Mostriamo che deve essere anche M ⊥ ⊂ Q(H), per cui M ⊥ = Q(H). Per la proposizione 2.106, sussiste la decomposizione diretta: H = M ⊕ Q(H) . D’altra parte, per (d) di teorema 3.14, si ha anche la decomposizione diretta (e ortogonale): H = M ⊕ M⊥ . Se y ∈ M ⊥ , in base alla prima decomposizione si ha la decomposizione unica di y: y = yM + z con yM ∈ M e z ∈ Q(H). Ma, come visto, Q(H) ⊂ M ⊥ , per cui, per l’unicit` a della decomposizione, y = yM + z deve coincidere anche con la decomposizione rispetto alla seconda coppia di sottospazi: e quindi yM ∈ M e z ∈ M ⊥ . In tal caso yM = 0 per ipotesi, per cui y = z ∈ Q(H). Dato che y ∈ M ⊥ `e un vettore arbitrario, abbiamo provato che M ⊥ ⊂ Q(H) come volevamo. (c) La tesi `e immediata conseguenza di (d) del teorema 3.14, quando K := M , tenuto conto dell’unicit` a della decomposizione diretta. (d) Possiamo completare N a base hilbertiana di H tramite l’unione con una base hilbertiana N di M ⊥ (infatti N ∪ N `e un insieme ortonormale per costruzione; inoltre, valendo H = M ⊕ M ⊥ per (b), se x ∈ H `e ortogonale a N e N , deve essere il vettore nullo. Per definizione di base hilbertiana, N ∪ N `e base hilbertiana di H.) Allora si verifica immediatamente che: R=
u (u| )
u∈N
e R =
u (u| )
u∈N
(dove le somme, se contengono infiniti addendi, sono calcolate nella topologia forte) sono operatori limitati, soddisfano RR = R, R(H) = M , R R = R , R (H) = M ⊥ ed infine R R = RR = 0 e R + R = I. Per la proposizione 2.106, R ed R sono proiettori associati alla decomposizione diretta M ⊕ M ⊥ . Per l’unicit` a della decomposizione su M e M ⊥ di ogni vettore, concludiamo che deve essere R = P (e R = Q). (e) Q = I − P `e proiettore ortogonale per cui: 0 ≤ (Qx|Qx) = (x|QQx) = (x|Qx) = (x|Ix) − (x|P x) ,
124
3 Spazi di Hilbert e operatori limitati
per ogni x ∈ H. Questo significa che I ≥ P . Da quanto appena detto segue anche che: ||P x||2 = (P x|P x) = (x|P P x) = (x|P x) ≤ (x|x) = ||x||2 . Prendendo l’estremo superiore su x con ||x|| = 1, si ha ||P || ≤ 1. Se P = 0, ci sar`a x ∈ H con ||x|| = 1 per cui P x = x e quindi ||P x|| = 1. In tal caso dovr` a essere ||P || = 1. Proposizione 3.54. Sia H spazio di Hilbert e M ⊂ H un sottospazio chiuso. I proiettori P e Q associati alla somma diretta ortogonale H = M ⊕ M⊥ secondo la proposizione 2.107 (con N := M⊥ ) e che proiettano rispettivamente su M e M⊥ sono proiettori ortogonali. Dimostrazione. Bisogna solo provare che P = P ∗. Il fatto che Q = Q∗ segue da Q = I − P . Se x ∈ H, allora si ha la decomposizione univoca x = y + z con y = P (x) ∈ M e z = Q(x) ∈ M⊥ . Sia x = y + z l’analoga decomposizione per x ∈ H. Vale (x |P x) = (y +z |y) = (y |y). Ma anche (P x |x) = (y |y +z) = (y |y), per cui (x |P x) = (P x|x) ossia ((P ∗ − P )x |x) = 0 per ogni x, x ∈ H. Scegliendo x = (P ∗ − P )x , si vede che deve valere P x = P ∗ x per ogni x e quindi P = P ∗.
3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati In questa sezione piuttosto tecnica vedremo alcune nozioni molto utili in teoria degli operatori limitati in uno spazio di Hilbert. Il risultato pi` u importante `e il cosiddetto teorema di decomposizione polare per operatori limitati. Si tratta di una decomposizione di un operatore che generalizza la decomposizione di un numero complesso z nel prodotto del suo valore assoluto e di un esponenziale immaginario: z = |z|ei arg z . Nel caso operatoriale, se z corrisponde ad un operatore limitato, |z| corrisponde ad un certo operatore positivo, il valore assoluto dell’operatore di partenza, e ei arg z ad un operatore che `e unitario, almeno restringendosi ad un certo sottospazio. La nozione di valore assoluto di un operatore `e utile per introdurre una generalizzazione del concetto di “convergenza assoluta” di serie numeriche costruite a partire da operatori e basi hilbertiane. Useremo queste serie nel definire gli operatori di HilbertSchmidt e gli operatori di classe traccia, alcuni dei quali rappresentano gli stati in meccanica quantistica. Parte delle dimostrazioni che seguono sono tratte da [Mar82] e [KaAk80]. Definizione 3.55. Se A ∈ B(H), con H spazio di Hilbert, B ∈ B(H) si dice radice quadrata (positiva) di A se B 2 = A (e, rispettivamente, B ≥ 0).
Radici quadrate di operatori positivi e decomposizione polare
125
Mostreremo tra poco che ogni operatore limitato positivo ha una ed una sola radice quadrata positiva. Ci serve un lemma iniziale che diamo sotto forma di proposizione in quanto si tratta, a sua volta, di un utile risultato usato nella teoria spettrale, lavorando con successioni e serie di proiettori ortogonali nella topologia forte. Proposizione 3.56. Sia H spazio di Hilbert. Se {An }n∈N ⊂ B(H) `e una successione monotona non decrescente (non crescente) di operatori autoaggiunti limitata superiormente (rispettivamente inferiormente) da K ∈ B(H), allora esiste A ∈ B(H) autoaggiunto con A ≤ K (rispettivamente A ≥ K) e tale che: A = s- lim An . (3.45) n→+∞
Dimostrazione. Dimostriamo la tesi nel caso non decrescente; l’altro caso si riporta a questo considerando la successione di termini K − An . Posto Bn := An + ||A0 ||I, valgono le propriet` a seguenti. (i) La successione dei Bn `e una successione monotona non decrescente di operatori positivi. Infatti, se ||x|| = 1, (x|An x) + ||A0 || ≥ (x|A0 x) + ||A0 ||, ma −||A0 || ≤ (x|A0 x) ≤ ||A0 || per (a) di proposizione 3.49. Di conseguenza (x|An x) + ||A0 || ≥ 0 per ogni x tale che ||x|| = 1. Questo equivale a dire che (y|An y) + ||A0 ||(y|y) ≥ 0 per ogni y ∈ H, ossia Bn = An + ||A0 ||I ≥ 0, (ii) Bn ≤ K + ||A0 ||I =: K1 e K1 `e positivo (K pu` o non esserlo), (iii) (x|K1 x) ≥ (x|Bn x) − (x|Bm x) ≥ 0 per ogni x ∈ H se n ≥ m. Infatti (x|K1 x) ≥ (x|Bn x), e anche −(x|Bm x) ≤ 0 ed infine (x|Bn x) − (x|Bm x) ≥ 0. Dato che che ogni operatore positivo T definisce un semiprodotto scalare, per cui `e valida la disuguaglianza di Schwarz: |(x|T y)|2 ≤ (x|T x)(y|T y) ,
(3.46)
avremo che, se n ≥ m: |(x|(Bn − Bm )y)|2 ≤ (x|(Bn − Bm )x)(y|(Bn − Bm )y) ≤ (x|K1 x)(y|K1 y) ≤ ||K1||2 ||x||2||y||2 . Quindi: |(x|(Bn − Bm )y)|2 ≤ ||K1 ||2 ||x||2||y||2 . Se si pone x = (Bn − Bm )y e si prende l’estremo superiore sugli y ∈ H con ||y|| = 1, si ricava che: ||Bn − Bm || ≤ ||K1 || . (3.47) Dalla (3.46) con y = (Bn −Bm )x e T = Bn −Bm si ricava che, per ogni x ∈ H, se n ≥ m: ||(Bn − Bm )x||4 = ((Bn − Bm )x|(Bn − Bm )x)2 ≤ (x|(Bn − Bm )x)((Bn − Bm )x|(Bn − Bm )2 x) .
126
3 Spazi di Hilbert e operatori limitati
Per (3.47), l’ultimo termine `e maggiorato da (x|(Bn − Bm )x)||Bn − Bm ||3||x||2 ≤ ||K1 ||3 ||x||2[(x|Bn x) − (x|Bm x)] . Quindi:
||(Bn − Bm )x||4 ≤ ||K1 ||3 ||x||2[(x|Bn x) − (x|Bm x)] .
La successione non decrescente limitata di numeri positivi (x|Bk x) `e necessariamente convergente, per cui `e di Cauchy. Concludiamo che deve essere di Cauchy anche quella di vettori Bk x. Esister`a dunque il limite per k → +∞ di tale successione. Definiamo: B : H x → lim Bn x . n→+∞
Si verifica facilmente che per costruzione B `e lineare, inoltre soddisfa: 0 ≤ (Bx|x) = (x|Bx) ≤ (x|K1 x) dato che 0 ≤ (Bk x|x) = (x|Bk x) ≤ (x|K1 x) per ogni k ∈ N. Dato che K1 `e limitato ed autoaggiunto (essendo positivo), da (a) di proposizione 3.49 concludiamo che B `e limitato, valendo: sup{|(x|Bx)| | x ∈ H , ||x|| = 1} ≤ sup{|(x|K1 x)| | x ∈ H , ||x|| = 1} = ||K1 || . B `e anche autoaggiunto per (e) di proposizione 3.49. Quindi, A := B − ||A0 ||I `e un operatore limitato, autoaggiunto e vale: Ax = lim (Bn − ||A0||I)x = lim An x . n→+∞
n→+∞
Infine A ≤ K perch´e per ogni x ∈ H vale (x|An x) ≤ (x|Kx) per ipotesi e tale risultato permane prendendo il limite per n → +∞. Questo risultato ci permette di dimostrare l’esistenza delle radici quadrate degli operatori limitati positivi. Teorema 3.57. Sia H spazio di Hilbert e A ∈ B(H) un operatore positivo. √ Esiste un’unica radice quadrata positiva, che indichiamo con A. Inoltre: √ (a) A commuta con tutti gli operatori B ∈ B(H) che commutano con A: √ √ se AB = BA con B ∈ B(H), allora AB = B A. √ (b) se A `e biettivo, A `e biettivo. Dimostrazione. Senza limitare la generalit`a, possiamo assumere che ||A|| ≤ 1. Quindi poniamo A0 := I − A. Mostriamo prima di tutto che A0 ≥ 0 e ||A0 || ≤ 1. A0 ≥ 0 dato che (x|A0 x) = (x|x) − (x|Ax) ≥ ||x||2 − ||A||||x||2, dove abbiamo usato il fatto che A = A∗ per cui (per (a) di proposizione 3.49) ||A|| = sup{|(z|Az)| | ||z|| = 1} e tenendo conto che |(z|Az)| = (z|Az) per la positivit` a
Radici quadrate di operatori positivi e decomposizione polare
127
di A. Dato che (x, y) → (x|A0 y) `e un semi prodotto scalare, essendo A0 ≥ 0, vale la disuguaglianza di Cauchy-Schwarz: |(x|A0 y)|2 ≤ (x|A0 x)(y|A0 y) ≤ ||x||2||y||2 , dove abbiamo usato la positivit` a di A = I −A0 e A0 nell’ultimo passaggio. Per y = A0 x, ed usando il fatto che A = A∗ , la disuguaglianza trovata implica: |(A0 x|A0 x)|2 ≤ ||x||2||A0x||2 , e quindi ||A0 x|| ≤ ||x||, da cui infine si ha che: ||A0|| ≤ 1 .
(3.48)
Passiamo a definire una successione di operatori limitati Bn : H → H, per n = 1, 2, . . .: 1 B1 := 0 , Bn+1 := (A0 + Bn2 ) . (3.49) 2 Dalla (3.48) si verifica immediatamente, usando le propriet` a della norma, che: ||Bn || ≤ 1 per ogni n ∈ N .
(3.50)
Per induzione si verifica immediatamente che gli operatori Bn sono polinomi in A0 a coefficienti non negativi. Si tenga conto, qui e nel seguito, che tutti gli operatori Bk commutano tra di loro e commutano con A0 per costruzione. Dalla (3.49) si ha che: Bn+1 − Bn =
1 1 1 2 2 (A0 + Bn2 ) − (A0 + Bn−1 ) = (Bn2 − Bn−1 ) 2 2 2
ossia:
1 (Bn + Bn−1 )(Bn − Bn−1 ) . 2 Dall’ultima identit` a segue facilmente, per induzione, che gli operatori Bn+1 − Bn sono polinomi di A0 a coefficienti non negativi: si tenga conto del fatto che ogni Bn + Bn−1 `e somma di polinomi a coefficienti non negativi per cui `e un polinomio a coefficienti non negativi ed infine si usi il fatto che il prodotto di polinomi a coefficienti non negativi `e un polinomio dello stesso genere. Dato che A0 ≥ 0, ogni suo polinomio a coefficienti non negativi `e un operatore positivo: il polinomio `e somma di termini a2n A2n 0 che sono positivi n n n (essendo a2n ≥ 0 e A2n = A A con A autoaggiunto, per cui a2n (x|A2n 0 0 0 0 0 x) = a2n (An0 x|An0 x) ≥ 0), e di termini a2n+1 A2n+1 che sono ancora positivi (perch´ e 0 n n n n a2n+1 ≥ 0 e (x|A2n+1 x) = (x|A AA x) = (A x|A A x) ≥ 0). 0 0 0 0 0 Concludiamo che gli operatori limitati Bn e Bn+1 − Bn sono operatori positivi. In altre parole, la successione degli operatori limitati positivi (e quindi autoaggiunti) Bn `e non decrescente. Questa successione `e anche maggiorata dall’operatore I. Infatti, essendo Bn∗ = Bn ≥ 0 vale, per (a) di proposizione 3.49, (x|Bn x) = |(x|Bn x)| ≤ ||Bn ||||x||2. Da (3.50) segue subito che Bn+1 − Bn =
128
3 Spazi di Hilbert e operatori limitati
Bn ≤ I. Possiamo allora applicare la proposizione 3.56 ottenendo che esiste un operatore limitato positivo B0 ≤ I tale che: B0 = s − lim Bn . n→+∞
Vale ulteriormente per la definizione di convergenza nella topologia operaa di toriale forte, per la commutativit` a degli operatori Bk e per la continuit` essi: B0 Bm x = ( lim Bn )Bm x = lim Bn Bm x = lim Bm Bn x n→+∞
n→+∞
n→+∞
= Bm lim Bn x = Bm B0 x . n→+∞
Quindi B0 commuta con ogni Bm e di conseguenza: B02 − Bn2 = (B0 + Bn )(B0 − Bn ) da cui, per n → +∞: ||B02 x − Bn2 x|| ≤ ||B0 + Bn ||||B0 x − Bn x|| ≤ (||B0 || + ||Bn ||)||B0x − Bn x|| ≤ 2||B0 x − Bn x|| → 0 . In altre parole:
B02 x = lim Bn2 x . n→+∞
Passando allora al limite nella relazione ottenuta da (3.49): Bn+1 x =
1 (A0 x + Bn2 x) , 2
troviamo, per ogni x ∈ H, B0 x = cio`e:
1 (A0 x + B02 x) , 2
2B0 = A0 + B02 .
Per concludere, esprimendo l’identit` a di sopra in termini di B := I − B0 , troviamo immediatamente che: B 2 = I − A0 , cio`e,
B2 = A .
Quindi B `e una radice quadrata di A. Si osservi che B ≥ 0 dato che B0 ≤ I e B = I − B0 . Per cui B `e una radice quadrata positiva di A. Ancora, se C `e un operatore limitato che commuta con A, allora commuter`a con A0 e quindi
Radici quadrate di operatori positivi e decomposizione polare
129
con ogni Bn . Di conseguenza C commuter`a con B0 e con B = I − B0 . Proviamo infine l’unicit` a della radice quadrata positiva. Sia V una radice quadrata positiva di A. La radice positiva B costruita sopra ha la propriet` a di commutare con tutti gli operatori che commutano con A. Siccome: AV = V 3 = V A , V e A commutano tra di loro e quindi B dovr` a commutare con V . Fissiamo arbitrariamente x ∈ H e poniamo y := Bx − V x. Abbiamo allora: ||Bx − V x||2 = ([B − V ]x|[B − V ]x) = ([B − V ]x|y) = (x|[B ∗ − V ∗ ]y) = (x|[B − V ]y) .
(3.51)
Mostriamo ora che, nelle nostre ipotesi, By = 0 e V y = 0 separatamente. Ci`o conclude la prova perch´e, per l’arbitrariet`a di x ∈ H, ||Bx − V x|| = 0 implica B =V. Vale: (y|By) + (y|V y) = (y|[B + V ][B − V ]x) = (y|[B 2 − V 2 ]x) = (y|[A − A]x) = 0 . Poich`e (y|V y) ≥ 0 e (y|By) ≥ 0 deve quindi essere: (y|V y) = (y|By) = 0 . Questo implica che V y = By = 0, infatti, se W `e una radice quadrata positiva di V , essendo: ||W y||2 = (W y|W y) = (y|W 2 y) = (y|V y) = 0 , dovr` a essere W y = 0 e, a maggior ragione, V y = W (W y) = 0. Nello stesso modo si trova By = 0. √ Non resta che provare che A `e biettivo se lo `e A. Se A `e √ biettivo, allora −1 commuta con A−1 , di conseguenza commuta con A anche A. Si verifica √ √ −1 −1 allora immediatamente che A A = AA ` e inverso destro e sinistro di √ A, che `e di conseguenza biettivo. Corollario 3.58. Sia H spazio di Hilbert; se A, B ∈ B(H) sono positivi e commutano tra di loro, allora il loro prodotto `e un operatore limitato positivo. √ Dimostrazione. B commuta con A, perci`o √ √ √ √ √ 2 (x|ABx) = (x|A B x) = (x| BA Bx) = ( Bx|A Bx) ≥ 0 . Concludiamo la sezione mostrando che ogni operatore limitato A su uno spazio di Hilbert ammette una decomposizione, A = U P , in un prodotto di un operatore positivo P , univocamente determinato, e un operatore isometrico U definito sul rango di quello positivo ed ivi univocamente determinato. Tale decomposizione si dice decomposizione polare dell’operatore e ha molteplici applicazioni in fisica matematica. Una definizione preliminare `e necessaria.
130
3 Spazi di Hilbert e operatori limitati
Definizione 3.59. Siano H spazio di Hilbert e A ∈ B(H). L’operatore limitato, positivo e quindi autoaggiunto: √ |A| := A∗ A , (3.52) `e detto valore assoluto di A. Osservazione 3.60. Valendo, per ogni x ∈ H: || |A| x||2 = (x| |A|2x) = (x|A∗Ax) = ||Ax||2, otteniamo: || |A| x|| = ||Ax|| ,
(3.53)
Ker(|A|) = Ker(A)
(3.54)
da cui segue che: e quindi |A| `e iniettivo se e solo se lo `e A. Un’altra utile propriet` a `e: Ran(|A|) = (Ker(A))⊥ ,
(3.55)
che vale in quanto Ran(|A|) = ((Ran(|A|))⊥ )⊥ = (Ker(|A|∗ ))⊥ = (Ker(|A|))⊥ = (Ker(A))⊥ . Passiamo al teorema di decomposizione polare. Teorema 3.61. (Di decomposizione polare per operatori limitati.) Siano H spazio di Hilbert e A ∈ B(H). Valgono i fatti seguenti. (a) Esiste una sola coppia di operatori P, U ∈ B(H) tali che sono vere, insieme, le condizioni seguenti: (1) vale la decomposizione: A = UP ,
(3.56)
(2) P `e positivo, (3) U `e isometrico su Ran(P ) (ossia ||U x|| = ||x|| per ogni x ∈ Ran(P )), (4) Ker(U ) ⊃ Ker(P ) (o equivalentemente (4)’ Ker(U ) ⊃ Ker(A)). (b) Risulta essere P = |A| e quindi Ker(U ) = Ker(A) = (Ran(P ))⊥ . (c) Se A `e biettivo, U coincide con l’operatore unitario A|A|−1 . Dimostrazione. (a) Cominciamo con il provare l’unicit` a. Se esiste la decomposizione (3.56) A = U P con P ≥ 0 (oltre che limitato) e U limitato, allora A∗ = P U ∗, essendo P autoaggiunto perch´e positivo ((c) in teorema 3.57); quindi A∗ A = P U ∗U P . (3.57) La condizione che U sia isometrico su Ran(P ) si scrive (U P x|U P y) = (P x|P y) per ogni x, y ∈ H, che equivale a (x|[P U ∗U P − P 2 ]y) = 0 per ogni x, y ∈ H. Quindi P U ∗U P = P 2 . Sostituendo in (3.57) concludiamo che deve
Radici quadrate di operatori positivi e decomposizione polare
131
essere P 2 = A∗ A e dunque, essendo P positivo ed estraendo l’unica radice quadrata positiva (teorema 3.57) ad ambo membri, troviamo P = |A|. Quindi, se esiste una decomposizione con i requisiti fissati in (a), necessariamente P = |A|. Mostriamo che anche U `e fissato unicamente. Notiamo che H = Ker(P ) ⊕ (Ker(P ))⊥ ma, usando (d) di proposizione 3.38 e la (e) del teorema 3.3, vale anche (Ker(P ))⊥ = Ran(P ∗) = Ran(P ) per il fatto che P `e autoaggiunto. Quindi H = Ker(P ) ⊕ Ran(P ). Per assegnare un operatore su H, `e sufficiente assegnarlo su ciascuno dei due addendi della somma diretta scritta sopra: U = 0 su Ker(P ) nelle ipotesi del teorema, mentre la condizione U P x = Ax per ogni x ∈ H fissa univocamente U su Ran(P ). D’altra parte, essendo per ipotesi U limitato, lo sar` a anche se ristretto a Ran(P ). Un operatore limitato definito in un dominio denso `e estendibile univocamente ad un operatore limitato definito sulla chiusura del dominio (vedi proposizione 2.57). Quindi, per le ipotesi fatte, U `e in realt`a fissato su tutto Ran(P ) e quindi su tutto H. La dimostrazione di unicit` a `e conclusa. Passiamo a quella di esistenza. In base a quanto visto sopra, `e necessario, innanzi tutto, mostrare che la condizione U P = A con P = |A|, riscritta equivalentemente come U : |A|x → Ax per ogni x ∈ H, definisce effettivamente un operatore, che indicheremo con U0 , su Ran(|A|). Perch´e tale funzione sia ben definita `e necessario sufficiente che valga |A|x = |A|y ⇒ Ax = Ay, altrimenti non avremmo una funzione. Notiamo che, da (3.53), se |A|x = |A|y, allora Ax = Ay e quindi l’applicazione U0 : Ran(|A|) |A|x → Ax `e ben definita (non `e plurivoca). Il fatto che U0 sia lineare `e ovvio per costruzione, come lo `e il fatto che sia un’isometria, poich´e U0 preserva le norme per (3.53) (si tenga conto dell’esercizio 3.9). Il fatto che U0 sia un’isometria su Ran(|A|) implica, per continuit` a, che si estenda in modo unico ad un’isometria sulla chiusura di Ran(|A|). Indichiamo ancora con U0 tale estensione. Infine definiamo un operatore U : H → H tale che, rispetto alla somma diretta vista sopra H = Ker(|A|) ⊕ Ran(|A|), si decomponga in ` immediato verificare che U ∈ B(H) U Ker(|A|) := 0 e U Ran(|A|):= U0 . E e che U soddisfa (3.56) per costruzione. Infine vale Ker(U ) ⊃ Ker(|A|) per costruzione. Proviamo, per concludere, che i due nuclei in realt`a coincidono. Ogni eventuale u con U u = 0 si decompone come u0 + x, con u0 ∈ Ker(|A|), su cui U si annulla, e x ∈ Ran(|A|), per cui deve valere U0 x = 0. Dato che su tale spazio U0 `e isometrico, deve essere x = 0 e quindi u = u0 ∈ Ker(|A|). Quindi Ker(U ) ⊂ Ker(|A|) e, tenendo conto anche dell’altra inclusione, vale infine Ker(U ) = Ker(|A|) = Ker(A) per (3.54). (b) `e gi`a stato provato completamente provando (a). (c) Se A `e iniettivo, usando (b), si trova che Ker(A) = Ker(U ) `e banale e quindi U `e iniettivo. D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A) e pertanto, se A `e suriettivo, deve esserlo U . Concludiamo che, se A `e biettivo, U deve essere tale. In tal caso, per (b), U `e un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H ed `e quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| `e biettivo e quindi possiamo scrivere: U = A|A|−1 .
132
3 Spazi di Hilbert e operatori limitati
Definizione 3.62. Siano H spazio di Hilbert e A ∈ B(H). Si dice decomposizione polare dell’operatore A la decomposizione A = UP ,
(3.58)
dove P, U ∈ B(H) soddisfano le propriet` a: P `e positivo, U `e isometrico su Ran(P ) e Ker(U ) = Ker(P ). Un corollario del teorema di decomposizione polare, utile in varie applicazioni, `e il seguente. Corollario 3.63. (Del teorema 3.61.) Nelle ipotesi del teorema 3.61, se U |A| = A `e la decomposizione polare di A, vale l’identit` a: |A∗| = U |A|U ∗ .
(3.59)
Dimostrazione. Da A = U |A| segue immediatamente che A∗ = |A|U ∗ = U ∗ U |A|U ∗, dove si `e tenuto conto del fatto che U ∗ U |A| = |A|, dato che U `e isometrico su Ran(|A|). Quindi, per l’operatore autoaggiunto AA∗ vale: AA∗ = U |A|U ∗ U |A|U ∗ . Dato che U |A|U ∗ `e evidentemente positivo, avremo, per l’unicit` a della radice quadrata: √ |A∗| = (A∗ )∗ A∗ = AA∗ = U |A|U ∗ .
Questo prova la tesi.
3.6 La trasformata di Fourier-Plancherel Introduciamo molto concisamente, in questa ultima sezione, i risultati pi` u importanti riguardanti la teoria della trasformata di Fourier e di FourierPlancherel, senza tuttavia introdurre la teoria delle distribuzioni di Schwartz [Rud91, ReSi80, Vla81]. Notazione 3.64. D’ora in poi faremo uso delle notazioni introdotte nell’esempio 2.96 riguardo agli operatori differenziali, in particolare xk ∈ R indicher`a la componente k-esima di x ∈ Rn , dx denoter`a l’ordinaria misura di Lebesgue in Rn , infine: αn 1 M α (x) := xα 1 · · · xn
per ogni multindice α = (α1 , . . . , αn) .
Con D(Rn ) indicheremo lo spazio (anche indicato in letteratura con Cc∞(Rn ) o anche C0∞ (Rn )) delle funzioni a valori complessi infinitamente differenziabili con supporto compatto. Con S(Rn ) indicheremo lo spazio di Schwartz (vedi esempio 2.96) su Rn . Con le notazioni introdotte, S(Rn ) `e lo spazio vettoriale complesso delle funzioni C ∞(Rn ) a valori complessi che godono dell’ulteriore
3.6 La trasformata di Fourier-Plancherel
133
propriet` a: per ogni f ∈ S(Rn ) e per ogni coppia di multindici α e β, esiste K < +∞ (dipendente da f, α e β!) tale che |M α (x)∂xβ f(x)| ≤ K,
per ogni x ∈ Rn .
(3.60)
Le norme || ||1 , || ||2 e || ||∞ in questa sezione denoteranno rispettivamente la norma di L1 (Rn , dx), L2 (Rn , dx) e L∞ (Rn , dx) (vedi (6) e (8) in esempi 2.39). Precisiamo di seguito una serie di propriet` a ben note degli spazi e degli operatori introdotti sopra. (1) Gli spazi D(Rn ) e S(Rn ) sono invarianti sotto l’azione degli operatori α M (x) (visto come operatore moltiplicativo) e ∂xα . In altre parole, le funzioni di ciascuno dei due spazi rimangono nel rispettivo spazio quando trasformate sotto l’azione di M α (x) e ∂xα . ` chiaro che D(Rn ) ⊂ Lp (R, dx) come sottospazio per ogni 1 ≤ p ≤ ∞, (2) E dato che i compatti su Rn hanno misura di Lebesgue finita e che ogni f ∈ D(Rn ) `e continua e quindi limitata sui compatti. (3) Vale anche che S(Rn ) ⊂ Lp (R, dx) per ogni 1 ≤ p ≤ ∞ come sottospazio. Infatti, se C ⊂ Rn `e un compatto contenente l’origine, f ∈ S(Rn ) `e limitata su C essendo ivi continua e, fuori da C, vale |f(x)| ≤ Cn |x|−n per ogni n = 0, 1, 2, 3, . . . pur di scegliere Cn ≥ 0 sufficientemente grande. In definitiva |f| `e limitata su Rn e quindi appartiene a L∞ ma, per ogni p ∈ [1, +∞), `e anche limitata da una funzione che appartiene a Lp : tale funzione `e costante su C e vale Cn /|x|n con n > 1/p fuori da C. (4) Oltre al fatto ovvio che D(Rn ) ⊂ S(Rn ), ricordiamo un fatto notissimo (indipendente dai risultati che troveremo in questa sezione) che sar` a utile tra poco [KiGv83]: Proposizione 3.65. Gli spazi D(Rn ) e S(Rn ) sono sottospazi densi in Lp (R, dx) per ogni 1 ≤ p < ∞. (5) Vale infine il seguente importante Lemma la cui dimostrazione si pu` o trovare in [Bre86] (Corollario IV.24) ed `e indipendente dai risultati che troveremo in questa sezione. Lemma 3.66. Se f ∈ L1 (Rn , dx) e f(x)g(x) dx = 0 Rn
per ogni g ∈ D(Rn ) ,
allora f(x) = 0 quasi ovunque rispetto alla misura di Lebesgue dx su Rn . Possiamo ora introdurre le prime definizioni elementari riguardanti la trasformata di Fourier.
134
3 Spazi di Hilbert e operatori limitati
Definizione 3.67. Le funzioni lineari da L1 (Rn , dx) in L∞ (Rn , dx) definite da: eik·x (F f)(k) := f(x) dx , se f ∈ L1 (Rn , dx) e ogni k ∈ Rn ,(3.61) n/2 Rn (2π) e−ik·x g(k) dk , se g ∈ L1 (Rn , dk) e ogni x ∈ Rn(3.62) (F− g)(x) := n/2 n (2π) R sono dette rispettivamente: trasformata di Fourier e trasformata inversa di Fourier. Osservazioni 3.68. (1) Si osservi che dk indica comunque la misura di Lebesgue in Rn . Abbiamo usato un nuovo nome per la variabile di Rn (k invece di x) nell’esplicitare la trasformata inversa di Fourier solo perch´e tale notazione `e quella tradizionale e ci`o si riveler`a comodo nei calcoli. ` ovvio che, per le propriet` (2) E a elementari dell’integrale,
dx
dxn ik·x ik·x
|(F f)(k)| ≤ ≤ e f(x) |e | |f(x)| (2π)n/2 (2π)n/2 Rn Rn dx ||f||1 = |f(x)| = n/2 (2π) (2π)n/2 Rn e similmente |(F− g)(x)| ≤ ||g||1/(2π n/2 ) per ogni x, k ∈ Rn , per cui ha senso definire la trasformata di Fourier e la trasformata inversa di Fourier come operatori a valori almeno in L∞ (Rn , dx). Nel seguito presenteremo solo le propriet`a pi` u immediate della trasformata di Fourier che si connettono pi` u direttamente con la trasformazione di FourierPlancherel. Tralasceremo importanti risultati come la continuit`a rispetto alla topologia naturale indotta da seminorme nello spazio di Schwartz, per i quali si rimanda a qualsiasi testo di teoria delle funzioni ed analisi funzionale oppure teoria delle distribuzioni [Rud91, ReSi80, Vla81] (vedi anche la sezione 2.4.4). Proposizione 3.69. La trasformazione di Fourier e la trasformazione inversa di Fourier godono delle seguenti propriet` a. (a) Sono continue rispetto alle norme naturali del dominio e codominio, valendo le disuguaglianze: ||Ff||∞ ≤
||f||1 (2π)n/2
e ||F−g||∞ ≤
||g||1 . (2π)n/2
(b) Lo spazio di Schwartz `e invariante sotto F e F− , cio`e: F (S(Rn )) ⊂ S(Rn ) e F− (S(Rn )) ⊂ S(Rn ). (c) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono una l’inversa dell’altra: se f ∈ S(Rn ), allora: eik·x f(x) dx g(k) = n/2 Rn (2π)
3.6 La trasformata di Fourier-Plancherel
se e solo se
f(x) = Rn
135
e−ik·x g(k) dk . (2π)n/2
(d) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono isometriche rispetto al semi prodotto scalare di L2 (Rn , dxn): se f1 , f2 , g1 , g2 ∈ S(Rn ), allora (F f1 )(k)(Ff2 )(k)dk = f1 (x)f2 (x)dx Rn
e
Rn
Rn
(F− g1 )(x)(F− g2 )(x)dx =
Rn
g1 (k)g2 (k)dk .
(e) Le due trasformazioni individuano trasformazioni limitate da L1 (Rn , dx) a C0 (Rn ) (lo spazio delle funzioni continue che tendono a zero all’infinito (4) in esempi 2.39) e pertanto vale il Lemma di Riemann-Lebesgue: per ogni f ∈ L1 (Rn , dx), (F f) (k) → 0 per |x| → +∞ e vale l’analoga propriet` a per F− . (f ) Le due trasformazioni, definite su L1 (Rn , dx), sono iniettive. Osservazione 3.70. Riguardo al punto (f), si pu` o dimostrare [Rud91] ancora pi` u fortemente che se f ∈ L1 (Rn , dx) `e tale che F f ∈ L1 (Rn , dk), allora vale ` valido lo stesso risultato scambiando il ruolo di F e F− . anche F− (F f) = f. E Prova della proposizione 3.69. (a) `e gi`a stata dimostrata in (2) di osservazioni 3.68. (b) Diamo la prova per F; per F− si pu` o procedere analogamente. Poniamo: eik·x g(k) := f(x) dx . n/2 Rn (2π) Si verifica facilmente che il secondo membro pu`o essere derivato in k tramite un operatore ∂kα facendo passare la derivata sotto il segno di integrale. Infatti risulta immediatamente che:
α ik·x
∂k e f(x) =
i|α|M α (x)eik·xf(x)
≤ |M α (x)f(x)| . La funzione x → |M α (x)f(x)| `e in L1 in quanto f ∈ S(Rn ). Dato che il modulo della derivata dell’integrando `e maggiorato uniformemente da una funzione positiva ed integrabile, noti teoremi sul passaggio del simbolo di derivata sotto quello di integrale (basati sul teorema della convergenza dominata di Lebesgue, vedi l’appendice in fondo al libro) permettono di concludere che: ∂kα g(k) = i|α|
Rn
eik·x M α (x)f(x) dx . (2π)n/2
(3.63)
136
3 Spazi di Hilbert e operatori limitati
Notando che f si annulla pi` u rapidamente di ogni potenza inversa di |x| per |x| → +∞, si trova che: ik·x
e M β (k)g(k) = f(x) dx (−i)|β| ∂xβ (2π)n/2 Rn e quindi, usando l’integrazione per parti, eik·x β ∂ f(x) dx . M β (k)g(k) = i|β| n/2 x Rn (2π)
(3.64)
Quindi, inserendo ∂kα g al posto della funzione g in (3.64) e tenendo conto di (a), si ha:
|M β (k)∂kα g(k)| ≤
∂ β (M α f)
1 , per ogni k ∈ Rn . Essendo finito il secondo membro, in quanto f ∈ S(Rn ), ed essendo α e β arbitrari, concludiamo che g ∈ S(Rn ). (c) Le identit` a (3.63) e (3.64) si scrivono in altro modo come: ∂ α F = i|α| F M α , |β|
M F=i β
(3.65)
F∂ , β
(3.66)
dove F `e in realt` a la restrizione della trasformata di Fourier a S(Rn ). Osservando che: F h = F− h per ogni h ∈ S(Rn ), si ricava facilmente: ∂ α F− = (−1)|α| i|α| F− M α , M β F− = (−1)|β| i|β| F− ∂ β .
(3.67) (3.68)
Dalle (3.65), (3.66), (3.67) e (3.68), troviamo in particolare che: F F− M α = M α F F− , F− F M α = M α F− F ,
(3.69) (3.70)
dove M α `e pensato come operatore moltiplicativo (M α f)(x) := M α (x)f(x), e anche F F − ∂ α = ∂ α F F− ,
(3.71)
F− F ∂ α = ∂ α F− F .
(3.72)
Mostreremo ora che, in virt` u di tali relazioni di commutazione, gli operatori J := F F− e J− := F− F devono essere l’operatore identit` a di S(Rn ). Per prima cosa proviamo che, fissati x0 ∈ Rn e f ∈ S(Rn ), il valore di (Jf)(x0 ) dipende solo da f(x0 ). Se f ∈ S(Rn ) possiamo sempre scrivere: 1 n df(x0 + t(x − x0 )) (xi − x0i )gi (x) , f(x) = f(x0 ) + dt = f(x0 ) + dt 0 i=1
3.6 La trasformata di Fourier-Plancherel
137
dove le funzioni gi (che sono C ∞ (Rn ), come si verifica facilmente) sono definite da: 1 ∂ gi (x) := f(x0 + t(x − x0 ))dt ∂xi 0 e dunque, se f1 , f2 ∈ S(Rn ) e f1 (x0 ) = f2 (x0 ), risulta: f1 (x) = f2 (x) +
n
(xi − x0i )hi (x) ,
(3.73)
i=1
dove, per differenza, la funzione x → ni=1 (xi − x0i )hi (x) e quindi le funzioni hi sono in S(Rn ). Applicando J ad ambo i membri di (3.73) e tenendo conto del fatto che J commuta con i polinomi in x per (3.69), otteniamo: (Jf1 )(x) = (Jf2 )(x) +
n
(xi − x0i )(Jhi )(x) .
i=1
Prendendo x = x0 , si vede che (Jf1 )(x0 ) = (Jf2 )(x0 ) sotto l’ipotesi iniziale di f1 (x0 ) = f2 (x0 ). Quindi, come dicevamo, (Jf)(x0 ) `e una funzione soltanto di f(x0 ). Tale funzione deve anche essere lineare, dato che J `e lineare per costruzione. Ne consegue che sar`a (Jf)(x0 ) = j(x0 )f(x0 ), dove j `e una funzione su Rn a valori in C. Per l’arbitrariet` a di x0 , abbiamo provato che J agisce come la moltiplicazione per una funzione j. Si osservi che tale funzione deve essere C ∞. Per provare ci` o, si scelga f ∈ S(Rn ) che valga costantemente 1 in un intorno I(x0 ) di x0 . Se x ∈ I(x0 ), vale (Jf)(x) = j(x). Dato che il primo membro `e C ∞ (I(x0 )), lo deve essere anche il secondo. Valendo ci`o nell’intorno di ogni punto di Rn , vale anche j ∈ C ∞ (Rn ). La (3.71) implica allora che, per ogni f ∈ S(Rn ) ed ogni x ∈ Rn : j(x)
∂ ∂ f(x) = j(x)f(x) . ∂xi ∂xi
Scegliendo, come prima, f con valore costantemente uguale a 1 in un aperto, si ha dall’identit` a di sopra che in quell’aperto tutte le derivate di j devono annullarsi. Dato che ci` o vale nell’intorno di ogni punto di Rn che `e connesso, la funzione continua j deve essere una funzione costante su tutto Rn . Il valore della costante ovviamente non dipende dall’argomento di J e quindi pu` o essere calcolato valutando J su una funzione arbitraria di S(Rn ). Un utile esercizio 2 `e quello di calcolare J sulla funzione x → e−x e si vede che il valore della costante `e proprio 1. La prova per J− si esegue nello stesso modo. (d) Usando (c) la tesi si prova immediatamente. Facciamo la dimostrazione per F ; quella per F− `e essenzialmente la stessa. Se f1 , f2 ∈ S(Rn ), poniamo, per i = 1, 2: eik·x gi (k) := f (x) dx . n/2 i Rn (2π)
138
3 Spazi di Hilbert e operatori limitati
` immediato verificare che, nelle nostre ipotesi, possiamo usare il teorema di E Fubini-Tonelli, ottenendo: eik·x g1 (k)g2 (k)dk = g1 (k) f (x)dxdk n/2 2 Rn Rn Rn (2π) eik·x = g (k)f2 (x)dx ⊗ dk . n/2 1 Rn ×Rn (2π) Usando nuovamente il teorema di Fubini-Tonelli per l’ultimo integrale opportunamente riscritto, abbiamo: g1 (k)g2 (k)dk Rn
= Rn ×Rn
e−ik·x e−ik·x g (k)f (x)dx ⊗ dk = f (x) g (k)dkdx 1 2 2 n/2 n/2 1 (2π) Rn Rn (2π) = f1 (x)f2 (x)dx , Rn
dove abbiamo usato il risultato in (c). Questa `e la tesi che volevamo provare. (e) Facciamo la dimostrazione per F , p per F− la dimostrazione `e analoga. Si osservi anche che entrambe le trasformazioni sono ben definite su L1 (Rn , dx) dato che l’integrale `e invariante quando alteriamo le funzioni su insiemi di mi||f||1 sura di Lebesgue nulla. La stima ||Ff||∞ ≤ (2π) n/2 assicura che l’applicazione n n n lineare F : S(R ) → S(R ) ⊂ C0 (R ) `e continua quando il dominio `e dotato della norma L1 e il codominio della norma || · ||∞. Dato che S(Rn ) `e denso in L1 nella norma detta e il codominio `e completo rispetto alla seconda norma, la trasformata di Fourier inizialmente definita su S(Rn ) si estende per continuit`a unicamente (e quindi coincide con la trasf. lineare gi` a definita su L1 (Rn , dx)) 1 n ad una trasformazione lineare limitata da L (R , dx) a C0 (Rn ) che conserva la stessa norma per la proposizione 2.57. Dato che, se f ∈ L1 , F f ∈ C0 (Rn ), per ogni > 0 esiste un compatto K ⊂ Rn tale che |(F f)(k)| < se k ∈ K . Scegliendo per ogni > 0 una palla di raggio r centrata nell’origine tanto grande da includere K , concludiamo che, per ogni > 0 esiste un reale r > 0 tale che |(F f)(k)| < se |k| > r . (f) Facciamo la dimostrazione per F , p per F− la dimostrazione `e analoga. Dato che l’operatore F `e lineare, `e sufficiente dimostrare che se F f `e la funzione nulla, allora f `e quasi ovunque nulla. Si supponga pertanto che: eik·x f(x) dx = 0 , per ogni k ∈ Rn . n/2 Rn (2π) Se g ∈ S(Rn ), applicando il teorema di Fubini-Tonelli, abbiamo che:
eik·x eik·x 0= g(k) f(x) dx dk = g(k) dk f(x) dx . n/2 n/2 Rn Rn (2π) Rn Rn (2π)
3.6 La trasformata di Fourier-Plancherel
139
Dato che F `e biettiva su S(Rn ), quanto ottenuto `e equivalente a dire che (notare che ψf ∈ L1 (Rn , dx) per ogni ψ ∈ S(Rn ) dato che ψ `e limitata): ψ(x)f(x) dx = 0 per ogni ψ ∈ S(Rn ). Rn
Dato che D(Rn ) ⊂ S(Rn ), il lemma 3.66 implica che f `e nulla quasi ovunque. Passiamo ad introdurre la trasformata di Fourier-Plancherel. Dato che S(Rn ) `e denso in L2 (Rn ), passando alle classi di equivalenza di funzioni si potr` a dire che S(Rn ) individua un sottospazio denso, che indicheremo ancora con lo stesso simbolo S(Rn ), nello spazio di Hilbert L2 (Rn ). Gli operatori F e F− possono essere pensati come definiti su tale sottospazio denso in L2 (R, dx). Il punto (d) della proposizione 3.69 implica in particolare che tali operatori sono limitati con norma pari a 1, dato che sono operatori isometrici. Come sappiamo dalla proposizione 2.57), F e F− individueranno univocamente due operatori lineari limitati su tutto L2 (Rn , dx). Per esempio, l’operatore che estende F su L2 (Rn , dx) `e definito come, se f ∈ L2 (Rn , dx), Ff := lim F fn , n→+∞
dove {fn }n∈N ⊂ S(Rn ) `e una qualunque successione che converge a f nella topologia di L2 (Rn , dx) (come provato nell’esercizio citato sopra, il limite esiste sempre e non dipende dalla successione scelta). Per la continuit` a del prodot to scalare, l’operatore esteso F continuer` a a conservare il prodotto scalare di L2 (R2 , dx) e pertanto F sar`a iniettivo su L2 (Rn , dx). In realt` a sar` a anche suriettivo per il seguente motivo elementare. Accanto all’operatore F possiamo similmente costruire l’operatore che estende su L2 (Rn , dx) la trasformata inversa di Fourier F−. Su S(Rn , dx) vale F F− = IS(Rn ) . a e continuit` a, tenendo conto del Passando alle estensioni su L2 per linearit` fatto che l’unica estensione lineare dell’identit`a su S(Rn , dx) (costruita con la procedura generale detta sopra) `e l’identit`a su L2 (Rn , dx), otteniamo che deve valere FF− = I , dove I `e l’identit` a su L2 (Rn , dx). Questo fatto implica immediatamente la suriettivit`a di F. Definizione 3.71. L’unico operatore F : L2 (Rn , dx) → L2 (Rn , dx) che estende per linearit` a e continuit` a la trasformata di Fourier ristretta a S(Rn ) `e detto trasformazione di Fourier-Plancherel.
140
3 Spazi di Hilbert e operatori limitati
Teorema 3.72. (Di Plancherel.) La trasformazione di Fourier-Plancherel: F : L2 (Rn , dx) → L2 (Rn , dx) `e un operatore lineare biettivo ed isometrico. Dimostrazione. La dimostrazione `e stata data immediatamente prima della definizione 3.71. Rimane aperta una questione. Se f ∈ L1 (Rn , dx)∩L2(Rn , dx) (ma f ∈ S(Rn )), a priori F f e Ff sono diversi, perch´e per definire F non abbiamo esteso F partendo da L1 (Rn , dx), ma siamo partiti dal suo sottospazio S(Rn ). Questa era l’unica possibilit` a, visto che L1 (Rn , dx) ⊂ L2 (Rn , dx). La seguente proposizione fa luce sulla questione, dando anche un metodo pratico per calcolare la trasformata di Fourier-Plancherel in termini di limiti di quella di Fourier. Osservazione 3.73. Ricordiamo che se K ⊂ Rn `e un insieme di misura finita ed in particolare se K `e un compatto (i compatti hanno misura di Lebesgue finita), allora: (1) L2 (K, dx) ⊂ L1 (K, dx). (2) se {fn }n∈N ⊂ L2 (K, dx) converge nella norma || ||2 a f ∈ L2 (K, dx) allora converge alla stessa funzione anche nella norma || ||1 . (3) L∞ (K, dx) ⊂ Lp (K, dx) per 1 ≤ p < ∞. (4) se {fn }n∈N ⊂ L∞ (K, dx) converge nella norma || ||∞ a f ∈ L∞ (K, dx), allora converge alla stessa funzione anche nella norma || ||p . Queste quattro affermazioni si provano immediatamente come segue, tenendo conto, per le prime due, che la funzione che vale costantemente 1 su un compatto, che quindi ha misura finita, `e integrabile. Per la prima affermazione si osservi che vale: 2|f(x)| ≤ |f(x)|2 + 1 , per cui l’integrale del primo membro `e maggiorato da quello del secondo. Per la seconda affermazione si noti che, dalla disuguaglianza di Cauchy-Schwarz
2 |g(x)| 1 dx
≤
K
|g(x)|2 dx
K
1dx
,
K
sostituendo f(x) − fn (x) a g(x) si ha la prova della seconda affermazione. Riguardo alla terza e quarta affermazione `e sufficiente notare che, per la stessa definizione di integrale di Lebesgue: |g|p dx ≤ ess sup |g|p dx = (||g||∞)p dx K
K
K
per ogni funzione misurabile g definita su K.
K
3.6 La trasformata di Fourier-Plancherel
141
Proposizione 3.74. La trasformazione di Fourier-Plancherel e quella di Fourier godono delle seguenti propriet` a. (a) Se f ∈ L2 (Rn , dx) ∩ L1 (Rn , dx), la sua trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier F f calcolata direttamente con la formula integrale (3.61). (b) Se f ∈ L2 (Rn , dx), la sua trasformata di Fourier-Plancherel pu` o essere calcolata come: Fˆ f = lim gn , n→+∞
dove il limite `e nel senso di L2 (Rn , dk): gn (k) := Kn
eik·x f(x)dx , (2π)n/2
(3.74)
essendo gli insiemi Kn ⊂ Rn tutti compatti e tali che Km+1 ⊃ Km per m = n 1, 2, . . ., con ∪∞ m=1 Km = R . Dimostrazione. (a) Cominciamo a provare la tesi per le funzioni f ∈ L2 (Rn , dx) tali che f sia differente da 0 su un insieme di misura nulla fuori da un compatto K0 . In questo caso f appartiene anche a L1 (Rn , dx). Sia quindi {sn }n∈N ⊂ S(Rn ) una successione di funzioni che tendono a f nella norma di L2 (Rn , dx). Se B e B sono due palle aperte di raggio finito tali che B ⊃ B ⊃ B ⊃ K0 , possiamo costruire una funzione h ∈ D(Rn ) tale da valere ` chiaro che se fn := h · sn , costantemente 1 su B e da annullarsi fuori da B. E la successione {fn } `e costituita da funzioni di D(Rn ), e quindi S(Rn ), con supporti contenuti nel compatto K := B. Quindi tutte le fn sono anche in L1 (Rn , dx) e la successione {fn } tende a f sia nella norma di L2 (Rn , dx) che in quella di L1 (Rn , dx). Per definizione, valendo fn → f nella norma || ||2 , sar`a: ||Ffn − Fˆ f||2 → 0
(3.75)
per n → +∞. D’altra parte, dato che fn → f anche nella norma || ||1 , per (a) di proposizione 3.69 ||Ffn − Ff||∞ → 0 per n → +∞. Dato che, sugli insiemi di misura finita, la convergenza nella norma || ||∞ implica quella nella norma || ||2 , avremo che: (3.76) ||Ffn − Ff||2 → 0 = F f. e quindi, valendo (3.75) e per l’unicit` a del limite, dovr` a essere Ff Supponiamo ora che f ∈ L2 (Rn , dx) ∩ L1 (Rn , dx) senza altre restrizioni. Consideriamo una classe di compatti {Kn } che soddisfino le ipotesi nel punto (b). Definiamo le funzioni fn := χKn · f, dove χE `e la funzione caratteristica dell’insieme E (definita in modo che χE (x) = 0 se x ∈ E e χE (x) = 1 ` chiaro che vale fn → f puntualmente per n → +∞. Inoltre se x ∈ E). E |f(x) − fn (x)|p ≤ |f(x)|p per p = 1, 2, . . .. Allora, per il teorema della convergenza dominata di Lebesgue, fn → f per n → +∞ in particolare rispetto alla
142
3 Spazi di Hilbert e operatori limitati
norma || ||1 e a quella || ||2 . D’altra parte, per quanto dimostrato sopra: F fn = Ffn . Quindi, per (a) di proposizione 3.69, troviamo che ||Ff − F fn ||∞ → 0 ed allo − Ffn ||2 → 0. Questi fatti varranno anche per le stesso tempo vale anche ||Ff funzioni che si ottengono restringendo Ff, F f, F fn ad un qualsiasi compatto K. Tenendo conto che per funzioni nulle fuori da un compatto la convergenza uniforme implica quella in L2 , si ha che se x appartiene ad un compatto qualsiasi, (F f)(x) = (Ff)(x) quasi ovunque. Ma ogni x ∈ Rn appartiene ad un compatto, per cui F f = Ff come elementi di L2 (Rn , dx). (b) La prova `e stata data nella parte finale della dimostrazione del punto (a). Esempi 3.75. (1) Un fatto piuttosto importante che distingue nettamente lo spazio D(Rn ) da S(Rn ) `e che il primo spazio, al contrario del secondo, non `e invariante sotto ` infatti la trasformazione di Fourier (e la trasformata inversa di Fourier). E n n n n chiaro che, essendo D(R ) ⊂ S(R ), vale F (D(R )) ⊂ F (S(R )) ⊂ S(Rn ), tuttavia non si pu` o chiedere di pi` u. Infatti vale il seguente risultato. Proposizione 3.76. Sia f ∈ D(Rn ), se anche Ff ∈ D(Rn ), allora f = 0. Lo stesso fatto vale per la trasformata inversa di Fourier. Dimostrazione. La prova `e semplice; la svolgiamo per F , ma la stessa prova vale anche per F− . Se vale: eip·x g(k) = f(x) dx , n/2 Rn (2π) dove f ha supporto compatto, allora l’integrale di sopra converge anche per k ∈ Cn . Inoltre, facendo uso del teorema della convergenza dominata di Lebesgue, si pu` o far passare la derivata nelle componenti ki di k, e nelle loro parti reale ed immaginaria, sotto il segno di integrale. Dato che k → eik·x `e analitica (cio`e analitica in ogni variabile ki separatamente), soddisfer`a le condizioni di Cauchy-Riemann in ogni variabile ki . Di conseguenza tali condizioni saranno soddisfatte anche per la funzione g in ogni variabile ki . Si conclude che g `e una funzione analitica su tutto Cn . La restrizione di g ad Rn definir` a, tramite la parte reale e quella immaginaria, due funzioni analitiche di variabile reale su tutto Rn . Se g ha supporto compatto, esister`a un aperto non vuoto di Rn ` un fatto ben noto nella teoria delle funzioni in cui Re g e Im g si annullano. E analitiche (reali di variabile reale) che se una funzione analitica definita su un aperto connesso (in questo caso tutto Rn ) si annulla su un aperto non vuoto incluso nel suo dominio, allora si annulla ovunque nel dominio. Dobbiamo quindi concludere che, nelle nostre ipotesi su f, se g ha supporto compatto, essa deve necessariamente essere la funzione nulla. Tale dovr`a anche essere f, in quanto F `e invertibile su S(Rn ).
3.6 La trasformata di Fourier-Plancherel
143
(2) Un fatto connesso con (1) `e il noto teorema di Paley-Wiener (vedi per es. [KiGv83]): Teorema 3.77. (Di Paley-Wiener.) Sia a > 0 e si consideri L2 ([−a, a], dx) come sottospazio di L2 (R, dx). Lo spazio Fˆ (L2 ([−a, a], dx)) contiene tutte e sole le funzioni g = g(k) tali che ciascuna di esse possa essere estesa analiticamente ed univocamente a tutto il piano complesso nella variabile k ∈ C in una funzione analitica che soddisfi: |g(k)| ≤ Ce2πa|Imk| ,
per ogni k ∈ C
per qualche costante C ≥ 0 dipendente da g. Visto che deve essere Fˆ (L2 ([−a, a], dx)) ⊂ L2 (R, dk) per il teorema di Plancherel, il teorema di Paley-Wiener implica che le funzioni analitiche g che sono limitate secondo la disuguaglianza di sopra per qualche costante C ≥ 0, individuano elementi di L2 (R, dk) quando k `e ristretta a R. Per concludere, consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione usata in (4) di esempi 3.33 per costruire basi Hilbertiane che deriva dalla teoria della trasformata di Fourier-Plancherel. Proposizione 3.78. Sia f : (a, b) → C misurabile tale che: (1) l’insieme {x ∈ (a, b) | f(x) = 0} ha misura nulla, (2) esistono C, δ > 0 per cui |f(x)| < Ce−δ|x| per ogni x ∈ (a, b). In questo caso lo spazio lineare finitamente generato da tutte le funzioni della forma x → xn f(x) := fn (x) per n = 0, 1, 2, . . . `e denso in L2 ((a, b), dx). ` sufficiente provare che S ⊥ = {0} dato che Dimostrazione. Sia S := {fn }n∈N . E ⊥ 2 `e S ⊕ < S > = L ((a, b), dx) per il teorema 3.14. Sia allora h ∈ L2 ((a, b), dx) tale che b
xn f(x)h(x)dx = 0 a
per ogni n = 0, 1, 2, . . .. Possiamo estendere la funzione h a tutta la retta reale definendola nulla fuori da (a, b). La condizione di sopra si riscrive: xn f(x)h(x)dx = 0 , (3.77) R
per ogni n = 0, 1, 2, . . .. Valgono inoltre i seguenti fatti: (i) f · h ∈ L1 (R, dx): infatti entrambe le funzioni sono in L2 (R, dx), per cui il loro prodotto `e in L1 (R, dx), (ii) f · h ∈ L2 (R, dx), perch´e |f(x)|2 < C 2 e−2δ|x| < C 2 < +∞ e |h|2 `e integrabile per ipotesi, (iii) la funzione che manda x ∈ R in eδ |x|f(x)h(x) `e in L1 (R, dx) per ogni δ < δ |x| δ. Infatti, essendo x → |e f(x)| ≤ Ce−(δ−δ )|x| , la funzione x → eδ |x|f(x)
144
3 Spazi di Hilbert e operatori limitati
`e in L2 (R, dx); inoltre h ∈ L2 (R, dx) per ipotesi, per cui il loro prodotto `e in L1 (R, dx). Per (i) possiamo calcolare la trasformata di Fourier: ik·x e √ f(x)h(x) dx . g(k) = 2π R Questa coincider` a con la trasformata di Fourier-Plancherel di f · h per i punti (i) e (ii) insieme, tenuto conto di (a) della proposizione 3.74. Per (iii), se k `e complesso e |Imk| < δ, la funzione g = g(k) di sopra `e ben definita ed analitica nella banda aperta B ⊂ C definita da Rek ∈ R, |Imk| < δ; la prova si costruisce analogamente a quanto fatto nell’esempio (1). Usando il teorema della convergenza dominata di Lebesgue e passando sotto il segno di integrale l’operatore di derivazione, `e infine facile provare che, per ogni n = 0, 1, . . .: dn g in √ | = xn f(x)h(x)dx . k=0 dk n 2π R Tutte queste derivate sono nulle per (3.77), di conseguenza lo sviluppo di Taylor di g nell’origine `e nullo e quindi g si annulla in un disco aperto contenuto nella banda B. Essendo g analitica, si annuller` a identicamente nell’aperto connesso B ed in particolare sull’asse k reale. Quindi, in particolare, avremo che la trasformata di Fourier-Plancherel della funzione f · h `e il vettore nullo di L2 (R, dk). Dato che la trasformata di Fourier-Plancherel `e una trasformazione unitaria dobbiamo concludere che f · h = 0 quasi ovunque su R ed in particolare su (a, b) dove per ipotesi f = 0 quasi ovunque. Ma allora deve essere h = 0 quasi ovunque su (a, b), ovvero ogni h ∈ S ⊥ coincide con l’elemento nullo di L2 ((a, b), dx). Questo conclude la prova.
Esercizi 3.1. Si pu` o dare la definizione di (semi) prodotto scalare anche per spazi vettoriali sul campo reale, semplicemente rimpiazzando la richiesta H2 nella definizione 3.1 con S(u, v) = S(v, u) ed usando solo combinazioni lineari a coefficienti in R in H1. Mostrare che, con la nozione di prodotto scalare reale data sopra, vale ancora la proposizione 3.3, con l’unica differenza che l’identit` a di polarizzazione viene sostituita con la (3.4). 3.2. (Difficile.) Si consideri uno spazio vettoriale con campo reale. Provare che se una (semi) norma p su tale spazio soddisfa l’identit` a del parallelogramma (3.3): p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 ) , (3.78) allora esiste, ed `e unico, un (semi) prodotto scalare S, definito come indicato nell’esercizio precedente, che induce p tramite la (3.2).
Esercizi
145
Soluzione. Se S `e un (semi) prodotto scalare sullo spazio vettoriale X reale, vale l’identit` a di polarizzazione (3.7): S(x, y) =
1 (S(x + y, x + y) − S(x − y, x − y)) . 4
Da questa identit` a segue immediatamente la prova dell’unicit` a di S, dato che S(z, z) = p(z)2 . Per provare l’esistenza di S per una fissata norma p su X definiamo: 1 S(x, y) := p(x + y)2 − p(x − y)2 . 4 Dimostriamo che S `e un semi prodotto scalare o un prodotto scalare a seconda che p sia una norma o una seminorma. Si osservi che se questo `e vero e se p `e una norma, allora, sostituendo S a p nel secondo membro dell’identit`a di sopra, si ha subito che S(x, x) = 0 implica che x = 0 e quindi S `e un prodotto scalare. Per concludere la dimostrazione dobbiamo provare che, definito S come detto sopra, per x, y, z ∈ X vale: (a) S(αx, y) = αS(x, y) se α ∈ R, (b) S(x + y, z) = S(x, z) + S(y, z), (c) S(x, y) = S(y, x), (d) S(x, x) = p(x)2 . Le propriet`a (c) e (d) seguono immediatamente dalla definizione di S. Dimostriamo le rimanenti due: (a) e (b). Da (3.3) e dalla definizione di S si ha: S(x, z) + S(y, z) = 4−1 p(x + z)2 − p(x − z)2 + p(y + z)2 − p(y − z)2
2
2
x+y x+y x+y −1 p = 2S +z −p −z ,z . =2 2 2 2 Abbiamo ottenuto che:
S(x, z) + S(y, z) = 2S
x+y ,z 2
.
(3.79)
` allora chiaro che (a) implica (b). Non resta che provare (a). Ponendo y = 0 E nell’identit` a (3.79) e tenendo conto del fatto che S(0, z) = 0 per la nostra definizione di S, otteniamo: S(x, z) = 2S(x/2, z) . Iterando la formula abbiamo immediatamente che (a) vale per α = m/2n , dove m, n = 0, 1, 2, . . .. Tali numeri formano un insieme denso in [0, +∞). D’altra parte R α → p(αx + z) e R α → p(αx − z) sono funzioni continue (usando la topologia indotta dalla norma p), ma allora, usando ancora S(x, y) := 1 (p(x + y, x + y) − p(x − y, x − y)), concludiamo che R α → S(αx, y) `e 4
146
3 Spazi di Hilbert e operatori limitati
continua in α e quindi (a) vale per α ∈ [0, +∞). Dalla definizione di S segue ancora che S(−x, y) = −S(x, y) e quindi il risultato si estende a tutti i valori di α ∈ R e la dimostrazione `e conclusa. 3.3. (Difficile.) Mostrare che se, su uno spazio vettoriale sul campo C, una (semi) norma p soddisfa l’identit` a del parallelogramma (3.3): p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 ) ,
(3.80)
allora esiste, ed `e unico, un (semi) prodotto scalare S che induce p tramite (3.2). Soluzione. Se S `e un (semi) prodotto scalare sullo spazio vettoriale complesso X, vale l’identit` a di polarizzazione (3.4): 4S(x, y) = S(x+y, x+y)−S(x−y, x−y)−iS(x+iy, x+iy)+iS(x−iy, x−iy). Essendo S(z, z) = p(z)2 , come nel caso reale, questa identit`a implica l’unicit` a di S per una data norma p su X. Passiamo alla prova di esistenza. Definiamo, per una data (semi) norma p e per x, y ∈ X: S1 (x, y) := 4−1 (p(x + y)2 − p(x − y)2 ) ,
S(x, y) := S1 (x, y) − iS1 (x, iy) .
Si osservi che S(x, x) = p(x)2 , inoltre, per costruzione, se p `e una norma, segue subito che S(x, x) = 0 implica che x = 0. Rimane solo da provare che S definito come sopra `e un (semi) prodotto scalare hermitiano secondo la definizione 3.1. Questa definizione equivale alla validit` a delle richieste: (a) S(αx, y) = αS(x, y) se α ∈ C, (b) S(x + y, z) = S(x, z) + S(y, z), (c) S(x, y) = S(y, x), (d) S(x, x) = p(x)2 . La propriet` a (d) `e vera per costruzione. Procedendo come nell’esercizio precedente, usando S1 al posto di S, si provano essere vere: la propriet` a (b) per S1 , la propriet` a (a) per S1 con α ∈ R e la propriet` a S1 (x, y) = S1 (y, x). Queste propriet` a, usando la definizione di S in funzione di S1 provano facilmente (a), (b) e (c). 3.4. Dimostrare quanto asserito in (1) in osservazioni 3.4 per uno spazio con (semi) prodotto scalare (X, S). Suggerimento. Se X×X (xn , yn ) → (x, y) ∈ X×X per n → +∞, usando la disuguaglianza di Cauchy-Schwarz. Provare che se S `e il (semi) prodotto scalare e p la (semi) norma associata, allora vale: |S(x, y) − S(xn , yn )| ≤ p(xn )p(yn − y) + p(xn − x)p(y) , e tenere conto che p(xn ) → p(x) e che la proiezione canonica `e continua nella topologia prodotto.
Esercizi
147
3.5. Considerare lo spazio di Banach p (N) con p ≥ 1. Provare che, se p = 2, `e impossibile definire un prodotto scalare hermitiano su tale spazio che induca la solita norma || ||p e che quindi lo renda spazio di Hilbert. Suggerimento. Mostrare che esistono coppie di vettori f, g che violano l’identit` a del parallelogramma. Considerare f = (1, 1, 0, 0, . . .) e g = (1, −1, 0, 0, . . .). 3.6. Considerare lo spazio di Banach (C([0, π/2], || ||∞). Provare che `e impossibile definire un prodotto scalare hermitiano su tale spazio che induca la solita norma || ||∞ e che quindi lo renda spazio di Hilbert. Suggerimento. Mostrare che esistono coppie di vettori f, g che violano l’identit` a del parallelogramma. Considerare f(x) = cos x e g(x) = sin x. 3.7. Nello spazio di Hilbert H, si consideri una successione {xn }n∈N ⊂ H che converge a x ∈ H in senso debole. In altre parole f(xn ) → f(x), se n → +∞, per ogni f ∈ H . Mostrare che in generale xn → x nel senso della topologia di H. Tuttavia, se vale anche la condizione ||xn || → ||x||, se n → +∞, o pi` u debolmente ||xn|| → kn ≤ ||x||, se n → +∞, per ogni n ∈ N, allora xn → x, se n → +∞, nel senso della topologia di H. Suggerimento. Per il teorema di Riesz, {xn }n∈N ⊂ H che converge a x ∈ H in senso debole se e solo se (z|xn ) → (z|x), se n → +∞, per ogni z ∈ H. Se {xn }n∈N `e una base hilbertiana di H, pensato come separabile, allora xn → 0 in senso debole, ma non nella topologia di H. Per la seconda questione, notare che ||x − xn ||2 = ||x||2 + ||xn||2 − 2Re(x|xn ). 3.8. Sia C ⊂ H un sottospazio chiuso nello spazio di Hilbert H. Provare che `e chiuso nella topologia debole. In altre parole, se {xn }n∈N ⊂ C tende debolmente (vedi esercizio precedente) a x ∈ H, allora x ∈ C. Suggerimento. Se PC : H → C `e il proiettore ortogonale su C, mostrare che PC xn → PC x in senso debole. 3.9. Provare la proposizione 3.8: un operatore lineare L : X → Y, con X e Y spazi con prodotto scalare, `e un’isometria nel senso della definizione 3.6 se e solo se soddisfa: ||Lx||Y = ||x||X per ogni x ∈ X, dove le norme sono quelle associate ai prodotti scalari dei corrispondenti spazi di Hilbert. Suggerimento. Usare l’identit` a di polarizzazione. 3.10. Siano H uno spazio di Hilbert e T : D(T ) → H un operatore lineare, dove D(T ) ⊂ H `e un sottospazio denso in H (eventualmente D(T ) = H). Si provi che se (u|T u) = 0 per ogni u ∈ D(T ) allora T = 0, cio`e T `e l’operatore nullo (che manda ogni vettore in 0).
148
3 Spazi di Hilbert e operatori limitati
Soluzione. Vale 0 = (u + v|T (u + v)) = (u|T u) + (v|T v) + (u|T v) + (v|T u) = (u|T v) + (v|T u) . Similmente 0 = i(u+iv|T (u+iv)) = i(u|T u)+i(v|T v)−(u|T v)+(v|T u) = −(u|T v)+(v|T u). Quindi, sommando membro a membro, (v|T u) = 0 per ogni u, v ∈ D(T ). Scegliendo {vn }n∈N ⊂ D(T ) tale che vn → T u per n → +∞, si ha che ||T u||2 = (T u|T u) = limn→+∞ (vn |T u) = 0 per ogni u ∈ D(T ), ossia T u = 0 per ogni u ∈ D(T ) e quindi T = 0. 3.11. Si consideri L2 ([0, 1], m) dove m `e la solita misura di Lebesgue. Sia f ∈ L2 ([0, 1], m). Mostrare che l’operatore Tf : L2 ([0, 1], m) g → f · g, dove · `e l’ordinario prodotto di funzioni punto per punto, `e ben definito, limitato con norma ||Tf || ≤ ||f|| e normale. Infine Tf `e autoaggiunto se e solo se f ammette solo valori reali, escluso al pi` u i valori di f su un insieme di misura nulla in [0, 1]. 3.12. Sia T ∈ B(H) autoaggiunto. Per λ ∈ R, si consideri la serie di operatori U (λ) :=
∞ n=0
(iλ)n
Tn , n!
dove T 0 := I, T 1 := T , T 2 := T T e via di seguito e la convergenza `e quella nella topologia uniforme. Si dimostri che la serie converge ad un operatore unitario. Suggerimento. Lavorare come per dimostrare le propriet`a della funzione esponenziale partendo dalla definizione in termini di serie. 3.13. In riferimento all’esercizio precedente, provare che se λ, μ ∈ R, U (λ)U (μ) = U (λ + μ). 3.14. Mostrare che la serie nell’esercizio 3.12 converge per ogni λ ∈ C ad un operatore limitato e che U (λ) `e sempre normale. 3.15. Mostrare che l’operatore U (λ) dell’esercizio 3.12 `e positivo se λ ∈ iR. Ci sono valori di λ ∈ C per cui U (λ) `e un proiettore (non necessariamente ortogonale)? 3.16. Calcolare esplicitamente U (λ) dell’esercizio 3.12 se T `e definito come Tf dell’esercizio 3.11 con f = f . 3.17. In 2 (N) si consideri l’operatore T : {xn } → {xn+1 /n}. Provare che T `e limitato e calcolare T ∗ .
Esercizi
149
3.18. Si consideri l’operatore di Volterra T : L2 ([0, 1], dx) → L2 ([0, 1], dx): x (T f)(x) = f(t)dt . 0
Si dimostri che `e ben definito, limitato e che il suo aggiunto soddisfa: 1 f(t)dt per ogni f ∈ L2 ([0, 1], dx). (T ∗ f)(x) = x
Suggerimento. Si ricordi che, essendo [0, 1] di misura di Lebesgue finita, L2 ([0, 1], dx) ⊂ L1 ([0, 1], dx) e usare il teorema C.6.
4 Propriet` a elementari degli operatori compatti, di Hilbert-Schmidt e di classe traccia Misura ci` o che `e misurabile, e rendi misurabile ci` o che non `e. Galileo
Dal punto di vista delle applicazioni alla MQ, il fine di questo capitolo `e quello di introdurre alcuni tipi di operatori che useremo quando definiremo la nozione di stato quantistico. Tali operatori sono noti in letteratura come operatori di classe traccia oppure operatori nucleari. Si tratta di operatori limitati su uno spazio di Hilbert che ammettono traccia. Per arrivare a definire gli operatori di classe traccia `e necessario introdurre gli operatori compatti, detti anche completamente continui, che rivestono una notevole importanza in vari rami della matematica e delle applicazioni alla fisica, indipendentemente dalle teorie quantistiche. Nella prima sezione del capitolo presenteremo la nozione generale di operatore compatto su uno spazio normato, discutendone brevemente le propriet` a generali in spazi normati e di Banach. Proveremo anche il classico risultato riguardante la non compattezza della palla unitaria in dimensione infinita. Nella seconda sezione specializzeremo la definizione al caso di spazi di Hilbert, in riferimento, in particolare agli spazi L2 , sui quali gli operatori compatti (come quelli di Hilbert-Schmidt) ammettono una certa rappresentazione integrale. Mostreremo che l’insieme degli operatori compatti individua uno ∗ideale bilatero nella C ∗ algebra degli operatori limitati sullo spazio di Hilbert. In questa sede enunceremo e dimostreremo il celebre teorema di Hilbert sollo sviluppo spettrale degli operatori compatti, che pu`o essere considerato come il precursore di tutti i teoremi di decomposizione spettrale che discuteremo nei prossimi capitoli. La quarta sezione riguarder`a lo ∗-ideale bilatero degli operatori di HilbertSchmidt (H-S) e le loro propriet`a pi` u elementari. In particolare mostreremo che lo spazio degli operatori di H-S `e a sua volta uno spazio di Hilbert. La penultima sezione concerner`a l’introduzione dello ∗-ideale bilatero degli operatori di classe traccia e la dimostrazione delle propriet`a pi` u importanti (e pi` u utili in fisica) di tali operatori. In particolare dimostreremo la propriet` a di ciclicit` a della traccia.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
152
4 Classi di operatori compatti
L’ultima sezione conterr`a una concisa introduzione al teorema dell’alternativa di Fredholm per le equazioni integrali di Fredholm di seconda specie.
4.1 Operatori compatti in spazi normati e di Banach In questa sezione introdurremo gli operatori compatti in spazi normati, dopo avere richiamato alcuni risultati generali degli insiemi compatti in spazi normati, specialmente nel caso infinitodimensionale. Nella sezione successiva ci restringeremo a lavorare negli spazi di Hilbert. 4.1.1 Compatti in spazi normati (infinitodimensionali) Ricordiamo che in uno spazio topologico generale un insieme compatto `e definito come nella definizione 2.28. Una nozione connessa `e quella di compattezza sequenziale. Definizione 4.1. Un sottoinsieme K di uno spazio topologico `e detto sequenzialmente compatto se per ogni successione {xn }n∈N ⊂ K esiste una sotto successione {xnp }p∈N convergente ad un punto di K. Osservazioni 4.2. Elenchiamo di seguito alcune propriet` a generali degli insiemi compatti che dovrebbero essere note dai corsi elementari di topologia [Ser94II]. Useremo tali propriet` a nel seguito. (1) La propriet` a di compattezza `e ereditaria (nel senso della topologia indotta) come precisato nella proposizione 2.30. (2) I sottoinsiemi chiusi dei compatti sono compatti e, negli spazi di Hausdorff (in particolare gli spazi vettoriali normati, come gli spazi di Hilbert), i compatti sono chiusi. (3) Negli spazi topologici metrizzabili (e quindi ancora in particolare gli spazi vettoriali normati, come gli spazi di Hilbert), la propriet` a di compattezza `e equivalente a quella di compattezza sequenziale. Un’altra propriet` a utile che vale in spazi metrici `e la seguente, che dimostreremo. Proposizione 4.3. Sia (X, || ||) spazio normato. Se A ⊂ X `e tale che ogni successione di punti di A ammette una sotto successione convergente (non necessariamente in A), allora A `e relativamente compatto. Dimostrazione. L’unica cosa da mostrare `e che se {yk }k∈N ⊂ A, allora esiste una sotto successione di {yk }k∈N che converge (in A, essendo esso chiuso). (k) Data {yk }k∈N ⊂ A, ci saranno delle successioni, una per ogni k, {xn }n∈N ⊂ (k) A, con xn → yk per n → +∞. Fissando k e prendendo un corrispondente nk sufficientemente grande, possiamo allora costruire termine per termine una
4.1 Operatori compatti in spazi normati e di Banach
153
(k)
nuova successione {zk := xnk }k∈N ⊂ A tale che ||yk − zk || < 1/k. Nelle ipotesi fatte su A, esister`a una sotto successione di {zk }k∈N , {zkp }p∈N , che converge a qualche y ∈ A. Si ha: ||ykp − y|| ≤ ||ykp − zkp || + ||zkp − y|| . Dato che 1/kp → 0 per p → +∞, fissato > 0, esister`a P tale che, se p > P , allora ||zkp − y|| < /2 insieme a 1/kp < /2, per cui ||ykp − y|| < . In altre parole ykp → y per p → +∞. Osservazione 4.4. La proposizione provata vale anche per spazi metrici, con banali modifiche nella dimostrazione. Esempi di compatti in uno spazio normato infinitodimensionale (X, || ||) si ottengono facilmente considerando compatti in sottospazi finitodimensionali. Come sappiamo dalla sezione 2.6, ogni sottospazio finitodimensionale S `e omeomorfo ad uno spazio Cn (o Rn nel caso si lavori con spazi vettoriali reali); in tal caso ogni insieme chiuso e limitato K ⊂ S (per esempio la chiusura di una palla aperta di raggio finito) `e un compatto in S per il teorema di Heine-Borel. Dato che la compattezza `e una propriet` a topologica ereditaria nel senso precisato nella proposizione 2.30, K continua ad essere un compatto anche nella topologia di (X, || ||). Un risultato importante e notevole, che distingue nettamente il caso di uno spazio normato finito-dimensionale da quello infinito-dimensionale e che si applica, pi` u in generale, a spazi metrici, `e il seguente. Proposizione 4.5. Sia (X, || ||) uno spazio normato. Se X ha dimensione infinita, la chiusura della palla aperta unitaria {x ∈ X | ||x|| < 1} non pu` o essere compatta. Lo stesso risultato vale per ogni palla aperta di raggio arbitrario finito e centrata in qualsiasi punto dello spazio. Dimostrazione. Indichiamo con B la palla aperta unitaria centrata nell’origine e supponiamo che B sia compatta. Allora possiamo ricoprire B, e quindi B, con un numero N > 0 di palle aperte Bk , di raggio 1/2 e centrate rispettivamente in xk , k = 1, . . . , N . Consideriamo un sottospazio Xn di X, di dimensione finita n, tale da contenere i vettori xk . Dato che la dimensione di X `e infinita, possiamo scegliere n > N arbitrariamente grande. Definiamo le ulteriori palle, di raggi 1 e 1/2 rispettivamente, P := B ∩ Xn e Pk := Bk ∩ Xn per ogni k = 1, . . . , N . Identifichiamo Xn con R2n (o Rn se il campo di X `e R) tramite la scelta di una base di Xn , {zk }k=1,...,n . Notare che una palla Pk non soddisfa necessariamente l’equazione di una palla in R2n in questa costruzione. Se normalizziamo la misura di Lebesgue m di R2n dividendo per il volume di P (che `e non nullo dato che `e aperto non vuoto per la proposizione 2.112) abbiamo che m(P ) = 1. Mostriamo che allora m(Pk ) = (1/2)n . La misura di Lebesgue `e invariante per traslazioni per cui ci si pu` o ridurre a considerare le
154
4 Classi di operatori compatti
palle centrate nell’origine di raggio r, B(r). Dato che ogni norma `e una funzione omogenea vale B(λr) = {λu | u ∈ B(r)} =: λB(r) per ogni λ > 0. Dato che la misura di Lebesgue su R2n soddisfa m(λE) = λ2n m(E), nelle ipotesi fatte risulta che deve essere m(Pk ) = m((1/2)P ) = (1/2)n m(P ) = (1/2)n . Essendo N N infine B ⊂ ∪N k=1 Bk e dunque P ⊂ ∪k=1 Pk , deve essere m(P ) ≤ k=1 m(Pk ) per subadditivit` a, ossia 1 ≤ N (1/2)2n. Questo `e impossibile se n `e abbastanza grande (N `e fissato). La dimostrazione si esegue con banali modifiche per ogni palla aperta di raggio finito centrata in qualsiasi punto dello spazio normato. Il corollario che segue mostra come, ancora una volta, passando dal caso finito dimensionale al caso infinitodimensionale, i compatti acquistino propriet` a differenti. In Cn o Rn dotati della norma standard, esistono compatti con interno non vuoto: basta considerare la chiusura di un qualsiasi insieme aperto limitato. Il teorema di Heine-Borel assicura allora che tale chiusura (che continua ad essere limitata) `e un compatto ed ha sicuramente interno non vuoto per costruzione. Similmente, lo spazio C che `e completo, si pu`o ottenere come l’unione di una classe numerabile di sottoinsiemi compatti: basta usare la classe dei dischi aperti di centri di coordinate razionali (con segno) e raggi razionali. Nel caso infinitodimensionale le cose cambiano drasticamente. Corollario 4.6. Sia X spazio normato infinito dimensionale. Allora valgono i seguenti fatti. (a) Se K ⊂ X `e compatto, l’interno di K `e vuoto. (b) Se X `e ulteriormente completo (cio`e `e uno spazio di Banach) allora X non pu` o essere ottenuto come l’unione numerabile di suoi sottoinsiemi compatti. Dimostrazione. (a) Supponiamo che l’interno di K sia non vuoto, allora contiene una palla aperta B, dato che le palle aperte formano una base della topologia. Vale B ⊂ K = K (dove si `e tenuto conto del fatto che i compatti sono chiusi, dato che gli spazi normati sono di Hausdorff). I sottoinsiemi chiusi dei compatti sono a loro volta compatti e pertanto B dovrebbe essere compatta, cosa impossibile per la proposizione precedente. (b) la tesi segue immediatamente da (a) e dall’ultima affermazione dell’enunciato del teorema 2.98 di Baire, dove X `e il nostro spazio normato completo. 4.1.2 Operatori compatti in spazi normati Possiamo ora introdurre la nozione di operatore compatto. Ricordiamo che in uno spazio normato (X, || ||) un insieme M `e detto limitato (rispetto alla norma || ||) se esiste una palla aperta, Bδ (x0 ), di raggio finito δ > 0 e centrata in qualche punto x0 ∈ X, tale che M ⊂ Bδ (x0 ). ` chiaro, allora, che M `e limitato se e solo se esiste una palla metrica di raggio E finito δ > 0 e centrata nell’origine di X, che contiene M (basta scegliere il raggio di tale palla pari a δ + ||x0||).
4.1 Operatori compatti in spazi normati e di Banach
155
Definizione 4.7. Siano X, Y spazi normati sullo stesso campo R o C. T ∈ L(X, Y) `e detto compatto o completamente continuo se vale una delle due condizioni equivalenti: (a) per ogni sottoinsieme M ⊂ X limitato, T (M ) `e relativamente compatto in Y; (b) se {xn }n∈N ⊂ X `e limitata, allora c’`e una sotto successione, {xnk }k∈N , tale che {T xnk }k∈N converge in Y. B∞(X, Y) denota il sottoinsieme degli operatori compatti da X a Y e, in particolare, B∞ (X) denota il sottoinsieme degli operatori compatti da X in X. Osservazioni 4.8. ` chiaro che (a) ⇒ (b). L’implicazione inversa, (b) ⇒ (a), `e immediata (1) E conseguenza della proposizione 4.3. (2) Ogni operatore compatto `e sicuramente limitato. Infatti, la palla chiusa di raggio 1 centrata nell’origine di X `e mappata in un insieme (che contiene l’origine) a chiusura compatta K. Essendo compatto, K `e ricopribile da un numero finito, N , di palle aperte di raggio finito r > 0, Br (yi ). Vale allora K ⊂ ∪N e il massimo delle distanze tra i centri i=1 Br (yi ) ⊂ BR+r (0), dove R ` yi delle palle e l’origine. In particolare ||T (x)|| ≤ (R + r) per ||x|| = 1 per cui ||T || ≤ r + R < +∞. Gli insiemi B∞ (X, Y) e B∞ (X) sono in realt` a spazi vettoriali rispetto alla solita definizione di combinazioni lineari di operatori, e dunque sono sottospazi vettoriali di B(X, Y) e B(X) rispettivamente. Non solo, ma godono di un’ulteriore propriet` a chiarita nella seguente proposizione. Proposizione 4.9. Se X e Y sono spazi normati, B∞ (X, Y) soddisfa quanto segue. (a) B∞ (X, Y) `e un sottospazio vettoriale di B(X, Y). (b) Se Z `e un ulteriore spazio normato e A ∈ B(X, Y) allora: (i) se B ∈ B(Z, X), vale AB ∈ B∞ (Z, Y), (ii) se B ∈ B(Y, Z), vale BA ∈ B∞ (X, Z). (c) Se Y `e spazio di Banach e {An }n∈N ⊂ B∞ (X, Y) converge a A ∈ B(X, Y) nella topologia operatoriale uniforme, allora A ∈ B∞ (X, Y). In altre parole B∞(X, Y) `e un sottospazio chiuso dello spazio di Banach (B∞ (X, Y), || ||), dove || || `e la norma operatoriale. Dimostrazione. (a) Si consideri l’operatore αA + βB con α, β ∈ C e A, B ∈ B∞(X, Y). Mostriamo che `e compatto, provando che ogni successone limitata {xn }n∈N ⊂ X ammette una sottosuccessione {xnr }r∈N ⊂ X tale che la associata successione delle immagini {(αA + βB)(xnr )}r∈N ⊂ Y `e convergente. Sia {xn }n∈N ⊂ X una successione limitata, allora esister`a una sottosuccessione {xnk }k∈N per cui la successione dei valori Axnk ⊂ Y converge, dato che A `e compatto. La sottosuccessione {xnk }k∈N sar`a anche limitata per ipotesi, pertanto esister`a una sua sottosuccessione, {xnkm }m∈N , tale che la successione dei valori Bxnkm ∈ Y converge. Per costruzione {xnkm }m∈N `e una sottosuc-
156
4 Classi di operatori compatti
cessione di {xnk }k∈N tale che la successione di valori αAxnkm + βBxnkm ⊂ Y converge. (b) Nel primo caso, se {zk }k∈N ⊂ Z `e limitata da M > 0, i valori Bzk formano un insieme limitato da ||B||M dato che B `e limitato. Dato che A `e compatto, esiste una sottosuccessione {znk }k∈N per cui la sottosuccessione dei valori ABznk converge. Quindi AB `e compatto. Nel secondo caso, dato che A `e compatto, se {xk }k∈N ⊂ X `e limitata, esiste una sottosuccessione {xnk }k∈N per cui i valori Axnk formano una successione convergente. Dato che B `e continuo, converger`a anche la successione dei valori BAxnk . Pertanto BA `e compatto. (c) Sia B(X, Y) A = limi→+∞ Ai con Ai ∈ B∞ (X, Y). Sia {xn }n∈N una successione limitata di vettori di X: ||xn|| ≤ C per ogni n. Vogliamo provare che esiste una sottosuccessione di {Axn } convergente. Usando una notazione che dovrebbe essere ovvia, con una procedura ricorsiva, costruiamo una famiglia di sottosuccessioni: (2) {xn } ⊃ {x(1) (4.1) n } ⊃ {xn } ⊃ · · · (i+1)
(i)
tale che, per ogni i = 1, 2, . . ., {xn } `e sotto successione di {xn } tale che (i+1) (i) {Ai+1 xn } `e convergente. Questo `e sempre possibile, in quanto ogni {xn } `e limitata da C essendo sotto successione di {xn } ed inoltre Ai+1 `e compatto per ipotesi. La sotto successione di {Axn } che proveremo convergere `e quella di (i) elementi Axi . Usando la disuguaglianza triangolare abbiamo facilmente che (i)
(k)
(i)
(i)
(i)
(k)
(k)
(k)
||Axi − Axk || ≤ ||Axi − An xi || + ||Anxi − An xk || + ||Anxk − Axk || . Usando la stima scritta, nelle nostre ipotesi si ha che: (i)
(k)
(i)
(k)
(i)
(k)
||Axi − Axk || ≤ ||A − An ||(||xi || + ||xk ||) + ||An (xi − xk )|| (i)
(k)
≤ 2C||A − An || + ||An xi − An xk || . Fissato > 0, se n `e grande a sufficienza, varr`a 2C||A − An || ≤ /2, dato che (r) An → A per ipotesi. Fissato n e se r ≥ n, {An (xp )}p `e sotto successione (n) ` facile vedere che la successione della successione convergente {An (xp )}p . E (p) {An (xp )}p costruita, per p ≥ n, con i termini “diagonali” di tutte queste sottosuccessioni, ciascuna sotto successione della precedente per (4.1), `e an(n) cora sotto successione della successione convergente {An (xp )}p , per cui `e anche essa convergente (allo stesso limite). Concludiamo che se i, k ≥ n sono (i) (k) grandi a sufficienza, vale anche ||An xi − An xk || ≤ /2. Quindi, se i, k sono (i) (k) grandi a sufficienza ||Axi − Axk || ≤ /2 + /2 = . Ci` o prova la tesi perch`e abbiamo ottenuto che la sottosuccessione `e di Cauchy nello spazio di Banach Y e quindi converge a qualche elemento di tale spazio. Una propriet` a notevole degli operatori compatti `e espressa dalla seguente proposizione, tenendo conto della proposizione 2.82.
4.1 Operatori compatti in spazi normati e di Banach
157
Proposizione 4.10. Siano X e Y spazi normati. Se X xn → x ∈ X in senso debole e T ∈ B∞ (X, Y), allora ||T (xn ) − T (x)||Y → 0 per n → +∞. In altre parole gli operatori compatti trasformano successioni convergenti debolmente in successioni convergenti in norma. Dimostrazione. La dimostrazione `e data nella soluzione dell’esercizio 4.4. L’ultima propriet` a generale degli operatori compatti in spazi normati, che proveremo prima di ridurci a considerare il caso degli operatori compatti negli spazi di Hilbert, `e il seguente importante risultato riguardante gli autovalori di operatori compatti. Teorema 4.11. (Sugli autovalori degli operatori compatti in spazi normati.) Sia T ∈ B∞(X) con X spazio normato. Valgono i fatti seguenti. (a) Per ogni δ > 0, esiste solo un numero finito di autospazi di T con autovalori λ tali che |λ| > δ. (b) Se λ = 0 `e un autovalore di T , l’autospazio corrispondente ha dimensione finita. (c) Gli autovalori di T formano un insieme limitato, al pi` u numerabile, e possono essere ordinati nell’ordine dei valori assoluti decrescenti: |λ1 | ≥ |λ2 | ≥ · · · 0 con, al pi` u, 0 come unico punto di accumulazione. Dimostrazione. Premettiamo un lemma che servir`a nella dimostrazione di (a) e (b).
Lemma 4.12. (Di Banach.) Sia x1 , x2 , . . . una successione (finita o infinita) di vettori linearmente indipendenti nello spazio normato X e Xn :=< {x1 , x2, . . . , xn } >. Esiste una corrispondente successione y1 , y2 , . . . ⊂ X che verifica, per n = 1, 2, . . .: (i) ||yn || = 1, (ii) yn ∈ Xn , (iii) d(yn , Xn−1 ) > 1/2, dove d(yn , Xn−1) `e la distanza del vettore yn da Xn−1 , cio`e: d(yn , Xn−1) =
inf
x∈Xn−1
||x − yn || .
Dimostrazione del lemma 4.12. Si osservi che d(yn , Xn−1) esiste finito, dato che si tratta dell’estremo inferiore di un insieme non vuoto, limitato dal basso da 0, di numeri reali. Scegliendo y1 := x1 /||x1|| si costruisce induttivamente la successione degli yn come segue. Dato che i vettori x1 , x2 , . . . sono linearmente indipendenti, vale xn ∈ Xn−1 e quindi d(xn , Xn−1) = α > 0. Sia allora x ∈
158
4 Classi di operatori compatti
Xn−1 tale che ||xn − x || < 2α. Dato che α = d(xn , Xn−1) = d(xn − x , Xn−1 ), il vettore: xn − x yn := ||xn − x || soddisfa le condizioni (i),(ii), (iii). Torniamo alla dimostrazione di (a) e (b). Nel caso in cui X sia finito dimensionale la tesi `e ovviamente vera dato che gli autovettori di autovalori differenti sono linearmente indipendenti. Consideriamo allora il caso in cui X sia infinitodimensionale e pertanto possono esistere infiniti autovalori ed infiniti autovettori. La prova di (a) e (b) si ha, contemporaneamente, dimostrando che, per ogni δ > 0, pu` o esistere soltanto un numero finito di autovettori linearmente indipendenti corrispondenti agli autovalori λ con |λ| > δ. Proviamo ci`o. Sia λ1 , λ2 , . . . una successione di autovalori di T , eventualmente ripetuti, tale che |λn | > δ. Assumiamo, per assurdo, che esista una successione infinita, x1 , x2, . . ., di corrispondenti autovettori linearmente indipendenti. Si osservi che stiamo dicendo, negando la tesi, che esistono infiniti autovettori linearmente indipendenti con autovalori λ tali che |λ| > δ. Usando l’enunciato del lemma dimostrato sopra, costruiamo la successione y1 , y2 , . . . che soddisfa le propriet` a (i),(ii) e (iii) e dove Xn `e lo spazio generato da x1 , x2 , . . . , xn . Dato che |λn | > δ, la successione { λynn }n=1,2,... `e limitata. Mostriamo ora che dalla successione delle immagini {T λynn }n=1,2,... non `e possibile estrarre una sottosuccessione convergente. Infatti, sar`a, per costruzione: yn :=
n
βk xk ,
k=1
e quindi: T
n−1 βk λk yn = xk + βn xn = yn + zn , λn λn k=1
dove: zn :=
n−1 k=1
βk
λk − 1 xk ∈ Xn−1 . λn
Di conseguenza, comunque siano i > j, vale:
T yi − T yj
= ||yi + zi − (yj + zj )||
λi λj
= ||yi − (yj + zj − zi )|| > 1/2 dato che yj + zj − zi ∈ Xi−1. Il risultato ottenuto `e evidentemente impossibile dato che T `e compatto. Di conseguenza, dobbiamo concludere che la successione infinita di autovettori linearmente indipendenti x1 , x2, . . . non esiste. Questo conclude la dimostrazione di (a) e (b). (c) La dimostrazione segue subito da (a) scegliendo una successione di numeri δ > 0 della forma δn = 1/n con n = 1, 2, 3, . . ..
4.2 Operatori compatti in spazi di Hilbert
159
Osservazioni 4.13. (1) Un’ultima propriet` a, che non dimostreremo, `e quella che stabilisce che l’operatore coniugato nel senso degli spazi di Banach (vedi la definizione 2.55) di un operatore compatto `e compatto. Dimostreremo questa propriet`a solo nel caso dell’aggiunto hermitiano di un operatore compatto, lavorando in spazi di Hilbert. (2) Dal lemma 4.12 segue una dimostrazione alternativa del fatto che la chiusura della palla unitaria in uno spazio normato infinitodimensionale non pu` o essere compatta (vedi l’esercizio 4.2).
4.2 Operatori compatti in spazi di Hilbert D’ora in avanti ci restringeremo a considerare operatori compatti in spazi di Hilbert, anche se alcune delle propriet`a che enunceremo valgono anche in un ambiente meno sofisticato, come spazi normati o spazi di Banach. Nel primo teorema che proveremo sugli operatori compatti in spazi di Hilbert, l’ipotesi di completezza dello spazio viene in realt` a usata solo nell’ultima propriet` a. Abbiamo bisogno di una proposizione preliminare prima di enunciare e provare il teorema. Proposizione 4.14. Sia H spazio di Hilbert. A ∈ B(H) `e compatto se e solo se |A| (vedi la definizione 3.59) `e compatto. Dimostrazione. Supponiamo A compatto. Sia {xk }k∈N una successione limitata in H e sia {Axkn }n∈N una sotto successione di {Axk }k∈N convergente in virt` u della compattezza di A. Essendo tale sotto successione successione di Cauchy, per (3.53), la sotto successione, {|A|xkn }n∈N , di {|A|xk }k∈N `e successione di Cauchy e quindi converge. Pertanto |A| `e compatto. Scambiando il ruolo di A e |A| ed usando la stessa dimostrazione, si prova che se |A| `e compatto, `e tale anche A. Teorema 4.15. Sia H spazio di Hilbert. Valgono i seguenti fatti. (a) B∞ (H) `e un sottospazio vettoriale di B(H). (b) B∞ (H) `e uno ∗-ideale bilatero di B(H), ossia, oltre ad essere un sottospazio, B∞ (H) gode della propriet` a che se T ∈ B∞ (H), allora T K, KT ∈ B∞ (H) per ogni K ∈ B(H) ed inoltre T ∗ ∈ B∞ (H). (c) B∞ (H) `e chiuso rispetto alla topologia uniforme. ` stato provato, nel caso pi` Dimostrazione. (a) E u generale di spazi normati, nella parte (a) proposizione 4.9. (b) Il fatto che, su spazi normati, il prodotto, a destra e a sinistra, di un operatore compatto con un operatore limitato produce ancora un operatore compatto, `e stato provato in (b) di proposizione 4.9. Per dimostrare la chiusura rispetto all’operazione di coniugazione hermitiana, notiamo che |T | `e compatto
160
4 Classi di operatori compatti
se e solo se T `e compatto per proposizione 4.14. Decomponendo polarmente T = U |T | secondo il teorema 3.61, segue che T ∗ = |T |U ∗, dove si `e tenuto conto del fatto che |T | ≥ 0, per cui |T | `e autoaggiunto. La limitatezza di U ∗ insieme alla compattezza di |T | implicano che T ∗ = |T |U ∗ `e compatto per quanto provato all’inizio di questa parte di dimostrazione. (c) Segue immediatamente da (c) della proposizione 4.9. Esempi 4.16. (1) Se X, Y sono spazi normati e T ∈ B(X, Y) `e tale che Ran(T ) ha dimensione finita, allora T deve essere compatto. Proviamolo. Se V ⊂ X `e limitato, cio`e V ⊂ Br (0) per qualche r > 0 finito, allora ||T (V )|| ≤ r||T || < +∞, per cui T (V ) `e limitato. T (V ) `e chiuso e limitato in uno spazio normato di dimensione finita che `e sempre omeomorfo ad un Cn (per proposizione 2.112). Per il teorema di Heine-Borel T (V ) `e allora compatto rispetto alla topologia indotta sul rango di T . Quindi T `e compatto dato che la compattezza rispetto alla topologia indotta equivale a quella rispetto alla topologia dello spazio ambiente. Come ulteriore sottocaso, se H `e spazio di Hilbert si consideri un operatore Tx ∈ L(H) della forma Tx : u → (x|u)y , ` chiaro che dove x, y ∈ H sono fissati vettori (eventualmente coincidenti). E tale operatore `e compatto, avendo rango di dimensione finita. (2) Se {xn }n∈N e {yn }n∈N sono sottoinsiemi ortogonali di H e se, interpretando la serie nella topologia uniforme, risulta che T = n∈N (xn | )yn `e un operatore limitato, allora T `e compatto per (a) e (c) del teorema 4.15. (3) In 2 (N) consideriamo l’operatore A : {xn } → {xn+1 /n}. Tale operatore `e compatto in quanto `e limite nella topologia uniforme degli operatori, per n = 1, 2 . . . , Am : {xn } → {x2 /1, x3/2, . . . , xm+1 /m, 0, 0, . . .} . Si verifica infatti facilmente che (lo si provi per esercizio) ||A − An || ≤ 1/(n + 1) . (4) Si consideri lo spazio X con misura μ sulla σ-algebra Σ in X e sia μ σfinita, in modo da definire la misura prodotto μ ⊗ μ; nel seguito useremo le notazioni semplificate L2 (μ) := L2 (X, μ) e L2 (μ ⊗ μ) := L2 (X × X, μ ⊗ μ). Consideriamo K ∈ L2 (X × X, μ ⊗ μ) e dimostriamo che: 2 K(x, y)f(y)dμ(y) TK : L (μ) f → X
2
definisce un operatore TK ∈ B(L (X, μ)) che `e compatto quando μ `e separabile (vedi (3) in esempi 3.33). Per prima cosa notiamo che, indipendentemente
4.2 Operatori compatti in spazi di Hilbert
161
dall’ipotesi di separabilit` a, se f ∈ L2 (μ): K(·, y)f(y)dμ(y) ∈ L2 (μ) X
e
K(·, y)f(y)dμ(y)
X
L2 (X,μ)
≤ ||K||L2(X×X,μ⊗μ)||f||L2(X,μ) ,
che equivale a dire: ||TK || ≤ ||K||L2(X×X,μ⊗μ) .
(4.2)
La prova di questo fatto `e interamente basata sul teorema di Fubini-Tonelli: Se K ∈ L2 (μ ⊗ μ) allora, per il teorema di Fubini-Tonelli: (1) |K(x, ·)|2 ∈ L1 (μ), μ-quasi ovunque, (2) X |K(x, y)|2 dμ(y) ∈ L1 (μ) . Da (1) segue che K(x, ·) ∈ L2 (μ) quasi ovunque e quindi K(x, ·)f ∈ L1 (μ) quasi ovunque e per la disuguaglianza di Cauchy-Schwarz: (3) X |K(x,y)||f(y)|dμ(y) ≤ ||K(x, ·)||L2||f||L2 . Posto F (x) := X K(x, y)f(y)dμ(y), F `e misurabile e vale, per la (3): (4) |F (x)|2 ≤ ||f||2L2 X |K(x, y)|2 dμ(y). Per (2) si ha quindi che |F |2 ∈ L2 (μ) ed `e quindi vero che vale K(·, y)f(y)dμ(y) ∈ L2 (μ) . X
Da (4) e dal teorema di Fubini-Tonelli segue infine anche
K(·, y)f(y)dμ(y) ≤ ||K||L2(μ⊗μ) ||f||L2(μ) ,
X
L2 (μ)
da cui (4.2). Per mostrare che TK `e compatto, facciamo l’ipotesi ulteriore che μ sia separabile in modo che sia separabile L2 (X, μ) (vedi la proposizione 3.34). Per esempio X pu` o essere un qualsiasi intervallo (o un boreliano) di R e μ la misura di Lebesgue su R. Se {un }n∈N `e una base hilbertiana di L2 (X, μ), allora {un · um }n,m∈N `e una base Hilbertiana di L2 (X × X, μ ⊗ μ) (· `e l’ordinario prodotto di funzioni punto per punto) e allora, nella topologia di L2 (X × X, μ ⊗ μ), K= knm un · um , n,m
dove i numeri knm ∈ C dipendono da K. Quindi, posto knmun · um Kp := n,m≤p
si ha che Kp → K per p → +∞ nella norma di L2 (X × X, μ ⊗ μ). Tenuto conto di (4.2) applicata agli operatori TKp −K = TKp − TK , dove TKp `e indotto dal
162
4 Classi di operatori compatti
nucleo integrale Kp , segue che, per p → +∞,
||TK − TKp || =
knm un · um
n,m>p
→0, L2 (X×X,μ⊗μ)
per cui TK `e compatto in quanto gli operatori TKp sono compatti essendo somme finite di operatori con rango di dimensione finita come quelli discussi nell’esempio (1) sopra. Osserviamo per finire che, anche senza assumere l’ipotesi che μ sia separabile, ma richiedendo che K ∈ L2 (X × X, μ ⊗ μ) e che μ sia σ-finita, si prova facilmente che: ∗ TK = TK , (4.3) dove K(x, y) := K(x, y) per ogni x, y ∈ X e la barra denota la coniugazione complessa. La dimostrazione segue facilmente dalla proposizione 3.36 e dal teorema di Fubini-Tonelli. Gli operatori compatti in spazi di Hilbert godono di notevoli propriet` a; in particolare per quanto riguarda gli autovettori, autovalori ed autospazi, gli operatori compatti e autoaggiunti hanno caratteristiche che generalizzano al caso infinito-dimensionale le propriet` a delle matrici hermitiane finito-dimensionali. I prossimi due teoremi illustrano tali propriet` a. Teorema 4.17. (Di Hilbert.) Siano H spazio di Hilbert e T ∈ B∞ (H) con T = T ∗ . Allora vale quanto segue. (a) Ogni autospazio di T con autovalore λ = 0 ha dimensione finita. (b) Indicando con σp (T ) l’insieme degli autovalori di T , esso ha le seguenti caratteristiche: (1) `e non vuoto, (2) `e reale, (3) `e al pi` u numerabile, (4) ha al pi` u un solo punto di accumulazione dato da 0, (5) vale l’identit` a: sup{|λ| | λ ∈ σp (T )} = ||T || . Pi` u precisamente, l’estremo superiore suddetto `e anche massimo ed `e raggiunto in Λ ∈ σp (T ) tale che Λ = ||T || se
sup||x||=1 (x|T x) = ||T || ,
(4.4)
inf ||x||=1 (x|T x) = −||T || .
(4.5)
oppure Λ = −||T || se
(6) T coincide con l’operatore nullo se e solo 0 `e l’unico autovalore.
4.2 Operatori compatti in spazi di Hilbert
163
Prova di parte del teorema 4.17. (a) Sia Hλ l’autospazio di T con autovalore λ = 0. Se B ⊂ Hλ `e la palla aperta di raggio 1 centrata nell’origine, allora si pu` o scrivere B = T (λ−1 B) e λ−1 B `e limitato a sua volta per costruzione. Dato che T `e compatto, B `e compatto. Quindi, nello spazio di Hilbert Hλ , la chiusura della palla aperta unitaria `e un insieme compatto, pertanto dimHλ < +∞ per la proposizione 4.5. (b) Proveremo tutti i punti eccetto (3) e (4), che saranno provati nella dimostrazione del teorema successivo. σp (T ), se `e non vuoto `e fatto di elementi reali per (c) (ii) di proposizione 3.49, essendo T autoaggiunto. Per (a) in proposizione 3.49 −||T || ≤ (x|T x) ≤ ||T || per ogni x di norma unitaria, di conseguenza ci possono essere solo le seguenti due possibilit`a: sup||x||=1 (x|T x) = ||T || oppure inf ||x||=1 (x|T x) = −||T ||. Supponiamo vero il primo fatto ed eseguiamo la dimostrazione in questo caso. L’altro caso si tratta con la stessa dimostrazione scambiando T con −T . Assumeremo che ||T || > 0, altrimenti la prova della tesi `e ovvia. Per ogni autovalore λ possiamo scegliere un autovettore x con ||x|| = 1 e quindi ||T || ≥ |(x|T x)| = |λ|(x|x) = |λ|, di conseguenza sup |σp(T )| ≤ ||T ||. Per provare (5), basta quindi esibire un autovettore con autovalore Λ = ||T ||. Si noti che ci` o prova anche che σp (T ) = ∅. Per ipotesi esister` a una successione di punti xn con ||xn|| = 1 tali che (xn |T xn ) → ||T || =: Λ > 0. Vale (dove usiamo anche il fatto che ||T xn|| ≤ ||T ||||xn|| = ||T ||) ||T xn − Λxn ||2 = ||T xn ||2 − 2Λ(xn |T xn ) + Λ2 ≤ ||T ||2 + Λ2 − 2Λ(xn |T xn ) . Essendo ||T || = Λ, nel limite per n → +∞ della precedente disuguaglianza, si ha che T xn − Λxn → 0 . (4.6) Per concludere ci basterebbe provare che anche {xn }n∈N converge a qualche punto, oppure che ci` o accade per una sua sotto successione. Dato che ||xn|| = 1, la successione {xn }n∈N `e limitata; essendo T compatto, possiamo estrarre da {T xn }n∈N una sotto successione convergente: {T xnk }k∈N. Da (4.6), si ha che: xn k =
1 [T xnk − (T xnk − Λxnk )] Λ
converge a qualche x ∈ H se k → +∞, in quanto combinazione lineare di successioni convergenti. Dato che T `e continuo e xnk → x, (4.6) implica che T x = Λx . Notiamo che x = 0 perch´e ||x|| = limk→+∞ ||xnk || = 1. Abbiamo provato che x `e un autovettore con autovalore Λ. (6) `e immediata conseguenza di (5). Passiamo al famoso teorema di Hilbert riguardante lo sviluppo degli operatori compatti autoaggiunti su una base hilbertiana di autovettori.
164
4 Classi di operatori compatti
Teorema 4.18. (Di Hilbert.) Siano (H, ( | )) spazio di Hilbert e T ∈ B∞ (T ) con T = T ∗ . (a) Se Pλ `e il proiettore ortogonale sull’autospazio con autovalore λ ∈ σp (T ) (insieme degli autovalori di T ), vale: T = λPλ . (4.7) λ∈σp (T )
Se σp (T ) `e infinito, la serie in (4.7) `e intesa nel senso della topologia uniforme e gli autovalori in σp (T ): λ0 , λ1 , . . . (con λi = λj se i = j) sono ordinati in modo tale che |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . .. (b) Se Bλ denota una base hilbertiana dell’autospazio di T associato a λ ∈ σp(T ), allora ∪λ∈σp (T ) Bλ `e una base hilbertiana per H; in altre parole, H ammette una base hilbertiana fatta di autovettori di T . Osservazione 4.19. Si osservi che ci possono essere al pi` u due autovalori non nulli con lo stesso valore assoluto (essendo gli autovalori reali). L’unica possibile ambiguit` a nell’ordinamento dei termini della serie di sopra, valendo: |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . . `e nella scelta dell’ordinamento di ogni coppia λ, λ se |λ| = |λ |. Come vedremo dalla dimostrazione del teorema, la somma della serie non dipende da qualunque scelta venga fatta per tale ordinamento. Prova del teorema 4.18 e della parte rimanente del teorema 4.17. (a) Sia λ un autovalore con autospazio Hλ . Sia Pλ il proiettore ortogonale su Hλ e Qλ := I − Pλ il proiettore ortogonale su H⊥ λ . Vale T Pλ = Pλ T = λPλ .
(4.8)
Questa identit` a si dimostra notando che se x ∈ H, Pλ x ∈ Hλ e allora T Pλ x = λPλ x, da cui T Pλ = λPλ . Prendendo l’aggiunto ad ambo membri e tenendo conto del fatto che λ ∈ R, T = T ∗ , Pλ = Pλ∗, si ha subito che Pλ T = λPλ = T Pλ . Come ulteriore conseguenza troviamo che vale anche, direttamente dalla definizione di Qλ e da quanto appena provato, Qλ T = T Qλ .
(4.9)
Notiamo ancora che, essendo I = Pλ +Qλ abbiamo che T = Pλ T +Qλ T , ossia T = λPλ + Qλ T .
(4.10)
Si osservi che Qλ T soddisfa: (i) `e autoaggiunto essendo (Qλ T )∗ = T ∗ Q∗λ = T Qλ = Qλ T , (ii) `e compatto per (b) del teorema 4.15, (iii) soddisfa per costruzione Pλ (Qλ T ) = (Qλ T )Pλ = 0 valendo Pλ Qλ = Qλ Pλ = 0.
4.2 Operatori compatti in spazi di Hilbert
165
Nel seguito useremo ripetutamente queste identit`a anche senza citarle esplicitamente e d’ora in poi scriveremo Pn , Qn , Hn per, rispettivamente, Pλn Qλn , Hλn . Cominciamo a scegliere un autovalore λ = λ0 con valore assoluto pi` u alto: ci sono al pi` u due di tali autovalori che differiscono per un segno; in tal caso scegliamo uno dei due. Avremo che, se T1 := Q1 T , allora vale T = λ0 P0 + T1 dove T1 soddisfa le propriet` a (i), (ii) e (iii) suddette. Se T1 = 0, la dimostrazione `e finita; se non lo `e sappiamo comunque che T1 `e autoaggiunto compatto, per cui possiamo reiterare la procedura appena illustrata usando T1 in luogo di T e trovando, se T2 := Q1 T1 , T = λ0 P0 + λ1 P1 + T2 . λ1 `e un autovalore di T1 , non nullo e con massimo valore assoluto (se un autovalore di valore assoluto massimo fosse nullo, sarebbe T1 = 0 per (6) in (b) del teorema 4.17), e P1 `e il proiettore ortogonale sull’autospazio di T1 associato a λ1 . Si osservi ancora che ogni autovalore λ1 di T1 `e anche autovalore di T essendo, se T1 u1 = λ1 u1 , T u1 = (λ0 P0 + T1 )u1 = λ0 P0 T1 = λ0 · 0 · T
1 1 u1 + T1 u1 = λ0 P0 Q0 T u1 + T1 u1 λ1 λ1
1 u1 + λ1 u1 = λ1 u1 . λ1
λ1 = λ0 perch´e u1 ∈ RanT1 = Ran(Q0 T ) ⊂ H⊥ 0 . Si osservi infine che ogni autovettore u di T con autovalore λ1 deve essere anche autovettore di T1 con autovalore λ1 . Infatti usando T1 = Q0 T = (I − P0 )T si ha, se T u = λ1 u: T1 u = λ1 u − λ1 P0 u = λ1 u + 0 = λ1 u , dove abbiamo usato P0 u = 0, che segue dal fatto che autospazi con autovalori distinti per operatori autoaggiunti (T ) sono ortogonali. In definitiva, l’auto(T ) spazio H1 1 con autovalore λ1 di T1 coincide con l’autospazio H1 di T con autovalore λ1 . Quindi P1 `e il proiettore ortogonale in H su tale autospazio per T oltre che per T1 . Dato che |λ0 | ha valore massimo possibile, vale comunque: |λ1 | ≤ |λ0 |. Questo fatto ha una conseguenza importante. Dato che ||T || = |λ0 | e ||T1 || = λ1 per il teorema precedente, avremo che: ||T1 || ≤ ||T || .
166
4 Classi di operatori compatti
Se risulta T2 = 0 la dimostrazione `e finita, altrimenti procederemo nello stesso modo ottenendo che n T− λk Pk = Tn , (4.11) k=0
dove:
|λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . .
e
||Tk || = |λk | .
(4.12)
Se nessuno degli operatori Tk `e l’operatore nullo, la procedura continua indefinitamente. Mostriamo che, in tal caso, la serie decrescente dei numeri positivi |λk | deve tendere a 0 (non ci pu` o essere un punto di accumulazione precedente a 0). Supponiamo che |λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . . ≥ > 0 Scegliamo un vettore xn ∈ Hn per ogni n ed in modo tale che ||xn|| = 1. Dunque la successione degli xn `e limitata, per cui la successione dei T xn o una sua sotto successione deve convergere, essendo T compatto. Ma questo `e impossibile perch´e, sviluppando il quadrato della norma di ||λn xn − λm xm || tenendo conto che xn e xm sono perpendicolari in quanto autovettori con autovalori distinti per un operatore autoaggiunto ((ii) in (b) di proposizione 3.49), si ha ||T xn − T xm ||2 = ||λn xn − λm xm ||2 = |λn |2 + |λm |2 ≥ 2 , per ogni n e m, per cui n´e la successione dei T xn n´e una sua sotto successione pu` o convergere non potendo essere di Cauchy. Questo `e assurdo e quindi la successione dei λn (se effettivamente sono infiniti) deve convergere a 0. Come conseguenza di (4.11) e (4.12), quanto appena provato implica che vale anche, nella topologia uniforme, +∞ T = λk Pk . (4.13) k=0
Si osservi che, per costruzione, il risultato non dipende dall’ordinamento che abbiamo adottato all’interno delle eventuali coppie di autovalori distinti con lo stesso valore assoluto. Mostriamo ora che l’identit`a (4.13) coincide con la (4.7) in quanto la successione trovata di autovalori {λk } esaurisce l’insieme degli autovalori di T eccetto al pi` u l’autovalore nullo che non fornisce comunque contributo a (4.13) e (4.7). Sia λ = λn per ogni n un autovalore di T e Pλ sia il proiettore ortogonale associato. Valendo Pn Pλ = 0 per ogni n (perch´e autospazi di autovalori distinti di operatori autoaggiunti sono ortogonali per (ii) in (b) di proposizione 3.49), (4.13) implica: T Pλ =
+∞
λk Pk Pλ = 0 ,
k=0
da cui, se u ∈ Hλ , Questo significa che λ = 0.
T u = T Pλ u = 0 .
4.2 Operatori compatti in spazi di Hilbert
167
La prova di (a) `e conclusa ed abbiamo contestualmente provato anche le parti rimanenti del teorema 4.17. (b) Si osservi che le basi hilbertiane Bλ esistono sempre per il teorema 3.28, essendo gli autospazi di T sottospazi chiusi (lo si dimostri per esercizio) dello spazio di Hilbert H e quindi spazi di Hilbert a loro volta. Sia B := ∪λ∈σp (T ) Bλ . Mostriamo che che se u ∈ B ⊥ allora u = 0 e ci`o conclude la dimostrazione in quanto l’insieme B `e ortonormale per costruzione per cui la definizione 3.23 `e soddisfatta. Se u ∈ B ⊥ , allora u ⊥ Bλ per ogni λ ∈ σp (T ), per cui Pλ u = 0 per ogni λ ∈ σp (T ). Usando la decomposizione di T data in (4.7), abbiamo che T u = 0; pertanto u appartiene all’autospazio di T con autovalore nullo H0 . Ma essendo anche u ortogonale ad ogni autospazio di T per costruzione, dovr` a essere contemporaneamente u ∈ H0 e u ∈ H⊥ 0 , ossia u = 0 che conclude la prova. Il teorema di Hilbert, insieme al teorema 3.61 di decomposizione polare, consentono di estendere la formula (4.7) dello sviluppo di un operatore compatto autoaggiunto ad un’analoga formula valida nel caso non autoaggiunto. Diamo prima una definizione che sar` a utile nel seguito. Definizione 4.20. Siano H spazio di Hilbert e A ∈ B∞ (H). Gli autovalori λ non nulli di |A| vengono detti valori singolari di A e il loro insieme si indica con sing(A). La dimensione (finita) mλ dell’autospazio corrispondente a λ ∈ sing(A) viene detta molteplicit` a di λ Teorema 4.21. Siano (H, ( | )) spazio di Hilbert e A ∈ B∞ (H) con A = 0, in modo che l’insieme dei valori singolari di A, sing(A), sia non vuoto. Ordinando sing(A) in modo decrescente: λ0 > λ1 > λ2 > . . ., ed usando tale ordinamento nelle somme scritte sotto, vale: A=
mλ
λ (uλ,i | ) vλ,i ,
(4.14)
λ (vλ,i | ) uλ,i ,
(4.15)
λ∈sing(A) i=1
A∗ =
mλ
λ∈sing(A) i=1
dove le somme, se infinite, sono intese nel senso della convergenza della topologia uniforme e, per ogni λ ∈ sing(A), l’insieme degli elementi uλ,1 , . . . , uλ,mλ `e una base ortonormale nell’autospazio di |A| associato all’autovalore λ. Inoltre, per λ ∈ sing(A) e i = 1, 2, . . . , mλ i vettori: 1 Auλ,i , (4.16) λ definiscono un insieme ortonormale. Per gli stessi valori di λ e i risulta infine: vλ,i :=
vλ,i = U uλ,i , dove U `e l’operatore che appare nella decomposizione polare A = U |A|.
(4.17)
168
4 Classi di operatori compatti
Dimostrazione. Notiamo che |A| `e autoaggiunto, positivo e compatto. I suoi autovalori saranno quindi reali, positivi e soddisfano quanto specificato in (a) e (b) del teorema 4.17. Studieremo il caso in cui l’insieme degli autovalori `e infinito (e quindi numerabile), lasciando il sottocaso banale al lettore. Il teorema 4.18 permette di sviluppare |A| come: |A| = λPλ , λ∈σp (|A|)
` chiaro che ci dove la convergenza `e intesa rispetto alla topologia uniforme. E si pu` o ridurre a considerare solo gli autovalori non nulli dato che quello nullo non fornisce contributo alla serie : |A| = λPλ . λ∈sing(A)
Se U `e limitato, si prova subito che se B(H) Tn → T ∈ B(H) nella topologia uniforme, vale anche U Tn → U T , sempre nel senso della topologia uniforme degli operatori. Dato che l’operatore U della decomposizione polare di A, A = U |A|, `e limitato, avremo subito che, nella convergenza della topologia uniforme: A = U |A| = λU Pλ . (4.18) λ∈sing(A)
Il teorema 4.17 nel punto (a) precisa che il sottospazio chiuso su cui proietta ogni Pλ (con λ > 0) ha dimensione finita mλ . Possiamo sempre trovare una base ortonormale di tale autospazio: {uλ,i }i=1,...,mλ . Si osservi che (uλ,i |uλ,j ) = δλλ δij per costruzione, siccome autovettori con autovalori distinti sono ortogonali (essendo |A| normale perch´e positivo) per (ii) in (b) di proposizione 3.49. Dato che uλ,i = |A|(uλ,i /λ), segue che uλ,i ∈ Ran(|A|). Quindi U agisce sugli uλ,i in modo isometrico, per cui i vettori a secondo membro di (4.17) sono ancora ortonormali. La (4.17) equivale alla (4.16) per la decomposizione polare di A: Auλ,i = U |A|uλ,i = U λuλ,i = λvλ,i . ` un facile esercizio provare che il proiettore ortogonale Pλ (λ > 0) si pu` E o scrivere come: mλ Pλ = (uλ,i | ) uλ,i . i=1
Di conseguenza: U Pλ =
mλ i=1
(uλ,i | ) U uλ,i =
mλ
(uλ,i | ) vλ,i .
i=1
Sostituendo in (4.18) si trova (4.14). La (4.15) si ottiene dalla (4.14) tenendo conto dei seguenti fatti.
4.3 Operatori di Hilbert-Schmidt
169
(i) L’operazione di coniugazione hermitiana A → A∗ `e antilineare, per cui trasforma combinazioni lineari di operatori in combinazioni lineari dei loro aggiunti e con i corrispondenti coefficienti sostituiti dai complessi coniugati dei coefficienti della combinazione lineare iniziale. (ii) L’operazione di coniugazione hermitiana `e continua nella topologia uniforme di B(H) in quanto ||A∗|| = ||A|| per (a) di proposizione 3.38. In conseguenza di ci`o, da (4.14) troviamo (si tenga conto del fatto che λ ∈ R): A∗ =
mλ
λ [(uλ,i | ) vλ,i ]∗ ,
λ∈sing(A) i=1
` un facile esercizio verificare dove la serie converge nella topologia uniforme. E che [(uλ,i | ) vλ,i ]∗ = (vλ,i | ) uλ,i , da cui segue immediatamente la (4.15).
Il teorema provato consente di introdurre la nozione di operatore di HilbertSchmidt e di operatore di classe traccia, che vedremo nelle prossime sezioni.
4.3 Operatori di Hilbert-Schmidt Una classe particolare di operatori compatti sono quelli di Hilbert-Schmidt. Questi trovano applicazioni in vasti rami della fisica matematica, oltre che nella meccanica quantistica. Questa sezione e dedicata ad introdurre tali operatori ed a discuterne le propriet`a generali. Nota importante. In questa sezione e talvolta nel seguito, la norma || ||2 , se riferita ad operatori, indica la norma di Hilbert-Schmidt che definiremo tra poco e non la solita norma L2 . La notazione non dovrebbe generare ambiguit` a, in quanto il significato dovrebbe essere ovvio dal contesto una volta che il lettore sia stato messo in guardia. Definizione 4.22. Sia (H, (|)) spazio di Hilbert e sia || || la norma indotta dal prodotto scalare. A ∈ B(H) `e detto operatore di Hilbert-Schmidt se esiste una base hilbertiana U per cui u∈U ||Au||2 < +∞ nel senso della definizione 3.20. La classe degli operatori di Hilbert-Schmidt su H sar` a indicata con B2 (H) e, se A ∈ B2 (H), allora: ! ||A||2 := ||Au||2 , (4.19) u∈U
dove U `e la base hilbertiana suddetta.
170
4 Classi di operatori compatti
Per prima cosa mostriamo che la particolare base scelta nella definizione `e in realt` a irrilevante e che anche ||A||2 non dipende dalla scelta di tale base. Proposizione 4.23. Siano (H, ( | )) spazio di Hilbert, || || la norma indotta dal prodotto scalare, U e V due basi hilbertiane (eventualmente coincidenti) e A ∈ B(H). (a) {||Au||2}u∈U ammette somma finita se e solo se {||Av||2 }v∈V ammette somma finita. In tal caso vale: ||Au||2 = ||Av||2 . (4.20) u∈U
v∈V
(b) {||Au||2}u∈U ammette somma finita se e solo se {||A∗v||2 }v∈V ammette somma finita. In tal caso vale: ||Au||2 = ||A∗v||2 . (4.21) u∈U
v∈V
Dimostrazione. Consideriamo che, per (d) del teorema 3.27, ||Au||2 = |(v|Au)|2 < +∞ , v∈V
per cui, fissato u, solo una quantit` a al pi` u numerabile di coefficienti |(v|Au)| `e non nulla per (b) di proposizione 3.22. Ci` o determina un insieme al pi` u numerabile V (u) ⊂ V tale che ||Au||2 = |(v|Au)|2 < +∞ . (4.22) u∈U
u∈U v∈V (u)
Questo significa in particolare, riutilizzando (b) di proposizione 3.22, che solo un insieme al pi` u numerabile di elementi u ∈ U fornisce somme v∈V (u) |(v|Au)|2 non nulle. In definitiva i coefficienti (v|Au) sono non nulli solo per un insieme Z al pi` u numerabile di coppie (u, v) ∈ U ×V . Definiamo gli insiemi al pi` u numerabili: U0 := {u ∈ U | esiste v ∈ V con (v|Au) = 0} , V0 := {v ∈ V | esiste u ∈ U con (v|Au) = 0} . In tal modo Z ⊂ U0 × V0 . Possiamo mettere su U0 e V0 le misure μ e ν che, rispettivamente, contano gli elementi di U0 e V0 e le serie sopra considerate si trascrivono in termini di integrali rispetto alle misure dette ((c) proposizione 3.22). In particolare (4.22) si riscrive: ||Au||2 = |(v|Au)|2 = dμ(u) dν(v)|(v|Au)|2 < +∞ . u∈U
u∈U v∈V (u)
U0
V0
(4.23)
4.3 Operatori di Hilbert-Schmidt
171
Le misure μ e ν sono σ-finite perch´e U0 e V0 sono al pi` u numerabili, per cui ha senso definire la misura prodotto μ ⊗ ν e applicare il teorema di FubiniTonelli. Tale teorema assicura che, per l’ultima parte di (4.23), la funzione (v, u) → |(v|Au)|2 `e integrabile rispetto alla misura prodotto e che possiamo interscambiare gli integrali: ||Au||2 = |(v|Au)|2 dμ(u) ⊗ dν(v) U0 ×V0
u∈U
=
dμ(u)|(v|Au)|2 < +∞ .
dν(v) V0
U0
Notiamo che (v|Au) = (A∗ v|u), per cui solo una quantit` a al pi` u numerabile di elementi (A∗ v|u) (con (u, v) ∈ U × V ) sar`a non nulla e avremo in particolare: ∗ 2 |(A v|u)| = dν(v) dμ(u)|(A∗v|u)|2 = ||Au||2 < +∞ . v∈V u∈U
V0
U0
u∈U
Ma il primo membro `e proprio v∈V ||A∗v||2 . Abbiamo provato parte della proposizione (b): se {||Au||2}u∈U ammette somma finita allora {||A∗v||2 }v∈V ammette somma finita e le due somme coincidono. Usando la stessa dimostrazione, scambiando i nomi delle basi e dei loro elementi e partendo dall’operatore A∗ , ricordando che vale (A∗ )∗ = A per operatori limitati, si prova nello stesso modo che vale la parte rimanente di (b): se {||A∗v||2 }v∈V ammette somma finita, allora {||Au||2}u∈U ammette somma finita, ed in tal caso vale (4.21). La dimostrazione di (a) si prova immediatamente da (b) tenendo conto dell’arbitrariet` a delle basi usate. Possiamo enunciare e provare alcune delle numerose ed interessanti propriet`a matematiche degli operatori di Hilbert-Schmidt. La propriet` a pi` u interessante dal punto di vista matematico `e la (b) del teorema scritto sotto: gli operatori di Hilbert-Schmidt formano uno spazio di Hilbert con un prodotto scalare che induce una norma che coincide, per ogni operatore A di Hilbert-Schimdt, proprio con il numero che avevamo indicato con ||A||2. Un altro fatto importante `e che gli operatori di Hilbert-Schmidt sono compatti e formano un ideale bilatero chiuso rispetto alla coniugazione hermitiana all’interno dello spazio degli operatori limitati. Teorema 4.24. Sia H spazio di Hilbert. Gli operatori di Hilbert-Schmidt godono delle seguenti propriet` a. (a) B2 (H) `e un sottospazio di B(H) e pi` u fortemente uno ∗-ideale bilatero di B(H); inoltre: (i) ||A||2 = ||A∗||2 per ogni A ∈ B2 (H); (ii) ||AB||2 ≤ ||B|| ||A||2 e ||BA||2 ≤ ||B|| ||A||2 per ogni A ∈ B2 (H) e B ∈ B(H);
172
4 Classi di operatori compatti
(iii) ||A|| ≤ ||A||2 per ogni A ∈ B2 (H). (b) Se A, B ∈ B2 (H) e se N `e una base hilbertiana in H, si definisca: (A|B)2 :=
(Ax|Bx) .
(4.24)
x∈N
L’applicazione: ( | )2 : B2 (H) × B2 (H) → C `e ben definita (la somma di sopra si riduce sempre ad una serie assolutamente convergente e non dipende dalla base hilbertiana) e determina un prodotto scalare su B2 (H) che per ogni A ∈ B2 (H) soddisfa: (A|A)2 = ||A||22 .
(4.25)
(c) (B2 (H), ( | )2 ) `e spazio di Hilbert. (d) B2 (H) ⊂ B∞(H). Pi` u precisamente, A ∈ B2 (H) se e solo se A `e compatto e l’insieme dei numeri positivi {mλ λ2 }λ∈sing(A) (essendo mλ la molteplicit` a di λ) ha somma finita. In tal caso risulta: ! ||A||2 =
mλ λ2 .
(4.26)
λ∈sing(A)
Dimostrazione. (a) Ovviamente B2 (H) `e chiuso rispetto alla moltiplicazione per scalare. Mostriamo che lo `e rispetto a quello di somma di operatori. Se A, B ∈ B2 (H) e N `e una qualsiasi base hilbertiana: # " ||(A + B)u||2 ≤ (||Au|| + ||Bu||)2 ≤ 2 ||Au||2 + ||Bu||2 . u∈N
u∈N
u∈N
u∈N
Quindi B2 (H) `e sottospazio di B(H). Il fatto che sia chiuso rispetto alla coniugazione hermitiana `e una immediata conseguenza di (b) della proposizione 4.23, che implica anche (i). Mostriamo che vale (ii) e, contestualmente, che B2 (H) `e chiuso rispetto alla composizione destra e sinistra con operatori limitati. Se A ∈ B2 (H) e B ∈ B(H) allora: u∈N
||BAu||2 ≤
u∈N
||B||2||Au||2 = ||B||2
||Au||2 .
u∈N
Questo prova insieme che B2 (H) `e chiuso rispetto alla composizione sinistra con operatori limitati e che vale la seconda disuguaglianza in (ii). La chiusura rispetto alla moltiplicazione a destra `e immediata conseguenza di quella a sinistra e della chiusura rispetto alla coniugazione hermitiana: B ∗ A∗ ∈ B2 (H) se A ∈ B2 (H) e B ∈ B(H), e quindi (B ∗ A∗ )∗ ∈ B2 (H), ossia AB ∈ B2 (H). Da (i) abbiamo anche che se A ∈ B2 (H) e B ∈ B(H), allora
4.3 Operatori di Hilbert-Schmidt
173
||AB||2 = ||(AB)∗ ||2 = ||B ∗ A∗ ||2 ≤ ||B ∗ || ||A∗||2 = ||B|| ||A||2 che completa la dimostrazione di (ii). Per provare (iii) notiamo che: 2 1/2
||A|| = sup ||Ax|| = sup (||Ax|| ) ||x||=1
= sup
||x||=1
= sup ||x||=1
||x||=1
1/2 |(u|Ax)|
2
u∈N
1/2 |(A∗ u|x)|2
,
u∈N
dove abbiamo usato (d) del teorema 3.27 rispetto alla base hilbertiana N . Utilizzando la disuguaglianza di Cauchy-Schwarz nell’ultimo termine della catena di uguaglianze di sopra, otteniamo: ||A|| ≤ sup
||x||=1
1/2 ||A∗u||2||x||2
=
u∈N
1/2 ||A∗ u||2
= ||A∗ ||2 = ||A||2 .
u∈N
(b) Se A, B ∈ B2 (H) e N `e una base hilbertiana, allora la quantit` a di termini Au e Bu non nulli, per u ∈ N , `e al pi` u numerabile per la definizione 4.22 e (b) di proposizione 3.22. Valendo: |(Au|Bu)| ≤ ||Au|| ||Bu|| ≤
1 (||Au||2 + ||Bu||2) , 2
concludiamo che la quantit` a di termini non nulli (Au|Bu) per u ∈ N `e anch’essa al pi` u numerabile e che la serie dei termini non nulli (Au|Bu) `e assolutamente convergente, per cui non conta l’ordinamento scelto nel calcolare (4.24). Mostreremo tra poco che la scelta della base hilbertiana `e irrilevante. Prima notiamo che (4.25) `e vera banalmente e che ( | )2 soddisfa gli assiomi di un semiprodotto scalare, come `e immediato verificare. L’assioma di positivit`a H3 `e immediata conseguenza di (iii), pertanto ( | )2 `e un prodotto scalare che induce la norma || ||2. Quindi vale l’identit` a di polarizzazione, che sussiste per ogni prodotto scalare: 4(A|B)2 = ||A + B||22 + ||A − B||22 − i||A + iB||22 + i||A − iB||22 . Dato che, per la proposizione 4.23, il secondo membro non dipende dalla base hilbertiana usata, non dipender` a dalla scelta della base nemmeno il primo membro. (c) Bisogna solo provare che lo spazio `e completo. Sia N una base hilbertiana di H. Sia {An }n∈N una successione di Cauchy di operatori di Hilbert-Schmidt rispetto alla norma || ||2 . Da (iii) di (a) la successione `e di Cauchy anche nella topologia uniforme, per cui, essendo B(H) completo per il teorema 2.54, esister`a A ∈ B(H) con ||A − An || → 0 per n → +∞. La propriet` a di Cauchy dice che preso > 0, esiste N tale che, ||An − Am ||22 ≤ 2 se n, m > N .
174
4 Classi di operatori compatti
Tenendo conto della definizione di || ||2, varr` a anche che, per lo stesso , per ogni sottoinsieme finito I ⊂ N : ||(An − Am )u||2 ≤ ||An − Am ||22 ≤ 2 u∈I
quando n, m > N . Passando al limite per m → +∞, si trova che vale ancora: ||(An − A)u||2 ≤ 2 , u∈I
a per ogni sottoinsieme finito I ⊂ N se n > N . In definitiva, per l’arbitrariet` di I, abbiamo che: ||A − An ||2 ≤ se n > N . (4.27) Da questo fatto segue in particolare che A − An ∈ B2 (H) e quindi: A = An + (A − An ) ∈ B2 (H) . Inoltre, per l’arbitrariet` a di > 0 in (4.27), vale anche che An tende a A rispetto alla norma || ||2 . Quindi ogni successione di Cauchy nella norma || ||2 converge in B2 (H), che di conseguenza `e completo. (d) Sia A ∈ B2 (H): mostriamo che `e compatto e che soddisfa (4.26). Sia N una base hilbertiana. Vale u∈N ||Au||2 < +∞, dove solo una quantit` a al pi` u numerabile di addendi `e non nulla ed infine sappiamo che la somma si pu` o scrivere come una serie o una somma finita considerando solo i vettori un per cui ||Aun||2 > 0. Di conseguenza varr` a che, per ogni > 0, esiste N tale che: +∞
||Aun ||2 ≤ 2 .
n=N
La stessa propriet`a si pu` o quindi trascrivere in termini di tutti gli elementi di N : per ogni > 0 esiste un sottoinsieme finito I ⊂ N tale che: ||Au||2 ≤ 2 . u∈N\I
Sia quindi AI l’operatore definito imponendo: AI u := Au se u ∈ I e AI u := 0 se u ∈ N \ I . Il rango di AI `e generato dai vettori Au con u ∈ I , essendo tali vettori in numero finito, AI `e limitato e compatto ((1) in esempi 4.16). Per costruzione esiste ||A − AI ||2 e vale: ||A − AI ||22 = ||(A − AI )u||2 = ||Au||2 , u∈B
u∈N\I
pertanto, per (iii) di (a) abbiamo che ⎛ ||A − AI || ≤ ||A − AI ||2 = ⎝
u∈N\I
⎞1/2 ||Au||2⎠
≤.
4.3 Operatori di Hilbert-Schmidt
175
Quindi A `e un punto di accumulazione dello spazio degli operatori compatti rispetto alla topologia uniforme. Tenendo conto del fatto che l’ideale degli operatori compatti `e chiuso nella topologia uniforme ((c) di teorema 4.15), il risultato ottenuto prova che A `e compatto. Dimostriamo√adesso che vale (4.26): consideriamo l’operatore positivo compatto |A| = A∗ A e sia {uλ,i}λ∈sing(A),i={1,2,...,mλ } una base hilbertiana di Ker(|A|)⊥ costruita come nel teorema 4.21. Possiamo completarla a base dello spazio di Hilbert aggiungendo una base hilbertiana per Ker(|A|), che coincide con Ker(A) per l’osservazione 3.60. (Se {ui } `e base hilbertiana per il sottospazio chiuso Ker(|A|) e {vj } `e una base hilbertiana per il sottospazio chiuso Ker(|A|)⊥ , allora l’insieme ortonormale N := {ui } ∪ {vj } `e base hilbertiana per H, perch´e, come `e facile provare dalla decomposizione ortogonale H = Ker(|A|) ⊕ Ker(|A|)⊥ , se x ∈ H `e ortogonale a N , allora x = 0.) Usando la base hilbertiana detta per esprimere ||A||2, abbiamo: ||A||22 =
mλ
(Auλ,i |Auλ,i ) =
λ∈sing(A) i=1
mλ
(A∗ Auλ,i |uλ,i )
λ∈sing(A) i=1
=
mλ
mλ λ2 ,
(4.28)
λ∈sing(A) i=1
dove si `e tenuto conto del fatto che la parte di base√riguardante Ker(A), per costruzione, non fornisce contributo, |A|uλ,i = A∗ Auλ,i = λuλ,i e (uλ,i |uλ,j ) = δλλ δij . Se, viceversa, A `e compatto e {mλ λ2 }λ∈sing(A) ha somma finita, allora da (4.28) segue che ||A||2 < +∞, per cui A ∈ B2 (H). Esempi 4.25. (1) Torniamo all’esempio (4) in esempi 4.16. Consideriamo gli operatori: TK : L2 (X, μ) → L2 (X, μ) indotti dai nuclei integrali K ∈ L2 (X × X, μ ⊗ μ) (con μ misura σ-finita separabile), (TK f)(x) := K(x, y)f(y)dμ(y) per ogni f ∈ L2 (X, μ) . X
Abbiamo provato che tali operatori sono compatti. Mostriamo ora che sono anche di Hilbert-Schmidt. Usando le stesse definizioni dell’esempio in questione, se f ∈ L2 (X, μ) avevamo visto che (vedi punto (3) nell’esempio (4)), per ogni x ∈ X, F (x) = |K(x, y)| |f(y)|dμ(y) < +∞ . X
2
Dato che F ∈ L (X, μ), per ogni g ∈ L2 (X, μ) la funzione x → g(x)F (x) `e una funzione integrabile (in modo da poter definire il prodotto scalare di g
176
4 Classi di operatori compatti
e F ). Il teorema di Fubini-Tonelli assicura quindi che la funzione (x, y) → g(x)K(x, y)f(y) `e in L2 (X × X, μ ⊗ μ) e che g(x)K(x, y)f(y) dμ(x) ⊗ dμ(y) = dμ(x) g(x) K(x, y)f(y)dμ(y) X×X
X
X
= (g|Tk f) .
(4.29)
Consideriamo allora una base hilbertiana di L2 (X×X, μ⊗μ) del tipo {ui ·uj }i,j , dove {uk }k `e una base hilbertiana per L2 (X, μ) (e quindi lo `e anche {uk }k , come si prova immediatamente). Dato che K ∈ L2 (X × X, μ ⊗ μ), varr` a lo sviluppo: K= αij ui · uj , (4.30) i,j
per cui: ||K||2L2 =
|αij |2 < +∞ .
(4.31)
i,j
D’altra parte, da (4.29) e (4.30), si ha: (ui |TK uj ) = ui (x)uj (y)K(x, y) dμ(x) ⊗ dμ(y) = (ui · uj |K) = αij , X×X
per cui (4.31) si pu` o riscrivere: ||K||2L2 =
|(ui |TK uj )|2 < +∞ .
i,j
Per definizione di operatore di Hilbert-Schmidt, TK `e quindi un operatore di Hilbert-Schmidt e vale anche: ||TK ||2 = ||K||L2
(4.32)
` abbastanza facile provare che se H = L2 (X, μ) con μ σ-finita e separabile, (2) E allora B2 (H) consiste di tutti e soli gli operatori TK con K ∈ L2 (X×X, μ⊗μ) e che quindi l’applicazione che identifica K con TK `e un isomorfismo di spazi di Hilbert L2 (X × X, μ ⊗ μ) allo spazio di Hilbert B2 (H). Consideriamo a tal fine T ∈ B2 (H) ed esibiamo K ∈ L2 (X ×X, μ⊗μ) per cui T = TK . Presa una qualsiasi base Hilbertiana {un }n∈N di L2 (X, μ) deve essere n∈N ||T un ||2 < +∞. Conseguentemente, sviluppando T un sulla stessa base {un }n∈N , si ottiene che: +∞ >
n∈N
||T un ||2 =
|(um |T un )|2 .
m∈N n∈N
Interpretando le somme come integrali il teorema su {un }n∈N, ed applicando 2 di Fubini-Tonelli, concludiamo che: |(u |T u )| < +∞ e quindi m n (n,m)∈N2
4.3 Operatori di Hilbert-Schmidt
177
l’operatore integrale di Hilbert-Schmidt TK con nucleo integrale K ∈ L2 (X × X, μ ⊗ μ) dato da: K := (um |T un )um · un (n,m)∈N2
`e ben definito. D’altra parte, usando i risultati dell’esempio precedente, per costruzione vale: (um |TK un ) = dμ(x)um (x) dμ(y)K(x, y)un (y) = (um |T un ) X
X
e quindi: TK un = T un per ogni n ∈ N. Per continuit` a segue immediatamente che TK = T . (3) Consideriamo l’equazione di Volterra nella funzione incognita f ∈ L2 ([0, 1], dx): x f(y)dy + g(x) , (4.33) f(x) = ρ 0 2
con g ∈ L ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato. Sopra dx indica la misura di Lebesgue e l’integrale esiste dato che, per ogni fissato x ∈ [0, 1], pu` o essere interpretato come il prodotto scalare tra f e la funzione [0, 1] y → θ(x − y), e quindi riscritto come:
x
1
f(y)dy = 0
0
θ(x − y)f(y)dy ,
dove θ(u) = 1 se u ≥ 0 oppure θ(u) = 0 se u < 0. Dato che evidentemente (x, y) → θ(x − y) `e anche una funzione in L2 ([0, 1]2, dx ⊗ dy), l’equazione pu` o essere riscritta in termini di un operatore di Hilbert-Schmidt T come: con g ∈ L2 ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato, (4.34) dove abbiamo introdotto l’operatore di Volterra: x (T g)(x) := g(y)dy g ∈ L2 ([0, 1], dx) . (4.35) f = ρT f + g ,
0
Pi` u in generale gli operatori di Volterra, e quindi le equazioni associate, sono definiti come: x (TV f)(x) := V (x, y)g(y)dy , 0
2
per qualche V : [0, 1] → R con qualche grado di regolarit` a. Noi studiamo qui il caso pi` u semplice dato dalla (4.35). Se l’operatore (I − ρT ) fosse invertibile, la soluzione dell’equazione (4.34) sarebbe data da: f = (I − ρT )−1 g .
(4.36)
178
4 Classi di operatori compatti
Formalmente, usando lo stesso sviluppo della serie geometrica, abbiamo che l’operatore inverso (destro e sinistro) di I − ρT `e dato dalla somma della serie: (I − ρT )−1 = I +
+∞
ρn+1 T n+1
(4.37)
n=0
interpretando la convergenza della serie nella topologia uniforme. Una condizione sufficiente per la convergenza `e ||ρT || < 1 e la dimostrazione `e la stessa che per la serie geometrica. Noi vogliamo per`o cercare di fare una stima pi` u fine. Usiamo la norma dello spazio B2 (L2 ([0, 1], dx)), tenendo conto di (iii) in (a) del teorema 4.24 ed infine notando che se, per An ∈ B(L2 ([0, 1], dx)), vale +∞ ||An|| ≤ an ≥ 0 dove la serie n=0 an converge, allora converge anche la serie +∞ 2 n=0 An nella topologia di B(L ([0, 1], dx)). La dimostrazione di quest’ultimo fatto `e la stessa che si ha in analisi elementare, per esempio per dimostrare il criterio di Weierstrass della serie dominata. Il calcolo diretto tramite (4.35), mostra che, se n ≥ 1: x (x − y)n (T n+1 g)(x) = g(y)dy , n! 0 per cui T n ∈ B2 (L2 ([0, 1], dx)) e anche: !
n−1
(x − y)n−1 2 n n 2
dx ⊗ dy ≤ 2 |θ(x − y)| ||T || ≤ ||T ||2 = . (n − 1)! (n − 1)! [0,1]2 n n
Dato che la serie di termine generico ρ n!2 converge, concludiamo che, per ogni valore di ρ = 0, l’operatore (I − ρT )−1 esiste in B(L2 ([0, 1], dx)) ed `e dato dalla somma a secondo membro di (4.37). E dunque (4.36) `e la soluzione dell’equazione di Volterra iniziale. Si pu` o infine dare la forma esplicita dell’operatore (I − ρT )−1 .
+∞ (I − ρT )−1 g (x) = g(x) + ρn+1 T n+1 g (x) n=0
= g(x) + ρ
+∞ x n=1
0
(ρ(x − y))n g(y)dy . n!
In teorema della convergenza dominata prova che si pu`o scambiare la serie con l’integrale trovando, per la soluzione dell’equazione di Volterra: x eρ(x−y) g(y)dy . f(x) = (I − ρT )−1 g (x) = g(x) + ρ 0
Tuttavia, nel fare queste operazioni, abbiamo usato una nozione di convergenza puntuale, differente da quella operatoriale uniforme. Il fatto che l’espressione di sopra sia davvero la forma esplicita dell’operatore inverso di
4.4 Operatori di classe traccia (o nucleari)
179
I − ρT si pu` o verificare per computo diretto, usando l’espressione esplicita (4.35) ed integrando per parti lavorando con g ∈ C([0, 1]). Il risultato si estende su tutto L2 ([0, 1], dx), tenendo conto che l’operatore con nucleo integrale θ(x − y)eρ(x−y) `e limitato (essendo di Hilbert-Schmidt) e C([0, 1]) `e denso in L2 ([0, 1], dx). L’unicit` a dell’inverso conclude la dimostrazione. (4) Sia L2 (X, μ) con μ separabile. Un operatore integrale TK : L2 (X, μ) → L2 (X, μ) individuato dal nucleo integrale: K(x, y) =
N
pk (x)qk (y) ,
k=1
dove pk , qk ∈ L2 (X, μ), k = 1, 2, 3, . . ., N sono funzioni arbitrarie e N ∈ N `e arbitrario, `e detto operatore degenere. Gli operatori degeneri formano uno ∗-ideale bilatero BD (L2 (X, μ)) di B(L2 (X, μ)) che `e sottospazio di B∞ (L2 (X, μ)) e B2 (L2 (X, μ)). Si pu` o provare abbastanza facilmente che BD (L2 (X, μ)) `e denso in B2 (L2 (X, μ)) nella topologia naturale di quest’ultimo. Il contenuto delle osservazioni (1) e (2) pu`o essere racchiuso in un teorema. L’ultima affermazione `e di immediata dimostrazione ed lasciata per esercizio. Teorema 4.26. Se μ `e una misura positiva σ-additiva e separabile su X, lo spazio B2 (L2 (X, μ)) `e costituito da tutti e soli gli operatori TK della forma: (TK f)(x) := K(x, y)f(y)dy , per ogni f ∈ L2 (X, μ), X
2
dove K ∈ L (X × X, μ ⊗ μ). Inoltre risulta: ||TK ||2 = ||K||L2(X×X,μ⊗μ) . L’applicazione L2 (X × X, μ ⊗ μ) K → TK ∈ B2 (L2 (X, μ)) `e un isomorfismo di spazi di Hilbert.
4.4 Operatori di classe traccia (o nucleari) Passiamo ad introdurre gli operatori di classe traccia, detti anche operatori nucleari. Seguiremo essenzialmente l’approccio in [Mar82] (un altro approccio si trova in [Pru81]). Proposizione 4.27. Siano H spazio di Hilbert e A ∈ B(H). I seguenti tre fatti sono equivalenti. (a) Esiste una base hilbertiana N di H per cui {(u||A|u)}u∈N ha somma finita: (u||A|u) < +∞ . u∈N
180
4 Classi di operatori compatti
(a)’ |A| `e operatore di Hilbert-Schmidt. (b) A `e compatto ed inoltre l’insieme indicizzato {mλ λ}λ∈sing(A), dove mλ `e la molteplicit` a di λ, ha somma finita. Dimostrazione. Si osservi che (a)’ `e una semplice trascrizione di (a), tenendo conto del fatto che |A| |A| = |A|. Per cui (a) e (a)’ sono equivalenti. Mostriamo che (a) implica (b). A `e compatto perch´e |A| = ( |A|)2 `e compatto essendo |A| compatto, in quanto ogni operatore di Hilbert-Schmidt `e compatto ((d) teorema 4.24), il prodotto di operatori compatti `e compatto ((b) teorema 4.15), ed infine |A| `e compatto se e solo se lo `e A (proposizione 4.14). Costruiamo una base hilbertiana di H usando autovettori di |A|: uλ,i con i = 1, . . . , mλ (mλ = +∞ al pi` u solo per λ = 0) e |A|uλ,i = λuλ,i . Rispetto a tale base:
2
uλ,i ( |A|)2 uλ,i |A|uλ,i |A|uλ,i =
|A|
= 2
λ,i
λ,i
=
(uλ,i ||A|uλ,i) =
λ,i
mλ λ
λ
2
per cui {mλ λ}λ∈sing(A), ha somma finita essendo
|A|
< +∞ per ipotesi. 2 ` ora ovvio che (b) implica (a)’ procedendo all’indietro nelle argomentazioni E
2
e calcolando
|A|
in una base di autovettori di |A|. 2
Definizione 4.28. Sia H spazio di Hilbert. A ∈ B(H) `e detto operatore di classe traccia o, equivalentemente, operatore nucleare, se soddisfa una delle tre condizioni (a), (a)’ o (b) in proposizione 4.27. L’insieme degli operatori di classe traccia su H sar` a indicato con B1 (H) e, se A ∈ B1 (H), allora
2
||A||1 :=
|A|
= mλ λ , (4.38) 2
λ∈sing(A)
dove abbiamo usato le stesse notazioni usate in proposizione 4.27. Osservazioni 4.29. (1) Il nome “classe traccia” deriva evidentemente almeno dal seguente fatto. Per un operatore A di classe traccia, il numero reale ||A||1 generalizza al caso infinito-dimensionale la nozione di traccia della matrice corrispondente ad |A| (e non A). In realt` a le analogie non finiscono qui, come vedremo tra poco. (2) Valgono le inclusioni: B1 (H) ⊂ B2 (H) ⊂ B∞ (H) ⊂ B(H) . L’unica inclusione non ancora dimostrata `e la prima. Per provarla notiamo che, se A ∈ B1 (H), allora, per definizione, |A| ∈ B2 (H), quindi |A| = |A| |A|
4.4 Operatori di classe traccia (o nucleari)
181
`e di Hilbert-Schmidt per (a) del teorema 4.24; in virt` u della decomposizione polare A = U |A|, essendo U ∈ B(H), si ha A ∈ B2 (H) per (a) del teorema 4.24. (3) Ciascuno degli insiemi scritti `e sottospazio vettoriale dello spazio degli operatori limitati ed in pi` u ∗-ideale bilatero (per gli operatori di classe traccia lo proveremo tra poco); infine ciascuno di questi sottospazi `e anche spazio di Hilbert o di Banach rispetto ad una naturale struttura: gli operatori compatti formano un sottospazio chiuso rispetto alla topologia uniforme in B(H) e quindi uno spazio di Banach rispetto alla norma operatoriale, gli operatori di Hilbert-Schmidt definiscono uno spazio di Hilbert rispetto al prodotto scalare di Hilbert-Schmidt e gli operatori di classe traccia definiscono uno spazio di Banach rispetto alla norma || ||1, come diremo pi` u avanti. Prima di passare ad estendere il concetto di traccia al caso infinito-dimensionale, vediamo le propriet` a pi` u importanti degli operatori nucleari o di classe traccia. Teorema 4.30. Sia H spazio di Hilbert. Gli operatori nucleari in H godono delle seguenti propriet` a. (a) Se A ∈ B1 (H) allora esistono due operatori B, C ∈ B2 (H) tali che A = BC. Viceversa, se B, C ∈ B2 (H) allora BC ∈ B1 (H) ed in tal caso: ||BC||1 ≤ ||B||2 ||C||2 .
(4.39)
u fortemente `e uno ∗-ideale bilatero, (b) B1 (H) `e un sottospazio di B(H) e pi` inoltre: (i) ||AB||1 ≤ ||B|| ||A||1 e ||BA||1 ≤ ||B|| ||A||1 per ogni A ∈ B1 (H) e B ∈ B(H), (ii) ||A||1 = ||A∗ ||1 per ogni A ∈ B1 (H). (c) || ||1 definisce una norma su B1 (H). ` possibile provare che B1 (H) `e uno spazio di Banach Osservazione 4.31. E rispetto alla norma || ||1 [Sch60, BiSo87]. Prova del teorema 4.30 eccetto (ii) in (b) che verr` a dimostrata in proposizione 4.34. (a) Se A `e di classe traccia, usando la decomposizione polare di A = U |A| (teorema 3.61), B e C possono sempre essere definiti come B := U |A| e C := |A|. Per definizione di operatore di classe traccia, |A| `e operatore di Hilbert-Schmidt, dunque C `e Hilbert-Schmidt. Lo `e anche B, in quanto U ∈ B(H) e gli operatori di Hilbert-Schmidt formano un ideale in B(H), come provato nel teorema 4.24. Siano ora B e C di Hilbert-Schmidt, mostriamo che A := BC `e di classe traccia. Notiamo che A `e compatto per (d) di teorema 4.24 e (b) di teorema 4.15; quindi dobbiamo solo provare che λ∈sing(A) mλ λ < +∞. Se BC = 0, la tesi `e ovvia. Assumiamo BC = 0 e sviluppiamo l’operatore compatto BC come nel teorema 4.21: A = BC =
mλ
λ∈sing(A) i=1
λ(uλ,i | )vλ,i .
182
4 Classi di operatori compatti
Per non caricare troppo le notazioni, poniamo: Γ := {(λ, i)|λ ∈ sing(A), i = 1, 2, . . ., mλ } e λj indichi il primo elemento della coppia j = (λ, i). Allora `e chiaro che:
λj =
j∈Γ
mλ λ .
λ∈singA
Dal teorema di decomposizione polare A = U |A| con U ∗U = I sul rango di |A| e tendo conto che vj = U uj per cui U ∗ vj = uj , segue che: (vj |BCuj ) = (vj |Auj ) = (vj |U |A|uj ) = λj (vj |U uj ) = λj (U ∗ vj |uj ) = λj (uj |uj ) = λj . Se S ⊂ Γ `e finito: j∈S
≤
λj =
(vj |BCuj ) =
j∈S
(B ∗ vj |Cuj )
j∈S
||B ∗vj || ||Cuj || ≤
!
j∈S
||B ∗ vj ||2
!
j∈S
||Cuj ||2 .
j∈S
Dato che gli insiemi ortonormali di elementi uj = uλ,i e vj = vλ,i possono essere separatamente completati a base hilbertiana di H, l’ultimo termine della catena di disuguaglianze di sopra `e maggiorato da: ||B ∗ ||2 ||C||2 = ||B||2 ||C||2 . Prendendo l’estremo superiore su tutti gli S finiti, concludiamo che: mλ λ ≤ ||B||2 ||C||2 ||BC||1 = λ∈sing(A)
ed in particolare A = BC ∈ B1 (H). (b) e (c). La chiusura di B1 (H) rispetto al prodotto per scalare si prova immediatamente dalla stessa definizione di operatore nucleare. Mostriamo che B1 (H) `e chiuso rispetto alla somma. Siano A, B ∈ B1 (H). Se A + B = 0, allora A + B `e nucleare banalmente. Assumiamo pertanto A + B = 0, che `e comunque compatto. Decomponendo polarmente abbiamo: A = U |A|, B = V |B|, A + B = W |A + B|. Usando la solita decomposizione sui valori singolari come nella prova di (a) avremo: A+B =
mβ
β∈sing(A+B) i=1
β(uβ,i | )vβ,i .
4.4 Operatori di classe traccia (o nucleari)
183
Se Γ := {(β, i)|β ∈ sing(A + B), i = 1, 2, . . . , mβ }, S ⊂ Γ `e finito e βj `e il primo elemento della coppia j ∈ Γ , si ha: βj = (vj |(A + B)uj ) = (vj |Auj ) + (vj |Buj ) . j∈S
j∈S
j∈S
j∈S
La somma delle due somme ottenuta alla fine pu` o essere riscritta in altro modo, ottenendo: βj = ( |A|U ∗ vj | |A|uj ) + ( |B|V ∗ vj | |B|uj ) . j∈S
j∈S
j∈S
Procedendo come per l’analoga dimostrazione in (a), otteniamo: βj ≤ || |A|U ∗ ||2 || |A|||2 + || |B|V ∗ ||2 || |B|||2 ≤ || |A|||22 + || |B|||22 j∈S
(nell’ultimo passaggio abbiamo tenuto conto del fatto per A che, per esempio, ∗ ∗ vale la disuguaglianza ((a) (ii) del teorema 4.24) || |A|U || ≤ || |A||| ||U ||, 2 2 ∗ dato che |A| `e di Hilbert-Schmidt; inoltre ||U || ≤ 1, come `e immediato provare, visto che `e un operatore isometrico su Ker(|A|)⊥ e si annulla su Ker(|A|)). Notiamo infine che: || |A|||22 + || |B|||22 = ||A||1 + ||B||1 . Abbiamo in definitiva provato che A + B ∈ B1 (H) e che in B1 (H) vale la disuguaglianza triangolare: ||A + B||1 ≤ ||A||1 + ||B||1 . Quindi || ||1 `e una seminorma. In realt`a `e una norma, in quanto ||A||1 = 0 implica che gli autovalori di |A| siano tutti nulli e quindi, essendo |A| compatto, |A| = 0 per (6) in (a) di teorema 4.17. Per la decomposizione polare di A = U |A|, segue infine che A = 0. Fino ad ora abbiamo provato che B1 (H) `e sottospazio vettoriale di B(H) e che || ||1 `e una norma. Mostriamo ora che B1 (H) `e chiuso rispetto alla composizione, a destra e a sinistra, con operatori Siano A ∈ B1 (H), B ∈ B(H) e A = U |A|. Allora limitati. BA = (BU |A|) |A|, dove i due fattori sono operatori di Hilbert-Schmidt e quindi, per (a), BA ∈ B1 (H). Usando (ii) di (a) in teorema 4.24, (4.38) e (a) del presente teorema, si ha: √ √ ||BA||1 ≤ ||BU |A|||2 || |A|||2 ≤ ||BU || || A||2 || A||2 √ ≤ ||B|| || A||22 = ||B|| ||A||1 . Inoltre AB = (U |A|) |A|B ∈ B1 (H) perch´e entrambi i fattori sono di Hilbert-Schmidt e vale (a). In modo analogo al caso trattato sopra, si trova
184
4 Classi di operatori compatti
che ||AB||1 ≤ ||B|| ||A||1. La prova di (ii) in (b) sar` a data nella prova della proposizione 4.34. Per concludere introduciamo il concetto di traccia di un operatore nucleare e mostriamo come la traccia abbia le stesse propriet`a formali della traccia di matrici. Proposizione 4.32. Se (H, ( | )) `e uno spazio di Hilbert, A ∈ B1 (H) e N `e una base hilbertiana di H: (u|Au) (4.40) trA := u∈N
`e ben definita, dato che la somma infinita a secondo membro `e (al pi` u) una serie assolutamente convergente. Inoltre: (a) trA non dipende dalla base hilbertiana scelta. (b) per ogni coppia ordinata (B, C) di operatori di Hilbert-Schmidt tali che A = BC vale: trA = (B ∗ |C)2 . (4.41) (c) |A| ∈ B1 (H) e vale:
||A||1 = tr|A| .
(4.42)
Dimostrazione. (a) e (b). Ogni operatore di classe traccia pu`o decomporsi nel prodotto di due operatori di Hilbert-Schmidt, come provato in (a) di teorema 4.30. Cominciamo con il notare che se A = BC con B, C operatori di HilbertSchmidt, allora: (B ∗ |C)2 = (B ∗ u|Cu) = (u|BCu) = (u|Au) = trA . u∈N
u∈N
u∈N
Questo prova che, oltre a valere (4.41), trA `e ben definito, essendo un prodotto scalare di Hilbert-Schmidt, e che nella somma infinita in (4.40) solo una quantit` a al pi` u numerabile di addendi `e non nulla e la somma infinita si riduce ad una somma finita oppure ad una serie assolutamente convergente dato che, per la definizione di prodotto scalare di Hilbert Schmidt, u∈N |(B ∗ u|Cu)| < +∞. (Quanto scritto sopra mostra anche che ∗ (B ∗ |C)2 = (B |C )2 se BC = B C , essendo B, B , C, C operatori di HilbertSchmidt.) Il risultato ottenuto prova infine l’invarianza di trA al variare della base hilbertiana, visto che ( | )2 non dipende dalla scelta della base hilbertiana. (c) Prima di tutto, per l’unicit` a della radice quadrata positiva, vale | (|A|) | = |A|. Infatti | (|A|) | `e l’unico operatore limitato positivo il cui quadrato `e |A|∗|A| = |A|2 e |A| `e limitato, positivo con quadrato pari a |A|2 . Quindi, essendo A di classe traccia: +∞ > (u||A|u) = (u|| (|A|) |u) , u∈N
u∈N
4.4 Operatori di classe traccia (o nucleari)
185
per cui, dalla definizione 4.28, |A| stesso `e di classe traccia. Infine, scegliendo una base hilbertiana fatta di autovettori di |A|, {uλ,i }, si ha: tr|A| =
mλ
(uλ,i | |A|uλ,i ) =
λ∈sing(A) i=1
mλ
λ∈sing(A) i=1
λ=
mλ λ = ||A||1 .
λ∈sing(A)
Questo conclude la dimostrazione.
Definizione 4.33. Siano H spazio di Hilbert e A ∈ B1 (H). Il numero trA ∈ C `e detto traccia dell’operatore A di A. La seguente proposizione enuncia altre utili propriet`a degli operatori nucleari in spazi di Hilbert: in particolare, esattamente come nel caso finitodimensionale, la ciclicit`a della traccia. Si osservi che non `e richiesto che tutti gli operatori nella traccia siano di classe traccia (e ci`o `e importante per le applicazioni in fisica). Proposizione 4.34. Sia H spazio di Hilbert. La traccia gode delle seguenti propriet` a. (a) Se A, B ∈ B1 (H) e α, β ∈ C, allora: trA∗ = trA , tr(αA + βB) = α trA + β trB .
(4.43) (4.44)
(b) Se A `e di classe traccia e B ∈ B(H), oppure A e B sono entrambi di Hilbert-Schmidt, allora trAB = trBA . (4.45) (c) Se A1 , A2 , . . . An sono in B(H) con almeno un operatore di classe traccia oppure almeno due operatori di Hilbert-Schmidt, allora vale la propriet` a di ciclicit` a della traccia: tr (A1 A2 · · · An ) = tr (Aσ(1) Aσ(2) · · · Aσ(n) ) ,
(4.46)
dove (σ(1), σ(2), . . . , σ(n)) `e una permutazione ciclica di (1, 2, . . ., n). Prova della proposizione 4.34 e di (ii) in (b) del teorema 4.30. (a) La prova `e immediata dalla stessa definizione di traccia. (b) Per dimostrare la tesi cominciamo con il provare che essa vale se A e B sono entrambi di Hilbert-Schmidt. Per (b) di teorema 4.24, (4.45) `e equivalente a dire che (A∗ |B)2 = (B ∗ |A)2 . (4.47) La prova di (4.47) `e immediata usando l’identit` a di polarizzazione, valida per tutti i prodotti scalari e le norme da essi generate: 4(X|Y ) = ||X + Y ||2 + ||X − Y ||2 − i||X + iY ||2 + i||X − iY ||2 ,
186
4 Classi di operatori compatti
e ricordando che, nel caso della norma di Hilbert-Schmidt, ||Z||2 = ||Z ∗ ||2 ((i) in (a) di teorema 4.24). Supponiamo ora che A sia di classe traccia e B ∈ B(H). Allora A = CD, con C e D di Hilbert-Schmidt per (a) del teorema 4.30. Inoltre DB e BC sono di Hilbert-Schmidt, in quanto B2 (H) `e un ideale bilatero di B(H). Quindi, usando la propriet` a di interscambio provata valida nel caso di due operatori di Hilbert-Schmidt, si ha: trAB = tr((CD)B) = tr(C(DB)) = tr((DB)C) = tr(D(BC)) = tr((BC)D) = tr(B(CD)) = trBA . ` chiaro che, essendo B1 (H) un ideale bilatero di B(H), `e sufficiente che un (c) E solo operatore tra A1 , . . . , An sia di classe traccia perch´e lo sia il loro prodotto. In particolare, usando (a) del teorema 4.30 unitamente al fatto che anche B2 (H) `e un ideale di B(H), si vede subito che se due operatori tra A1 , . . . , An ` chiaro sono di Hilbert-Schmidt, allora il prodotto totale `e di classe traccia. E che la (4.46) `e equivalente a: tr (A1 A2 · · · An ) = tr (A2 A3 · · · An A1 ) ;
(4.48)
infatti, continuando a permutare un passo alla volta, si ottengono tutte le permutazioni cicliche. Proviamo la (4.48). Consideriamo dapprima il caso in cui due operatori, Ai e Aj con i < j, siano di Hilbert-Schmidt. Se i = 1, la tesi segue subito da (b) con la coppia di operatori di Hilbert-Schmidt A = A1 e B = A2 · · · An . Se i > 1, allora i quattro operatori (i) A1 · · · Ai , (ii) Ai+1 · · · An , (iii) Ai+1 · · · An A1 , (iv) A2 · · · Ai sono necessariamente di HilbertSchmidt perch´e contengono ciascuno Ai oppure Aj (mai entrambi), quindi vale: tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai ) = tr(A2 · · · Ai Ai+1 · · · An A1 ) , che `e quanto volevamo provare. Dimostriamo ora la propriet` a di ciclicit` a nell’ipotesi che Ai sia di classe traccia. Se i = 1 la tesi segue immediatamente da (b) con A = A1 e B = A2 · · · An . Supponiamo allora che i > 1. Allora A1 · · · Ai e A2 · · · Ai sono di classe traccia perch´e ciascuno dei due contiene Ai , quindi, ricordando (b) della presente proposizione, si ha: tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai ) = tr(A2 · · · Ai Ai+1 · · · An A1 ) . La propriet` a di ciclicit` a della traccia consente di provare (ii) in (b) del teorema 4.30. In base a (4.42) si tratta di provare che tr|A| = tr|A∗ |. Dal corollario
4.4 Operatori di classe traccia (o nucleari)
187
del teorema di decomposizione polare (teorema 3.61) sappiamo che |A∗ | = U |A|U ∗, dove U |A| = A `e la decomposizione polare di A. Vale allora ||A∗||1 = tr|A∗ | = tr(U |A|U ∗) = tr(U ∗ U |A|) = tr|A| = ||A||1 , dove abbiamo usato il fatto che U ∗ U |A| = |A|, dato che U `e isometria su Ran(|A|) (teorema 3.61). Osservazioni 4.35. (1) Un’utile propriet` a degli operatori di classe traccia `e il seguente risultato che potremo provare, nel capitolo 9, dopo avere provato il teorema spettrale per operatori autoaggiunti: Proposizione 4.36. Se H `e uno spazio di Hilbert, T ∈ B(H) `e di classe traccia se e solo se u∈N |(u|T u)| < +∞ per ogni base hilbertiana N ⊂ H. Dimostrazione. Vedi la soluzione dell’esercizio 9.3.
(2) Evidentemente, se A ∈ B1 (H) e A = A∗ , calcolando la traccia di A usando una base hilbertiana di autovettori di A stesso (che esiste per il teorema 4.18), concludiamo che tr(A) = λ∈σp (A) mλ λ, dove σp (A) denota, al solito, l’insieme degli autovalori di A e mλ la dimensione dell’autospazio con autovalore λ. Quindi, come nel caso finitodimensionale, la traccia coincide con la somma degli autovalori, per operatori di classe traccia autoaggiunti. Tale risultato continua a valere anche se A non `e autoaggiunto. Teorema 4.37. (Di Lidiskii.) Se T ∈ B1 (H) con H spazio di Hilbert com plesso, allora tr(T ) = λ∈σ(T ) mλ λ, dove σp (T ) denota l’insieme degli autovalori di T , mλ indica la dimensione dell’autospazio con autovalore λ e la serie converge assolutamente. Si osservi che tale risultato non `e per nulla ovvio. Per la dimostrazione si pu`o consultare [BiSo87]. Esempio 4.38. * Il seguente esempio richiede nozioni di geometria Riemanniana. Un esempio importante di operatori di classe traccia in fisica si ottiene studiando [Mor99] l’operatore di Laplace su variet` a Riemanniane (M, g). Tale operatore, in coordinate locali x1 , . . . , xn sulla variet` a M , di dimensione n, `e individuato dall’operatore differenziale: Δ=
n 1 ∂ ij √ ∂ g (x) g , √ g ∂xi ∂xj i=1
in cui g indica il determinante della matrice di coefficienti gij , i.j = 1, . . . , n, che descrive il tensore metrico nelle coordinate dette e gij sono i coefficienti della matrice inversa di quella dei coefficienti gij . Se V : M → (K, +∞), per qualche K > 0, `e una qualsiasi funzione infinitamente differenziabile,
188
4 Classi di operatori compatti
consideriamo l’operatore A = −Δ + V , definito sullo spazio D(M ) delle funzioni complesse infinitamente differenziabili definite su M . Possiamo pensare D(M ) come sottospazio (denso) di L2 (M, μg ), essendo μg la misura di Borel naturalmente associata alla metrica che, in coordinate locali, si riduce a √ gdx1 · · · dxn . L’operatore A `e positivo, non `e limitato, e risulta che ammette un unico inverso (anch’esso positivo): A−1 : L2 (M, μg ) → D(M ). Pensando A−1 come operatore a valori in L2 (M, μg ), risulta che A−1 ∈ B(L2 (M, μg )). La cosa interessante `e che vale anche A−1 ∈ B∞ (L2 (M, μg )). Possiamo dire di pi` u. Esiste un teorema dovuto a Weyl che prova che gli autovalori λj ∈ σp (A) di A (dove j etichetta l’autovettore φj e non l’autovalore corrispondente λj , in modo che φi = φk se k = i ma 0 < K ≤ λ0 ≤ λ1 , ≤ λ2 , ≤ · · ·) soddisfano la stima: kn n/2 lim j −1 λj = , (4.49) j→+∞ vol(M ) in cui vol(M ) `e il volume della variet`a (che `e finito essendo compatta) e kn una costante universale, che dipende solo dalla dimensione della variet` a. Inoltre gli autovettori {φj }j∈N formano una base hilbertiana di L2 (M, μg ). Ne consegue che per l’insieme degli autovalori di A−k , σp (A−k ), vale σp (A−k ) = {λ−k j }j∈N . −k −k Calcolando le norme || ||1 e || ||2 di A = |A| , usando la base hilbertiana di autovettori {φj }j∈N di A, si ha: ||A−k ||1 =
+∞ j=0
λ−k j
e
||A−k ||22 =
+∞
λ−2k . j
j=0
Usando la stima (4.49) segue che A−k ∈ B1 (L2 (M, μg )) se k > n/2 e anche che A−k ∈ B2 (L2 (M, μg )) se k > n/4.
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali Le equazioni integrali sono un ramo importantissimo dell’analisi funzionale, specialmente per le applicazioni in fisica (per esempio nella teoria dello scattering quantistico [Pru81] e nello studio dei problemi inversi) ed altre scienze. Ci occuperemo nel seguito di discutere alcuni risultati generali per lo pi` u dovuti a Fredholm ed assumendo quasi sempre il punto di vista astratto, in cui gli operatori integrali sono visti come casi particolari di operatori compatti su spazi di Hilbert (anche se molti risultati si possono facilmente estendere al caso pi` u generale di operatori compatti su spazi di Banach). Consideriamo, per fissare le idee, uno spazio con misura (X, Σ, μ), dove μ : Σ → [0, +∞] `e una misura positiva (σ-additiva) che sia σ-finita e separabile, e consideriamo una funzione K ∈ L2 (X × X, μ ⊗ μ) sulla quale non facciamo altre ipotesi. Quindi TK ∈ B2 (H) `e il solito operatore integrale (vedi (3), (4) in
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
esempi 4.16 e (1),(2) in esempi 4.25) su H = L2 (X, μ) definito da: K(x, y)ψ(y)dμ(y) . (TK ψ)(x) :=
189
(4.50)
X
Vogliamo studiare, in termini molto generali l’equazione integrale: TK ϕ − λϕ = f ,
(4.51)
dove f ∈ H `e assegnata e ϕ ∈ H `e l’incognita e λ ∈ C `e costante. Per cominciare, consideriamo la situazione in cui λ = 0. Si ottiene in questo modo la cosiddetta equazione di Fredholm di prima specie nello spazio di Hilbert H. Dal punto di vista astratto si tratta di risolvere l’equazione, nell’incognita ϕ ∈ H: Aϕ = f , per un operatore compatto A : H → H (nel caso concreto A `e l’operatore TK , che `e anche di Hilbert-Schmidt) e per un assegnato elemento f ∈ H. Come importante risultato generale, valido anche sostituendo lo spazio di Hilbert H con un qualsiasi spazio di Banach B infinito dimensionale, ed assumendo A compatto, possiamo dire che l’equazione detta non ha soluzione per qualche scelta del termine noto f ∈ H, comunque fissiamo A ∈ B∞ (H). Ci`o segue immediatamente dalla seguente proposizione. Proposizione 4.39. Se A ∈ B∞ (B) con B spazio di Banach di dimensione infinita, allora Ran(A) = B. Dimostrazione. Possiamo sempre scrivere B = ∪n∈N Bn , dove Bn `e la palla aperta di raggio n centrata nell’origine, e dunque: Ran(A) = ∪n∈NA(Bn ) . Se fosse Ran(A) = B, potremmo scrivere che: B = ∪n∈N A(Bn ) ⊂ ∪n∈NA(Bn ) ⊂ B e quindi: B = ∪n∈N A(Bn ) , dove ogni A(Bn ) `e compatto perch`e A `e compatto e Bn limitata. Quindi B sarebbe un’unione numerabile di compatti e ci` o `e impossibile per il corollario 4.6. Un altro problema con le equazioni di Fredholm di prima specie segue dalla seguente proposizione di facile dimostrazione. Proposizione 4.40. Ogni operatore inverso sinistro di ogni operatore compatto iniettivo A ∈ B∞ (X), dove X `e uno spazio normato, non pu` o mai essere limitato se X `e infinito dimensionale.
190
4 Classi di operatori compatti
` data nella soluzione dell’esercizio 4.1. Dimostrazione. E
In base a tale risultato, se due equazioni Aϕ = f1 e Aϕ = f2 ammettono entrambe soluzione, tali soluzioni possono differire di molto, anche se f1 e f2 sono vicine in norma. In altre parole le equazioni di Fredholm di prima specie sono problemi malposti nel senso di Goursat. Questo non significa, ovviamente, che le equazioni di Fredholm di prima specie non siano matematicamente interessanti o che non siano utili nelle scienze applicate. Significa invece che il loro studio `e difficile e richiede argomenti avanzati e specialistici che sono lontani dalla presentazione elementare che stiamo facendo. Passiamo a considerare il caso λ = 0 in (4.51). L’equazione che si ottiene in tal modo si dice equazione di Fredholm di seconda specie. Per il momento assumeremo che l’operatore TK ammetta un nucleo hermitiano. In altre parole consideriamo l’equazione: TK ϕ − λϕ = f ,
(4.52)
dove Tk ha la forma (4.50) con λ = 0 assegnato in C e K(x, y) = K(y, x), in ∗ modo tale che, in base alla (4.3), TK = TK . In questo caso si pu` o enunciare un teorema generale. Teorema 4.41. (Sull’equazione di Fredholm di seconda specie a nucleo hermitiano.) Sullo spazio di Hilbert H = L2 (X, μ), dove la misura positiva σ-additiva μ `e σ-finita e separabile, si consideri l’equazione (4.52) nell’incognita ϕ ∈ H e dove f ∈ H `e assegnato, λ ∈ C \ {0} `e assegnato e TK ha la forma: (TK ψ)(x) =
K(x, y)dμ(y) , X
con K ∈ L2 (X × X, μ ⊗ μ) con K(x, y) = K(y, x). Valgono i seguenti fatti. (a) Se il numero λ non `e un autovalore di TK , allora l’equazione (4.52) ha sempre una ed una sola soluzione comunque si scelga f ∈ H. (b) Se λ `e autovalore di TK , allora l’equazione (4.52) ha sempre soluzioni se e solo f `e ortogonale all’autospazio con autovalore λ. In tal caso l’equazione (4.52) ammette infinite soluzioni. Dimostrazione. Moltiplicando ambo membro dell’equazione (4.52) per λ−1 ci possiamo ridurre a studiare il caso con λ = 1 (dopo aver ridefinito λ−1 K come K e λ−1 f come il nuovo f). Pertanto dimostriamo il teorema in questo caso. Sappiamo che TK `e compatto ed autoaggiunto per (3) negli esempi 4.16, faremo quindi riferimento ai teoremi 4.17 e 4.18. Sia {ψn }n∈N una base hilbertiana di autovettori di TK . Allora possiamo decomporre, in un unico modo, ogni elemento ϕ ∈ H come: ϕ=
+∞ n=1
an ψn + ϕ ,
(4.53)
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
191
dove ϕ ∈ Ker(TK ) e gli an ∈ C sono univocamente individuati da ϕ. In particolare: +∞ f= bn ψn + f . n=1
Cerchiamo la soluzione dell’equazione (4.52): ϕ = TK ϕ − f nella forma (4.53). Quindi dobbiamo determinare i numeri an e l’elemento ϕ noti TK e f. Sostituendo la (4.53) e l’analoga per f nell’equazione (4.52), si trova immediatamente che deve essere: an ψn + ϕ = an λn ψn − bn ψn − f , n
n
n
dove i λn sono gli autovalori non nulli di TK corrispondenti agli autovettori ψn (in generale pu` o accadere che λn = λn dato che abbiamo numerato gli autovettori e non gli autovalori). In altre parole: an (1 − λn + bn )ψn = −f − ϕn . n
Si osservi che i due membri sono ortogonali per costruzione e lo sono anche, a due a due, i vettori ψn . Pertanto l’identit` a scritta sopra `e possibile se e solo se: ϕ = −f , an (1 − λn ) = −bn con n = 1, 2, . . .. In tutti i casi ϕ `e sempre determinato, coincidendo con f . L’esistenza di soluzioni per l’equazione (4.52) equivale quindi alla validit` a delle condizioni: ϕ = −f , an = λnbn−1 per i λn = 1 b0 = 0 per i λm = 1. Se λn = 1 per ogni n, i coefficienti an sono univocamente individuati dai bn . Se λm = 1 per qualche m e bm = 0, l’ultima condizione non `e soddisfatta e quindi l’equazione (4.52) non ammette soluzioni. Se invece bm = 0, per ogni m per cui λm = 1 (cio`e f `e normale all’autospazio di TK con autovalore 1), i coefficienti am possono essere scelti arbitrariamente, mentre sono determinati i rimanenti coefficienti an . In tal caso ci sono infinite soluzioni dell’equazione (4.52). Per concludere, passiamo al caso generale, lasciando cadere l’ipotesi di nucleo hermitiano. Per rimanere su un piano ancora pi´ u generale, studieremo l’equazione di Fredholm di seconda specie astratta nello spazio di Hilbert H: Aϕ − λϕ = f ,
(4.54)
dove f ∈ H, λ ∈ C \ {0} e A ∈ B∞ (H) sono assegnati per un generico spazio di Hilbert H e ϕ ∈ H `e l’incognita del problema. Dunque non facciamo altre
192
4 Classi di operatori compatti
ipotesi su A, se non che sia un operatore compatto. In particolare lasciamo cadere l’ipotesi su A che sia di Hilbert-Schmidt. Proviamo il seguente teorema generale, dovuto a Fredholm, che ammette una formulazione valida nel caso in cui A ∈ B∞ (B), dove B `e un arbitrario spazio di Banach. Teorema 4.42. (Di Fredholm.) In riferimento allo spazio di Hilbert H, si consideri l’equazione di Fredholm di seconda specie astratta: Aϕ − λϕ = f ,
(4.55)
nell’incognita ϕ ∈ H con f ∈ H, λ ∈ C \ {0} e A ∈ B∞ (H) assegnati. Si considerino anche l’equazione omogenea, l’equazione coniugata e l’equazione omogenea coniugata, nell’ordine: Aϕ0 −λϕ0 = 0 , ∗
A ψ −λψ = g , A∗ ψ0 −λψ0 = 0 ,
(4.56) (4.57) (4.58)
con g ∈ H assegnata e ϕ0 , ψ, ψ0 ∈ H incognite. Valgono i risultati seguenti. (a) L’equazione Aϕ − λϕ = f ha soluzioni se e solo se f `e ortogonale a ciascuna soluzione ψ0 dell’equazione omogenea coniugata A∗ ψ0 − λψ0 = 0. (b) L’equazione Aϕ−λϕ = f ha, per ogni f ∈ H, una ed una sola soluzione oppure l’equazione omogenea Aϕ0 − λϕ0 = 0 ha una soluzione non nulla. (c) Le equazioni omogenee Aϕ0 − λϕ0 = 0 e A∗ ψ0 − λψ0 = 0 hanno il medesimo numero, che `e sempre finito, di soluzioni linearmente indipendenti. Osservazioni 4.43. (1) La celebre alternativa di Fredholm corrisponde all’enunciato (b) nel teorema di sopra. (2) Il teorema vale in particolare quando A `e autoaggiunto ed in tal caso si ritrova il teorema 4.41 come sottocaso. Prova del Teorema 4.42. Anche in questo caso, dividendo l’equazione iniziale per λ = 0, ci si riduce a studiare il caso λ = 1 (dopo aver ridefinito λ−1 A −1 come il nuovo A e λ−1 f come il nuovo f e e λ g come il nuovo g). Nel seguito dunque assumeremo λ = 1. Definiamo T := A−I. Si osservi che tale operatore `e limitato, ma non `e compatto perch`e I non `e compatto. La dimostrazione del teorema si esegue provando tre lemmi. Cominciamo a notare che, bench´e Ker(T ) sia sempre un sottospazio chiuso di H se T `e continuo, come nel caso in esame, ci`o non `e detto valere per il sottospazio Ran(T ). Invece questo fatto `e vero. Il primo lemma prova infatti che, se T := A − I con A ∈ B∞ (H) allora anche Ran(T ) `e chiuso. Lemma 4.44. Nelle ipotesi fatte su T , Ran(T ) `e chiuso.
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
193
Dimostrazione. Siano yn ∈ Ran(T ), per n ∈ N, e valga yn → y per n → +∞. Dobbiamo provare che y ∈ Ran(T ). Per ipotesi deve essere: yn = T xn = Axn − xn
(4.59)
per qualche successione di elementi {xn }n∈N ∈ H. Possiamo, senza perdere generalit` a, sempre supporre che xn ∈ Ker(T )⊥ , eventualmente togliendo da xn la sua proiezione su Ker(T ). Se riusciamo a provare che la successione degli xn `e limitata abbiamo concluso la dimostrazione del lemma. Infatti, essendo A compatto, in tal caso esister`a una sottosuccessione di elementi xnk con Axnk → y ∈ H se k → ∞. Sostituendo in (4.59) si conclude che xnk → x per qualche x ∈ H se k → +∞. Per la continuit` a di A, deve anche essere T x = Ax − x = y e quindi y ∈ Ran(T ). Dunque, per concludere la dimostrazione, proviamo per assurdo che la successione iniziale {xn }n∈N ⊂ Ker(T )⊥ `e limitata. Se non fosse limitata, esisterebbe una sottosuccessione di elementi xnm con 0 < ||xnm || → +∞ per m → +∞. Dato che la successione degli yn deve essere limitata essendo convergente, dividendo per ||xnm || in (4.59), si otterrebbe: xn m xn m ynm xn m =A − = →0. (4.60) T ||xnm || ||xnm || ||xnm || ||xnm || x
Dato che A `e compatto e la successione degli ||xnnm || `e limitata, potremm mo estrarre una seconda sottosuccessione di elementi xnmk /||xnmk || per cui, contemporaneamente: xnmk xnmk → x ∈ H e T → T x se k → +∞. ||xnmk || ||xnmk || Dalla (4.60) si conclude che T x = 0 e dunque x ∈ Ker(T ). Dato che, per xnm ipotesi, ||xn k || ∈ Ker(T )⊥ ed essendo Ker(T )⊥ chiuso, deve anche valemk
re x ∈ Ker(T )⊥ . Ne consegue che x ∈ Ker(T ) ∩ Ker(T )⊥ = {0}, che `e impossibile visto che: ||x|| = lim
k→+∞
||xnmk || ||xnmk ||
=1.
L’assurdo trovato conclude la dimostrazione.
Il secondo lemma `e il seguente. Lemma 4.45. Nelle ipotesi fatte su T valgono le decomposizioni ortogonali: H = Ker(T ) ⊕ Ran(T ∗ ) = Ker(T ∗ ) ⊕ Ran(T ) .
(4.61)
Dimostrazione. Dato che T, T ∗ ∈ B(H), da (e) e (d) di teorema 3.14 e (d) di proposizione 3.38, abbiamo immediatamente che deve essere: Ker(T ) = (Ran(T ∗ )⊥ )⊥ = Ran(T ∗ ) e Ker(T ∗ ) = (Ran(T )⊥ )⊥ = Ran(T ) ed anche: H = Ker(T ) ⊕ Ran(T ∗ ) = Ker(T ∗ ) ⊕ Ran(T ) .
194
4 Classi di operatori compatti
Il risultato del lemma precedente conclude la dimostrazione, tenendo conto che il lemma vale anche rimpiazzando T con T ∗ , dato che (A − I)∗ = A∗ − I dove A∗ `e compatto se A `e tale. Dal lemma 4.45 segue immediatamente che l’enunciato (a) del teorema 4.42 `e vero (per λ = 1 che `e il caso che volevamo provare). Infatti, da esso segue che: f ⊥ Ker(T ∗ ) se e solo se f ∈ Ran(T ), cio`e esiste ϕ ∈ H tale che T ϕ = f. Per andare avanti con la dimostrazione di (b) del teorema principale, definiamo i sottospazi (che sono chiusi per il lemma 4.44) Hk := Ran(T k ) per k = 1, 2, . . . in modo tale che: H ⊃ H1 ⊃ H2 ⊃ H3 ⊃ · · · . Si osservi che per costruzione T (Hk ) = Hk+1 . Con queste definizioni abbiamo un terzo lemma. Lemma 4.46. Con le definizioni date per i sottospazi Hk , k = 1, 2, . . ., esiste j ∈ N tale che: Hk+1 = Hk se k ≥ j. Dimostrazione. Assumiamo per assurdo che j suddetto non esista. In tal caso Hk = Hh se k = h. In questo caso si pu` o costruire una successione di vettori ortonormali xk che soddisfano xk ∈ Hk e xk ⊥ H k+1 se k = 1, 2, . . .. Se l > k abbiamo allora che: Axl − Axk = −xk + (xl + T xl − T xk ) ` allora e quindi ||Axl − Axk ||2 ≥ 1 dato che xl + T xl − T xk ∈ Hk+1 . E impossibile estrarre una sottosuccessione convergente dalla successione Axk , contraddicendo l’ipotesi che A sia compatto e provando il lemma. Possiamo ora provare due lemmi che, insieme, costituiscono la dimostrazione dell’enunciato (b) del teorema 4.42 (sempre nel caso λ = 1). Lemma 4.47. Nelle ipotesi fatte su T , se Ker(T ) = {0}, allora Ran(T ) = H. Dimostrazione. Assumiamo che Ker(T ) = {0}, in modo tale che T sia iniettivo, ma supponiamo anche, per assurdo, che Ran(T ) = H. In tal caso gli spazi Hk per k = 1, 2, 3, . . . risulterebbero essere tutti distinti, cosa impossibile per il lemma 4.46. Lemma 4.48. Nelle ipotesi fatte su T , se Ran(T ) = H , allora Ker(T ) = {0}. Dimostrazione. Se Ran(T ) = H, a causa del lemma 4.45, deve essere che Ker(T ∗ ) = {0}. Ma allora per il lemma precedente (usando T ∗ al posto di T ) Ran(T ∗) = H. Usando ancora il lemma 4.45, si ha che Ker(T ) = {0}. ` chiaro che i lemmi 4.47 e 4.48 costituiscono insieme l’enunciato (b) del E teorema 4.42 che risulta essere pertanto provato. Concludiamo provando che anche (c) del teorema 4.42 `e vero (per λ = 1).
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
195
Supponiamo che dimKer(T ) = +∞ contrariamente a quanto asserito in (c). In tal caso esister`a un insieme ortonormale infinito {xn }n∈N ⊂ Ker(T ). Per costruzione Axn = xn e quindi ||Axk − Axh ||2 = 2. Ma questo `e impossibile perch´e implicherebbe che dall’insieme limitato {xn }n∈N non si possa estrarre una sottosuccessione per cui {Axnk }k∈N converga e questo deve essere vero in quanto A `e compatto. Concludiamo che dimKer(T ) = m < +∞. Similmente dimKer(T ∗ ) = n < +∞. Supponiamo, per assurdo, che diversamente da quanto asserito in (c), m = n. In particolare possiamo supporre che: m < n. Siano poi {ϕj }j=1,...,n e {ψj }j=1,...,m basi ortonormali per Ker(T ) e Ker(T ∗ ) rispettivamente. Definiamo S ∈ B(H) come: Sx := T x +
m
(ϕj |x)ψj .
j=1
Dato che S = A − I con A compatto (ottenuto dall’operatore compatto A aggiungendo un operatore compatto perch´e con rango di dimensione finita), tutti i risultati trovati sopra per T = A − I sono ancora validi per S. Mostriamo se Sx = 0 allora x = 0. Tale equazione si scrive esplicitamente: Tx +
m
(ϕj |x)ψj = 0 .
(4.62)
j=1
Dato che, in virt` u del lemma 4.45, tutti i vettori ψj sono ortogonali a tutti i vettori della forma T x, dalla (4.62) segue che T x = 0 e (ϕj |x) = 0 se 1 ≤ g ≤ m, dato che, da un lato il vettore x deve essere una combinazione lineare dei vettori ϕj , e dall’altro lato x deve essere ortogonale a tali vettori. Conseguentemente x = 0. Concludiamo che Sx = 0 implica che x = 0. Ma allora, in seguito all’enunciato (b), deve esistere y ∈ H tale che: Ty +
m
(ϕj |y)ψj = ψm+1 .
j=1
Prendendo il prodotto scalare dei due membri con ψm+1 otteniamo una contraddizione: 1 nel membro di sinistra e 0 in quello di destra, dato che T y ∈ Ran(T ) e Ran(T ) ⊥ Ker(T ∗ ). La contraddizione trovata mostra che non pu` o essere m < n, ma m ≥ n. Scambiando il ruolo di T e T ∗ , si ottiene che deve anche essere n ≥ m. Concludiamo che m = n. La prova dell’enunciato (c) `e terminata. Esempi 4.49. Un caso interessante di equazione di Fredholm di seconda specie `e dato dall’equazione di Volterra di seconda specie: x ϕ(x) = K(x, t)ϕ(t)dt + f(x) , (4.63) a 2
dove ϕ ∈ L ([a, b], dx) `e la funzione incognita, f ∈ L2 ([a, b], dx) `e assegnata ed il nucleo integrale soddisfa |K(x, t)| < M < +∞ per ogni x, t ∈ [a, b] con
196
4 Classi di operatori compatti
t ≤ x. (Un eventuale fattore moltiplicativo ρ ∈ C\{0} `e stato inglobato in K.) In questo caso si ricade nella teoria del teorema di Fredholm riscrivendo l’integrale come un integrale su tutto [a, b] e assumendo che K(x, t) = 0 se t ≥ x. Per questo tipo di equazione sussiste per`o un risultato pi` u preciso, basato sulla teoria delle mappe di contrazione (vedi la sezione 2.7). Risulta infatti che una potenza abbastanza elevata di TK : L2 ([a, b], dx) → L2 ([a, b], dx) `e una mappa di contrazione, dove TK `e l’operatore integrale in (4.63): x (TK ϕ)(x) = K(x, t)ϕ(t)dt . a
Di conseguenza l’equazione omogenea TK ϕ = 0 ha una ed una sola soluzione – che deve coincidere con ϕ = 0 – a causa del teorema 2.117. La dimostrazione n del fatto che TK sia una mappa di contrazione se n `e abbastanza alto si esegue similmente a quanto visto in (1) negli esempi 2.118, ma usando lo spazio di Banach (L2 ([a, b], dx), || ||2) al posto dello spazio di Banach (C([a, b]), || ||∞) (vedi esercizio 4.18). Tenuto conto di ci`o, da (a) e (b) del teorema di Fredholm, segue subito che l’equazione 4.63 ha esattamente una soluzione per ogni scelta del termine noto f ∈ L2 ([a, b], dx).
Esercizi 4.1. Dimostrare che se X `e uno spazio normato e T : X → X `e compatto ed iniettivo, allora ogni operatore lineare S : Ran(T ) → X, che sia inverso sinistro di T , non pu` o essere limitato quando X non ha dimensione finita. Soluzione. Se S fosse limitato, usando la proposizione 2.57, potremmo estenderlo ad un operatore limitato S˜ : Y → X, dove Y := Ran(T ), ottenendo ˜ = I. Esattamente come nella dimostrazione di (b) nella proposizione 4.9, ST ˜ `e compatto se T ∈ B(X, Y) `e compatto e S˜ ∈ B(Y, X). Ne si prova che ST conseguirebbe che l’operatore I : X → X `e compatto, cosa impossibile perch´e ci`o implicherebbe che la palla unitaria in X abbia chiusura compatta, e questo sappiamo essere falso, se la dimensione di X non `e finita, dalla proposizione 4.5. 4.2. Provare, facendo uso del Lemma di Banach 4.12 che, in uno spazio normato infinito dimensionale, la chiusura della palla unitaria non `e compatta. Traccia della soluzione. Siano x1 , x2 , . . . una successione infinita di vettori linearmente indipendenti con ||xn|| = 1 (e quindi tutti nella chiusura della palla unitaria), con il lemma di Banach si costruisce una successione di vettori y1 , y2 , . . . con ||yn || = 1 e con ||yn−1 − yn || > 1/2. Tale successione non pu`o contenere alcuna sottosuccessione convergente. 4.3. Provare che se A∗ = A ∈ B∞ (H), con H spazio di Hilbert, allora σp (|A|) = {|λ| |λ ∈ σp (A)} .
Esercizi
197
Concludere che se A∗ = A ∈ B∞ (H), allora sing(A) = {|λ| |λ ∈ σp (A) \ {0}} . Soluzione. Sviluppando gli operatori compatti autoaggiunti A ed |A| secondo il teorema 4.18 si ha, con ovvie notazioni, A= λPλ e |A| = μPμ . λ∈σp (A)
μ∈σp (|A|)
Calcolando il quadrato degli operatori A e |A|, usando la continuit` a di tali operatori (che permette lavorare come se le tutte le serie fossero somme finite), l’idempotenza e l’ortogonalit`a dei proiettori relativi ad autovettori distinti ed infine tenendo conto che |A|2 = A∗ A = A2 , si ha che deve valere λ2 Pλ = μ2 Pμ . (4.64) λ∈σp (A)
μ∈σp (|A|)
Si tenga ora conto che Pλ Pλ0 = 0 se λ = λ0 e Pλ Pλ0 = Pλ0 altrimenti e che l’analoga propriet` a vale per i proiettori della decomposizione di |A|. Applicando Pλ0 a destra di ambo membri di (4.64), prendendo l’aggiunto del risultato e applicando Pμ 0 a destra dei membri dell’identit`a finale, si ricava infine che, per ogni λ0 ∈ σ(A) e μ0 ∈ σp (|A|): deve valere λ20 Pλ0 Pμ 0 = μ20 Pλ0 Pμ 0 ossia (λ20 − μ20 )Pλ0 Pμ 0 = 0 .
(4.65)
Il fatto che A ammetta una base Hilbertiana di autovettori (teorema 4.18) si pu` o scrivere come ben noto: I = sPλ0 . λ0∈σ(A)
a Fissiamo μ0 ∈ σp (|A|). Se fosse Pλ0 Pμ 0 = 0 per ogni λ0 ∈ σ(A) dall’identit` di sopra avremmo Pμ 0 = 0 che `e impossibile per definizione di autospazio. Di conseguenza, dovendo valere (4.65), ci deve essere λ0 ∈ σ(A) tale che λ2 = μ20 , ovvero μ0 = |λ0 |. Se λ0 ∈ σp (A), usando un’analoga procedura scambiando il ruolo di A e |A|, si prova che deve esistere μ0 ∈ σp (|A|) tale che λ2 = μ20 , ovvero μ0 = |λ0 |. La prima affermazione `e provata. La seconda affermazione `e ora evidente dalla definizione di valore singolare. 4.4. Si dimostri che se T ∈ B∞ (H) e se H xn → x ∈ H in senso debole, cio `e: (g|xn ) → (g|x) se n → +∞, per ogni fissato g ∈ H, allora ||T (xn)−T (x)|| → 0 per n → +∞. In altre parole gli operatori compatti trasformano successioni convergenti debolmente in successioni convergenti in norma. Si estenda il risultato al caso di T ∈ B(X, Y) con X e Y spazi normati.
198
4 Classi di operatori compatti
Soluzione. Sia xn → x in senso debole. Se si tiene conto del teorema di Riesz, si ha subito che l’insieme {xn }n∈N `e debolmente limitato nel senso del corollario 2.74 del teorema di Banach-Steinhaus. In base a tale risultato, vale ||xn|| ≤ K per ogni n ∈ N, per qualche K > 0. Definiamo allora yn := T xn , y := T x e notiamo che, per ogni h ∈ H, (h|yn ) − (h|y) = (T ∗ h|xn ) − (T ∗ h|x) → 0 se n → +∞, e quindi anche la successione degli yn converge debolmente a y. Supponiamo, per assurdo, che ||yn − y|| → 0 se n → +∞. Allora devono esistere un > 0 e una sottosuccessione {ynk }k∈N con ||y − ynk || ≥ per ogni k ∈ N. Dato che {xnk }k∈N `e limitata da K come osservato sopra, e T compatto, deve esistere una sottosuccessione {ynkr }r∈N che converge a qualche y = y. Questa sottosuccessione {ynkr }r∈N deve quindi convergere anche debolmente a y . Ma questo `e impossibile dato che {yn }n∈N converge debolmente a y = y . Allora deve essere: yn → y nel senso della norma di H. Il ragionamento si pu` o ripetere nel caso generale in cui T ∈ B(X, Y) con X e Y spazi normati, interpretando X xn → x ∈ X in senso debole come: g(xn ) → g(x) se n → +∞, per ogni fissatog ∈ X , dato che il corollario 2.74 del teorema di Banach-Steinhaus vale in questo caso. Nella dimostrazione si deve osservare che se h ∈ Y allora h ◦ T ∈ X perch´e composizione di funzioni lineari continue. 4.5. In riferimento agli esempi 4.25, provare che dati TK , TK ∈ B2 (L2 (X, μ)) (dove la misura `e assunta essere separabile) che sono dunque individuati dai nuclei integrali K e K , allora l’operatore di Hilbert-Schmidt aTK + bTK , con a, b ∈ C ha nucleo integrale aK + bK . 4.6. Provare che dato TK ∈ B2 (L2 (X, μ)) individuato dal nucleo integra∗ le K allora l’operatore di Hilbert-Schmidt TK ha nucleo integrale K ∗ con ∗ K (x, y) = K(y, x). 4.7. Nelle stesse ipotesi dell’esercizio 4.5 mostrare che il nucleo integrale di TK TK `e K(x, y)K (y, z) dμ(y) . K (x, z) := X 2
4.8. Se L (X, μ) `e separabile, si consideri l’applicazione L2 (X × X, μ ⊗ μ) K → TK ∈ B2 (L2 (X, μ)). Si dimostri che si tratta di un isomorfismo di spazi di Hilbert. Si discuta se si pu` o o meno pensare tale applicazione come un’isometria tra spazi normati, assumendo B(L2 (X, μ)) come codominio. Pi` u debolmente si discuta la continuit` a dell’omomorfismo. 4.9. In riferimento a (4) in esempi 4.25, dimostrare che, se g ∈ C0 ([0, 1]), allora: x (I − ρT )−1 g (x) = g(x) + ρ eρ(x−y) g(y)dy . 0
Esercizi
199
Suggerimento. Applicare l’operatore I − ρT , tenendo conto dell’espres∂ ρ(x−y) sione integrale di T e osservando che ρeρ(x−y) = ∂x e . 4.10. Si consideri l’insieme BD (L2 (X, μ)) degli operatori degeneri su L2 (X, μ) (vedi (4) in esempi 4.25), con μ separabile. Provare che le seguenti affermazioni sono equivalenti. (a) T ∈ BD (L2 (X, μ)). (b) Ran(T ) ha dimensione finita. (c) T ∈ B2 (L2 (X, μ)) (e pertanto T `e un operatore integrale) con nucleo N integrale che pu`o sempre essere scritto come K(x, y) = k=1 pk (x)qk (y) dove le funzioni: p1 , . . . , pN ∈ L2 (X, μ) e q1 , . . . , qN ∈ L2 (X, μ) sono, separatamente, linearmente indipendenti. 4.11. Si consideri l’insieme BD (L2 (X, μ)) degli operatori degeneri (vedi (4) in esempi 4.25) su L2 (X, μ), con μ separabile. Mostrare BD (L2 (X, μ)) `e uno ∗-ideale bilatero di B(L2 (X, μ)) sottospazio di B2 (L2 (X, μ)). In altre parole si deve provare che BD (L2 (X, μ) ⊂ B2 (L2 (X, μ)), che `e un sottospazio chiuso rispetto alla coniugazione hermitiana e che AD, DA ∈ BD (L2 (X, μ) se A ∈ B(L2 (X, μ)) e D ∈ BD (L2 (X, μ)). 4.12. Si consideri BD (L2 (X, μ)) (vedi (4) in esempi 4.25) con L2 (X, μ), con μ separabile. La chiusura topologica di BD (L2 (X, μ)) in B2 (L2 (X, μ)) rispetto alla topologia naturale di B(L2 (X, μ)) coincide con B2 (L2 (X, μ))? Suggerimento. Si consideri l’operatore, dove la convergenza della serie `e quella rispetto alla norma operatoriale uniforme: T :=
+∞ n=0
1 √ TKn , n
e dove Kn (x, y) = φn (x)φn (y), essendo {φn }n∈N una base hilbertiana di L2 (X, μ). Provare che T ∈ B(L2 (X, μ)) `e ben definito, ma T ∈ B2 (L2 (X, μ)), dato che ||T φn||2 = 1/n. 4.13. Considerare un operatore integrale TK su L2 ([0, L]N , dx), con nucleo integrale K(x, y) dove K ∈ C 1 ([0, L]N ). Assumendo che TK ∈ B1 (L2 ([0, L]N , dx)), mostrare che tr(TK ) = K(x, x)dx . [0,L]N
Suggerimento. Usare come base di Hilbert per sviluppare la traccia la base hilbertiana degli esponenziali 1 LN/2
2π
ei L
N
k=1
n i xi
,
n 1 , n 2 , . . . , nN ∈ Z .
200
4 Classi di operatori compatti
Ricordare che, se f : [0, L]N → C `e di classe C 1 allora la serie di Fourier converge puntualmente (escluso al pi` u l’insieme di misura nulla rappresentato dal bordo di [0, L]N ): N N 1 2π 2π f(x) = ei L k=1 ni xi e−i L k=1 niyi f(y)dy . L [0,L]N n1,...,nN ∈Z
Usare infine il teorema di Fubini-Tonelli opportunamente. 4.14. Considerare un operatore integrale TK su L2 ([0, 2π], dx), con nucleo integrale: 1 1 in(x−y) K(x, y) = e . 2π n2 n∈Z\{0}
Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia. 4.15. Si consideri TK nell’esercizio 4.14 e l’operatore differenziale: A := −
d2 , dx2
definito sulle funzione infinitamente differenziabili su [0, 2π] che soddisfano condizioni di periodicit` a (includendo tutte le derivate). Quanto vale: TK A? 2π 1 Suggerimento. Vale TK A = I − P0 dove P0 : f → ( 2π 0 f(x)dx)1, essendo 1 la funzione che vale costantemente 1 su [0, 2π], definisce il proiettore ortogonale sul sottospazio delle funzioni costanti in L2 ([0, 2π], dx). 4.16. Considerare un operatore integrale Ts su L2 ([0, 2π], dx), con nucleo integrale: 1 in(x−y) 1 Ks (x, y) = e . 2π n2s n∈Z\{0}
Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia se s > 1/2. Dimostrare che: tr(Ts ) = ζR (s) , dove il secondo membro `e la funzione zeta di Riemann. 4.17. Si provi che se B ∈ B(H), con H spazio di Hilbert, e se esiste una base hilbertiana N per la quale: u∈N ||Bu|| < +∞, allora B ∈ B1 (H). Suggerimento. Osservare che |||B|ψ|| ||ψ|| |||B|ψ||.
=
||Bψ|| e |(ψ||B|ψ)|
≤
Esercizi
201
4.18. Si consideri l’operatore integrale TK : L2 ([a, b], dx) → L2 ([a, b], dx) x (TK ϕ)(x) = K(x, t)ϕ(t)dt . a
dove K `e una funzione misurabile tale che esiste M ∈ R con |K(x, t)| ≤ M se x, t ∈ [a, b] con t ≤ x. Dimostrare che: M n (b − a)n n ||TK || ≤ (n + 1)! n `e una mappa di contrazione. e quindi esiste un intero positivo n per cui TK
Soluzione. Si osservi, nei calcoli che seguono, che ϕ ∈ L2 ([a, b], dx) implica ϕ ∈ L1 ([a, b], dx) per la disuguaglianza di Cauchy-Schwarz, dato che la funzione che vale costantemente 1 `e in L2 ([a, b], dx). Per costruzione, se θ(z) = 0 per z ≥ 0 e θ(z) = 0 altrimenti, possiamo scrivere,
b
n |(TK ϕ)(x)| =
b
b
dx2 · · ·
dx1 a
a
dxn θ(x − x1 )θ(x1 − x2 ) · · · θ(xn−1 − xn ) a
×K(x, x1 )K(x1 − x2 ) · · · K(xn−1 , xn)ϕ(xn ) . Conseguentemente: n ϕ)(x)| |(TK
≤M
n [a,b]n
dx1 · · · dxn |θ(x − x1 ) · · · θ(xn−1 − xn )| |ϕ(xn )| .
Applicando la disuguaglianza di Cauchy-Schwarz su L2 ([a, b]n, dx1 · · · dxn ), tenendo conto che θ(z)2 = θ(z) = |θ(z)|, si trova subito che: n |(TK ϕ)(x)| ≤
! M
n [a,b]n
dx1 · · · dxn θ(x − x1 ) · · · θ(xn−1 − xn ) [b − a](n−1)/2||ϕ||2 ,
cio`e: n |(TK ϕ)(x)| ≤ M n
(x − a)n/2 √ [b − a](n−1)/2||ϕ||2 . n!
Conseguentemente: M n (b − a)n n ||TK ϕ||2 ≤ ||ϕ||2 . (n + 1)! e quindi:
M n (b − a)n n || ≤ . ||TK (n + 1)!
202
4 Classi di operatori compatti
Dato che:
M n (b − a)n →0 n→+∞ (n + 1)! lim
se n → +∞,
per n grande a sufficienza, possiamo scrivere che, per qualche numero positivo λ < 1: n n ||TK ϕ − TK ϕ ||2 ≤ λ||ϕ − ϕ ||2 , n `e un operatore di contrazione. pertanto TK
5 Operatori non limitati con domini densi in spazi di Hilbert von Neumann aveva appena finito di tenere la sua lezione quando uno studente si alz` o in piedi dicendo, con un tono vagamente colpevole, che non era riuscito a capire l’argomento conclusivo. Von Neumann rispose: “Giovanotto, in matematica lei non deve capire le cose, le deve usare”. David Wells
In questo capitolo estenderemo la teoria degli operatori sviluppata nei precedenti capitoli per includere il caso di operatori non limitati e non definiti su tutto lo spazio. Nella prima sezione daremo, in particolare, la nozione di dominio naturale di un operatore costruito componendo in vario modo operatori con dominio non massimale. Introdurremo la nozione di operatore chiuso e di operatore chiudibile. Quindi, presenteremo la nozione generale di operatore aggiunto, per operatori non limitati e densamente definiti, estendendo la nozione gi` a fornita nel caso di operatori limitati definiti su tutto lo spazio di Hilbert. La sezione successiva si occuper`a di discutere le generalizzazioni, al caso di operatore non limitato, della nozione di operatore autoaggiunto. Introdurremo a tal fine le nozioni di operatore hermitiano, simmetrico, essenzialmente autoaggiunto ed autoaggiunto, discutendone le propriet` a generali pi` u importanti. In particolare presenteremo la nozione di core di un operatore e quella di indici di difetto. La terza sezione sar`a completamente dedicata a due esempi di operatori autoaggiunti della massima importanza in Meccanica Quantistica: gli operatori posizione ed impulso negli spazi di Hilbert L2 (Rn , dx). Studieremo le propriet` a matematiche di tali operatori, presentandone varie possibili definizioni equivalenti. L’ultima sezione sar`a dedicata a criteri pi` u avanzati per stabilire se un operatore simmetrico ammette estensioni autoaggiunte. In particolare presenteremo il criterio di von Neumann e quello di Nelson. Alcuni strumenti tecnici per affrontare questo tipo di analisi, discussi nello stessa sezione, sono la trasformata di Cayley e la nozione di vettore analitico introdotta da Nelson e rivelatasi di estrema importanza nelle applicazioni della teoria degli operatori alla MQ.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
204
5 Operatori non limitati con domini densi in spazi di Hilbert
5.1 Operatori non limitati con dominio non massimale Introduciamo la teoria degli operatori non limitati e con dominio non massimale. Il dominio degli operatori in questione sar` a in ogni caso un sottospazio vettoriale dello spazio ambiente e considereremo spesso il caso in cui tale sottospazio sia denso. Malgrado gli operatori che considereremo non saranno limitati, tutte le definizioni generali che daremo si ridurranno a quelle, gi` a viste nei capitoli precedenti, restringendosi a lavorare con operatori limitati. 5.1.1 Operatori non limitati con dominio non massimale in spazi normati Le prime nozioni che presentiamo sono generali e non necessitano ancora della struttura di spazio di Hilbert. Una nozione di grafico di un operatore, in realt` a, `e gi`a stata data nella definizione 2.103, per operatori con dominio massimale. La definizione che segue la estende leggermente. Definizione 5.1. Sia X spazio vettoriale. Un’applicazione lineare: T : D(T ) → X , con D(T ) ⊂ X sottospazio di X, `e detta operatore in X e D(T ) `e detto dominio di T . Il grafico, G(T ), dell’operatore T `e il sottospazio di X ⊕ X: G(T ) := {(x, T x) | x ∈ D(T )} . Se α ∈ C e A e B sono operatori in X con dominio D(A) e D(B) rispettivamente, si definiscono gli operatori in H: (a) AB, tale che ABf := A(Bf) sul suo dominio naturale: D(AB) := {f ∈ D(B) | Bf ∈ D(A)} ; (b) A + B tale che (A + B)f := Af + Bf sul suo dominio naturale: D(A + B) := D(A) ∩ D(B) ; (c) αA, tale che αAf := α(Af) sul suo dominio naturale: D(αA) = D(A) se α = 0, oppure D(0A) := H. ` evidente che la definizione di grafico data sopra si riduce a quella gi` E a vista nel caso di operatori T ∈ L(X), che non sono altro che operatori in X con D(T ) = X. La nozione di estensione di un operatore e quella di operatore chiuso giocano un ruolo importante nel seguito. Cominciamo con la prima nozione che `e ovvia. Definizione 5.2. Se A `e un operatore nello spazio vettoriale X, un operatore B in X si dice essere un’estensione di A, e si scrive A ⊂ B, se G(A) ⊂ G(B).
5.1 Operatori non limitati con dominio non massimale
205
5.1.2 Operatori chiusi e chiudibili Passiamo alla nozione di operatore chiuso, estendendo la definizione 2.103 al caso in cui il dominio dell’operatore non coincida con tutto lo spazio, ad aggiungendo alcune nuove nozioni. Ricordiamo che, se X `e spazio normato, la topologia prodotto, sul prodotto cartesiano X × X, `e quella i cui aperti, oltre a ∅, sono le unioni di prodotti di due aperte Bδ (x)×Bδ1 (x1 ), di centri x, x1 ∈ X e raggi δ, δ1 > 0 arbitrari (vedi la sezione 2.4.6). Definizione 5.3. Sia A operatore nello spazio normato X. (a) A `e detto chiuso se il suo grafico `e chiuso nella topologia prodotto di X × X. In altre parole A `e chiuso se, per una successione {xn }n∈N ⊂ D(A) si ha: (i) xn → x ∈ X per n → +∞ e (ii) T xn → y ∈ X per n → +∞, allora vale x ∈ D(A) e y = T x. (b) A `e detto chiudibile se la chiusura G(A) del suo grafico `e ancora il grafico di un operatore (che risulta essere necessariamente chiuso). Tale operatore si indica con A e si dice chiusura di A. La seguente proposizione caratterizza gli operatori chiudibili. Proposizione 5.4. Sia A operatore nello spazio normato X. I seguenti fatti sono equivalenti: (i) A `e chiudibile, (ii) G(A) non contiene elementi del tipo (0, z) con z = 0, (iii) A ammette estensioni chiuse. Dimostrazione. (i) ⇔ (ii). A non `e chiudibile se e solo se ci sono due successioni in D(A), {xn }n∈N e {xn }n∈N , tali che xn → x ← xn , ma Axn → y = y ← Axn . Per linearit` a questo `e equivalente a dire che c’`e una successione di elementi xn = xn − xn → 0 tale che T xn → y − y = z = 0. Ci` o equivale a dire che G(A) contiene (0, z) = (0, 0). (i) ⇔ (iii). Se A `e chiudibile, A `e un’estensione chiusa di A. Se, viceversa, esiste un’estensione chiusa B di A, non pu` o accadere che esistano in G(A) elementi del tipo (0, z) = (0, 0), altrimenti, essendo A ⊂ B e B chiuso, avremmo che G(B) = G(B) ⊃ G(A) (0, z) e quindi B non sarebbe operatore lineare essendo B(0) = 0. Un’utile propriet` a generale degli operatori chiudibili, che vale in spazi di Banach (e quindi anche in spazi di Hilbert) `e la seguente. Proposizione 5.5. Siano X e Y spazi di Banach e T ∈ B(X, Y). Se l’operatore T soddisfa Ran(T ) ⊂ D(A), con A : D(A) → Y operatore in Y chiudibile (in generale non limitato e con D(A) sottospazio proprio di Y), allora AT ∈ B(X, Y). Dimostrazione. Dato che la chiusura di A estende A, AT = AT `e ben definito. Per concludere la dimostrazione `e sufficiente dimostrare che AT : X → Y `e
206
5 Operatori non limitati con domini densi in spazi di Hilbert
chiuso e quindi applicare il teorema 2.104 del grafico chiuso. Per provare che AT `e chiuso, si assuma che, se n → +∞, X xn → x ∈ X e (AT )(xn ) → y ∈ Y. Allora vale anche: T xn → z ∈ Y, dato che T `e continuo. Dato che A `e chiuso e A(T xn ) → y, deve essere z ∈ D(A) e Az = y. Cio`e (AT )(x) = y. Allora AT `e chiuso per definizione. 5.1.3 Il caso degli spazi di Hilbert: struttura di H ⊕ H e operatore τ Consideriamo il caso in cui X = H sia uno spazio di Hilbert con prodotto ` conveniente definire una struttura di spazio di Hilbert sulla scalare ( | ). E somma diretta H ⊕ H ((3) in notazione 2.102), ottenendo la somma diretta hilbertiana di H con se stesso. Dal punto di vista topologico, H ⊕ H pu` o dotarsi della topologia prodotto di H × H, che `e quella usata per definire la nozione di chiusura di un operatore e di operatore chiuso. Mostriamo che esiste una struttura naturale di spazio di Hilbert su H⊕H che induce proprio la topologia prodotto tramite la norma associata al prodotto scalare. Definiamo il prodotto scalare su H ⊕ H come: ((x, x)|(y, y ))H⊕H := (x|y) + (x |y )
se (x, x), (y, y ) ∈ H ⊕ H.
(5.1)
Con questa definizione, i due sottospazi H della somma diretta H ⊕ H risultano anche essere ortogonali e quindi la somma `e ortogonale oltre che diretta. Mostriamo che H ⊕ H `e, con tale prodotto scalare, uno spazio di Hilbert. Dato che la norma || ||H⊕H indotta da questo prodotto scalare soddisfa: ||(z, z )||2H⊕H = ||z||2 + ||z ||2
per ogni (z, z ) ∈ H ⊕ H,
(5.2)
{(xn , xn )}n∈N
ogni successione ⊂ H⊕H, che sia di Cauchy rispetto alla norma || ||H⊕H, individua le due successioni di Cauchy in H: {xn }n∈N e {xn }n∈N. Tali ` quindi successioni di Cauchy convergono rispettivamente a x e x in H. E immediato provare che (xn , xn ) → (x, x) per n → +∞ nella norma || ||H⊕H, direttamente da (5.2). Pertanto (H⊕H, || ||H⊕H) `e completo. Infine, il prodotto scalare su H⊕H induce la topologia prodotto su H⊕H come preannunciato. A tal fine, ricordando l’analoga discussione svolta nella sezione 2.4.6, `e sufficiente (H⊕H) notare, se (x, y) ∈ H⊕H e se Bδ ((x, y)) `e la palla aperta in H⊕H centrata in (x, y) di raggio δ > 0 e B (z) l’analoga palla aperta in H centrata in z di raggio > 0, allora valgono le inclusioni: (H⊕H)
Bδ/2 (x) × Bδ/2 (y) ⊂ Bδ
((x, y)) ⊂ Bδ (x) × Bδ (y) .
Osservazione 5.6. In virt` u del risultato ottenuto, su uno spazio di Hilbert, la nozione di operatore chiuso e di chiusura (definizione 5.3) pu` o essere equivalentemente riferita alla topologia indotta dal prodotto scalare su H ⊕ H. Un utile strumento per dimostrare rapidamente alcuni risultati, `e l’operatore limitato: τ : H ⊕ H (x, y) → (−y, x) ∈ H ⊕ H . (5.3)
5.1 Operatori non limitati con dominio non massimale
Se
∗
207
`e riferito alla struttura di spazio di Hilbert di H ⊗ H, si ha subito: τ ∗ = τ −1 = −τ ,
(5.4)
pertanto, in particolare, τ `e unitario su H ⊗ H. Se ⊥ `e riferito a H ⊕ H, si verifica e per computo diretto che τ e ⊥ commutano: se F ⊂ H ⊕ H, si ha: τ (F ⊥ ) = (τ (F ))⊥ .
(5.5)
5.1.4 Propriet` a generali dell’operatore aggiunto hermitiano Passiamo ora a definire l’aggiunto di un operatore T nello spazio di Hilbert H con dominio D(T ) denso in H, quando T non sia, in generale, limitato. Ora non possiamo usare il teorema di Riesz e dobbiamo procedere in modo alternativo. Per prima cosa definiamo il dominio D(T ∗ ) dell’operatore aggiunto, sapendo gi` a dove vogliamo arrivare: vogliamo che (T ∗ x|y) = (x|T y) se x ∈ D(T ∗ ) e y ∈ D(T ). D(T ∗ ) := {x ∈ H | esiste zT ,x ∈ H con (x|T y) = (zT ,x |y) per ogni y ∈ D(T )} , (5.6) e poi assumeremo, per x ∈ D(T ∗ ), che T ∗ x := zT ,x. Mostriamo che la definizione (5.6) `e ben posta e determina (a) un sottospazio D(T ∗ ) ⊂ H e (b) un operatore T ∗ : D(T ∗ ) x → zT ,x . (a) D(T ∗ ) = ∅, perch´e 0 ∈ D(T ∗ ) definendo zT ,0 := 0. Inoltre, usando la (anti)linearit`a del prodotto scalare e di T , si verifica subito che, se x, x ∈ D(T ∗ ) e α, β ∈ C, allora αx + βx ∈ D(T ∗ ), dato che (αx + βx |T y) = (zT ,αx+βx |y) se si pone zT ,αx+βx := αzT ,x + βzT ,x . Quindi D(T ∗ ) `e un sottospazio. (b) La legge D(T ∗ ) x → zT ,x =: T ∗ x definisce una funzione, che risulta essere lineare per costruzione per quanto visto sopra, solo nel caso in cui ogni x ∈ D(T ∗ ) individua un unico zT ,x . Mostriamo che questo `e vero quando D(T ∗ ) `e denso, come da noi assunto. Se (zT ,x |y) = (x|T y) = (zT ,x |y) per ogni y ∈ D(T ), allora deve anche essere: 0 = (x|T y) − (x|T y) = (zT ,x − zT ,x|y). Dato che D(T ) = H, esiste {yn }n∈N ⊂ D(T ) con yn → zT ,x − zT ,x . Per la continuit` a del prodotto scalare, (zT ,x − zT ,x |y) = 0 implica che ||zT ,x − zT ,x ||2 = 0 e quindi zT ,x = zT ,x . Definizione 5.7. Se T `e un operatore nello spazio di Hilbert H con D(T ) = H, l’operatore aggiunto di T , T ∗ , `e l’operatore in H definito sul sottospazio: D(T ∗ ) := {x ∈ H | esiste zT ,x ∈ H con (x|T y) = (zT ,x |y) per ogni y ∈ D(T )} e tale che: T ∗ : x → zT ,x. Osservazioni 5.8. ` chiaro che, come volevamo all’inizio, per costruzione vale: (1) E (T ∗ x|y) = (x|T y) ,
per ogni coppia (x, y) ∈ D(T ∗ ) × D(T ).
208
5 Operatori non limitati con domini densi in spazi di Hilbert
(2) Se T ∈ B(H), applicando la definizione 5.7 per T ∗ si vede immediatamente che vale D(T ∗ ) = H a causa del teorema 3.17 di Riesz. Concludiamo che: per gli operatori di B(H) la definizione di aggiunto data in definizione 5.7 coincide con quella data in definizione 3.37. (3) Se T `e un operatore densamente definito sullo spazio di Hilbert H, non `e detto che D(T ∗ ) sia denso in H, per cui, in generale, non esiste (T ∗ )∗ . (4) Se A e B sono operatori densamente definiti nello spazio di Hilbert H: A⊂B
⇒
A∗ ⊃ B ∗ .
(5.7)
La prova `e immediata dalla definizione 5.7 di aggiunto.
Teorema 5.9. Sia A operatore in H, spazio di Hilbert, e D(A) = H. Vale quanto segue. (a) A∗ `e un operatore chiuso e vale: G(A∗ ) = τ (G(A))⊥ .
(5.8)
(b) A `e chiudibile se e solo se D(A∗ ) `e denso. In tal caso: A ⊂ A = (A∗ )∗ . (c) Ker(A∗ ) = [Ran(A)]⊥ e Ker(A) ⊂ [Ran(A∗ )]⊥, dove possiamo sostituire ⊂ con = se D(A∗ ) `e denso in H. (d) Se A `e chiuso allora vale la decomposizione ortogonale di H ⊗ H: H ⊕ H = τ (G(A)) ⊕ G(A∗ ) .
(5.9)
Dimostrazione. (a) Esplicitando l’insieme τ (G(A))⊥ troviamo subito che: τ (G(A))⊥ = {(x, y) ∈ H ⊕ H | − (x|Az) + (y|z) = 0 per ogni z ∈ D(A)} . In altre parole τ (G(A))⊥ `e il grafico di A∗ (purch´e tale operatore sia definito!) e vale (5.8). τ (G(A))⊥ `e chiuso per costruzione, essendo l’ortogonale di un insieme ((a) di teorema 3.14), quindi A∗ `e chiuso. (b) Consideriamo la chiusura del grafico di A. Vale D(A) = (D(A)⊥ )⊥ per il teorema 3.14. Tenendo conto che τ τ = −I, che S ⊥ = −S ⊥ per ogni insieme S, e che valgono (5.5) e (5.8), troviamo che: G(A) = −τ ( τ (G(A))⊥ )⊥ = −τ (G(A∗ ))⊥ = τ (G(A∗ ))⊥ .
(5.10)
Per la proposizione 5.4, G(A) `e il grafico di un operatore (la chiusura di A) se e solo se G(A) non contiene elementi del tipo (0, z) con z = 0. In altre parole G(A) non `e il grafico di un operatore se e solo se esiste z = 0 con (0, z) ∈ τ (G(A∗ ))⊥ . Questa condizione si esplicita in: esiste z = 0 tale che
0 = ((0, z)|(−A∗ x, x)) ,
per ogni x ∈ D(A∗ ) .
5.2 Classi di operatori hermitiani
209
In altre parole G(A) non `e il grafico di un operatore se e solo se D(A∗ )⊥ = {0}, che `e equivalente a dire che D(A∗ ) non `e denso in H. In definitiva: G(A) `e il grafico di un operatore se e solo se D(A∗ ) `e denso in H. Se D(A∗ ) `e denso in H, allora (A∗ )∗ `e definito e, usando (5.10) e (5.8): G(A) = τ (G(A∗ ))⊥ = G((A∗ )∗ ) . Infine, per la definizione di chiusura dell’operatore A, G(A) = G(A). Sostituendo sopra: G(A) = G((A∗ )∗ ) , e quindi A = (A∗ )∗ . (c) Le identit` a seguono immediatamente da: (A∗ x|y) = (x|Ay) ,
per ogni coppia (x, y) ∈ D(A∗ ) × D(A)
e dalla densit`a di D(A) (e da quella di D(A∗ )). (d) Dato che A `e chiuso, G(A) `e chiuso e quindi τ (G(A)) `e chiuso perch´e l’operatore τ : H ⊕ H → H ⊕ H `e unitario. Dalla (5.8) e da (b) e (d) del teorema 3.14 abbiamo immediatamente che (5.9) deve essere vera. Questo conclude la dimostrazione. Osservazione 5.10. Tenuto conto del fatto che, se D(A) `e denso e λ ∈ C, allora vale (A − λI)∗ = A∗ − λI, la prima relazione del punto (c) implica immediatamente che valga anche la seguente identit`a: Ker(A∗ − λI) = [Ran(A − λI)]⊥ , mentre la seconda relazione del punto (c) fornisce: Ker(A − λI) ⊂ [Ran(A∗ − λI)]⊥ . Nel resto del libro useremo diverse volte le relazioni trovate.
5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti Siamo ora in grado di enunciare la definizione generale di operatore autoaggiunto insieme a quella di altre nozioni collegate. Definizione 5.11. Siano (H, ( | )) spazio di Hilbert e A : D(A) → H operatore in H. (a) A `e detto hermitiano se (Ax|y) = (x|Ay) per ogni coppia x, y ∈ D(A). (b) A `e detto simmetrico se: (i) A `e hermitiano e (ii) D(A) `e denso.
210
5 Operatori non limitati con domini densi in spazi di Hilbert
In altre parole, A `e simmetrico se: (i)’ D(A) = H e (ii)’ A ⊂ A∗ . (c) A `e detto autoaggiunto se: (i) D(A) `e denso e (ii) A = A∗ . (d) A `e detto essenzialmente autoaggiunto se: (i) D(A) `e denso, (ii) D(A∗ ) `e denso e (iii) A∗ = (A∗ )∗ (cio`e l’aggiunto di A `e autoaggiunto). Equivalentemente (per (b) del teorema 5.9), A `e essenzialmente autoaggiunto se: (i)’ D(A) `e denso, (ii)’ A `e chiudibile e (iii)’ vale A∗ = A. (e) A `e detto normale se A∗ A = AA∗ , dove i due membri sono definiti sui loro domini naturali. Osservazioni 5.12. (1) A commento di (c) nella definizione 5.11, si osservi che, per (a) di teorema 5.9, ogni operatore autoaggiunto `e quindi automaticamente chiuso. (2) Val la pena di notare che: (i) le definizioni di operatore hermitiano, simmetrico, autoaggiunto ed essenzialmente autoaggiunto coincidono quando il dominio dell’operatore `e tutto lo spazio di Hilbert, (ii) vale il seguente importante teorema. Teorema 5.13. (Di Hellinger-Toeplitz.) Un operatore hermitiano con dominio dato da tutto lo spazio di Hilbert `e necessariamente limitato (ed autoaggiunto nel senso della definizione 3.46). Dimostrazione. La limitatezza vale per (d) della proposizione 3.49. L’operatore `e quindi autoaggiunto anche nel senso della definizione 3.9. (iii) gli operatori limitati autoaggiunti nel senso della definizione 3.46 sono tutti e soli gli operatori autoaggiunti nel senso della definizione 5.11 con dominio dato da tutto lo spazio. (3) La nozione di operatore essenzialmente autoaggiunto `e la pi` u importante delle quattro presentate sopra nelle applicazioni in Meccanica Quantistica, per il seguente fatto. Come vedremo tra poco, gli operatori essenzialmente autoaggiunti ammettono una sola estensione autoaggiunta, per cui portano tutta l’informazione di un operatore autoaggiunto. Per motivi che vedremo pi` u avanti, gli operatori importanti in Meccanica Quantistica sono operatori autoaggiunti; d’altra parte gli operatori pi` u comodi da trattare in tale teoria sono gli operatori differenziali. Risulta spesso che operatori differenziali della MQ definiti su domini opportuni siano essenzialmente autoaggiunti. In
5.2 Classi di operatori hermitiani
211
tal modo gli operatori differenziali essenzialmente autoaggiunti sono, da una parte, comodi per essere usati, dall’altra, portano le informazioni, in maniera univoca, di operatori autoaggiunti utili in Meccanica Quantistica. Per questo motivo ci soffermeremo su alcune propriet`a connesse all’autoaggiunzione essenziale. (4) Dato un operatore A : D(A) → H nello spazio di Hilbert H, si dice che B ∈ B(H) commuta con A, quando: BA ⊂ AB . Se il dominio di A `e denso e quindi esiste A∗ , si verifica facilmente che se B ∈ B(H) commuta con A allora B ∗ commuta con A∗ (lo si provi per esercizio). Indichiamo con {A} il commutante di A : D(A) → H, cio`e: {A} := {B ∈ B(H) | BA ⊂ AB} . Nel caso in cui A = A∗ risulta che {A} `e una sotto ∗-algebra di B(H) che `e chiusa rispetto alla topologia operatoriale forte. Si tratta dunque di un’algebra di von Neumann (vedi (3) in esempi 3.42). L’ulteriore commutante {A} := {{A} } `e ancora un’algebra di von Neumann, detta algebra di von Neumann generata da A. Vale la seguente elementare, ma importante, proposizione che useremo spesso senza citarla esplicitamente. La semplice dimostrazione `e lasciata al lettore. Proposizione 5.14. Siano H1 e H2 spazi di Hilbert e U : H1 → H2 operatore unitario. Se A : D(A) → H1 `e un operatore in H1 si consideri l’operatore in H2 : A2 : D(A2 ) → H2
con A2 := U A1 U −1 e D(A2 ) := U D(A1 ).
A2 `e chiudibile, chiuso, hermitiano, simmetrico, essenzialmente autoaggiunto, autoaggiunto, normale se e solo se A1 `e, rispettivamente, `e chiudibile, chiuso, hermitiano, simmetrico, essenzialmente autoaggiunto, autoaggiunto, normale. Notazione 5.15. D’ora in poi scriveremo anche A∗∗···∗ in luogo di (((A∗ )∗ ) · · ·)∗ . Proposizione 5.16. Siano (H, (|)) spazio di Hilbert e A operatore in H; allora valgono i seguenti fatti. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora: ∗
A∗ = A = A∗ = A∗∗∗ .
(5.11)
(b) A `e essenzialmente autoaggiunto se e solo se A `e autoaggiunto. (c) Se A `e autoaggiunto, allora `e simmetrico massimale: non ha estensioni proprie simmetriche. (d) Se A `e essenzialmente autoaggiunto, allora A ammette solo una estensione autoaggiunta: A (che coincide con A∗ ).
212
5 Operatori non limitati con domini densi in spazi di Hilbert
Dimostrazione. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora esistono A∗ , A∗∗ e A∗∗∗ . Inoltre ∗
A = (A∗∗ )∗ = A∗∗∗ = (A∗ )∗∗ = A∗ per (b) del teorema 5.9. Dato che A∗ `e chiuso (per (a) di teorema 5.9), vale infine: A∗ = A∗ . (b) Se A `e essenzialmente autoaggiunto, allora A = A∗ e quindi, in particolare, D(A) = D(A∗ ) `e denso. Calcolando l’aggiunto di A e tenendo conto di (b) in ∗ teorema 5.9, si ha: A = (A∗ )∗ = A, ossia A `e autoaggiunto. ∗ Viceversa, se A `e autoaggiunto, ossia esiste A = A, allora D(A), D(A∗ ), ∗ D(A∗∗ ) sono densi e, applicando (a): A∗ = A∗ = A ; quindi A∗ = A. Allora A `e essenzialmente autoaggiunto. (c) Sia A autoaggiunto e A ⊂ B con B simmetrico. Prendendo gli aggiunti, si ha A∗ ⊃ B ∗ . Ma B ∗ ⊃ B per la simmetria. Allora: A ⊂ B ⊂ B ∗ ⊂ A∗ = A , e quindi A = B = B ∗ . (d) Sia A∗ = A∗∗ e A ⊂ B con B = B ∗ . Prendendo l’aggiunto di A ⊂ B si ha che: B = B ∗ ⊂ A∗ . Prendendo due volte l’aggiunto di A ⊂ B troviamo anche che A∗∗ ⊂ B, ma allora: B = B ∗ ⊂ A∗ = A∗∗ ⊂ B , per cui B = A∗∗ , che coincide con A per (b) del teorema 5.9.
Passiamo ora a discutere i due teoremi fondamentali che caratterizzano gli operatori autoaggiunti ed essenzialmente autoaggiunti. Teorema 5.17. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti: (a) A `e autoaggiunto, (b) A `e chiuso e Ker(A∗ ± iI) = {0}, (c) Ran(A ± iI) = H. Dimostrazione. (a) ⇒ (b). Se A = A∗ , allora A `e chiuso perch´e A∗ `e chiuso. Se x ∈ Ker(A∗ + iI), allora vale anche Ax = −ix e quindi i(x|x) = (Ax|x) = (x|Ax) = (x| − ix) = −i(x|x) , per cui (x|x) = 0 e quindi x = 0. La prova per Ker(A∗ − iI) = {0} `e analoga. (b) ⇒ (c). Dalla definizione di operatore aggiunto segue che (vedi l’osservazione 5.10): [Ran(A−iI)]⊥ = Ker(A∗ +iI). Quindi da (b) segue che Ran(A−iI) `e denso in H. Ora teniamo conto della chiusura di A per mostrare che in realt`a
5.2 Classi di operatori hermitiani
213
Ran(A − iI) = H. Si fissi y ∈ H arbitrariamente e si scelga {xn }n∈N ⊂ D(A) per cui (A − iI)xn → y ∈ H. Vale, se z ∈ D(A), ||(A − iI)z||2 = ||Az||2 + ||z||2 ≥ ||z||2 , da cui il fatto che {xn }n∈N `e una successione di Cauchy ed esiste x = limn→+∞ xn . La chiusura di A comporta subito quella di A − iI, per cui: (A − iI)x = y e quindi Ran(A − iI) = Ran(A − iI) = H. La prova per Ker(A∗ − iI) = {0} `e analoga. (c) ⇒ (a) Dato che A ⊂ A∗ per l’ipotesi di simmetria, `e sufficiente provare che D(A∗ ) ⊂ D(A). Sia y ∈ D(A∗ ). Dato che Ran(A − iI) = H, esiste un vettore x− ∈ D(A) tale che: (A − iI)x− = (A∗ − iI)y . a di sopra, si Su D(A) l’operatore A∗ coincide con A e pertanto, dall’identit` trova che: (A∗ − iI)(y − x− ) = 0 . Ma Ker(A∗ − iI) = Ran(A + iI)⊥ = {0}, per cui y = x− e y ∈ D(A). La dimostrazione nel caso di Ran(A + iI) `e analoga. Teorema 5.18. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti: (a) A `e essenzialmente autoaggiunto, (b) Ker(A∗ ± iI) = {0}, (c) Ran(A ± iI) = H. Dimostrazione. (a) ⇒ (b). Se A `e essenzialmente autoaggiunto, allora A∗ = A∗∗ e quindi A∗ `e autoaggiunto (e dunque chiuso). Applicando il teorema 5.17, segue che Ker(A∗∗ ± iI) = {0} e quindi vale (b) perch´e A∗∗ = A∗ . (b) ⇒ (a). A ⊂ A∗ per ipotesi e quindi, essendo D(A) denso, lo `e anche D(A∗ ). Di conseguenza, per la (b) del teorema 5.9, A `e chiudibile e A ⊂ A = A∗∗ (in particolare D(A∗∗ ) = D(A) ⊃ D(A) `e denso). Pertanto, da A ⊂ A∗ segue ∗ ∗ A ⊂ A∗ e, per la (a) di proposizione 5.16, si ha A∗ = A . In definitiva, A ⊂ A , ovvero A `e simmetrico. Possiamo allora applicare il teorema 5.17 all’operatore A, valendo per esso la proposizione (b) in tale teorema. Concludiamo che A `e autoaggiunto. Da (b) di proposizione 5.16 segue che A `e essenzialmente autoaggiunto. (b) ⇔ (c). Dato che Ran(A ± iI)⊥ = Ker(A∗ ∓ iI) e che Ran(A ± iI) ⊕ Ran(A ± iI)⊥ = H, (b) e (c) sono equivalenti. Per concludere presentiamo un concetto utile nelle applicazioni: quello di core per un operatore. Definizione 5.19. Sia A un operatore nello spazio di Hilbert H con dominio denso e sia A chiudibile. Un sottospazio denso S ⊂ D(A) `e detto essere un core di A se: A S = A .
214
5 Operatori non limitati con domini densi in spazi di Hilbert
Vale la seguente ovvia ma importante proposizione. Proposizione 5.20. Se A `e un operatore autoaggiunto nello spazio di Hilbert H, un sottospazio S ⊂ D(A) `e un core per A se e solo se A S `e essenzialmente autoaggiunto. Dimostrazione. Se A S `e essenzialmente autoaggiunto, allora ammette un’unica estensione autoaggiunta, che coincide con la sua chiusura per (d) in proposizione 5.16; nel caso in esame, tale estensione coincide necessariamente con A, che per ipotesi `e autoaggiunto. Quindi A S `e un core. Viceversa, se A S `e un core, la chiusura di A S `e autoaggiunta perch´e coincide con l’operatore autoaggiunto A. Per (b) di proposizione 5.16, A S `e dunque essenzialmente autoaggiunto.
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso Come esempi del formalismo costruito fino ad ora, introduciamo e studiamo alcune caratteristiche di due operatori autoaggiunti, di grande importanza in Meccanica Quantistica, che si chiamano rispettivamente operatore posizione ed operatore impulso. Il significato fisico di tali operatori sar` a chiarito nella seconda parte del libro. Nel seguito adotteremo le convenzioni le definizioni e le notazioni usate nella sezione 3.6. Inoltre x = (x1 , . . . , xn ) denota il punto generico di Rn . 5.3.1 L’operatore posizione Definizione 5.21. Sia H := L2 (Rn , dx), dove dx `e la misura di Lebesgue su Rn . Se i ∈ {1, 2, . . . , n} `e fissato, l’operatore in H: (Xi f)(x) = xi f(x) , con dominio:
D(Xi ) := f ∈ L2 (Rn , dx)
Rn
(5.12)
2
|xi f(x)| dx < +∞
,
(5.13)
si chiama operatore posizione rispetto alla coordinata i-esima. Proposizione 5.22. Per l’operatore Xi della definizione 5.21 valgono i seguenti fatti. (a) Xi `e autoaggiunto. (b) D(Rn ) e S(Rn ) sono core per Xi e quindi: Xi = Xi D(Rn ) = Xi S(Rn ) . Dimostrazione. (a) Il dominio di Xi `e sicuramente denso in H in quanto include lo spazio D(Rn ) delle funzioni infinitamente differenziabili a supporto
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso
215
compatto e anche lo spazio delle funzioni di Schwartz S(Rn ) (vedi notazione 3.64) che sono entrambi densi in L2 (Rn , dx). Quindi Xi `e chiudibile ed ammette aggiunto. Dalla definizione di Xi e del suo dominio risulta immediatamente che (g|Xi f) = (Xi g|f) se f, g ∈ D(Xi ). Di conseguenza Xi `e hermitiano e simmetrico. Mostriamo che `e anche autoaggiunto. Dato che, per la simmetria Xi ⊂ Xi∗ `e sufficiente provare che D(Xi∗ ) = D(Xi ). Determiniamo l’aggiunto di Xi direttamente dalla definizione. f ∈ D(Xi∗ ) se e solo se esiste h ∈ L2 (Rn , dx) (che, per definizione, coincide con Xi∗ f) tale che: f(x)xi g(x)dx = h(x)g(x)dx per ogni g ∈ D(Xi ). Rn
Rn
Dato che D(Xi ) `e denso e vale: [xi f(x) − h(x)]g(x)dx = 0 per ogni g ∈ D(Xi ), Rn
possiamo anche dire che: f ∈ L2 (Rn , dx) appartiene a D(Xi∗ ) se e solo se vale xi f(x) = h(x) quasi ovunque, con h ∈ L2 (Rn , dx). In definitiva, D(Xi∗ ) `e composto da tutte e sole funzioni f ∈ L2 (Rn , dx) per cui 2 |xi f(x)| dx < +∞ , Rn
e quindi D(Xi∗ ) = D(Xi ) e Xi `e autoaggiunto. (b) Se definiamo l’operatore Xi come abbiamo fatto sopra, eccetto per il fatto che restringiamo il suo dominio allo spazio D(Rn ) oppure a S(Rn ), l’operatore ottenuto in tal modo cessa di essere autoaggiunto, ma rimane simmetrico. Gli aggiunti di Xi D(Rn ) e Xi S(Rn ) dovono entrambi coincidere con l’operatore Xi∗ gi`a trovato sopra, perch´e nella costruzione di Xi∗ abbiamo solo usato il fatto che Xi `e l’operatore che moltiplica per xi su un dominio denso: che fosse D(Xi ) definito in (5.13) o un suo sottospazio denso non cambiava il risultato. Definendo Xi come in (5.12) e (5.13), il suo aggiunto Xi∗ deve soddisfare Ker(Xi∗ ± iI) = {0} per (b) del teorema 5.17. Ma dato che Xi∗ `e lo stesso che si ottiene restringendo il dominio di Xi a D(Rn ) o S(Rn ), valendo (b) del teorema 5.18, l’operatore Xi , con dominio ristretto, risulta essere essenzialmente autoaggiunto. (b) `e allora conseguenza immediata della proposizione 5.20. 5.3.2 L’operatore impulso Passeremo ora ad introdurre l’operatore impulso. D’ora in poi faremo uso delle definizioni e convenzioni notazionali esposte nell’esempio 2.96 e in notazione 3.64. Abbiamo bisogno di alcune definizioni preliminari. Diremo che f : Rn → C `e una funzione localmente integrabile su Rn se vale f · g ∈ L1 (Rn , dx) per ogni funzione g ∈ D(Rn ).
216
5 Operatori non limitati con domini densi in spazi di Hilbert
Definizione 5.23. Sia f localmente integrabile. Se α `e un multindice, diremo che h : Rn → C `e la α-esima derivata di f in senso debole, e scriveremo w-∂ α f = h, se h : Rn → C `e localmente integrabile e vale: |α| h(x)g(x) dx = (−1) f(x)∂xα g(x) dx (5.14) Rn
Rn
per ogni funzione g ∈ D(Rn ). Osservazione 5.24. (1) La derivata in senso debole, se esiste `e univocamente determinata a meno di un insieme di misura nulla: se h e h sono localmente integrabili (ma non necessariamente L2 (Rn , dx) in qual caso, quanto stiamo per dire sarebbe immediato) e soddisfano (5.14), allora: (h(x) − h (x))g(x) dx = 0 per ogni g ∈ D(Rn ). (5.15) Rn
Ma allora h(x) − h (x) = 0 quasi ovunque per il lemma di Du Bois-Reymond [Vla81]: Lemma 5.25. (Di Du Bois-Reymond.) Se φ `e localmente integrabile su Rn , allora φ `e nulla quasi ovunque se e solo se: Rn φ(x)f(x) dx = 0 per ogni f ∈ D(Rn ). (2) Nel caso che f ∈ C |α|(Rn ), la derivata di ordine α in senso debole di f esiste e coincide con quella in senso ordinario (a meno di un insieme di misura nulla). Tuttavia vi sono casi in cui la derivata ordinaria non esiste ed esiste solo quella debole. (3) Le funzioni L2 (Rn , dx) sono localmente integrabili essendo D(Rn ) ⊂ L2 (Rn , dx) e valendo f · g ∈ L1 se f, g ∈ L2 . Per introdurre l’operatore impulso, consideriamo l’operatore Aj in H := L2 (Rn , dx): (Aj f)(x) = −i
∂ f(x) ∂xj
con D(Aj ) := D(Rn ),
(5.16)
dove `e una costante positiva (la costante di Planck) – il cui valore `e del tutto irrilevante in quello che segue. Dalla definizione di Aj risulta immediatamente che (g|Aj f) = (Aj g|f) se f, g ∈ D(Aj ). Aj `e dunque simmetrico essendo D(Aj ) = H. Mostriamo che Aj `e anche essenzialmente autoaggiunto. Determiniamo l’aggiunto di Aj che si indica con Pj := A∗j direttamente dalla definizione. Per f ∈ D(A∗j ) = D(Pj ) deve esistere φ ∈ L2 (Rn , dx) (che, per definizione, coincide con Pj f) tale che: ∂ φ(x)g(x)dx = −i f(x) g(x)dx , per ogni g ∈ D(Rn ) . (5.17) ∂xj Rn Rn
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso
217
Prendendo il complesso coniugato ad ambo membri, la condizione (5.17) si esprime dicendo che: f ∈ L2 (Rn , dx) appartiene a D(Pj ) se e solo se ammette derivata in senso debole φ ∈ L2 (Rn , dx). Definizione 5.26. Sia H := L2 (Rn , dx), dove dx `e la misura di Lebesgue su Rn . Se i ∈ {1, 2, . . . , n} `e fissato, l’operatore in H: (Pj f)(x) = −iw-
∂ f(x) , ∂xj
(5.18)
con dominio:
( )
∂ 2 n D(Pj ) := f ∈ L2 (Rn , dx) esiste w- ∂x f ∈ L (R , dx) , j
(5.19)
si dice operatore impulso rispetto alla coordinata j-esima. Osservazione 5.27. Se n = 1, D(Pj ) si identifica con lo spazio di Sobolev H1 (R, dx). Proposizione 5.28. Per l’operatore Pj della definizione 5.26 valgono i seguenti fatti. (a) Pj `e autoaggiunto. (b) D(Rn ) e S(Rn ) sono core per Pj . Conseguentemente: ∂ f(x) ∂xj ∂ (A j f)(x) = −i f(x) ∂xj (Aj f)(x) = −i
con f ∈ D(Aj ) := D(Rn ) ,
(5.20)
con f ∈ D(Aj ) := S(Rn ) ,
(5.21)
sono essenzialmente autoaggiunti e Aj = Aj = Pj . Dimostrazione. Nel seguito, per semplicit`a notazionale, porremo = 1 (inglobando la costante −1 nell’unit` a di misura della coordinata xj ), la derivata parziale rispetto alla coordinata i-esima la indicheremo con ∂j e l’analoga derivata parziale in senso debole con w-∂j . Vogliamo provare che Ker(A∗j ± iI) = {0}. Ci` o proverebbe, in virt` u del teorema 5.18, che Aj `e essenzialmente autoaggiunto, ossia che Pj = A∗j `e autoaggiunto. Lo spazio Ker(A∗j ± iI) `e costituito dalle funzioni f ∈ L2 (Rn , dx) che ammettono derivata debole e che soddisfano: i(w-∂j f ± f) = 0. Consideriamo dunque l’equazione, per f ∈ L2 (Rn , dx): w-∂j f ± f = 0 . Moltiplicando per un esponenziale, tale equazione implica che: w-∂j e±xj f = 0 , Ci riduciamo quindi a provare che vale il seguente fatto.
(5.22)
(5.23)
218
5 Operatori non limitati con domini densi in spazi di Hilbert
Lemma 5.29. Se h : Rn → C `e localmente integrabile e soddisfa w-∂j h = 0 ,
(5.24)
allora h coincide quasi ovunque con una funzione costante nella variabile xj . Prova del lemma 5.29. Senza perdere generalit` a supporremo j = 1 e indicheremo con (x, y) le coordinate di Rn , in cui x `e la coordinata x1 e y indica le rimanenti n − 1 coordinate. Sia h localmente integrabile che soddisfi (5.24). Esplicitamente: ∂ h(x, y) g(x, y)dx ⊗ dy = 0 , per ogni g ∈ D(Rn ) . (5.25) ∂x n R Sia f ∈ D(Rn ) e scegliamo a > 0 sufficientemente grande in modo che valga suppf ⊂ [−a, a] × [−a, a]n−1. Definiamo χ ∈ D(R) per cui suppχ = [−a, a] e χ(x)dx = 1. Allora esiste una funzione g ∈ D(Rn ) tale che: R ∂ f(u, y)du . g(x, y) = f(x, y) − χ(x) ∂x R Infatti basta considerare: x f(u, y)du − g(x, y) := −∞
x
χ(u)du
f(u, y)du .
(5.26)
R
−∞
Questa funzione `e C ∞ per costruzione, la sua derivata in x coincide con: f(x, y) − χ(x) f(u, y)du . R
Inoltre il supporto di g `e limitato: se per qualche coordinata |yk | > a, f(u, y) = 0 qualunque sia u per cui g(x, y) = 0 qualunque sia x. Se x < −a si annullano il primo integrale in (5.26) ed anche il secondo visto che χ ha supporto in [−a, a]. Viceversa, se x > a vale: +∞ g(x, y) := f(u, y)du − 1 f(u, y)du = 0 , R
−∞
dove abbiamo tenuto conto delle condizioni suppχ = [−a, a] R χ(x)dx = 1. In definitiva g si annulla fuori da [−a, a] × [−a, a]n−1. Inserendo g in (5.25) ed usando il teorema di Fubini-Tonelli, troviamo:
h(x, y)f(x, y) dx ⊗ dy − h(x, y)χ(x)dx f(u, y) du ⊗ dy = 0 . Rn
Rn
R
Cambiando nome alle variabili:
h(x, y) − h(u, y)χ(u)du f(x, y) dx ⊗ dy = 0 , Rn
R
(5.27)
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso
219
essendo f una funzione qualsiasi di D(Rn ). Si osservi che la funzione: h(u, y)χ(u)du (x, y) → k(y) := R
`e localmente integrabile su R , perch´e la funzione: n
(x, y, u) → f(x, y)h(u, y)χ(u) `e integrabile su Rn+1 per ogni f ∈ D(Rn ) (basta notare che |f(x, y)| ≤ |f1 (x)||f2 (y)| per f1 e f2 opportune in D(R)). La (5.27), valida per ogni f ∈ D(Rn ), implica immediatamente che: h(u, y)χ(u)du = 0 h(x, y) − R
quasi ovunque su R per il lemma 5.25 di Du Bois-Reymond. In altre parole: n
h(x, y) = k(y)
quasi ovunque su Rn .
Nel caso in esame, il risultato trovato implica che ogni soluzione di (5.22) deve essere della forma f(x) = e±xj h(x), dove h non dipende dalla variabile xj . Il teorema Fubini-Tonelli implica immediatamente che Rn |f(x)|2 dx = di±2x 2 ||h||L2(Rn−1 ) R e j dxj . h deve quindi essere la funzione quasi ovunque nulla se vogliamo che, come richiesto, f ∈ L2 (Rn , dx). Ne consegue che Ker(A∗ ± iI) = {0} e dunque Pj = A∗j `e autoaggiunto (cio`e Aj `e essenzialmente autoaggiunto). Dato che S(Rn ) ⊃ D(Rn ), abbiamo facilmente che, Aj `e simmetrico e, se f ∈ D(A ∗j ), allora f ammette derivata generalizzata e vale: ∗
A j f = −iw-
∂ f. ∂xj ∗
Usando la stesa procedura seguita sopra, si ha che se f ∈ Ker(A j ± I) allora f = 0 e pertanto anche Aj `e essenzialmente autoaggiunto. Essendo Aj ⊂ Aj ed essendo anche Aj essenzialmente autoaggiunto, deve allora valere ∗∗ che A = A = A∗∗ = A = Pj per (d) di proposizione 5.16. Esiste un altro modo per introdurre l’operatore Pj . Consideriamo la trasformata di Fourier-Plancherel Fˆ : L2 (Rn , dx) → L2 (Rn , dk) vista nella sezione 3.6. Useremo le stesse notazioni usate in tale sezione. Definiamo nello spazio L2 (Rn , dk) l’analogo dell’operatore Xj introdotto sopra, che per` o indicheremo con Kj dato che le coordinate di Rn vengono indicate con (k1 , . . . , kn) nello spazio “di arrivo” della trasformata di Fourier-Plancherel. Essendo Fˆ una trasformazione unitaria, l’operatore Fˆ −1 Kj Fˆ sar`a autoaggiunto se definito sul dominio Fˆ −1 D(Kj ).
220
5 Operatori non limitati con domini densi in spazi di Hilbert
Proposizione 5.30. Se Kj `e l’operatore posizione rispetto alla coordinata j-esima nello spazio di arrivo della trasformata di Fourier-Plancherel Fˆ : L2 (Rn , dx) → L2 (Rn , dk), vale: Pj = Fˆ−1 Kj Fˆ . Dimostrazione. Per provare ci` o `e sufficiente mostrare che i due operatori coincidono su un dominio in cui sono essenzialmente autoaggiunti. Consideriamo lo spazio S(Rn ). Come sappiamo dalla sezione 3.6, la trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier su tale spazio e vale: Fˆ (S(Rn )) = S(Rn ). Inoltre, dalle propriet` a della trasformata di Fourier abbiamo che, se g ∈ S(Rn ) e 1 f(x) = eik·x g(k) dk (2π)n/2 Rn allora:
∂ 1 −i f(x) = ∂xj (2π)n/2 In altre parole abbiamo ottenuto che:
Rn
eik·x kg(k) dk .
Pj S(Rn ) = Fˆ −1 Kj S(Rn ) Fˆ . Notiamo che Kj `e essenzialmente autoaggiunto su S(Rn ) per la proposizione 5.22, per cui lo `e anche Fˆ −1 Kj S(Rn ) Fˆ su S(Rn ), essendo Fˆ unitaria. Dato che anche Pj S(Rn ) = Aj `e essenzialmente autoaggiunto (proposizione 5.28) e che le estensioni autoaggiunte di operatori essenzialmente autoaggiunti sono uniche e coincidono con la chiusura dell’operatore (per (d) di proposizione 5.16), concludiamo che Pj = Fˆ −1 Kj S(Rn ) Fˆ = Fˆ −1 Kj S(Rn ) Fˆ = Fˆ −1 Kj Fˆ . Questo conclude la dimostrazione.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte In questa rimanente parte del capitolo introdurremo alcuni utili criteri per stabilire se un operatore ammette estensioni autoaggiunte ed eventualmente quante. 5.4.1 La trasformata di Cayley e gli indici di difetto Uno degli strumenti tecnici di centrale importanza per discutere questi criteri `e la cosiddetta trasformata di Cayley, che introduciamo nel seguito. Prima estendiamo il concetto di isometria (definizione 3.6) agli operatori con dominio non massimale.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
221
Definizione 5.31. Un operatore U : D(U ) → H, nello spazio di Hilbert H, `e detto isometria, se soddisfa: (U x|U y) = (x|y)
per ogni coppia x, y ∈ D(U ).
Osservazioni 5.32. ` chiaro che se D(U ) = H la definizione di isometria data sopra individua (1) E gli operatori isometrici nel senso della definizione 3.46. (2) Per la proposizione 3.8, la definizione di isometria data sopra equivale a richiedere che U soddisfi ||U x|| = ||x||, per ogni x ∈ D(U ). La trasformazione R t → (t − i)(t + i)−1 ∈ C definisce una corrispondenza biunivoca tra la retta reale R ed il cerchio in C di raggio unitario centrato nell’origine e privato di 1. Esiste un’analoga corrispondenza che associa operatori isometrici ad operatori simmetrici. Questa corrispondenza, di cui studieremo solo alcune propriet` a, `e la trasformata di Cayley. Teorema 5.33. Sia H uno spazio di Hilbert. (a) Se A `e un operatore simmetrico in H: (i) A + iI `e iniettivo, (ii) `e ben definita la trasformata di Cayley di A: V := (A − iI)(A + iI)−1 : Ran(A + iI) → H ,
(5.28)
(iii) V risulta essere un’isometria con Ran(V ) = Ran(A − iI). (b) Se vale (5.28) allora valgono i seguenti fatti: (i) I − V `e iniettivo, (ii) Ran(I − V ) = D(A) e A := i(I + V )(I − V )−1 .
(5.29)
(c) Se A operatore simmetrico in H, A `e autoaggiunto se e solo se la sua trasformata di Cayley V `e un operatore unitario su H. (d) Se V : H → H `e unitario e I − V `e iniettivo, V `e la trasformata di Cayley di qualche operatore in H autoaggiunto. Dimostrazione. (a) Per computo diretto, usando la simmetria di A e le propriet` a di (anti-)linearit` a del prodotto scalare, si verifica subito che, se f ∈ D(A): ||(A ± iI)f||2 = ||Af||2 + ||f||2 . (5.30) Di conseguenza, se (A + iI)f = 0 o (A − iI)f = 0, allora f = 0. Gli operatori A ± iI sono quindi iniettivi su D(A) e quindi V `e ben definita da D(V ) := Ran(A + iI) a valori in H. Da (5.30) segue che, per ogni g ∈ D(A) ||(A − iI)g|| = ||(A + iI)g|| .
222
5 Operatori non limitati con domini densi in spazi di Hilbert
Se poniamo g = (A+iI)−1 h, per h ∈ Ran(A+iI), troviamo immediatamente: ||V h|| = ||(A − iI)(A + iI)−1 h|| = ||h|| , per cui V isometria con dominio D(V ) = Ran(A+iI) e Ran(V ) = Ran(A−iI). (b) D(V ) `e costituito dai vettori g = (A + iI)f per f ∈ D(A). Applicando V a g troviamo V g = (A − iI)f. Aggiungendo e togliendo g = (A + iI)f membro a membro, si ottengono le relazioni: (I + V )g = 2Af , (I − V )g = 2if .
(5.31) (5.32)
(5.32) mostra che (I − V ) `e iniettiva in quanto, se (I − V )g = 0, allora f = 0 e quindi g = (A + iI)f = 0. Possiamo allora scrivere, se f ∈ D(A): g = 2i(I − V )−1 f .
(5.33)
Inoltre Ran(I − V ) = D(A) segue subito da (5.32). Applicando (I + V ) ad ambo membri di (5.33) ed usando (5.31) otteniamo: Af = i(I + V )(I − V )−1 f
per ogni f ∈ D(A).
(c) Supponiamo che A = A∗ . Per il teorema 5.17, deve accadere che Ran(A + iI) = Ran(A − iI) = H. Allora, per (a) V `e un’isometria da Ran(A + iI) = H con immagine H = Ran(A − iI). Quindi V `e un’isometria suriettiva e cio`e un operatore unitario. Supponiamo ora che V : H → H sia operatore unitario e sia la trasformata di Cayley di A simmetrico in H. Per (a) deve essere Ran(A+iI) = Ran(A−iI) = H. Questo equivale a dire che A = A∗ per il teorema 5.17. ` sufficiente provare che V `e la trasformata di Cayley di un operatore (d) E simmetrico. Per (c) tale operatore simmetrico `e autoaggiunto. Per ipotesi, c’`e una corrispondenza biettiva z → x, tra D(V ) = H e Ran(I − V ), data da x := z − V z. Definiamo l’operatore A : Ran(I − V ) → H, dato da: Ax := i(z + V z) ,
se x = z − V z.
(5.34)
Se x, y ∈ D(A) = Ran(I − V ), allora x = z − V z e y = u − V u per qualche coppia z, u ∈ D(V ). Dato che V `e un’isometria, vale che: (Ax|y) = i(z +V z|u −V u) = i(V z|u)−i(z|V u) = (z −V z|iu +iV u) = (x|Ay), e quindi A `e hermitiano. Per provare che `e anche simmetrico, notiamo che D(A) = Ran(I − V ) `e denso. Infatti [Ran(I − V )]⊥ = Ker(I − V ∗ ). Se non fosse Ker(I − V ∗ ) = {0}, ci sarebbe u ∈ H, non nullo, tale che V ∗ u = u e allora, applicando V ad ambo membri, u = V u. Questo `e impossibile perch´e I − V `e iniettivo per ipotesi.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
223
Per concludere, proviamo che V `e la trasformata di Cayley di A. La (5.34) pu` o essere riscritta nella forma: 2iV z = Ax − ix ,
2iz = Ax + ix ,
se z ∈ H.
(5.35)
Allora: V (Ax + ix) = Ax − ix per x ∈ D(A) e H = D(V ) = Ran(A + iI). Ma allora V `e la trasformata di Cayley di A perch´e vale: V (A + iI) = A − iI e quindi: V = (A − iI)(A + iI)−1 . Questo conclude la dimostrazione del teorema.
Osservazione 5.34. Dall’enunciato e dalla dimostrazione del teorema risulta che se A `e simmetrico allora Ker(A ± iI) = {0}. In generale per` o non accade anche che Ker(A∗ ± iI) = {0}! Quest’ultima `e una condizione molto pi` u forte che equivale alla essenziale autoaggiunzione di A (se A `e simmetrico) per il teorema 5.18. Passiamo alle conseguenze del teorema 5.33 nello studio dell’esistenza di estensioni autoaggiunte di un operatore simmetrico. Il primo dei teoremi a riguardo `e il seguente, che introduce i cosiddetti indici di difetto. Teorema 5.35. Sia A un operatore simmetrico sullo spazio di Hilbert H. Definiti gli indici di difetto: d±(A) := dim Ker(A∗ ± iI) , vale quanto segue: (a) A ammette estensioni autoaggiunte se e solo se d+ (A) = d− (A), (b) Se d+ (A) = d−(A), esiste una corrispondenza biunivoca tra estensioni autoaggiunte di A ed operatori isometrici suriettivi da Ker(A∗ − iI) a Ker(A∗ + iI). A ammette tante estensioni autoaggiunte quanti sono gli operatori isometrici suriettivi suddetti e, in particolare, A ammette pi` u di una estensione autoaggiunta se d+ (A) = d− (A) > 0. Osservazione 5.36. Gli indici di difetto possono definirsi equivalentemente come: d± (A) := dim [Ran(A ∓ iI)]⊥ , dato che Ker(A∗ ± iI) = [Ran(A ∓ iI)]⊥ .
Prova del teorema 5.35. Consideriamo la trasformata di Cayley V di A. Supponiamo che A ammetta un’estensione autoaggiunta B. Sia U : H → H la ` immediato provare che U `e un’estensione di V trasformata di Cayley di B. E usando (5.28) e tenendo conto che (B + iI)−1 estende (A + iI)−1 e B − iI estende A − iI. Di conseguenza, U trasforma Ran(A + iI) in Ran(A − iI). Essendo U unitario, si ha che y ⊥ Ran(A+iI) se e solo se U y ⊥ U (Ran(A+iI)).
224
5 Operatori non limitati con domini densi in spazi di Hilbert
In altre parole U ([Ran(A + iI)]⊥ ) = [Ran(A − iI)]⊥ . Per (d) di proposizione 3.38, questo equivale a dire U (Ker(A∗ + iI)) = Ker(A∗ − iI). Dato che U `e un’isometria, deve allora essere dim Ker(A∗ + iI) = dim Ker(A∗ − iI) ossia d+ (A) = d− (A). Mostriamo che, viceversa, se vale d+ = d− , allora A ammette estensioni autoaggiunte e queste non sono uniche se d+ (A) = d−(A) > 0. Sia V la trasformata di Cayley di A. Dato che V `e limitata, usando la proposizione 2.57, possiamo estendere V , in modo unico, ad un operatore isometrico da U : Ran(A + iI) → Ran(A − iI). Possiamo fare la stessa cosa per V −1 , estendendola, in modo unico, ad un operatore isometrico da ` chiaro che, per continuit` Ran(A − iI) a Ran(A + iI). E a, tale operatore deve ⊥
essere U −1 : Ran(A − iI) → Ran(A + iI). Ricordiamo che Ran(A ± iI) = [Ran(A ± iI)]⊥ = Ker(A∗ ∓ iI). Nell’ipotesi di d+ (A) = d− (A), possiamo infine definire un operatore unitario U0 : Ker(A + iI) → Ker(A − iI). Valendo le decomposizioni ortogonali di sottospazi chiusi H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) , l’operatore W : (x, y) := U ⊕U0 :→ (U x, U0 y), con x ∈ Ran(A + iI) e y ∈ Ker(A∗ − iI), `e un operatore unitario su H. Inoltre I − W `e iniettivo. Infatti, Ker(I − W ) consiste nelle coppie (x, y) = (0, 0) con U x = x e U0 y = y: la prima equazione ammette solo la soluzione x = 0 perch´e U `e un’isometria e la seconda equazione implica che y ∈ Ker(A∗ + iI) ∩ Ker(A∗ − iI) che produce subito y = 0. Possiamo allora applicare (d) del teorema 5.33: W `e la trasformata di Cayley di un operatore B autoaggiunto. Dato che W estende U , B `e un’estensione autoaggiunta di A. La scelta dell’operatore unitario U0 pu` o essere fatta in pi` u modi se d+ (A) = d−(A) > 0, tale scelta definisce diverse estensioni autoaggiunte di A. Mostriamo ora che la corrispondenza tra le estensioni autoaggiunte di A e gli operatori isometrici suriettivi U0 `e biunivoca. I punti (a) e (b) del teorema 5.33 implicano immediatamente che, due operatori simmetrici sono diversi se e solo se le loro trasformate di Cayley sono diverse. Consideriamo allora le estensioni autoaggiunte dell’operatore A. Ogni estensione autoaggiunta, B, individua una trasformata di Cayley W unitaria che estende l’operatore U (definito sopra) in un operatore unitario su H. Dato che: U : Ran(A + iI) → Ran(A − iI) `e isometrico suriettivo, che valgono le decomposizioni H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) , e che infine W estende U , ci`o pu` o accadere solo se W determina un’isometria suriettiva U0 : Ker(A∗ − iI) → Ker(A∗ + iI). Due estensioni autoaggiunte
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
225
B, B distinte devono individuare due operatori U0 , U0 distinti, altrimenti le trasformate di Cayley W, W dei due operatori coinciderebbero e quindi gli operatori coinciderebbero a loro volta. Abbiamo ottenuto che l’applicazione che manda l’estensione autoaggiunta di A, B, nell’associata isometria suriettiva U0 `e iniettiva. Questa applicazione `e anche suriettiva dato che, come visto sopra, la scelta dell’isometria suriettiva U0 determina un’estensione autoaggiunta di A: l’unica che ha trasformata di Cayley data da W := U ⊕ U0 . Una prima importante conseguenza del teorema 5.35 `e la seguente. Teorema 5.37. Un operatore simmetrico A sullo spazio di Hilbert H `e essenzialmente autoaggiunto se e solo se ammette un’unica estensione autoaggiunta. Dimostrazione. Se A `e essenzialmente autoaggiunto allora ammette un’unica estensione autoaggiunta come noto da (d) di proposizione 5.17. Per il teorema 5.35, se A `e simmetrico ammette estensioni autoaggiunte solo se d+ = d− . In particolare, se ammette un’unica estensione autoaggiunta deve essere d+ = d− = 0. Ma allora, per (b) del teorema 5.18, A `e essenzialmente autoaggiunto. 5.4.2 Il criterio di Von Neumann Un secondo teorema che enunceremo e dimostreremo ora `e in realt` a un corollario del teorema 5.33. Tale teorema `e dovuto a von Neumann che stabilisce condizioni sufficienti affinch´e un operatore simmetrico ammetta estensioni autoaggiunte. Abbiamo bisogno di due definizioni preliminari. Definizione 5.38. Siano X e X spazi vettoriali su C dotati di prodotto scalare hermitiano ( | )X e ( | )X rispettivamente. Una funzione suriettiva V : X → X `e detta operatore antiunitario se soddisfa le seguenti propriet` a: (a) antilinearit` a : V (αx + βy) = αV x + βV y per ogni x, y ∈ X, α, β ∈ C; (b) anti isometricit` a: (V x|V y)X = (x|y)X per ogni x, y ∈ X. Osservazione 5.39. Notare la coniugazione complessa a secondo membro in (b), ma osservi che vale comunque ||V z||X = ||z||X per ogni z ∈ X. Si noti che V `e biettivo. Definizione 5.40. Se (H, ( | )) `e uno spazio di Hilbert, un operatore antiunitario C : H → H `e detto coniugazione oppure equivalentemente operatore di coniugazione se `e involutivo, cio`e se soddisfa: CC = I. Osservazione 5.41. Una coniugazione `e definita su uno spazio vettoriale complesso con prodotto scalare hermitiano e, in generale, non `e un’involuzione nel senso della definizione 3.40, che `e invece definita su un’algebra.
226
5 Operatori non limitati con domini densi in spazi di Hilbert
Teorema 5.42. (Di von Neumann). Sia A `e un operatore simmetrico nello spazio di Hilbert H. Se esiste una coniugazione C : H → H tale che valga C(D(A)) ⊂ D(A) ed anche: AC = CA . allora A ammette estensioni autoaggiunte. Dimostrazione. Mostriamo prima di tutto che C(D(A∗ )) ⊂ D(A∗ ) e che vale anche A∗ C = CA∗ . Infatti, dalla definizione di aggiunto (A∗ f|Cg) = (f|ACg) per ogni f ∈ D(A∗ ) e g ∈ D(A). Usando il fatto che C `e antiunitaria: (CCg|CA∗f) = (CACg|Cf). Dato che C commuta con A e CC = I, si ha ancora (g|CA∗ f) = (Ag|Cf)), ossia (CA∗ f|g) = (Cf|Ag) per ogni f ∈ D(A∗ ) e g ∈ D(A). Dalla definizione di aggiunto, questo significa che Cf ∈ D(A∗ ) se f ∈ D(A∗ ) e CA∗ f = A∗ Cf. Passiamo a provare l’esistenza delle estensioni autoaggiunte facendo uso del teorema 5.35. In base a quanto appena provato, se A∗ f = if, applicando C ad ambo membri ed usando il fatto che C sia antilineare e commuti con A∗ , troviamo: A∗ Cf = −iCf. Per cui C `e un’applicazione (iniettiva perch´e conserva la norma) da Ker(A∗ − iI) a Ker(A∗ + iI). Tale applicazione `e anche suriettiva in quanto, se vale A∗ g = −ig, definendo f := Cg troviamo che deve essere A∗ f = +if e, riapplicando C a f (tenendo conto di CC = I), troviamo Cf = g. Quindi C `e un’applicazione biettiva da Ker(A∗ − iI) a Ker(A∗ + iI). Il fatto che sia anche anti isometrica, e quindi preservi l’ortonormalit`a di vettori, comporta subito che trasformi biettivamente basi hilbertiane in basi hilbertiane, in particolare quindi, conservandone la cardinalit` a. Allora deve essere d+ (A) = d−(A). Per il teorema 5.33 vale la tesi. 5.4.3 Il criterio di Nelson Discutiamo, per concludere, il criterio di Nelson che fornisce condizioni sufficienti affinch´e un operatore simmetrico sia essenzialmente autoaggiunto. Una parte della dimostrazione del teorema finale sar` a pienamente comprensibile solo dopo avere dimostrato alcuni risultati di teoria spettrale, nei capitoli 8 e 9. Abbiamo comunque ritenuto corretto presentare il teorema in questo capitolo. Il lettore pu` o postporre la dimostrazione fino a quando abbia raggiunto familiarit` a con la teoria sviluppata nei due capitoli menzionati. Sono necessarie alcune definizioni e risultati preliminari. Definizione 5.43. Sia A operatore nello spazio di Hilbert H. (a) ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), `e detto vettore C ∞ per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). (b) ψ ∈ C ∞ (A) `e detto vettore analitico per A, se vale: +∞
||An ψ|| n t < +∞ n! n=0
per qualche t > 0.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
227
(d) ψ ∈ C ∞ (A) `e detto vettore di unicit` a per A, se l’operatore A Dψ `e essenzialmente autoaggiunto come operatore nello spazio di Hilbert Hψ := Dψ , dove Dψ `e il sottospazio di H delle combinazioni lineari (finite) vettori An ψ con n = 0, 1, 2 . . . . Se ψ `e un vettore analitico per A, la serie: +∞ ||An ψ|| n t , n! n=0
converge per qualche t > 0. Allora, per i noti teoremi di convergenza sulle serie di potenze, converger`a assolutamente ed uniformemente la serie complessa: +∞ ||An ψ|| n z , n! n=0
per ogni z ∈ C con |z| < t. Ulteriormente convergeranno, per |z| < t, anche le serie delle derivate di ogni ordine, cio`e le serie: +∞
||An+p ψ|| n z , n! n=p per ogni fissato p = 1, 2, 3, . . .. Quest’ultimo fatto ha un’importante conseguenza, di verifica immediata usando ripetutamente la disuguaglianza triangolare e la propriet` a di omogeneit` a della norma. Proposizione 5.44. Se ψ `e un vettore analitico per A operatore nello spazio di Hilbert H, allora tutti vettori in Dψ sono vettori analitici per A. Pi` u precisamente, se la serie: +∞ ||An ψ|| n t , n! n=0 converge per t > 0 e φ ∈ Dψ , allora la serie: +∞ n=0
||An φ|| n s , n!
converge per ogni s ∈ C con |s| < t. Vale infine la seguente proposizione nota anche come Lemma di Nussbaum. Proposizione 5.45. (“Lemma di Nussbaum”.) Sia A operatore simmetrico nello spazio di Hilbert H. Se D(A) contiene un insieme di vettori di unicit` a le cui combinazioni lineari formano un insieme denso in H, allora A `e essenzialmente autoaggiunto.
228
5 Operatori non limitati con domini densi in spazi di Hilbert
Dimostrazione. Per il teorema 5.18, `e sufficiente provare che gli spazi Ran(A± iI) sono densi. Nelle ipotesi fatte, dati φ ∈ H e > 0, ci sar`a una combinazione N lineare finita di vettori di unicit` a ψi con ||φ − i=1 αi ψi || < /2. Dato che ψi ∈ Hψ e A Dψ `e essenzialmente autoaggiunto in tale spazio di Hilbert, per (c) del teorema 5.18, esistono vettori ηi ∈ Hψ con ||(A Dψ +iI)ηi − ψi || ≤ −1 N N N |α | . Allora, posto η := /2 j j=1 i=1 αi ηi e ψ := i=1 αi ψi , vale η ∈ D(A) e ||(A + iI)η − φ|| ≤ ||(A Dψ +iI)η − ψ|| + ||φ − ψ|| < . Dato che > 0 `e arbitrario, abbiamo che Ran(A + iI) `e denso. La prova per il caso Ran(A − iI) `e analoga. Per (c) del teorema 5.18, A `e essenzialmente autoaggiunto. La proposizione precedente permette di dimostrare il teorema di Nelson la cui dimostrazione, come preannunciato, richiede alcuni risultati di teoria spettrale per operatori autoaggiunti non limitati che vedremo nei capitoli 8 e 9, ma che sono indipendenti dal teorema di Nelson stesso. Teorema 5.46. (Criterio di Nelson.) Sia A un operatore simmetrico nello spazio di Hilbert H. Se D(A) contiene un insieme di vettori analitici per A le cui combinazioni lineari finite sono dense in H, allora A `e essenzialmente autoaggiunto. Dimostrazione. Per la proposizione 5.45 `e sufficiente provare che, nelle ipotesi fatte, ogni vettore analitico ψ0 per A `e anche vettore di unicit` a per A. Notiamo che A Dψ0 `e sicuramente un operatore simmetrico in Hψ0 := Dψ0 , dato che `e hermitiano e il suo dominio `e denso in Hψ0 . Supponiamo che A Dψ0 ammetta un’estensione autoaggiunta B in Hψ0 . (Nota: stiamo parlando di estensioni autoaggiunte di A Dψ0 nello spazio di Hilbert Hψ0 , non in H!) Sia μψ la misura spettrale di ψ ∈ Dψ0 rispetto alla PVM dello sviluppo spettrale di (B) B (cfr (c) in teorema 8.30 e teorema 9.9) definita come μψ (E) := (ψ|PE ψ) (B) per ogni insieme di Borel E ⊂ σ(B) ⊂ R, dove PE `e la misura a valori di proiezione associata all’operatore autoaggiunto B. Dato che ψ0 `e analitico: +∞ n=0
||An ψ0 || n t0 < +∞ n!
per qualche t0 > 0.
Quindi, per quanto detto nell’osservazione 5.41, +∞ n=0
||An ψ|| n t < +∞ per ogni t < t0 con t ≥ 0. n!
Se z ∈ C e 0 < |z| < t0 allora:
n +∞ +∞ n
z n
z
x dμψ (x) =
1 · |xn |dμψ (x)
n!
n! σ(B) n=0 σ(B) n=0
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte +∞ n t0 ≤ n! n=0
=
1/2 dμψ (x)
229
1/2 2n
x dμψ (x)
σ(B)
σ(B)
+∞ n +∞ tn t0 0 ||ψ|| ||B n ψ|| = ||ψ|| ||An ψ|| < +∞ , n! n! n=0 n=0
dove abbiamo usato le propriet` a in (c) del teorema 9.4 rispetto alla misura spettrale P (B) dello sviluppo spettrale di B (teorema spettrale 9.9). Il teorema di Fubini-Tonelli implica che, se 0 < |z| < t0 , possiamo scambiare il simbolo di serie con quello di integrale nell’integrale di partenza con l’integrando senza valore assoluto: +∞ +∞ n zn n z n x = x dμψ (x) . n! σ(B) n=0 n! n=0 σ(B) Allora, se 0 ≤ |z| < t0 e se ψ appartiene al dominio di ezB (cfr definizione 9.10) +∞ n z n (ψ|ezB ψ) = x dμψ (x) ezx dμψ (x) = σ(B) σ(B) n=0 n! =
+∞ n=0
zn n!
xn dμψ (x) = σ(B)
+∞ n z (ψ|An ψ) . n! n=0
In particolare ci`o accade sicuramente se z = it (con |t| < t0 ) dato che il dominio di eitB `e tutto lo spazio di Hilbert per il corollario 9.5: (ψ|eitB ψ) =
+∞ (it)n (ψ|An ψ) . n! n=0
(5.36)
(Si osservi che la serie a secondo membro `e una serie di potenze e pertanto essa converge in un disco aperto di raggio t0 , ci` o definisce un prolungamento analitico della funzione a primo membro per it rimpiazzato da z in tale disco anche se ψ non appartiene al dominio di ezB .) Consideriamo un’altra estensione autoaggiunta di ADψ0 , B . Ripetendo i ragionamenti di sopra troviamo che, per |t| < t0 : +∞ (it)n (ψ|eitB ψ) = (5.37) (ψ|An ψ) . n! n=0 (5.36) e (5.37) implicano che, per ogni |t| < t0 e per ogni ψ ∈ Dψ0 :
(ψ|(eitB − eitB )ψ) = 0 . Dato che Dψ0 `e uno spazio denso in Hψ0 , concludiamo che (vedi l’esercizio svolto 3.10), per ogni |t| < t0 :
eitB = eitB .
230
5 Operatori non limitati con domini densi in spazi di Hilbert
Calcolando la derivata in senso forte per t = 0, per il teorema di Stone (teorema 9.25), risulta che (si tenga conto del fatto che t0 > 0 per ipotesi): B = B . Concludiamo che tutte le eventuali estensioni autoaggiunte di A Dψ coincidono. Mostriamo che esiste almeno un’estensione autoaggiunta. Definiamo C : Dψ0 → Hψ0 come: C:
N n=0
an An ψ0 →
N
an An ψ0 .
n=0
Si prova facilmente che C si estende in modo unico ad una coniugazione su Hψ0 , che indicheremo ancora con C (vedi l’esercizio 5.15). Inoltre, per costruzione CA Dψ0 = A Dψ0 C, per cui A Dψ0 ha estensioni autoaggiunte per il teorema 5.42. In conclusione, per ogni vettore analitico ψ0 , A Dψ0 deve essere essenzialmente autoaggiunto in Hψ0 per il teorema 5.37, perch´e `e simmetrico ed ammette esattamente un’estensione autoaggiunta. Abbiamo in questo modo provato che ogni vettore analitico ψ0 `e anche vettore di unicit` a per A. Questo conclude la dimostrazione. Esempi 5.47. (1) Un esempio tipico nel quale applicare il criterio di von Neumann, `e il caso dell’operatore di rilevanza fondamentale in Meccanica Quantistica: H := −Δ + V dove Δ `e il solito operatore laplaciano su Rn : n ∂2 Δ := , ∂x2i i=1
e V `e una funzione localmente integrabile a valori reali. Se definiamo il dominio di H come D(Rn ), risulta subito che H `e un operatore simmetrico su L2 (Rn , dx). Definendo C come l’operatore antiunitario che associa ad ogni funzione f ∈ L2 (Rn , dx) la funzione che punto per punto assume i valori complessi coniugati di f, `e chiaro che vale CH = HC, per cui H ammette estensioni autoaggiunte. Precisando meglio la natura di V si riesce a provare che H `e essenzialmente autoaggiunto, come vedremo alla fine del capitolo 9. ∂ (2) L’operatore Ai := −i ∂x definito su D(Rn ) (vedi proposizione 5.28), come i sappiamo `e essenzialmente autoaggiunto, quindi ammette estensioni autoaggiunte. Esiste una coniugazione C che commuti con Ai ? (Si noti che potrebbe anche non esistere). La coniugazione usata in (1) non commuta con Ai malgrado ammetta il suo dominio come spazio invariante. Un’altra coniugazione `e C : L2 (Rn , dx) → L2 (Rn , dx) definita da: (Cf)(x) := f(−x) (quasi ovunque) ` facile verificare che C(D(Rn )) ⊂ D(Rn ) e che per ogni f ∈ L2 (Rn , dx). E CAi = Ai C.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
231
(3) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx) dove dx `e la solita d misura di Lebesgue, e i consideri A := i dx con dominio dato dallo spazio del1 le funzioni C ([0, 1]) (cio`e funzioni di classe C 1 ((0, 1)) che ammettono limiti finiti per la derivata prima in 0 e 1), che si annullano in 0 e in 1. Si verifica immediatamente che l’operatore `e hermitiano, usando l’integrazione per parti e tenendo conto che le funzioni si annullano agli estremi di integrazione annullando i termini dovuti al bordo. Inoltre si pu` o verificare che il dominio di A `e effettivamente denso, per cui l’operatore A `e simmetrico. Mostriamo che A non `e essenzialmente autoaggiunto. Infatti, la condizione che g ∈ D(A∗ ) soddisfi A∗ g = ig ovvero A∗ g = −ig si scrive rispettivamente: 0
1
g(x) [f (x) ± f(x)] dx = 0
per ogni f ∈ D(A). Usando l’integrazione per parti, si verifica immediatamente che, le funzioni di L2 ([0, 1], dx) definite da g(x) = ex e g(x) := e−x , soddisfano l’identit` a di sopra per ogni f di classe C 1 ([0, 1]) che si annulli in 0 e in 1. Queste due ultime condizioni sono fondamentali per verificare l’identit` a di sopra integrando per parti, in quanto le due funzioni esponenziali non si annullano in 0 e 1. In virt` u del teorema 5.18, A non `e essenzialmente autoaggiunto. Tuttavia esistono estensioni autoaggiunte a causa del teorema 5.37. Infatti la trasformazione antilineare C : L2 ([0, 1], dx) → L2 ([0, 1], dx) definita da (Cf)(x) := f(1 − x) manda funzioni C 1 ([0, 1]) che si annullano in 0 e 1 in funzioni C 1 ([0, 1]) che si annullano in 0 e 1 ed inoltre:
d d d d Ci f (x) = −i f(1 − x) = i f(1 − x) = i (Cf)(x) dx d(1 − x) dx dx per cui CA = AC. Tali estensioni devono essere in numero maggiore di 1, altrimenti A sarebbe essenzialmente autoaggiunto per il teorema 5.35, cosa che sappiamo essere falsa. Si osservi che i risultati ottenuti non cambierebbero considerando differenti domini analoghi a quello usato sopra, in particolare considerando come dominio quello delle funzioni C ∞ ([0, 1]) che si annullano in 0 e 1, oppure quello delle funzioni C ∞ su [0, 1] a supporto compatto contenuto in (0, 1). (4) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx), dove dx `e la solita d misura di Lebesgue, e si consideri A := −i dx con dominio dato dallo spazio delle funzioni C ∞ ([0, 1]) periodiche e con derivate di ogni ordine periodiche, di periodo [0, 1]. L’integrazione per parti prova immediatamente che A `e hermitiano. Le funzioni esponenziali en (x) := ei2πnx, per x ∈ [0, 1], con n ∈ Z formano una base hilbertiana di H come segue da (1) in esempi 3.33. Queste funzioni sono tutte contenute in D(A), per cui, essendo lo spazio generato da
232
5 Operatori non limitati con domini densi in spazi di Hilbert
esse denso in H, D(A) `e denso in H e quindi A `e simmetrico. Ogni f ∈ H `e in corrispondenza biunivoca con la successione dei coefficienti di Fourier {fn }n∈Z ⊂ 2 (Z) dello sviluppo: f = fn en . n∈Z
Abbiamo in tal modo definito un operatore unitario U : H → 2 (Z) tale che U : f → {fn }n∈Z (vedi teorema 3.29). Dalla teoria elementare delle serie di Fourier si verifica facilmente che: U D(A)U −1 =: D(A ) `e lo spazio delle successioni {fn } di 2 (Z) tali che, per ogni N ∈ N, nN |fn | → 0 per n → +∞. Inoltre, se A := U AU −1 e {fn }n∈Z ∈ D(A ), A : {fn }n∈Z → {2πnfn }n∈Z . Ragionando come per l’operatore Xi nella prova della proposizione 5.22, si verifica subito che:
D(A∗ ) = {gn }n∈Z ⊂ 2 (Z) |2πngn |2 < +∞
n∈Z
e, su questo dominio:
A∗ : {fn } → {2πnfn } .
Procedendo come nella prova della proposizione 5.22, si verifica subito che l’aggiunto di questo operatore coincide con l’operatore stesso. Quindi A∗ `e autoaggiunto e A `e essenzialmente autoaggiunto. Dato che U `e unitaria, concludiamo (lo si provi in dettaglio) che anche A `e essenzialmente autoaggiunto e che per la sua unica estensione autoaggiunta A, vale A = U A U −1 . (5) L’esempio (4) pu` o essere trattato molto pi` u rapidamente con il criterio di Nelson. Il dominio di A contiene le funzioni en le cui combinazioni lineari sono dense in H := L2 ([0, 1], dx). Vale anche Aen = 2πnen , per cui: +∞ k=0
+∞
||Ak en || k (2πn)k k t = (t) = e2πnt < +∞ , k! k! k=0
per ogni t > 0. Quindi A `e essenzialmente autoaggiunto.
Esercizi 5.1. Sia A un operatore nello spazio di Hilbert H con dominio denso D(A). Siano α, β ∈ C e si consideri il dominio naturale D(αA+βI) := D(A). Provare che: (i) αA + βI : D(αA + βI) → H ammette aggiunto e (αA + βI)∗ = αA∗ + βI .
Esercizi
233
(ii) αA + βI `e hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto se e solo se A `e, rispettivamente, hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto. (iii) αA + βI `e chiudibile se e solo se A `e chiudibile ed in tal caso vale: αA + βI = αA + βI . Suggerimento. Applicare direttamente le definizioni necessarie. 5.2. Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che, se A + B : D(A) ∩ D(B) → H `e densamente definito, allora: A∗ + B ∗ ⊂ (A + B)∗ . 5.3. Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che, se il dominio naturale D(AB) `e densamente definito, allora AB : D(AB) → H ammette aggiunto e: B ∗ A∗ ⊂ (AB)∗ . 5.4. Sia A un operatore nello spazio di Hilbert H densamente definito e L : H → H un operatore limitato. Provare, applicando la definizione di aggiunto, che vale la relazione: (LA)∗ = A∗ L∗ . Dimostrare infine che vale la relazione: (L + A)∗ = L∗ + A∗ . 5.5. Sia A operatore simmetrico sullo spazio di Hilbert H. Provare che, se A : D(A) → H `e biettivo, allora `e autoaggiunto. (Tenere conto del fatto che, come si dimostra dal teorema spettrale per operatori autoaggiunti non limitati, che vedremo pi` u avanti, l’inverso di un operatore autoaggiunto (quando esiste) `e autoaggiunto.) Soluzione. Se A `e simmetrico lo `e A−1 : H → D(A). Questo `e definito su tutto lo spazio di Hilbert per cui `e autoaggiunto. Il suo inverso sar` a a sua volta autoaggiunto. 5.6. Nel seguito se A `e un operatore su H, il commutante {A} `e l’insieme degli operatori di B(H) per cui BA ⊂ AB. Sia A : D(A) → H operatore nello spazio di Hilbert H. Provare che se D(A) `e denso e A `e chiuso, allora {A} ∩ {A∗ } `e una sotto ∗-algebra di B(H) con unit` a ed `e chiusa rispetto alla topologia forte. Dimostrare che se A `e autoaggiunto ed `e definito su tutto H, allora l’algebra di von Neumann ({A} ) coincide con l’algebra di von Neumann generata da {A} nel senso di (3) in esempi 3.42. 5.7. Dimostrare la proposizione 5.14.
234
5 Operatori non limitati con domini densi in spazi di Hilbert
5.8. Si studi l’hermiticit` a, la simmetria e l’essenziale autoaggiunzione nello spazio di Hilbert H = L2 ([0, 1], dx), dell’operatore −d2 /dx2 , con dominio dato dalle funzioni C ∞ ([0, 1]) e (i) periodiche oppure, (ii) che si annullano agli estremi. 5.9. Si dimostri che le estensioni autoaggiunte dell’operatore nell’esempio (3) in esempi 5.47 sono parametrizzabili da un unico parametro reale. Suggerimento. Si studino le dimensioni di Ker(A∗ ± iI) = Ran(A ∓ iI). 5.10. Dimostrare che l’operatore in L2 (R, dx) dato da: H := −
d2 + x2 . dx2
` essenzialmente autoaggiunto se D(H) := S(R). E Suggerimento. Cercare una base hilbertiana di L2 (R, dx) fatta di autovettori di H. 5.11. Si consideri l’operatore di Laplace in Rn gi`a considerato in (1) in esempi 5.47: n ∂2 Δ := . ∂x2i i=1 Si dimostri esplicitamente che Δ `e essenzialmente autoaggiunto sullo spazio di Schwartz S(Rn ) nello spazio di Hilbert L2 (Rn , dx) e dunque ammette una sola estensione autoaggiunta Δ. Si provi infine che, se F : L2 (Rn , dx) → L2 (Rn , dk) `e la trasformata di FourierPlancherel (vedi sezione 3.6), vale: FΔF−1 f (k) := −k 2 f(k) , dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da:
2 n 4 2
f ∈ L (R , dk) k |f(k)| dk < +∞ . Rn
Suggerimento. L’operatore Δ `e simmetrico su S(R3 ), pertanto possiamo usare il teorema 5.18 verificando la validit`a della condizione (b). Notando che lo spazio di Schwartz `e invariante sotto l’azione dell’operatore unitario F dato dalla trasformata di Fourier-Plancherel come provato nella sezione 3.6, possia := FΔF −1 . mo studiare la condizione (b) del teorema 5.18 per l’operatore Δ 3 Tale operatore `e essenzialmente autoaggiunto su S(R ) se e solo se lo `e Δ su sulle funzioni di S(Rn ), si riduce alla semplice moltipliS(R3 ). L’azione di Δ cazione per −k 2 = −(k12 +k22 +. . .+kn2 ) che definisce, come si prova subito, un operatore autoaggiunto sul dominio naturale suddetto. La condizione (b) del
Esercizi
235
∗ usando la stessa teorema 5.18 pu`o allora essere verificata facilmente per Δ n n definizione di aggiunto ed il fatto che S(R ) ⊃ D(R ). L’unicit` a dell’estensione autoaggiunta per operatori essenzialmente autoaggiunti prova l’ultima parte dell’esercizio tenendo conto del fatto che F `e un operatore unitario. 5.12. Ricordando che D(Rn ) indica lo spazio delle funzioni complesse infinitamente differenziabili a supporto compatto su Rn , in riferimento all’esercizio precedente ed indicando con Δ l’unica estensione autoaggiunta di Δ : S(Rn ) → L2 (Rn , dx), mostrare che D(Rn ) `e un core per Δ. In altre parole ΔD(Rn ) `e essenzialmente autoaggiunto e ΔD(Rn ) = Δ. Suggerimento. Per provare quanto richiesto basta dimostrare che (ΔD(Rn ) )∗ = Δ (perch´e da ci`o segue che, prendendo l’aggiunto, ΔD(Rn ) = ∗ ((Δ D(Rn ) )∗ )∗ = Δ = Δ). Per provare l’identit` a detta notiamo che se ∗ ψ ∈ D((ΔD(Rn ) ) ) allora, per ogni ϕ ∈ D(Rn ), deve valere: (Δϕ|ψ) = (ϕ|ψ ), dove ψ = (Δ D(Rn ) )∗ ψ ∈ L2 (Rn , dx). Passando in trasformata di FourierPlancherel si vede subito che, nelle ipotesi fatte, Fψ = −k 2 Fψ, dato che n F(D(R )) `e denso in L2 (Rn , dk). Abbiamo ottenuto che ψ ∈ D(Δ) e ψ = Δψ e quindi: (Δ D(Rn ) )∗ ⊂ Δ. Supponiamo viceversa che ψ ∈ D(Δ). In questo caso, passando in trasformata di Fourier-Plancherel −k 2 Fψ ∈ L2 (Rn , dk) e, per ogni ϕ ∈ D(Rn ) possiamo scrivere: (Δϕ|ψ) = − dkk 2 (Fϕ)Fψ = − dk(Fϕ)k 2 Fψ = (ϕ|Δψ). Per definizione di operatore aggiunto abbiamo trovato che: ψ ∈ D((Δ D(Rn ) )∗ ) e (Δ D(Rn ) )∗ ψ = Δψ. Abbiamo con ci`o provato che vale anche l’altra inclusione: (ΔD(Rn ) )∗ ⊃ Δ. 5.13. Ricordiamo che se A `e un operatore su H, allora il commutante {A} `e l’insieme degli operatori di B(H) tali che BA ⊂ AB. Sia A : D(A) → H autoaggiunto. Sia T la trasformata di Cayley di A. Provare che ({A} ) generata da A coincide con l’algebra di von Neumann ({T } ) generata da {T } (vedi (3) in esempi 3.42). 5.14. Dimostrare la proposizione 5.44. 5.15. Dimostrare che se A : D(A) → H `e un operatore simmetrico sullo spazio di Hilbert H e ψ ∈ C ∞(A) `e tale che le combinazioni lineari finite di vettori An ψ, n ∈ N, sono dense in H, allora la richiesta che, per ogni scelta di N = 0, 1, 2, . . . e an ∈ C, C:
N n=0
an An ψ →
N
an An ψ
n=0
individua una coniugazione C : H → H (definizione 5.38). Traccia di soluzione. prima cosa da provare `e che C `e ben definita coLa N N1 N me funzione, cio`e che, se n=0 an An ψ = n=0 an An ψ allora n=0 an An ψ =
236
5 Operatori non limitati con domini densi in spazi di Hilbert
N1 Ψ
an An ψ. Per provare n=0 M = m=0 bm Am ψ, vale:
ci`o, basta osservare che, nelle ipotesi dette se
N N
1
n n ψ an A Ψ = ψ an A Ψ per cui
n=0
N n=0
n=0
N
1
n n an A ψ Ψ = an A ψ Ψ .
n=0
N n Dato che i vettori Ψ formano un insieme denso, segue che n=0 an A ψ = N1 n n=0 an A ψ come si voleva. Per costruzione si verifica che se Ψ e Ψ sono della forma detta sopra: (CΨ |CΨ ) = (Ψ |Ψ ). Dato che i vettori Ψ sono densi in H e che ||CΨ || = ||Ψ ||, si prova immediatamente che C si estende per continuit`a e antilinearit` a a tutto H. Tale operatore antilineare soddisfa (CΨ |CΨ ) = (Ψ |Ψ ) su tutto H ed `e suriettivo, come si ottiene estendendo per continuit`a la relazione CCΨ = IΨ .
Parte II
Teoria Spettrale e formalismo della Meccanica Quantistica
6 Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria Ci sono soltanto due possibili conclusioni: se il risultato conferma le ipotesi, allora hai appena fatto una misura. Se il risultato `e contrario alle ipotesi, allora hai fatto una scoperta. Enrico Fermi
In questo capitolo cercheremo di fornire qualche idea generale riguardo a cosa si intenda per sistema quantistico e per fenomenologia quantistica. Le parti successive alla prima sezione di questo capitolo possono essere tralasciate dal lettore pi` u matematico, non interessato alla genesi dei concetti fisici della MQ. In tali paragrafi passeremo rapidamente ad enunciare in modo piuttosto sommario alcuni dei fatti sperimentali e dei modelli teorici “proto quantistici” che hanno infine condotto alla formulazione prima della meccanica ondulatoria e poi della MQ vera e propria. Molti dettagli fisici si possono trovare in [CCP82]. Ometteremo completamente ogni discussione su alcune importanti tappe di questo percorso storico: spettroscopia atomica, modelli atomici (Rutherford, Bohr, Bohr-Sommerfeld), esperimento di Franck-Hertz, per i quali si rimanda a testi di fisica (es. [CCP82]). Il nostro succinto sommario metter`a solo a giustificare il modello di base per la teoria matematica della MQ che svilupperemo nei prossimi capitoli. Notazione 6.1. In questo capitolo e a volte nei successivi, come di consueto nelle trattazioni di fisica, indicheremo i vettori dello spazio tridimensionale (identificabile con R3 una volta fissato un sistema di riferimento), con le lettere in grassetto: x. Nello stesso modo la misura di Lebesgue in R3 sar`a indicata con d3 x.
6.1 Generalit` a sui sistemi quantistici ` Usiamo qui la parola sistema fisico in senso molto generico e discorsivo. E molto difficile definire dal punto di vista fisico cosa sia un sistema quantistico. Possiamo cominciare a dire che pi` u di sistema fisico quantistico pi` u opportuno parlare di sistema fisico dal comportamento quantistico, distinguendo tali sistemi fisici da un punto di vista pi` u fenomenologico-sperimentale che teorico. All’interno della formulazione teorica della meccanica quantistica non esiste Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
240
6 Fenomenologia quantistica
una precisa demarcazione tra sistemi classici e sistemi quantistici, se non una demarcazione imposta del tutto “a mano”, e tale questione `e oggi, ancora di pi` u che in passato, oggetto di discussione ed attivit`a di ricerca teorica e sperimentale. Parlando in modo del tutto generico, possiamo dire che hanno comportamento quantistico i sistemi della microfisica, cio`e molecole, atomi, nuclei e particelle subnucleari quando presi individualmente o a piccoli numeri. Sistemi fisici costituiti da pi` u copie di tali sottosistemi (per esempio cristalli ) possono avere a loro volta comportamento quantistico. Alcuni sistemi macroscopici hanno comportamento tipicamente quantistico solo in determinate condizioni difficili da realizzare (es. condensazione di Bose-Einstein, L.A.S.E.R.). In modo leggermente pi` u preciso della rozza distinzione tra microsistemi e macrosistemi esposta sopra, possiamo dire che, generalmente parlando, quando un qualsiasi sistema fisico si comporta quantisticamente l’azione caratteristica del sistema, cio`e il numero dalle dimensioni fisiche di Energia × Tempo (equivalentemente Quantit` a di Moto × Lunghezza ovvero Momento angolare) ottenuto combinando opportunamente le dimensioni fisiche caratteristiche del sistema (es. massa, velocit`a, dimensioni lineari ecc...) nei processi considerati `e dell’ordine o inferiore al valore della costante di Planck: h = 6.6262 · 10−34Js. La costante di Planck e la parola quantum che caratterizza il nome della MQ vennero introdotte per la prima volta da Planck nel 1900 nel suo lavoro sulla teoria del corpo nero, per eliminare il problema dell’energia totale, teoricamente infinita, di un sistema fisico costituito da radiazione elettromagnetica in equilibrio termodinamico con le pareti di una cavit` a tenuta ad una temperatura fissata. La sua ipotesi teorica, rivelatasi poi esatta, prevedeva che la radiazione in potesse scambiare energia con le pareti in quantit` a proporzionali alle frequenza degli oscillatori atomici nelle pareti, la cui costante universale di proporzionalit` a era proprio la costante di Planck suddetta. Tali quantit` a di energia vennero chiamate in latino quanta, quanti in italiano. Tornando al criterio per discriminare i sistemi quantistici da quelli classici usando la costante h, consideriamo per esempio un elettrone legato ad un nucleo di idrogeno. Un’azione caratteristica dell’elettrone si ottiene come, per esempio il prodotto della massa dell’elettrone (∼ 9 · 10−31 Kg), per una stima della velocit`a intorno al nucleo (∼ 106 m/s) per il valore del raggio di Bohr dell’atomo di idrogeno (∼ 5 · 10−11m). Il calcolo fornisce un’azione caratteristica dell’ordine di 4.5·10−35Js pi` u piccolo dunque della costante di Planck. Ci si aspetta quindi che l’elettrone nell’atomo abbia comportamento quantistico, come infatti accade. Si pu` o fare un calcolo analogo per sistemi fisici macroscopici come per esempio un pendolo di massa di qualche grammo e lunghezza dell’ordine del centimetro che oscilla sottoposto alla forza di gravit`a. Un’azione caratteristica di questo sistema pu`o essere definita come il prodotto dell’energia cinetica massima per il periodo di oscillazione. Si trovano, per il sistema in questio-
6.2 Alcune propriet` a particellari delle onde elettromagnetiche
241
ne valori dell’azione caratteristica di moltissimi ordini di grandezza superiori ad h. Osservazione 6.2. Una delle propriet`a peculiari dei sistemi quantistici `e il fatto che l’insieme, in gergo lo spettro, dei valori assumibili dalle grandezze fisiche che caratterizzano gli stati di un sistema quantistico, come l’energia, `e generalmente diverso dallo spettro dei valori delle stesse grandezze valutate su sistemi macroscopici analoghi. In certi casi, la differenza `e sorprendente perch´e si passa da uno spettro continuo di valori possibili nel caso classico, ` importante per` ad uno spettro discreto, nel caso quantistico. E o precisare la discretezza dello spettro dei valori assumibili da una generica grandezza fisica quantistica non `e una caratteristica necessaria in MQ: esistono grandezze quantistiche con spettro di valori continuo anche in MQ. Questo fraintendimento `e all’origine o, a volte, conseguenza di una delle interpretazioni pi` u frequenti, ma riduttiva, dell’aggettivo quantistica nella parola Meccanica Quantistica.
6.2 Alcune propriet` a particellari delle onde elettromagnetiche Le onde elettromagnetiche (e quindi in particolare la luce), in particolari circostanze sperimentali, rivelano comportamenti tipici di insiemi di particelle. Nella descrizione matematica di tali comportamenti classicamente anomali `e coinvolta la costante di Planck. Possiamo citare due esempi di comportamento classicamente anomalo, che hanno svolto un ruolo fondamentale nello sviluppo iniziale della MQ per i corrispondenti modelli teorici proto quantistici, costruiti nel tentativo di darne una spiegazione: l’effetto fotoelettrico e l’effetto Compton. 6.2.1 Effetto Fotoelettrico L’effetto fotoelettrico riguarda l’emissione di elettroni (corrente elettrica) da parte di metalli in seguito ad illuminazione con un’onda elettromagnetica. Tale effetto era noto dalla prima met`a del secolo XIX e alcune sue caratteristiche risultavano del tutto inspiegabili alla luce della teoria classica dell’interazione onde elettromagnetica e materia [CCP82]. In particolare era inspiegabile la presenza di un valore minimo della frequenza della luce usata per irraggiare il metallo, al di sotto del quale non si ha emissione elettronica. Il valore di tale soglia dipende dal metallo usato. Una volta raggiunta la soglia, l’istantaneit` a del processo di emissione era del tutto inspiegabile. Secondo la teoria classica l’emissione di elettroni dovrebbe apparire indipendentemente dalla frequenza usata pur di aspettare un tempo sufficientemente lungo, in modo da fare assorbire agli elettroni del metallo energia sufficiente da vincere l’energia di legame con gli atomi.
242
6 Fenomenologia quantistica
Nel 1905 A. Einstein propose un modello, per l’epoca molto ardito, che rendeva conto di tutte le propriet` a anomale dell’effetto fotoelettrico1 e con una precisione notevole in riferimento ai dati sperimentali. Seguendo Planck, l’ipotesi centrale di Einstein era che un onda elettromagnetica monocromatica, cio´e con frequenza definita, che indicheremo con ν, fosse in realt`a costituita da particelle materiali, dette quanti di luce, ciascuna dotata di energia: E = hν .
(6.1)
In tale modello l’energia totale dell’onda elettromagnetica sarebbe quindi stata pari alla somma delle energie dei singoli quanti di luce. Tutto ci` o era ed `e in contrasto totale con la teoria dell’elettromagnetismo classico, in cui un’onda elettromagnetica `e un sistema continuo, la cui energia `e proporzionale all’ampiezza dell’onda invece che alla frequenza. Quello che dunque sarebbe dovuto accadere nell’effetto fotoelettrico, secondo il modello di Einstein, `e che, illuminando il metallo con un onda monocromatica, ciascuno dei pacchetti energetici associati all’onda potesse essere assorbito da un elettrone del metallo e trasformato in energia cinetica. Pi` u precisamente l’ipotesi di Einstein per spiegare la fenomenologia sperimentale, era che il pacchetto potesse essere o assorbito completamente oppure non assorbito affatto, senza possibilit` a di assorbimenti parziali. Se, e solo se, l’energia del quanto fosse stata uguale o superiore all’energia dell’elettrone di legame con il metallo E0 (dipendente dal metallo e misurabile indipendentemente dall’effetto fotoelettrico), l’elettrone sarebbe stato istantaneamente espulso, trasformando in energia cinetica l’eventuale energia in eccesso del quanto assorbito. La frequenza ν0 := E0 /h avrebbe individuato cos`ı la soglia sulla frequenza osservata sperimentalmente. Tale ipotesi si rivel`o in perfetto accordo con dati sperimentali. 6.2.2 Effetto Compton L’osservazione e lo studio dell’effetto Compton risalgono al 1923. Esso riguarda la diffusione di onde elettromagnetiche monocromatiche di altissima frequenza – raggi X (> 1017Hz) e raggi γ (> 1018 Hz) – da parte di materia estesa ` utile ricordare nel seguito che le onde elettroma(gas, liquidi e solidi). E gnetiche monocromatiche hanno sia frequenza che lunghezza d’onda fissate, per cui nel seguito ci riferiremo anche alla loro lunghezza d’onda. Schematizzando al massimo, l’effetto sperimentale consiste in questo. Irraggiando la sostanza (che diremo ostacolo) con un’onda elettromagnetica monocromatica piana propagantesi nella direzione z con lunghezza d’onda λ nota, si osserva un’onda diffusa dall’ostacolo con diverse componenti (cio`e diverse lunghezze d’onda o frequenze). Una componente `e diffusa in tutte le direzioni ed ha la stessa lunghezza d’onda della radiazione incidente, l’altra componente ha una lunghezza d’onda leggermente superiore a λ, λ(θ) che dipende dall’angolo di 1
Einstein ricevette il Premio Nobel per la Fisica proprio per tale lavoro.
6.2 Alcune propriet` a particellari delle onde elettromagnetiche
243
osservazione θ. Se pi` u precisamente, θ `e definito come l’angolo tra la direzione di propagazione dell’onda incidente z e la direzione di propagazione dell’onda diffusa oltre l’ostacolo, con lunghezza d’onda λ(θ), misurando θ a partire dall’asse z, vale la relazione: λ(θ) = λ + f (1 − cosθ)
(6.2)
dove la costante f ha le dimensioni di una lunghezza e si ottiene dai dati sperimentali. Il suo valore `e2 f = 0.024(±0.001) ˚ A. Si noti che si ha completa isotropia attorno all’asse z. La teoria elettromagnetica classica era ed `e assolutamente incapace di spiegare un tale fenomeno. Tuttavia, come Compton dimostr`o, il fenomeno poteva essere spiegato assumendo le tre ipotesi seguenti, del tutto incompatibili con la teoria classica, ma in accordo con l’ipotesi dei quanti di luce di Einstein. (a) L’onda elettromagnetica `e costituita da particelle che trasportano energia, esattamente come aveva ipotizzato Einstein, secondo la legge (6.1). (b) Ogni quanto di luce possiede anche un impulso p := k ,
(6.3)
dove k `e il vettore d’onda dell’onda elettromagnetica associata al quanto (vedi sotto). (c) I quanti di luce interagiscano, in un processo d’urto (in generale in regime relativistico), con gli atomi e con gli elettroni pi` u esterni degli atomi dell’ostacolo soddisfacendo le leggi di conservazione dell’impulso e dell’energia. Osservazione 6.3. A commento di (c), ricordiamo che il vettore vettore d’onda k associato ad un onda piana monocromatica ha, per definizione, direzione e verso pari a quello di propagazione dell’onda e modulo dato da 2π/λ, dove λ `e la lunghezza d’onda dell’onda. Equivalentemente, se ν `e la frequenza dell’onda, |k| = 2π/λ = 2πν/c , (6.4) dove si `e usata la ben nota relazione: νλ = c ,
(6.5)
valida per le onde elettromagnetiche monocromatiche ed essendo c = 2.99792 · 108 m/s `e la velocit` a della luce. Possiamo dare qualche dettaglio in pi` u per il lettore interessato. Le leggi di conservazione dell’energia e dell’impulso da usarsi in regime relativistico, cio`e quando (qualcuna) delle velocit` a coinvolte sono dell’ordine di c, si scrivono rispettivamente, nelle ipotesi fatte: me c2 + hν(θ) , 1 − v2 /c2 me v + k(θ) . k = 1 − v2 /c2
me c2 + hν =
2
Ricordiamo che 1 ˚ A= 10−10 m.
(6.6) (6.7)
244
6 Fenomenologia quantistica
A primo membro compaiono le quantit`a precedenti dell’urto a secondo membro quelle successive all’urto. me = 9.1096 · 10−31Kg `e la massa dell’elettrone. L’elettrone `e pensato in quiete prima dell’urto con il quanto di luce. In seguito all’urto, il quanto di luce viene diffuso nella direzione individuata da θ, mentre l’elettrone acquista velocit`a v. Il vettore d’onda precedente all’urto, k, `e quindi nella direzione (generica ma fissata) z mentre il vettore d’onda del quanto di luce dopo l’urto, k(θ), forma un angolo θ con k. Dalla (6.7), tenendo conto della definizione del vettore d’onda, si ricava subito che: m2e c2 h2 ν 2 h2 ν(θ)2 hν hν(θ) = 2 + −2 cos θ . 2 2 1 − v /c c c2 c c Eliminando ν tra la relazione appena ottenuta e la (6.6) si ricava immediatamente ν(θ) = ν −
hνν(θ) (1 − cosθ) . me c2
(6.8)
Tenendo conto della relazione (6.1) e ν = c/λ, si ricava facilmente la (6.2) nella forma: λ(θ) = λ +
h (1 − cosθ) me c
(6.9)
da cui si evince che f = h/(me c), il cui valore numerico coincide proprio con quello ottenuto sperimentalmente quando si sostituiscono i valori numerici di h, me e c. Si osservi anche, che nel limite formale per me → +∞, la (6.9) fornisce λ(θ) → λ. Ci` o porta anche a spiegare la componente dell’onda diffusa isotropicamente senza variazione della lunghezza d’onda (rispetto alla lunghezza d’onda della radiazione incidente), come dovuta a quanti di luce che interagiscono con particelle di massa molto pi` u grande di quella elettronica (un atomo del materiale o tutto l’ostacolo nel suo complesso). Osservazione 6.4. Il modello di Einstein e quello di Compton spiegano perfettamente l’effetto fotoelettrico e la formula (6.2) in termini quantitativi e qualitativi. Tuttavia devono considerarsi come modelli ad hoc, slegati ed addirittura in contrasto con il corpus della fisica teorica dell’epoca: l’idea della costituzione corpuscolare delle onde elettromagnetiche e quindi della luce, come noto dai tempi di Newton e Huygens, non pu` o spiegare effetti ondulatori notissimi della luce quali i fenomeni di interferenza e diffrazione. In qualche modo il modello ondulatorio e quello corpuscolare della luce (onde elettromagnetiche) devono coesistere nella realt` a, ma ci`o non `e possibile nel paradigma della fisica classica. Ci`o invece accade nella formulazione relativistica completa della MQ introducendo il concetto di fotone, particella priva di massa, del quale non ci discuteremo se non con brevi accenni.
6.3 Cenni di Meccanica Ondulatoria
245
6.3 Cenni di Meccanica Ondulatoria In queste dispense non ci occuperemo pi` u delle propriet` a quantistiche della luce che richiederebbero uno sviluppo ulteriore del formalismo della MQ che presenteremo. Le idee esposte sopra sui primi tentativi di descrizione quantistica della luce furono per`o utili, ribaltando il punto di vista, per arrivare alla formulazione della meccanica ondulatoria, il primo passo verso la formulazione della MQ. La meccanica ondulatoria `e una delle due prime versioni un p` o rudimentali della MQ per particelle dotate di massa3 . Nel seguito ci occuperemo molto succintamente di esporre alcune idee portanti della meccanica ondulatoria che mettono in luce alcuni punti fondamentali e generali che useremo per costruire il formalismo proprio della MQ. In particolare tralasceremo alcuni risultati storicamente connessi quali l’equazione stazionaria di Schr¨odinger e la spiegazione, tramite essa, dello spettro energetico dell’atomo di idrogeno. Torneremo pi` u avanti su questi argomenti dopo avere costruito il formalismo. 6.3.1 Onde di de Broglie Un quanto di luce di Einstein e Compton `e associato ad un’onda elettromagnetica piana monocromatica di numero d’onda k = p/ e pulsazione ω = E/, dove lo ricordiamo, la pulsazione `e semplicemente 2π volte la frequenza ν. Ogni componente dell’onda piana elettromagnetica (una componente lungo i tre versori ortogonali del vettore di campo elettrico o magnetico che vibra perpendicolarmente a k) ha allora la forma di un’onda scalare: ψ(t, x) = Aei(k·x−tω) .
(6.10)
In realt` a solo la parte reale dell’onda di sopra ha senso fisico, ma `e pi` u comodo lavorare con onde complesse per vari motivi, in particolare perch`e appaiono nella decomposizione di Fourier (vedi sezione 3.6) di una soluzione generale dell equazioni del campo elettromagnetico (equazioni di Maxwell) e pi` u generalmente dell’equazione di d’Alembert. In termini di impulso e energia del quanto di luce associato, la stessa onda pu` o riscriversi: i
ψ(t, x) = Ae (p·x−tE) .
(6.11)
Dove, lo si noti, compaiono solo l’impulso e l’energia del quanto di luce. Nel 1924 de Broglie fece un’ipotesi estremamente rivoluzionaria: come alle onde elettromagnetiche si associavano delle particelle (fotoni) in certi contesti sperimentali, si dovevano poter associare, viceversa, delle onde di qualche genere alle particelle materiali. Secondo de Broglie, tali onde materiali dovevano avere la stessa forma (6.11) dove ora, per`o, p e E avrebbero dovuto essere, 3 L’altra versione sviluppata parallelamente da Heisenberg consisteva nella cosiddetta meccanica delle matrici [CCP82] che non tratteremo.
246
6 Fenomenologia quantistica
rispettivamente, l’impulso e l’energia (cinetica) della particella materiale. La lunghezza d’onda associata ad una particella di impulso p: λ = h/|p| ,
(6.12)
viene detta lunghezza d’onda di de Broglie della particella. Non era affatto chiara la natura di tali fantomatiche onde, fino al 1927, quando si ebbe evidenza sperimentale di onde associate al comportamento di elettroni, con due distinti esperimenti da parte di Davisson e Germer e, separatamente, G.P. Thompson. Senza entrare nei dettagli degli esperimenti, ` noto che, quando un’onda (elettromagnetica, premettiamo quanto segue. E sonora ecc...) incontra un ostacolo, con una struttura interna di dimensioni tipiche dell’ordine o superiori alla lunghezza d’onda dell’onda incidente, l’onda diffusa dall’ostacolo produce un fenomeno detto diffrazione: le varie parti interne dell’ostacolo agiscono sull’onda creando interferenza costruttiva e distruttiva, in modo che l’onda diffusa proietti, su uno schermo su cui incide, delle figure costituite da zone d’ombra e zone di maggiore intensit` a (cio`e pi` u chiare nel caso di onde luminose). Tali figure si dicono figure di diffrazione. Se l’ostacolo `e un cristallo, dalle figure di diffrazione si pu` o risalire alla struttura interna del cristallo. Davisson, Germer e G.P. Thompson, produssero figure di diffrazione ottenute da fasci di elettroni sparati su cristalli. Pi` u precisamente, le figure di diffrazione si produssero su uno schermo dall’accumularsi delle tracce puntiformi degli elettroni, diffusi da un cristallo di passo reticolare dell’ordine di 1 ˚ A. La peculiarit`a notevole, che corroborava l’ipotesi di de Broglie, era il fatto che che, negli esperimenti detti, le figure di diffrazione apparivano solo se la lunghezza di de Broglie degli elettroni era dell’ordine o inferiore al passo reticolare, esattamente come nel fenomeno della diffrazione prodotto da onde elettromagnetiche. ` importante sottolineare che il fenomeno della diffrazioOsservazione 6.5. E ne `e strettamente dovuto alla natura ondulatoria dell’onda (al fatto che ci sia qualcosa che oscilli ed al principio di sovrapposizione). Non `e possibile produrre figure di diffrazione usando particelle che soddisfino le usuali leggi della meccanica classica, su qualsivoglia ostacolo. 6.3.2 Funzione d’onda di Schr¨ odinger e interpretazione probabilistica di Born Nel 1926, in due famosi e geniali articoli, Schr¨ odinger prese sul serio l’ipotesi di de Broglie e fece un’assunzione pi` u precisa: quella di associare ad una particella materiale, non un’onda piana come (6.11), ma un pacchetto d’onde costituito dalla sovrapposizione (nel senso della trasformata di Fourier, vedi sezione 3.6) di onde piane di de Broglie. Nel caso di particelle libere, cio`e la cui energia `e data dalla sola energia cinetica, l’onda di Schr¨ odinger si scrive: i e (p·x−tE(p)) ˆ ψ(t, x) = (6.13) ψ(p) d3 p , (2π2 )3/2 R3
6.3 Cenni di Meccanica Ondulatoria
247
dove E(p) := p2 /(2m) essendo m la massa della particella. Nei due articoli Schr¨ odinger osserv`o che l’ottica geometrica si basa su un’equazione, detta equazione dell’iconale [CCP82], che ha una struttura formalmente analoga all’equazione di Hamilton-Jacobi [FaMa94, CCP82] per una particella della meccanica classica. Schr¨odinger tent` o allora di determinare un’equazione fondamentale di una meccanica ondulatoria per la materia, rispetto alla quale l’equazione di Hamilton-Jacobi della meccanica giocasse lo stesso ruolo approssimato che equazione dell’iconale (ottica geometrica) gioca rispetto all’equazione di d’Alembert (ottica ondulatoria) [CCP82]. In questo modo pervenne alla notissima equazione di Schr¨ odinger. Noi ricaveremo tale equazione dopo avere costruito il formalismo. Nel caso di una particella soggetta ad una forza dovuta ad un potenziale U , f (t, x) = −∇U (t, x), l’equazione `e: * + ∂ψ(t, x) 2 i = − Δ + U (t, x) ψ(t, x) (6.14) ∂t 2m 3 ∂2 e l’operatore di Laplace in R3 . dove Δ = j=1 ∂x 2 ` j L’onda di de Broglie-Schr¨ odinger ψ, che `e una funzione a valori complessi, venne chiamata funzione d’onda della particella a cui `e associata. L’interpretazione fisica della funzione d’onda ψ – almeno nell’interpretazione standard (“di Copenhagen”) del formalismo della MQ – venne data Born sempre nel 1926: |ψ(t, x)|2 |ψ(t, y)|2 d3 y R3
ρ(t, x) :=
`e la densit` a di probabilit` a di trovare la particella nel punto x al tempo t, quando si esegua un esperimento per determinarne la posizione. L’interpretazione di Born che si rivel` o in accordo con l’esperienza, era gi`a in sostanziale accordo con i risultati degli esperimenti di Davisson, Germer e G.P. Thompson, in cui le tracce delle particelle sullo schermo si addensavano nelle regioni in cui ρ(t, x) > 0 ed erano assenti nelle regioni in cui ρ(t, x) = 0, dando luogo alle figure di diffrazione. Osservazioni 6.6. (1) Dal punto di vista matematico, l’assunzione dell’interpretazione di Born richiede che abbiano senso fisico solo le funzioni d’onda a quadrato sommabile e non quasi ovunque nulle, cio`e gli elementi non nulli di L2 (R3 , d3x): uno spazio di Hilbert entra in gioco per la prima volta, nella costruzione della MQ. (Il fatto che le onde piane di de Broglie non abbiano diretto significato fisico alla luce dell’interpretazione di Born non appartenendo a L2 (R3 , d3 x), `e fisicamente irrilevante. Le onde piane monocromatiche usate per interpretare i risultati sperimentali secondo l’ipotesi di de Broglie possono essere approsˆ simate a piacimento da elementi di L2 (R3 , d3 x) usando distribuzioni ψ(p) strette attorno ad un valore p0 , che determina con l’approssimazione voluta la lunghezza d’onda λ0 = |p0 |/h di de Broglie.)
248
6 Fenomenologia quantistica
(2) Assumendo l’interpretazione di Born si deve concludere che, quando non viene eseguito alcun esperimento per determinarne la posizione, la particella associata alla funzione d’onda ψ, non pu` o evolvere temporalmente secondo le leggi della meccanica classica: se seguisse una traiettoria regolare come prescritto dalla meccanica classica, la funzione |ψ|2 associata dovrebbe essere quasi ovunque nulla fuori dalla traiettoria. Tuttavia avendo ogni traiettoria regolare in R3 misura nulla, |ψ|2 dovrebbe essere nulla quasi ovunque in R3 , portando ad una contraddizione. In altre parole, quando non si esegue un esperimento per determinare la posizione della particella, la particella non deve considerarsi un oggetto classico, ma la sua evoluzione temporale `e descritta dall’evoluzione dell’onda ψ (secondo l’equazione di Schr¨ odinger). (3) Se si ammette, come nell’interpretazione di Copenhagen, che la funzione d’onda ψ sia una descrizione completa dello stato fisico della particella, si deve concludere che la posizione della particella sia fisicamente indefinita prima di eseguire un esperimento che la determini e che venga fissata all’atto dell’esperimento in modo probabilistico. Non `e corretto pensare che l’uso di una descrizione probabilistica sia dovuto ad insufficiente conoscenza dello stato del sistema: “la posizione esiste ma noi non la conosciamo”. Nell’interpretazione di Copenhagen la posizione non esiste fino a quando non si esegue un esperimento per determinarla e lo stato della particella (l’informazione massima sulle sue propriet` a fisiche variabili nel tempo) `e descritto dall’onda ψ. Nella meccanica ondulatoria la particella quantistica ha dunque una duplice natura di onda-corpuscolo, ma le due nature non vengono mai in contrasto perch´e non si manifestano mai contemporaneamente.
6.4 Principio di Indeterminazione di Heisenberg Quando cerchiamo di valutare sperimentalmente il valore di qualsiasi grandezza definita per un sistema fisico, interagendo con esso, possiamo alterare lo stato del sistema. Tuttavia nella descrizione classica, in linea di principio, possiamo rendere piccola a piacere la perturbazione apportata allo stato. Nel 1927 Heisenberg si rese conto che le ipotesi di Planck, Einstein, Compton, de Broglie avevano una conseguenza (anche epistemologica) notevole in questo contesto. In termini quantitativi il principio di Heisenberg stabilisce che, considerando sistemi quantistici e particolari grandezze che si vogliono misurare, non `e sempre possibile rendere piccola a piacere la perturbazione apportata allo stato del sistema dalla procedura di misura: la costante di Planck rappresenta un limite invalicabile per il prodotto delle indeterminazioni di alcune coppie di grandezze. Pi` u precisamente, esaminando vari esperimenti ideali, in cui si assumeva qualcuna delle ipotesi dei modelli di Planck, Einstein, Compton e de Broglie, Heisenberg arriv` o alla conclusione che: cercando di determinare la posizione, o l’impulso, di una particella lungo un fissato asse x, se ne altera l’impulso o, rispettivamente, la posizione, lungo
6.4 Principio di Indeterminazione di Heisenberg
249
lo stesso asse in modo tale che il prodotto della minima larghezza possibile delle due incertezze Δx e Δp con cui, alla fine, risultano essere note le due grandezze soddisfi sempre: ΔxΔp h .
(6.15)
Se la posizione e l’impulso sono valutati lungo assi reciprocamente ortogonali il prodotto delle incertezze pu` o invece essere arbitrariamente piccolo. (6.15) esprime il principio di indeterminazione di Heisenberg per la posizione e l’impulso. Una relazione analoga vale per l’incertezza ΔE con cui `e determinata l’energia E di una particella e l’incertezza Δt con cui si determina il tempo t in cui viene fatta la misura dell’energia4 : ΔEΔt h .
(6.16)
A titolo di esempio consideriamo l’esperimento ideale in cui si cerca di determinare la posizione X di un elettrone di momento inizialmente noto P , illuminandolo con un fascetto di luce monocromatica di lunghezza d’onda λ, che si propaga nella direzione x. Immaginiamo di voler leggere la posizione su uno schermo parallelo all’asse X, tramite una lente interposta tra l’asse X e lo schermo. Un quanto di luce che ha interagito con l’elettrone produrr` a un’immagine X , colpendo schermo dopo avere attraversato la lente. A causa dell’apertura finita della lente, non `e possibile conoscere con esattezza la direzione lungo la quale `e stato diffuso il quanto di luce che produce l’immagine X sullo schermo. Dall’ottica ondulatoria sappiamo che in X si avr`a una figura di diffrazione che permetter` a di raggiungere nella misura della coordinata X una accuratezza non pi` u piccola di: ΔX
λ , sin α
dove α `e il semi angolo sotto il quale da X si vede la lente. Al quanto di luce corrisponde l’impulso h/λ, per cui l’incertezza della componente Px del quanto di luce diffuso sar` a data, approssimativamente, da h(sin α)/λ. L’impulso totale del sistema particella - quanto di luce - microscopio, dovr`a rimanere costante, per cui l’incertezza nella componente x della quantit` a di moto della particella, dopo la diffusione del quanto di luce, dovr` a essere uguale alla corrispondente incertezza per il quanto di luce stesso: ΔPx 4
h sin α . λ
Tale relazione d’indeterminazione ha uno status ed una interpretazione molto pi` u problematici che per le relazioni posizione-impulso e non ne discuteremo qui [CCP82].
250
6 Fenomenologia quantistica
Il prodotto delle due indeterminazioni della particella lungo l’asse x risulta essere dunque, al minimo: ΔXΔPx h . Osservazione 6.7. Il principio di Heisenberg, a questo livello, ha esattamente la stessa (in)consistenza logica dei modelli proto quantistici di Planck, Einstein, Compton... Esso deve essere visto pi` u come una ipotesi di lavoro per costruire una nuova nozione di particella in cui i concetti di posizione ed impulso classici abbiano senso solo entro limiti fissati dal principio stesso: gli stati fisici di una particella quantistica devono essere tali per cui l’impulso o la posizione non siano definite e definibili contemporaneamente. Val la pena di sottolineare che, come vedremo, nella formulazione finale della MQ il principio di Heisenberg diventa un teorema.
6.5 Le grandezze compatibili e incompatibili Indipendentemente dal principio di Heisenberg, la fenomenologia quantistica mostra che ci sono coppie grandezze A e B che risultano essere incompatibili. Questo significa che, se si misura prima la grandezza A sul sistema ottenendo il risultato a e – immediatamente dopo – si misura B ottenendo il risultato b, una successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale) – produce un risultato a1 generalmente differente da a anche di molto. Lo stesso fenomeno appare scambiando il ruolo di A e B. Coppie di grandezze incompatibili sono in particolare la componente della posizione e dell’impulso lungo un fissato, tali grandezze soddisfano anche il principio di Heisenberg. Questi due fatti sono connessi, ma il legame pu`o essere spiegato chiaramente solo dopo avere costruito il formalismo completo. In generale coppie di grandezze incompatibili non soddisfano il principio di Heisenberg. Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono apparati di misura in grado di misurarle contemporaneamente. ` importante sottolineare che la fenomenologia quantistica mostra che esiE stono anche coppie di grandezze A , B compatibili. Questo significa che, se si misura prima la grandezza A sul sistema ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b , una successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale) – produce lo stesso risultato a . Lo stesso fenomeno appare scambiando il ruolo di A e B . In particolare ogni grandezza fisica A `e compatibile con se stessa e con ogni funzione di A (per esempio la posizione di una particella lungo una retta ed il quadrato del numero che individua tale posizione.)
6.5 Le grandezze compatibili e incompatibili
251
Un esempio di coppie di grandezze incompatibili che non soddisfano il principio di Heisenberg sono due componenti diverse dello spin di una particella. Lo spin dell’elettrone (e poi di tutte le particelle nucleari e subnucleari) fu introdotto da Goudsmit e Uhlembeck nel 1925 [CCP82] per spiegare alcune propriet` a “anomale”, il cosiddetto effetto Zeeman anomalo, degli spettri energetici (righe spettrali) degli atomi di metalli alcalini. In senso semi classico, lo spin rappresenta il momento angolare intrinseco dell’elettrone che, per certi aspetti, pu`o essere pensato come dovuto ad un incessante moto rotatorio dell’elettrone attorno al proprio centro di massa. Tuttavia questa interpretazione `e fuorviante `e non pu` o essere presa alla lettera. Il significato profondo dello spin pu` o solo essere dato nel contesto della definizione, dovuta a Wigner, di particella elementare quantistica come sistema elementare invariante sotto l’azione del gruppo di Poincar´e. Allo spin `e associato un momento magnetico intrinseco che `e, alla fine, il responsabile dell’effetto Zeeman anomalo osservato. Tuttavia lo spin `e una grandezza vettoriale con caratteristiche peculiari quantistiche, che lo differenziano completamente da un momento angolare classico, e lo fanno rientrare nella categoria dei momenti angolari quantistici. La prima differenza `e nei valori assumibili dal modulo a di misura tali valori sono dello spin. Nell’unit` sempre numeri del tipo s(s + 1) dove s `e un intero fissato dipendente dal tipo di particella, s = 1/2 per l’elettrone. Ciascuna delle tre componenti dello spin, rispetto ad una terna di assi destrorsa ortonormale, pu` o assumere ciascuno dei 2s + 1 valori discreti −s, −s + 1, . . . , s − 1, s. Le tre componenti dello spin risultano essere grandezze fisiche incompatibili nel senso detto sopra: la misurazione alternata, fatta a tempi vicinissimi di due differenti componenti ` dello spin, fornisce valori sempre differenti per tali componenti dello spin. E importante precisare che la stessa incompatibilit`a si ha anche per le componenti del momento angolare orbitale e totale di una particella. Un esempio di coppie di grandezze compatibili per una particella quantistica sono la componente x dell’impulso e la componente y del vettore posizione.
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili Alcuni storici della scienza sostengono che ormai `e molto difficile stabilire il punto di distinzione e connessione fra il livello sperimentale e quello della cosiddetta teoria. In realt` a, la loro relazione include molti elementi arbitrari, le cosiddette approssimazioni. Paul K. Feyerabend
In questo capitolo presenteremo la struttura matematica generale della Meccanica Quantistica. La procedura, essenzialmente dovuta a von Neumann e qui presentata in veste pi` u moderna tenendo conto del teorema di Gleason, sar`a un’estensione della meccanica (hamiltoniana) classica che tenga conto dei risultati sperimentali sulla natura dei sistemi quantistici discussi nel capitolo precedente. Nella prima sezione riassumeremo i risultati presentati nel capitolo precedente, rimarcando alcuni punti fondamentali, che giocheranno un ruolo fondamentale nel seguito. Nella sezione successiva riesamineremo alcuni aspetti della formulazione della meccanica di Hamilton da un punto di vista insiemistico e logicoformale insieme, mostrando che esiste un’interpretazione dei fondamenti della teoria in cui le proposizioni elementari sul sistema fisico sono descritte da una σ-algebra, mentre gli stati sono descrivibili in termini di misure di Borel (eventualmente di Dirac) su tale σ-algebra. Nella terza sezione, mostreremo come si possa modificare la struttura delineata nel caso classico fino ad introdurre una descrizione della fenomenologia quantistica. In questo caso la σ-algebra sar` a sostituita dal reticolo dei proiettori su un opportuno spazio di Hilbert e gli stati da una nozione generalizzata di misura σ-additiva sul reticolo dei proiettori. Nella quarta sezione entreremo nel cuore della struttura mostrando, tramite il teorema di Gleason, che le misure generalizzate di cui sopra non sono altro che operatori di classe traccia, positivi con traccia unitaria. In questo modo introdurremo lo spazio convesso degli stati quantistici, identificando gli stati puri (o raggi) con gli elementi estremali del corpo convesso. Discuteremo inoltre la descrizione formale della nozione di proposizioni compatibili, del processo di misura e l’esistenza di regole di superselezione con la decomposizione dello spazio di Hilbert in settori coerenti. Faremo qualche accenno alle interessanti logiche quantistiche ed ai recenti sviluppi anche in altre direzioni. Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
254
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Nella quinta ed ultima sezione ci dedicheremo alla costruzione euristica della nozione di osservabile, vista come insieme di proposizioni elementari che costituiscono una misura a valori di proiezione (PVM) sullo spazio di Hilbert del sistema fisico. Tale costruzione fornir`a anche una motivazione fisica alla dimostrazione del teorema spettrale, che sar`a provato successivamente.
7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia quantistica Riassumeremo di seguito alcuni punti cruciali del comportamento dei sistemi quantistici brevemente descritto nel capitolo precedente. QM1. (i) I risultati delle misure di grandezze fisiche su sistemi quantistici, di cui `e fissato lo stato, hanno esiti probabilistici. Non `e possibile prevedere l’esito della misura, ma solo (per esempio per quanto riguarda la posizione di una particella nell’interpretazione di Born) la probabilit` a di ogni possibile esito. (ii) Tuttavia, se una grandezza `e stata misurata ed ha prodotto un certo risultato, ripetendo la misura della stessa grandezza immediatamente dopo la prima misura (per evitare che nel frattempo lo stato del sistema evolva), il risultato della misura sar` a lo stesso gi`a ottenuto. QM2. (i) Esistono delle grandezze fisiche incompatibili nel senso che segue. Dette A e B due grandezze di tale genere, se si misura prima la grandezza A sul sistema (a stato fissato) ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b, una successiva misura di A – arbitrariamente vicina temporalmente a quella di B in modo da non poter imputare il risultato all’evoluzione temporale dello stato – produce un risultato a1 = a in generale. Accade lo stesso fenomeno scambiando il ruolo di A e B. Risulta che: (a) le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e che (b) non esistono apparati sperimentali di misura in grado di misurarle contemporaneamente. (ii) Esistono anche grandezze fisiche compatibili nel senso che segue. Dette A e B due grandezze di tale genere, se si misura prima la grandezza A sul sistema (a stato fissato) ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b , una successiva misura di A – arbitrariamente vicina temporalmente a quella di B in modo da non poter imputare il risultato all’evoluzione temporale – produce lo stesso risultato a gi`a ottenuto. Accade lo stesso fenomeno scambiando il ruolo di A e B . Risulta che: (a) ogni grandezza fisica `e compatibile con se stessa e (b) se due grandezze fisiche sono una funzione dell’altra (es. l’energia ed il suo quadrato), allora sono compatibili.
7.1 Interpretazione standard della fenomenologia quantistica
255
Osservazioni 7.1. (1) QM1 e QM2 si riferiscono alle grandezze fisiche “non definitorie” di un sistema fisico. Per grandezze definitorie intendiamo quelle i cui valori non dipendono dallo stato del sistema e che quindi permettono di distinguere un sistema da un altro. Le rimanenti grandezze, quelle a cui si riferiscono QM1 e QM2, assumono valori che, invece, sono dipendenti dallo stato del sistema. ` chiaro che non `e possibile avere la certezza assoluta che i sistemi fisici (2) E quantistici soddisfino (i) di QM1. Si potrebbe infatti sospettare che la stocasticit`a dell’esito delle misure derivi dal fatto che, in realt` a, gli sperimentatori non conoscano completamente lo stato del sistema e, se lo conoscessero completamente, potrebbero prevedere con certezza gli esiti delle misure. In questo senso la probabilit` a quantistica sarebbe semplicemente di natura epistemica. Nell’interpretazione standard della MQ, la cosiddetta interpretazione di Copenaghen, la stocasticit`a degli esiti delle misure `e assunta invece come un fatto fondamentale della natura dei sistemi quantistici. Esistono comunque interessanti tentativi di interpretazione della fenomenologia quantistica basati su formalismi alternativi (le cosiddette formulazioni in termini di variabili nascoste) [Bon97]. In tali approcci la stocasticit` a `e spiegata come dovuta ad una incompleta informazione da parte dello sperimentatore sul reale stato fisico del sistema che `e descritto da pi` u variabili (ed in modo molto diverso) rispetto a quelle usate nella formulazione standard. Nessuno di tali tentativi (malgrado alcuni siano veramente notevoli, come la teoria di Bohm) `e risultato fino ad oggi veramente soddisfacente, tanto da essere un vero competitore dell’interpretazione e della formulazione standard della MQ quando si considerino anche le teorie quantistiche relativistiche e la teoria dei campi quantistica relativistica in particolare. Bisogna anche sottolineare che, non `e comunque possibile costruire una teoria fisica completamente classica (includendo le teorie relativistiche non quantistiche tra le teorie classiche) che possa spiegare completamente la fenomenologia sperimentale dei sistemi quantistici. Per essere in accordo con i dati sperimentali noti, le variabili nascoste devono comunque soddisfare un requisito di contestualit` a piuttosto inusuale nelle teorie classiche e, ogni teoria che spieghi la fenomenologia quantistica, inclusa la stessa MQ, deve essere non locale [Bon97]. In effetti, come discuteremo nella sezione 12.3.2, in seguito all’analisi teorica di Einstein, Podolsky e Rosen prima e Bell poi, gli esperimenti hanno provato l’esistenza di correlazioni tra esiti di misure che avvengono in regioni distinte dello spazio ed in periodi di tempo tanto brevi che non e possibile la trasmissione di informazione, tra i due eventi, tramite qualunque mezzo fisico che si muova ad una velocit` a non superiore a quella della luce nel vuoto. ` implicito in QM1 e QM2 che i sistemi fisici interessanti nella fenomeno(3) E logia e teoria quantistica vengano divisi in due grandi categorie: gli strumenti di misura ed i sistemi quantistici. Nella formulazione di Copenaghen si assume che gli strumenti di misura siano sistemi che soddisfino alle leggi della fisica classica. Queste assunzioni che corrispondono a dati di fatto sperimentali e che sono, a dire il vero, piuttosto rozze dal punto di vista teorico, sono alla
256
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
base dell’interpretazione del formalismo e non si riesce a dire molto altro nel corpus della formulazione standard. Per esempio non `e, per il momento, chiaro dove si situi la linea di confine tra sistemi classici e quantistici, nemmeno come questa linea possa essere descritta all’interno del formalismo e nemmeno se il sistema costituito dall’apparato di misura e dal sistema quantistico possa essere a sua volta considerato come un sistema quantistico pi` u grande e trattato all’interno del formalismo. Infine, il processo fisico dell’interazione tra strumento di misura e sistema quantistico che fornisce l’esito della misura non `e descritto all’interno del formalismo quantistico standard come un processo dinamico. Rimandiamo a [Bon97, Des80], ed anche all’ottima sezione dedicata agli aspetti fondazionali delle teorie quantistiche nella Stanford Encyclopedia of Philosophy1 , per una discussione su tali interessanti e difficili argomenti.
7.2 Stati classici come misure di probabilit` a sulla σ-algebra delle proposizioni elementari Vediamo ora come la nozione di misura (di Borel) di probabilit`a possa essere usata per rappresentare gli stati fisici dei sistemi classici. Un’estensione di tale nozione verr`a impiegata nel seguito per dare una descrizione matematica degli stati dei sistemi quantistici. Simili approcci si trovano in [Mac63] e in [Mar82]. 7.2.1 Misure di probabilit` a, misure di Borel La trattazione formale moderna del calcolo delle probabilit` a, dovuta a Kolmogorov, si traduce nello studio delle misure di probabilit` a. Definizione 7.2. Una misura positiva σ-additiva, μ, sullo spazio misurabile (X, Σ) `e detta misura di probabilit` a se μ(X) = 1. Il caso pi` u semplice di misura di probabilit`a su (X, Σ) `e sicuramente la misura di Dirac δx concentrata in x ∈ X, che `e definita come: δx (E) = 0 se x ∈ E
e
δx (E) = 1 se x ∈ E, per ogni E ∈ Σ.
Nel seguito lavoreremo con misure di Borel. Ricordiamo a tal fine le seguenti nozioni, che risulteranno utili in tutto il resto del libro. Abbiamo gi` a usato queste nozioni in alcuni esempi, ma dato che le useremo esplicitamente per costruire la teoria, enunciamo le relative definizioni formalmente. Definizione 7.3. Sia X uno spazio topologico. (a) La σ-algebra di Borel di di X, B(X), `e la pi` u piccola (nel senso dell’intersezione) σ-algebra che contiene gli aperti di X. (b) Gli elementi di B(X) si dicono boreliani o insiemi di Borel di X. (c) f : X → C `e detta essere Borel misurabile se `e misurabile rispetto a B(X) e B(C), in altre parole, se f −1 (E) ∈ B(X) per ogni E ∈ B(C). 1
http://plato.stanford.edu/
7.2 Stati classici come misure di probabilit` a
257
Ovviamente, in (c), B(C) `e riferita alla topologia standard su C e la definizione include il caso in cui f sia a valori in R. Definizione 7.4. Se X `e uno spazio topologico di Hausdorff e localmente compatto, una misura di Borel su X `e una misura positiva σ-additiva definita su B(X). 7.2.2 Stati come misure Consideriamo un sistema fisico classico con n gradi di libert` a spaziali e quindi 2n gradi di libert` a complessivi, tenendo conto anche dei gradi di libert` a cinetici (le “velocit`a”). La formulazione hamiltoniana [FaMa94, CCP82] della dinamica del sistema, molto sommariamente, si esplicita come segue. (i) Lo spazio ambiente `e lo spaziotempo delle fasi, Hn+1 . Si tratta di una variet` a differenziabile di dimensione 2n + 1 data dall’unione disgiunta2 di sottovariet` a embedded 2n-dimensionali, Ft , etichettate differenziabilmente da t ∈ R: , Hn+1 = Ft , t∈R
(ii) il parametro t ∈ R `e il tempo, ogni Ft `e lo spazio delle fasi al tempo t e ogni punto di Ft rappresenta uno stato del sistema al tempo t, (iii) Hn+1 `e dotato di un atlante di sistemi di coordinate locali dette coordinate simplettiche: t, q 1 , . . . , q n , p1 , . . . , pn (dove le coordinate q 1 , . . . , q n , p1 , . . . , pn sono coordinate sulle Ft ) rispetto alle quali le equazioni differenziali di evoluzione del sistema prendono la forma di Hamilton: dq k ∂H(t, q(t), p(t)) = k = 1, 2, . . ., n , dt ∂pk ∂H(t, q(t), p(t)) dpk =− k = 1, 2, . . . , n , dt ∂q k
(7.1) (7.2)
dove H `e la funzione hamiltoniana del sistema nelle coordinate locali considerate, che `e assegnata quando `e noto il sistema fisico. In questa rappresentazione, l’evoluzione temporale del sistema `e descritta dalle curve integrali delle equazioni differenziali di Hamilton rappresentate sopra. Ogni curva integrale determina, per ogni fissato istante di tempo t ∈ R, un punto (t, s(t)) ∈ Hn+1 con s(t) ∈ Ft , in cui la curva interseca Ft . s(t) `e lo stato del sistema al tempo t. 2
Precisamente Hn+1 `e una variet` a fibrata con base R, l’asse del tempo e fibre Ft , date da variet` a simplettiche 2n dimensionali. Inoltre esiste un atlante su Hn+1 le cui carte locali hanno coordinate, t, q1 , . . . , qn , p1 , . . . , pn , dove t `e la coordinata naturale sulla base R e le rimanenti 2n coordinate definiscono una carta locale simplettica sulle Ft .
258
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
In taluni casi fisicamente importantissimi, per esempio in meccanica statistica o termodinamica statistica, lo stato del sistema non `e noto con certezza e quindi non `e nota con certezza l’evoluzione del sistema. In tali situazioni si adoperano descrizioni in termini di insiemi statistici [CCP82, FaMa94]: non si considera un unica copia del sistema fisico, ma un insieme statistico di copie identiche ed indipendenti di esso, con stati distribuiti su ogni Ft secondo una certa densit`a di probabilit` a, localmente rappresentabile come una funzione ρ = ρ(t, q, p) di classe C 1 . L’evoluzione temporale di tale densit`a `e fissata dalla richiesta che essa soddisfi l’equazione di Liouville: ∂ρ + ∂t n
i=1
∂ρ ∂H ∂H ∂ρ − i ∂q i ∂pi ∂q ∂pi
=0.
(7.3)
ρ(t, s), con s ∈ Ft , rappresenta dunque la densit` a probabilit` a che il sistema fisico si trovi nello stato s al tempo t. L’interpretazione di ρ richiede che, per ogni t: ρ(t, s) ≥ 0 e
Ft
ρ dμt = 1 ,
(7.4)
dove la misura μt su B(Ft ), `e definita richiedendo che, su ogni carta locale simplettica di Ft , sia la misura di Lebesgue dq 1 · · · dq n dp1 · · · dpn (estesa ` un fatto noto come teorema di con una partizione dell’unit` a a tutto Ft ). E Liouville che, con tale scelta di μt in ogni spazio delle fasi, il valore dell’integrale in (7.4) non dipende da t ∈ R, quando ρ soddisfa (7.3) [FaMa94, CCP82]. Nel caso in cui si lavori con insiemi statistici, la densit`a ρt `e comunque pensata come lo stato del sistema al tempo t, anche se questa accezione di stato `e un’estensione della precedente. Noi seguiremo questa convenzione, distinguendo tra stato sharp individuato da punti r(t) ∈ Ft e stato probabilistico individuato da una densit` a di Liouville ρt su Ft . In entrambi i casi lo stato al tempo t `e pensabile come una misura di Borel di probabilit` a {νt }t∈R definita sullo spazio delle fasi Ft . Precisamente: (i) per uno stato probabilistico3 νt (E) := E ρ(t, s)dμt se E ∈ B(Ft ), (ii) per uno stato sharp νt := δr(t) . Osservazione 7.5. Per rappresentare gli stati del sistema al tempo t in modo del tutto generale, tralasciando il problema dell’evoluzione dello stato ed abbandonando la formulazione hamiltoniana standard, si potrebbe lavorare su variet`a topologiche Ft invece che differenziabili. Gli stati (al tempo t) potrebbero comunque essere rappresentati in termini di misure di probabilit`a rispetto alla σ-algebra di Borel. La richiesta dell’esistenza di una topologia su Ft `e intrinsecamente connessa con l’esistenza di “intorni” dei punti di tale 3
Ft `e una variet` a differenziabile e quindi `e uno spazio di Hausdorff localmente compatto (in quanto localmente omeomorfo a Rn ). Essendo μt definita su B(Ft) ed essendo ρt continua, νt `e ben definita su B(Ft).
7.2 Stati classici come misure di probabilit` a
259
insieme, dovuti alla presenza di errori di misura sperimentali, rimpicciolibili a piacere, ma non annullabili. Pi` u precisamente, la richiesta di poter distinguere i punti di Ft malgrado l’esistenza di errori di misura, viene tradotta matematicamente con la richiesta che la topologia di Ft sia di Hausdorff (come d’altronde `e richiesto per definizione nelle variet` a differenziabili). 7.2.3 Proposizioni, insiemi e stati come misure su di esse Se ammettiamo che la descrizione hamiltoniana del nostro sistema fisico contenga tutte le propriet` a fisiche del sistema, tutte le proposizioni sul sistema che al tempo t sono vere o false, o sono vere con una certa probabilit` a, devono poter essere descritte nello spazio delle fasi al tempo t, Ft , in qualche modo. Inoltre, il valore di verit` a di tali proposizioni, ovvero la probabilit` a che siano vere, devono potersi ottenere dallo stato νt del sistema. Un modo naturale di fare tutto ci`o `e il seguente. Prima di tutto osserviamo che ogni proposizione P individua un insieme di Ft , che contiene tutti e soli i punti di Ft (pensati come stati sharp sistema) che la rendono vera (al tempo t). Indicheremo tale insieme ancora con P ⊂ Ft . Poi mettiamoci nel caso in cui si lavora con uno stato sharp e quindi νt sia una misura di Dirac. In questo caso, la proposizione P sar`a vera al tempo t se e solo se il punto r(t) che descrive lo stato al tempo t appartiene all’insieme P . L’osservazione cruciale `e ora che, se assegniamo convenzionalmente il valore 0 ad una proposizione falsa al tempo t e 1 ad una vera allo stesso tempo, tutto riferito allo stato νt = δr(t) , il valore di verit` a della proposizione P , quando lo stato `e νt , `e calcolabile come νt (P ), pensato come misura dell’insieme P ⊂ Ft secondo la misura (di Dirac) νt . Questo fatto chiarisce il significato operativo della misura di Dirac νt pensata come stato del sistema al tempo t. Ulteriormente, la stessa interpretazione pu` o essere usata quando lo stato sia probabilistico: νt (P ) rappresenta la probabilit` a che la proposizione P ⊂ Ft sia vera al tempo t quando lo stato `e lo stato probabilistico νt . Osservazioni 7.6. ` chiaro che tutto quanto detto ha senso se gli insiemi P appartengono (1) E alla σ-algebra su cui sono definite le misure νt . Tale σ-algebra `e quella di Borel ed `e pertanto ragionevolmente grande. (2) Una stessa proposizione pu`o essere formulata in modi differenti ma equivalenti. Nell’identificare proposizioni con insiemi di Ft noi stiamo esplicitamente assumendo che: se due proposizioni individuano lo stesso sottoinsieme di Ft si devono considerare come la stessa proposizione. 7.2.4 Interpretazione insiemistica dei connettivi logici Prese due proposizioni P e Q, possiamo comporle con connettivi logici per costruire altre proposizioni. In particolare possiamo considerare la proposizione costruita con la disgiunzione, P OQ, e la proposizione costruita con
260
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
la congiunzione, P EQ. Con una sola proposizione possiamo costruirne la negazione P . Possiamo interpretare queste proposizioni in termini di insiemi della σalgebra di Borel su Ft : (i) la disgiunzione P O Q corrisponde a P ∪ Q, (ii) la congiunzione P E Q corrisponde a P ∩ Q, (iii) la negazione P corrisponde a Ft \ P . ` possibile mettere un ordinamento parziale in ogni classe di sottoinsiemi di E Ft usando l’inclusione insiemistica: P ≤ Q se e solo se P ⊂ Q. L’interpretazione pi` u naturale a livello di proposizioni del fatto che P ⊂ Q `e semplicemente che Q `e conseguenza logica di P , ossia P ⇒ Q . Osservazioni 7.7. (1) La probabilt` a che siano vere queste proposizioni composte pu`o essere calcolata usando la misura νt in quanto le operazioni insiemistiche che corrispondono a O, E, sono operazioni rispetto alle quali ogni σ-algebra `e chiusa. (2) Si verifica facilmente che se νt `e una misura di Dirac, il valore di probabilit` a (che ricordiamo essere solo 0 o 1 in questo caso) assegnato a ciascuna delle espressioni composte di sopra, coincide con il valore di verit`a calcolato tramite le tavole di verit` a del connettivo logico usato. Per esempio, P OQ `e vera (cio`e νt (P ∪ Q) = 1) se e solo se almeno una delle due proposizioni costituenti `e vera (cio`e se e solo se νt (P ) = 1 o νt (Q) = 1); infatti il punto p su cui `e concentrata la misura di Dirac δx = νt cade in P ∪ Q se e solo se x cade in almeno uno dei due insiemi P e Q. 7.2.5 Proposizioni “infinite” e grandezze fisiche Solitamente nel calcolo proposizionale non si considerano delle proposizioni composte contenenti infinite proposizioni ed infiniti connettivi logici come P1 O P2 O . . .. L’interpretazione delle proposizioni e dei connettivi in termini di elementi e operazioni in una σ-algebra permette per`o di “maneggiare” tali proposizioni infinite. Possiamo legare, almeno alcune, di tali proposizioni a grandezze fisiche misurabili sul sistema. In via del tutto generale, possiamo considerare le grandezze fisiche definite sul nostro sistema hamiltoniano come qualche classe di funzioni regolari in qualche senso, definite sullo spaziotempo delle fasi ed a valori reali: f : Hn+1 → R. Una scelta molto generale per il requisito di regolarit` a si ha prendendo tutta la classe delle funzioni le cui restrizioni ad ogni Ft siano Borel-misurabili. Si possono fare delle scelte meno radicali, considerando, per esempio, solo la classe delle funzioni continue, oppure di classe C 1 oppure, addirittura, solamente di classe C ∞ . Dal punto di vista fisico sembrerebbe naturale richiedere che le grandezze fisiche siano descritte da funzioni almeno continue, per il fatto che le misure sono sempre affette da errori sperimentali nel determinare il punto di Ft che rappresenta lo stato del sistema al tempo t: se le funzioni non sono continue, piccoli errori di misura possono provoca-
7.2 Stati classici come misure di probabilit` a
261
re grandi variazioni sui valori delle grandezze. Tuttavia bisogna tenere anche conto del fatto che vi possono essere grandezze che assumono valori discreti, per le quali la critica di sopra non si applica (i valori si possono distinguere usando strumenti sufficientemente, ma non infinitamente, precisi). Dato che siamo interessati al passaggio al caso quantistico piuttosto che ad un’analisi del caso classico, non faremo un’analisi accurata di questa problematica. Ci restringiamo ora a lavorare ad un tempo fissato t, per cui le grandezze fisiche che considereremo saranno funzioni f : Ft → R Borel-misurabili. Se f : Ft → R `e una grandezza fisica valutabile sul sistema fisico (al tempo t), possiamo costruire con essa delle proposizioni del tipo: (f)
PE = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel E ⊂ R” . Il fatto di considerare insiemi di Borel E e non solo, per esempio, intervalli aperti oppure singoli punti, consente di trattare sullo stesso piano grandezze che assumono valori continui e grandezze che assumo valori discreti e tenere anche conto del fatto che gli esiti degli strumenti di misura sono di fatto insiemi e non singoli punti, a causa della precisione finita dello strumento. In effetti, in B(R) cadono gli insiemi chiusi, insiemi contenenti quantit`a finite e numerabili di punti, ecc. In termini insiemistici, la proposizione sar` a associata ad un insieme boreliano di Ft , che indicheremo ancora con lo stesso simbolo della proposizione: (f) PE = f −1 (E) ⊂ Ft . (Come precisato sopra, con questa convenzione, una volta noto lo stato νt , la (f) (f) probabilit` a che PE sia vera al tempo t per il sistema `e νt (PE ).) Consideriamo un intervallo [a, b) con b ≤ +∞. Possiamo decomporre tale intervallo nell’unione disgiunta di una infinit` a di sotto intervalli: [a, b) = ∪∞ [a , a ) dove a := a ed inoltre a < a i i+1 1 i i+1 ed infine ai → b i=1 ` chiaro allora che la proposizione: per i → ∞. E (f)
P[a,b) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [a, b)” , pu` o essere decomposta in una disgiunzione infinita di proposizioni ciascuna della forma: (f) P[ai ,ai+1 ) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [ai , ai+1 )” .
262
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili (f)
(f)
+∞ P[a,b) = Oi=1 P[ai ,ai+1 ) , (f)
che corrisponde alla decomposizione dell’insieme P[a,b) nell’unione disgiunta: (f)
(f)
P[a,b) = ∪+∞ i=1 P[ai ,ai+1 ) . Quindi vediamo che ha senso fisico assumere l’esistenza di, almeno alcune, proposizioni sul sistema costruite con infiniti connettivi logici ed infinite sotto proposizioni. Per dualit` a rispetto alla negazione, che trasforma la disgiunzione O in congiunzione E, se assumiamo che l’insieme delle proposizioni ammissibili sia chiuso rispetto alla negazione , dobbiamo assumere come fisicamente sensate anche proposizioni infinite costruite con il connettivo E. Il fatto di poter rappresentare le proposizioni come insiemi di una σ-algebra e quindi poterne calcolare la probabilit` a che siano vere su uno stato del sistema tramite la misura corrispondente, suggerisce di assumere che abbiano senso fisico proposizioni costruite con un’infinit` a numerabile connettivi logici di tipo O oppure un’infinit` a numerabile di connettivi logici di tipo E, perch´e gli insiemi corrispondenti sono ancora elementi della σ-algebra, che appunto `e chiusa rispetto all’unione ed all’intersezione numerabile di insiemi. Per avere una struttura “isomorfa” a quella di σ-algebra costituita da proposizioni insieme ai connettivi logici O, E, , dobbiamo includere tra le proposizioni fisiche ancora due proposizioni che corrispondono agli insiemi ∅ e Ft rispettivamente. Tali proposizioni evidentemente sono quella sempre falsa (ovvero con probabilit` a 0 di essere vera per qualsivoglia stato) che indicheremo con 0 e quella sempre vera (ovvero con probabilit`a 1 di essere vera per qualsivoglia stato) che indicheremo con 1. Una volta identificate le proposizioni con insiemi, la struttura di σ-algebra ci permette di dichiarare che: l’insieme delle proposizioni elementari P relative al sistema fisico considerato, insieme ai connettivi logici O, E, , costituiscano una struttura “isomorfa” ad una σ-algebra. Il valore di verit` a, per stati sharp, oppure la probabilit` a che una proposizione P sia vera, per stati probabilistici, per un fissato stato del sistema al tempo t `e νt (P ) dove ora P ⊂ Ft `e l’insieme associato alla proposizione. (Tutto ci` o `e indipendente dal fatto che una proposizione sia “normale” o costituita con infiniti connettivi logici.) Osservazione 7.8. Ci si pu` o chiedere se la σ-algebra associata all’insieme di tutte le proposizioni sul sistema corrisponda alla σ-algebra di Borel di Ft o ` chiaro che, se si assume che ogni funzione reale misurabile sia pi` u piccola. E limitata definita su Ft sia una grandezza fisica, allora la risposta `e positiva, perch´e tra queste funzioni ci sono le funzioni caratteristiche di ogni insieme misurabile di Ft .
7.2 Stati classici come misure di probabilit` a
263
7.2.6 Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle proposizioni elementari Useremo nel seguito alcune nozioni elementari relative alla teoria degli insiemi parzialmente ordinati che supporremo nota al lettore. Tali nozioni sono comunque richiamate in appendice al libro. Nel caso di sistemi fisici classici possiamo identificare proposizioni con insiemi e pensare gli stati come misure su tali insiemi. Per il passaggio al caso quantistico in cui non esiste lo spazio delle fasi, `e importante farsi la domanda che segue. Esistono strutture matematica in qualche senso “isomorfe” ad una σ-algebra che non siano σ-algebre di insiemi? La risposta `e positiva e si ricava dalla teoria dei reticoli. Definizione 7.9. Un insieme parzialmente ordinato (X, ≥) `e detto reticolo quando soddisfa i due seguenti requisiti: (a) per ogni coppia x, y ∈ X esiste sup{a, b}, (b) per ogni coppia x, y ∈ X esiste inf{a, b}. Osservazioni 7.10. (1) Nella teoria dei reticoli sup{a, b} si indica con a∨ b e inf{a, b} si indica con ` importante notare che in un reticolo esistono inf{a, b} e sup{a, b} con a ∧ b. E anche se a e b non sono confrontabili, cio`e non vale a ≤ b oppure b ≤ a. Si prova facilmente che i seguenti tre fatti sono equivalenti: a ∧ b = a , a ∨ b = b , a ≤ b. (2) Si osservi che per ogni reticolo X, dalla definizione di inf e sup, seguono le propriet` a associative: per ogni terna a, b, c ∈ X, (a ∧ b) ∧ c = a ∧ (b ∧ c) , (a ∨ b) ∨ c = a ∨ (b ∨ c) , per cui, per esempio, si pu` o scrivere a ∨ b ∨ c ∨ d e a ∧ b ∧ c ∧ d senza ambiguit`a. (3) Valgono anche le propriet` a di simmetria: a∨b = b∨a, a∧b = b∧a, per ogni coppia a, b ∈ X. Di conseguenza, per esempio a ∨ b ∨ c = c ∨ a ∨ b ∨ a. Esistono diversi tipi di reticoli, la seguente definizione ne classifica alcuni. Definizione 7.11. Un reticolo (X, ≥) si dice: (a) distributivo se valgono le leggi distributive tra ∨ e ∧, per ogni terna a, b, c ∈ X: a ∨ (b ∧ c) = (a ∨ b) ∧ (a ∨ b) , a ∧ (b ∨ c) = (a ∧ b) ∨ (a ∧ b) ;
264
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(b) limitato se ammette minimo e massimo, indicati con 0 e 1 rispettivamente; (c) ortocomplementato se `e limitato ed `e dotato di un’applicazione X a → ¬a, dove ¬a `e detto ortocomplemento di a, che soddisfa: (i) a ∨ ¬a = 1 per ogni a ∈ X, (ii) a ∧ ¬a = 0 per ogni a ∈ X, (iii) ¬(¬a) = a per ogni a ∈ X, (iv) se a ≥ b allora ¬b ≥ ¬a per ogni coppia a, b ∈ X. (d) σ-completo, se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo superiore che viene denotato con ∨n∈N an . Un reticolo che soddisfi (a), (b) e (c) `e detto algebra di Boole. Un’algebra di Boole che soddisfi (d) `e detta algebra di Boole σ-completa ovvero, equivalentemente, σ-algebra di Boole. Definizione 7.12. Se X e Y sono algebre di Boole, un’applicazione h : X → Y `e detta omomorfismo di algebre di Boole se soddisfa: h(a ∨ b) = h(a) ∨ h(b) , per ogni coppia a, b ∈ X h(¬a) = ¬h(a) , per ogni a ∈ X . Se X e Y sono σ-algebre di Boole, un omomorfismo di algebre di Boole h : X → Y `e detto omomorfismo di σ-algebre di Boole se soddisfa: h(∨n∈N an ) = ∨n∈Nh(an )
per ogni insieme numerabile {an }n∈N ⊂ X .
Un omomorfismo biettivo di algebre di Boole (σ-algebre di Boole) `e detto isomorfismo di algebre di Boole (rispettivamente di σ-algebre di Boole). Le nozioni di sotto reticolo, sotto algebra di Boole, sotto σ-algebra di Boole sono definite nel solito modo, cio`e come un sottoinsieme della struttura di partenza che continui ad avere la stessa struttura se dotato della restrizione della relazione d’ordine e, se `e il caso, dello stesso massimo 1 e minimo 0 della struttura iniziale. Osservazioni 7.13. (1) Si verifica che per ogni algebra di Boole X, se a ∈ X allora ¬a `e l’unico elemento a soddisfare (i) e (ii) di (c) nella definizione 7.11. Da questo risultato si prova che valgono le identit` a di De Morgan: per ogni a, b ∈ X, ¬(a ∨ b) = ¬a ∧ ¬b ,
(7.5)
¬(a ∧ b) = ¬a ∨ ¬b .
(7.6)
(2) Dalla stessa definizione di inf e sup si verifica che un’algebra di Boole `e σ-completa se e solo se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo inferiore. Tale estremo inferiore viene denotato con ∧n∈N an e vale ∧n∈Nan = ¬(∨n∈N¬an ) da cui anche ∨n∈Nan = ¬(∧n∈N ¬an ).
7.2 Stati classici come misure di probabilit` a
265
(3) Se h : X → Y `e un omomorfismo di algebre di Boole, dalle identit` a di De Morgan si prova subito che: h(a ∧ b) = h(a) ∧ h(b) ,
per ogni coppia a, b ∈ X .
Nello stesso modo si ha subito che h(1) = 1 e h(0) = 0. (Per esempio h(1) = h(a ∨ ¬a) = h(a) ∨ ¬h(a) = 1.) (4) Usando il fatto che a ∨ b = b se e solo se a ≤ b, si ha che un omomorfismo di algebre di Boole h : X → Y preserva l’ordinamento: se per a, b ∈ X vale a ≤ b, allora vale anche h(a) ≤ h(b) . (5) Usando (2) si ha facilmente che, se h : X → Y `e un omomorfismo di σ-algebre di Boole, allora: h(∧n∈N an ) = ∧n∈N h(an )
per ogni insieme numerabile {an }n∈N ⊂ X . (7.7)
(6) Si prova facilmente che, se h : X → Y `e un isomorfismo di (σ-)algebre di Boole, allora h−1 : Y → X `e un isomorfismo di (σ-)algebre di Boole. In base alle definizioni date risulta ovvio che valgono le seguenti proposizioni. Proposizione 7.14. Ogni σ-algebra su un insieme X `e un’algebra di Boole (ossia un reticolo distributivo, limitato, ortocomplementato), σ-completa in cui: (i) la relazione d’ordine `e l’inclusione insiemistica (e quindi ∨ corrisponde a ∪ e ∧ corrisponde a ∩), (ii) il massimo ed il minimo dell’algebra di Boole sono X e ∅, (iii) l’operazione di ortocomplemento corrisponde al complemento insiemistico rispetto allo spazio X. Proposizione 7.15. Siano Σ, Σ due σ-algebre su X e X rispettivamente e f : X → X una funzione misurabile. Valgono i due seguenti fatti. (f) (a) Gli insiemi PE := f −1 (E) , con E ∈ Σ , definiscono una σ-algebra di Boole che `e sotto σ-algebra di Boole di quella definita su X secondo la proposizione 7.14. (f) (b) L’applicazione Σ E → PE `e un omomorfismo di σ-algebre di Boole. Dobbiamo concludere le stesse cose per l’insieme delle proposizioni relative ad un sistema fisico. Proposizione 7.16. Le proposizioni relative ad un sistema fisico costituiscono un reticolo distributivo, limitato, ortocomplementato e σ-completo, cio`e una σ-algebra di Boole, in cui: (i) la relazione d’ordine corrisponde alla relazione di conseguenza logica, (ii) il massimo ed il minimo sono la proposizione sempre vera 1 e quella sempre falsa 0, (iii) l’operazione di ortocomplemento corrisponde alla negazione. Se f : Ft → R `e una grandezza fisica rappresentata da una funzione Borel misurabile, allora valgono i seguenti fatti.
266
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(a) Al variare di E nella σ-algebra di Borel di R, le proposizioni: (f)
PE = “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , definiscono una σ-algebra di Boole. (f) (b) L’applicazione che associa ad ogni boreliano E ⊂ R la proposizione PE definisce un omomorfismo di σ-algebre di Boole. Osservazione 7.17. Si osservi che da (i) e (iii) segue che la congiunzione deve corrispondere all’intersezione e la disgiunzione all’unione.
7.3 Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali Passiamo finalmente a considerare sistemi quantistici. Cercando di seguire un approccio per quanto possibile vicino al caso classico, vogliamo prima di tutto cercare di dare un modello matematico per la classe delle proposizioni elementari relative ad un sistema quantistico e che possiamo valutare al tempo t eseguendo esperimenti sul sistema con opportuni strumenti di misura, il cui risultato `e un semplice 0 (= proposizione falsa) oppure 1 (= proposizione vera). Non sappiamo ancora come descrivere lo stato quantistico, ma sappiamo qualcosa, QM1 e QM2, riguardo alle grandezze quantistiche misurabili sul sistema quando ne `e assegnato lo stato. Per il momento ci concentreremo su QM2. Sappiamo che esistono gran` immediato concludere che esistono proposizioni incomdezze incompatibili. E patibili: se A e B sono grandezze incompatibili (A)
PJ
=
“Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel J ⊂ R” , (B)
PK
=
“Il valore di B valutata sullo stato del sistema cade nell’insieme di Borel K ⊂ R” , sono in generale proposizioni incompatibili: i valori di verit` a di tali proposizioni si disturbano a vicenda eseguendo la verifica di esse ripetutamente in successione con intervalli di tempo piccoli a piacere (in modo da non imputare il fenomeno all’evoluzione dello stato del sistema). Sappiamo che non esistono apparati di misura in grado di misurare contemporaneamente due
7.3 Proposizioni quantistiche come proiettori ortogonali
267
grandezze incompatibili. Non ha quindi alcun senso fisico, in questa situazione, affermare che le due proposizioni considerate sopra, associate a grandezze fisiche incompatibili, possano assumere sul sistema un valore di verit`a contem(A) (B) poraneamente. Le due proposizioni PJ e PK , in questo senso, sono dette incompatibili. Osservazione importante. Deve essere ben chiaro che quindi incompatibili (A) (B) non significa qui che le due proposizioni PJ e PK non possono essere vere contemporaneamente, per cui, per esempio, la loro congiunzione `e sempre falsa. Significa molto pi` u fortemente, che non ha senso (fisico) attribuire ad esse qualsiasi valore di verit` a contemporaneamente. Tale valore di verit` a non pu` o nemmeno essere definito con una procedura di limite misurando successivamente in sequenza le due proposizioni, perch´e esse “si disturbano reciprocamente” nel senso precisato. (A) (B) Infine non p `ossibile dare significato fisico a proposizioni del tipo PJ O PK (A) (B) oppure PJ E PK perch´e non esiste alcun modo sperimentale per attribuire valori di verit` a a tali proposizioni. In virt` u di quanto appena osservato, non possiamo assumere, come modello dell’insieme delle proposizioni elementari testabili sul nostro sistema quantistico, un qualche reticolo (o σ-algebra) di insiemi in cui la disgiunzione e la congiunzione sono sempre possibili. Dovremmo imporre degli ulteriori vincoli su tale modello, vietando certe combinazioni. Un’idea alternativa dovuta a von Neumann, che si `e rivelata vincente, `e quella di modellizzare le proposizioni elementari tramite i proiettori ortogonali di uno spazio di Hilbert. 7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert L’insieme dei proiettori ortogonali su uno spazio di Hilbert gode di alcune interessantissime propriet`a, molto vicine a quelle dei reticoli booleani, ma con alcune importanti differenze che consentono di modellizzare le proposizioni incompatibili di sistemi quantistici. Non esamineremo la questione a fondo, ma discuteremo solo alcune propriet`a importanti. Prima di tutto notiamo alcune propriet` a molto interessanti che riguardano coppie di proiettori che commutano tra di loro. Proposizione 7.18. Sia (H, ( | )) uno spazio di Hilbert e sia P(H) l’insieme dei proiettori ortogonali su H. Valgono le propriet` a che seguono per ogni coppia P, Q ∈ P(H). (a) I seguenti fatti sono equivalenti: (i) P ≤ Q, (ii) P (H) `e sottospazio di Q(H), (iii) P Q = P , (iv) QP = P .
268
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(b) I seguenti fatti sono equivalenti: (i) P Q = 0, (ii) QP = 0, (iii) P (H) e Q(H) sono ortogonali. Se valgono (i), (ii) e (iii), P + Q `e proiettore ortogonale e proietta su P (H) ⊕ Q(H). (c) Se P Q = QP allora P Q `e proiettore ortogonale e proietta su P (H)∩Q(H). (d) Se P Q = QP allora P + Q − P Q `e proiettore ortogonale e proietta sul sottospazio chiuso < P (H), Q(H) >. Dimostrazione. (a) Prima di tutto notiamo che se P `e un proiettore che proietta su M, allora P u = 0 se e solo e u ∈ M⊥ a causa della decomposizione diretta ortogonale H = M ⊕ M⊥ ((d) in teorema 3.14) e tenendo conto che il componente di u in M `e proprio P u. (i) ⇒ (ii). Se P ≤ Q allora (u|Qu) ≥ (u|P u) ovvero essendo i proiettori idempotenti ed autoaggiunti: (Qu|Qu) ≥ (P u|P u) che si pu`o anche scrivere come ||Qu|| ≥ ||P u||. Quindi in particolare Qu = 0 implica P u = 0 ovvero Q(H)⊥ ⊂ P (H)⊥ . Usando (e) di teorema 3.14 e notando che Q(H) e P (H) sono chiusi, troviamo infine che P (H) ⊂ Q(H). (ii) ⇒ (iii). Se S `e una base hilbertiana per P (H) la si completi a base per Q(H) aggiungendo l’insieme S di vettori ora conto ortogonali a S. Si tenga che, per (d) di proposizione 3.53, P = s- u∈S u(u| ) e Q = s- u∈S∪S u(u| ). Dall’ortogonalit` a di S e S , dal fatto che ciascuno di essi `e insieme ortonormale e infine dalla continuit` a del prodotto scalare segue immediatamente la tesi per controllo diretto. (iii) ⇔ (iv). Si ottengono una dall’altra prendendo l’aggiunto ad ambo membri. (iii) e (iv) ⇒ (i). Se u ∈ H, (u|Qu) = ((P + P ⊥)u|Q(P + P ⊥)u) dove P ⊥ = I − P . Notiamo che P e P ⊥ commutano con Q per (iii) e (iv) inoltre P P ⊥ = P ⊥ P = 0. Sviluppando il secondo membro di (u|Qu) = (u|(P + P ⊥ )Q(P + P ⊥ )u) si ha, tenendo conto che alcuni termini sono nulli per quanto appena detto: (u|Qu) = (u|P QP u) + (u|P ⊥QP ⊥u) . D’altra parte, per (iii) e (iv): (u|P QP u) = (u|P P u) = (u|P u). Concludiamo che: (u|Qu) = (u|P u) + (u|P ⊥QP ⊥u) , e quindi (u|Qu) ≥ (u|P u). (b) Supponiamo P Q = 0, prendendo l’aggiunto si ha che QP = 0, quindi si verifica immediatamente che P (H) e Q(H) sono ortogonali essendo P Q = QP = 0. Se P (H) e Q(H) sono ortogonali, prendiamo in ciascuno di tali spazi una base hilbertiana N e N rispettivamente, scrivendo i pro iettoriP e Q come indicato in (d) di proposizione 3.53: P = u∈N (u| )u, Q = u∈N (u| )u, si ricava immediatamente che P Q = QP = 0. Usando le
7.3 Proposizioni quantistiche come proiettori ortogonali
269
espressioni di P e Q scritte sopra, tenendo conto che N ∪ N `e una base hilbertiana per P (H) ⊕ Q(H) ed usando ancora (d) di proposizione 3.53 si ricava che P + Q `e il proiettore ortogonale che proietta su P (H) ⊕ Q(H). (c) Il fatto che P Q sia proiettore ortogonale (cio`e autoaggiunto ed idempotente) se P Q = QP dove P e Q sono proiettori ortogonali `e di immediata verifica. Se u ∈ H, P Qu ∈ P (H), ma anche P Qu = QP u ∈ Q(H) e quindi P Qu ∈ P (H) ∩ Q(H). Abbiamo provato che P Q(H) ⊂ P (H) ∩ Q(H), per concludere basta provare che P (H) ∩ Q(H) ⊂ P Q(H). Se u ∈ P (H) ∩ Q(H) allora P u = u e Qu = u e quindi vale anche P u = P Qu = u ossia u ∈ P Q(H). Questo significa che se P (H) ∩ Q(H) ⊂ P Q(H). (d) Il fatto che R := P + Q − P Q sia proiettore ortogonale `e di immediata verifica. Consideriamo lo spazio < P (H), Q(H) >. Possiamo costruire una base hilbertiana per tale spazio come segue. Per prima cosa costruiamo una base hilbertiana N per il sottospazio chiuso P (H) ∩ Q(H). Quindi aggiungiamo a questa una seconda base hilbertiana per lo spazio che “rimane in P (H) una volta tolto P (H) ∩ Q(H)”, cio`e costruiamo una base hilbertiana N per lo spazio chiuso ortogonale in P (H) a P (H) ∩ Q(H): P (H) ∩ (P (H) ∩ Q(H))⊥ . Infine costruiamo, con lo stesso criterio, una terza base hilbertiana N per ` facile convincersi che le tre basi sono a due a due Q(H) ∩ (P (H) ∩ Q(H))⊥ . E ortogonali e insieme costituiscono una base per < P (H), Q(H) >. Tutto ci` o mostra che vale la decomposizione diretta ed ortogonale < P (H), Q(H) > = (P (H) ∩ Q(H)) ⊕ (P (H) ∩ (P (H) ∩ Q(H))⊥ ) ⊕ (Q(H) ∩ (P (H) ∩ Q(H))⊥ ) . Nelle nostre ipotesi, il proiettore sul primo spazio della decomposizione `e P Q per (c). Il proiettore su (P (H) ∩ Q(H))⊥ `e quindi I − P Q. Quindi, applicando nuovamente (c), il proiettore ortogonale sul secondo addendo della decomposizione `e P (I − P Q) = P − P Q. Similmente, il proiettore sul terzo addendo della decomposizione `e: Q(I − P Q) = Q − P Q . Applicando (b), il proiettore sulla somma diretta ortogonale dei tre spazi detti, cio`e su < P (H), Q(H) > sar`a: P Q + (P − P Q) + (Q − P Q) = P + Q − P Q . Questo conclude la dimostrazione.
In base a quanto dimostrato, consideriamo due proiettori ortogonali P, Q ∈ P(H) che commutano e assumiamo di associare a tali proiettori delle proposizioni sul sistema fisico indicate con le stesse lettere. Se facciamo le associazioni P E Q ←→ P Q , P O Q ←→ P + Q − P Q , P ←→ I − P ,
270
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
i secondi membri delle associazioni scritte sopra sono ancora proiettori ortogonali. Inoltre questi proiettori soddisfano propriet` a formalmente identiche a quelle delle proposizioni costruite con connettivi logici. Per esempio, risulta subito che (P E Q) =P O Q. Infatti: P O Q ←→ (I −P )+(I −Q)−(I −P )(I −Q) = 2I −P −Q−I +P Q+P +Q = I − P Q ←→ (P E Q) ed in tal modo si possono verificare tutte le relazioni che abbiamo scritto precedentemente, quando si lavora con proiettori commutanti. Si osservi ancora che se P e Q commutano e P ≤ Q allora P Q = QP = P e P + Q − P Q = Q. Se pensiamo queste identit`a come identit`a di valori di verit` a, abbiamo una situazione analoga, tenendo conto delle associazioni di sopra, a quanto accade a P E Q e P O Q nelle situazioni in cui Q `e conseguenza logica di P . Per cui possiamo dire che P ≤ Q corrisponde alla situazione in cui Q `e conseguenza logica di P . La differenza sostanziale tra i proiettori ortogonali e le proposizioni di un sistema classico `e per` o la seguente. Se i proiettori P e Q non commutano, allora P Q e P + Q − P Q non sono nemmeno proiettori in generale, per cui le corrispondenze sopra proposte non hanno significato. Tutto ci` o sembra molto interessante per il nostro fine di cercare un modello per le proposizioni dei sistemi quantistici tenendo conto di QM2. L’idea `e che: le proposizioni dei sistemi quantistici siano in corrispondenza biunivoca con proiettori ortogonali in uno spazio di Hilbert in modo tale che: (i) la relazione di conseguenza logica tra proposizioni P e Q (ossia che P ⇒ Q) corrisponda alla relazione P ≤ Q tra i corrispondenti proiettori, (ii) due proposizioni sono compatibili se e solo se i rispettivi proiettori commutano. Osservazione 7.19. Prima di procedere ulteriormente chiariamo un punto sulla natura dei proiettori ortogonali commutanti. Dai punti (a) e (b) della proposizione 7.18 si potrebbe sospettare che gli unici casi in cui due proiettori ortogonali P e Q commutino siano quando: (a) gli spazi su cui proiettano sono uno incluso nell’altro, oppure, (b) gli spazi su cui proiettano sono reciprocamente ortogonali. Mostriamo con un esempio concreto che ci sono altre possibilit` a. Consideriamo lo spazio L2 (R2 , dx ⊗ dy) dove dx e dy sono la misura di Lebesgue sulla retta reale. Consideriamo gli insiemi del piano: A = {(x, y) ∈ R2 | a ≤ x ≤ b}, con a < b fissati, e B = {(x, y) ∈ R2 | c ≤ y ≤ d}, con c < d fissati. Se G ⊂ R2 `e misurabile, definiamo l’operatore lineare: PG : L2 (R2 , dx ⊗ dy) → L2 (R2 , dx ⊗ dy) definito da PG f = χG · f per ogni f ∈ L2 (R2 , dx ⊗ dy), dove χG `e, al solito, la funzione caratteristica di G e · indica il prodotto di funzioni punto per punto.
7.3 Proposizioni quantistiche come proiettori ortogonali
271
L’operatore PG `e un proiettore ortogonale come `e facile provare. Inoltre si verifica subito che: PG(L2 (R2 , dx ⊗ dy)) = {f ∈ L2 (R2 , dx ⊗ dy) | ess supp f ⊂ G} . ` allora immediato verificare che vale PA PB = PB PA = PA∩B , ma: E (a) nessuno dei due spazi di proiezione PA (L2 (R2 , dx ⊗ dy)) e PB 2 (L (R2 , dx ⊗ dy)) `e incluso nell’altro e (b) due spazi di proiezione non sono ortogonali. Se l’idea della corrispondenza tra proposizioni di sistemi quantistici e proiettori ortogonali su un opportuno spazio di Hilbert `e sensata, le similitudini strutturali tra i costrutti con i proiettori ortogonali e quelli dell’algebra di Boole σ-completa delle proposizioni deve valere anche quando si considerino pi` u di due proposizioni. In particolare, ci si aspetta di trovare una struttura di reticolo distributivo, limitato, ortocomplementato (ed eventualmente σ-completo) in qualche insieme opportunamente scelto di proiettori rappresentante propriet` a compatibili a due a due. Il teorema seguente, oltre ad asserire che lo spazio di tutti i proiettori ortogonali `e un reticolo (non distributivo in generale), mostra che `e davvero cos`ı. di proiettori ortogonali a due a due comSe abbiamo un insieme, P(H), mutanti, `e facile provare con il Lemma di Zorn (vedi Appendice A) che esiste e anche un insieme P0 (H) di proiettori ortogonali che include l’insieme P(H) che `e massimale rispetto alla condizione di commutativit`a (cio`e ogni proiettore ortogonale che commuta con gli elementi di P0 (H) `e contenuto in P0 (H)). Teorema 7.20. Sia H spazio di Hilbert. (a) La classe, P(H), dei proiettori ortogonali su H `e un reticolo limitato, ortocomplementato, σ-completo e, in generale, non distributivo. Pi` u precisamente: (i) la relazione d’ordine `e la relazione d’ordine ≥ tra proiettori, (ii) il massimo ed il minimo di P(H) sono: I (operatore identit` a) e 0 (operatore nullo) rispettivamente, (iii) l’operazione di ortocomplemento del proiettore ortogonale P corrisponde a ¬P = I − P . (7.8) (iv) P(H) non `e distributivo se dimH ≥ 2. (b) In P(H) valgono i seguenti ulteriori fatti: (i) se P, Q ∈ P(H) commutano, allora: P ∧ Q = PQ, P ∨ Q = P + Q − PQ,
(7.9) (7.10)
(ii) se {Qn }n∈N ⊂ P(H) `e costituito da elementi a due a due commutanti, allora: ∨n∈N Qn = s- lim Q0 ∨ · · · ∨ Qn , (7.11) n→+∞
∧n∈N Qn = s- lim Q0 ∧ · · · ∧ Qn , n→+∞
indipendentemente dall’ordine con cui si etichettano i Qn .
(7.12)
272
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(c) Sia P0 (H) ⊂ P(H) un insieme di proiettori ortogonali a due a due commutanti e sia P0 (H) massimale rispetto alla condizione di commutativit` a, allora vale quanto segue: (i) P0 (H) `e un reticolo limitato, ortocomplementato, σ-completo e distributivo – ossia una σ-algebra di Boole – rispetto alla relazione d’ordine ≥, (ii) il minimo, il massimo di P0 (H), l’ortocomplemento di elementi di P0 (H), l’estremo inferiore e quello superiore di insiemi al pi` u numerabili di P0 (H), esistono in P0 (H) e coincidono con i corrispondenti elementi calcolati rispetto P(H). (d) Pi` u in generale se P0 (H) ⊂ P(H) `e un insieme di proiettori ortogonali a due a due commutanti, ma non necessariamente massimale, soddisfacente la propriet` a (ii) in (c), allora P0 (H) `e una σ-algebra di Boole rispetto alla relazione d’ordine ≥. Dimostrazione. (a) Ricordiamo che ≥ `e una relazione d’ordine parziale in P0 (H) per (f) di proposizione 3.49. Si tenga quindi conto di (a) di proposizione 7.18, per cui: P ≤ Q se e solo se P (H) ⊂ Q(H) .
(7.13)
In tal modo la relazione d’ordine parziale sui proiettori ortogonali corrisponde biunivocamente a quella dei relativi sottospazi di proiezione. La classe dei sottospazi chiusi di H `e un reticolo: se M, N sono sottospazi chiusi, l’estremo superiore ed inferiore di tale coppia sono rispettivamente M ∨ N = < M, N > e M ∧ N = M ∩ N. Proviamolo. < M, N > `e un sopraspazio chiuso di M ed N per costruzione, inoltre, se L `e un sopraspazio chiuso di M e di N, deve contenerli entrambi e quindi contiene < M, N >, quindi M∨N = < M, N >. M∩N `e un sottospazio chiuso di M ed N per costruzione, inoltre, se L `e un sottospazio chiuso contenuto in M ed N, deve essere contenuto in M ∩ N, quindi M ∧ N = M ∩ N. Passando ai proiettori ed usando (7.13), avremo che se P, Q ∈ P(H), P ∨ Q `e il proiettore ortogonale che proietta su < P (H), Q(H) >, mentre P ∧ Q `e il proiettore ortogonale che proietta su P (H)∩ Q(H). Si osservi che la dimostrazione con le stesse argomentazioni, pu`o essere estesa immediatamente al caso di una famiglia di cardinalit` a qualsiasi di proiettori ortogonali {Pi }i∈I . In tal caso: ∨i∈I Pi `e il proiettore ortogonale che proietta su < {Pi (H)}i∈I > e ∧i∈I Pi `e il proiettore ortogonale che proietta su ∩i∈I Pi (H) per cui il reticolo dei pro` iettori ortogonali e quello dei sottospazi chiusi sono entrambi σ-completi. E chiaro che, nel reticolo dei sottospazi chiusi, il minimo ed il massimo sono, rispettivamente {0} e H. Passando al reticolo dei proiettori ortogonali tramite (7.13), si ha che il minimo ed il massimo sono, rispettivamente, il proiettore ortogonale che proietta su {0}, cio`e l’operatore nullo, ed il proiettore su H che coincide con l’operatore identit`a. L’ortocomplementazione di proiettori ¬P := I − P , corrisponde all’ortocomplementazione di sottospazi chiusi per (b) di proposizione 3.53: ¬P (M) := P (M)⊥ . La verifica delle propriet`a dell’operazione di ortocomplementazione per sottospazi (e quindi per proiettori) `e allora immediata tenendo conto di (b), (d) ed (e) nel teorema 3.14.
7.3 Proposizioni quantistiche come proiettori ortogonali
273
Diamo infine un controesempio per provare che il reticolo dei sottospazi chiusi, e quindi anche quello dei proiettori ortogonali, non `e distributivo. Consideriamo un sottospazio bidimensionale S di uno spazio di Hilbert H con dimensione ≥ 2. Possiamo identificare con C2 tale sottospazio scegliendo in esso una base ortonormale {e1 , e2 }. Si considerino quindi i tre sottospazi di S: H1 :=< e1 >, H2 :=< e2 >, H3 :=< e1 + e2 >. Vale H1 ∧(H2 ∨H3 ) = H1 ∧S = H1 , ma (H1 ∧H2 )∨(H1 ∧H3 ) = {0}∨{0} = {0}. Per cui: H1 ∧ (H2 ∨ H3 ) = (H1 ∧ H2 ) ∨ (H1 ∧ H3 ) . (b) e (c). Se i proiettori ortogonali P e Q commutano, oppure se i proiettori ortogonali {Qn }n∈N commutano a due a due, per il Lemma di Zorn, esiste sempre un insieme massimale di proiettori ortogonali commutanti a due a due P0 (H) che contiene P e Q oppure, rispettivamente, {Qn }n∈N . Con tale precisazione possiamo provare (b) e (c) contemporaneamente, scegliendo un tale P0 (H) arbitrariamente nella prova di (b). ` chiaro che 0 e I appartengono a P0 (H) dato che commutano con tutti gli E elementi di P0 (H). La stessa cosa accade per ¬P = I − P se P ∈ P0 (H). Bisogna ora provare che, per ogni coppia di proiettori P, Q ∈ P0 (H), esistono l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P0 (H), che questi si calcolano come detto in (b) e che, infine, tali proiettori coincidono con l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P(H). Le propriet` a di distributivit` a di ∨ e ∧ seguono facilmente dalle formule (7.10) e (7.9), dalle propriet` a di commutativit` a dei proiettori e dal fatto che i proiettori ortogonali soddisfano la propriet` a di idempotenza P P = P . Tenendo conto di (c) di proposizione 7.18, il proiettore su M ∩ N , che corrisponde a P ∧ Q in P(H), `e proprio P Q che appartiene a P0 (H) perch´e, per costruzione, commuta con tutti i proiettori di P0 (H) e tale insieme `e massimale. Concludiamo che: P ∧ Q := inf {P, Q} = inf {P, Q} = P Q . P0(H)
P(H)
Dato che P e Q commutano per ipotesi, il proiettore su < M, N >, che corrisponde a P ∨ Q calcolato in P(H), `e P + Q − P Q per (d) di proposizione 7.15 e tale proiettore appartiene a P0 (H) perch´e commuta con tutti i proiettori di P0 (H). Concludiamo, come sopra, che: P ∨ Q := sup {P, Q} = sup {P, Q} = P + Q − P Q . P0 (H)
P(H)
Quindi P0 (H) `e un’algebra di Boole. Mostriamo per concludere che P0 (H) `e σ-completo. Consideriamo una famiglia numerabile di proiettori {Qn }n∈N ed associamo a ciascuno dei Qn il nuovo proiettore Pn definito induttivamente come P0 := Q0 e, per n = 1, 2, . . .: Pn := Qn (I − P1 − . . . − Pn−1 ) .
274
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Si verifica facilmente per induzione che: (i) Pn Pm = 0 se n = m, (ii) Q1 ∨ · · · ∨ Qn = P1 ∨ · · · ∨ Pn = P1 + · · · + Pn per n = 0, 1, . . .. Si osservi che allora, se definiamo gli operatori limitati: An := P1 + · · · + Pn , risulta subito che: (iii) An = A∗n e An An = An per ogni n = 0, 1, . . ., cio`e gli An sono proiettori ortogonali per cui in particolare An ≤ I, per ogni n = 0, 1, . . . per (e) di proposizione 3.53, (iv) An ≤ An+1 per ogni n = 0, 1, . . . . Per la proposizione 3.56 esiste l’operatore limitato autoaggiunto Q dato dal limite forte: A = s- lim Pn = s- lim Q0 ∨ · · · ∨ Qn . n→+∞
n→+∞
` immediato verificare dall’espressione di sopra che AA = A, per cui A `e E ancora un proiettore ortogonale che appartiene a P0 (H) in quanto `e limite (forte) di operatori che commutano con tutti gli elementi di P0 (H). Vale, sempre per la proposizione 3.56, An ≤ A e quindi in particolare Qn ≤ Q1 ∨ · · ·∨Qn ≤ A per ogni n ∈ N. Mostriamo che A `e l’estremo superiore della classe dei Qn , sia in P(H) che in P0 (H). Supponiamo che il proiettore ortogonale K ∈ P(H) soddisfi K ≥ Qn per ogni n ∈ N. Questo significa che KQn = Qn per (a) di proposizione 7.18. Allora, dalla definizione degli operatori Pn , vale anche KPn = Pn e quindi KAn = An , per cui K ≥ An per ogni naturale n per (a) di proposizione 7.18. La proposizione 3.56 assicura allora che K ≥ A. In altre parole A ∈ P0 (H) `e un maggiorante della classe dei Qn ed ogni altro maggiorante K ∈ P(H) maggiora A. Per definizione di estremo superiore A = supP(H) {Qn }n∈N =: ∨n∈NQn . Dato che A ∈ P0 (H), A sar`a anche estremo ` chiaro che nell’identit` superiore in P0 (H). E a provata sopra: ∨n∈NQn = s- lim Q0 ∨ · · · ∨ Qn n→+∞
`e irrilevante l’ordine con cui sono stati etichettati i Qn dato che il primo membro, cio`e l’estremo superiore dell’insieme {Qn }n∈N, non dipende dall’ordine con cui si etichettano gli elementi dell’insieme per definizione. La formula (7.12) si dimostra facilmente usando ¬ e formula (7.11) per l’estremo superiore. La prova di (d) `e immediata tenendo semplicemente conto che la commutativit` a implica la distributivit`a del reticolo direttamente da (i) e (ii) di (b). Questa proposizione conclude la nostra brevissima introduzione alla teoria dei reticoli ed alle sue relazioni con la formulazione della Meccanica Quantistica. Essa mostra che ha o pu`o avere senso pensare di associare proiettori ortogonali a proposizioni relative a sistemi quantistici, descrivendo l’incompatibilit`a tra
7.3 Proposizioni quantistiche come proiettori ortogonali
275
proposizioni in termini di non commutativit` a dei proiettori associati. In questo contesto si ritrova anche la struttura classica, restringendosi a lavorare in insiemi di proiettori commutanti massimali (oppure, pi` u generalmente, che soddisfino la richiesta (ii) in (c) nella tesi del teorema dimostrato per ultimo). Ci si pu` o chiedere se sia possibile dare delle motivazioni pi` u profonde per la scelta di descrivere le propriet`a dei sistemi fisici quantistici tramite un reticolo di proiettori ortogonali che non siano la semplice risposta “perch´e funziona”. Importanti, sebbene parziali, risultati in questa direzione sono stati ottenuti da diversi autori (tra cui G. Mackey) a partire dal celebre lavoro di C. Piron Axiomatique Quantique Helv. Phys. Acta 37 439-468 (1964). ` importante precisare che quanto visto in questo capitolo `e solo un picE colo ed informale passo verso le diverse formulazione della Logica Quantistica (o logiche quantistiche) della quale non ci occuperemo. Si vedano a tal proposito [DCGi02, EGL09] oltre che [Bon97]. L’unica cosa che possiamo dire `e che per costruire le logiche quantistiche si preferisce considerare i sottospazi su cui proiettano i proiettori ortogonali piuttosto che i proiettori stessi. La struttura di reticolo nell’insieme dei sottospazi chiusi indotta dall’inclusione insiemistica non `e altro che quella dei proiettori di P(H) rispetto alla relazione d’ordine parziale tra operatori limitati ≥, come visto nella dimostrazione del teorema precedente. Il reticolo che si viene a costruire in questo modo, come accade per il corrispondente reticolo di proiettori ortogonali, soddisfa tutte le ipotesi che definiscono una σ-algebra di Boole eccetto la propriet` a distributiva. Soddisfa invece una propriet` a differente che produce la struttura di reticolo ortomodulare, limitato e σ-completo. Un punto importante `e il seguente. Per noi R := P ∧ Q indica solo il proiettore che proietta sull’intersezione dei sottospazi associati a P e Q. R pu` o avere o meno senso fisico come proposizione sul sistema, ma non corrisponde alla proposizione P E Q quando P e Q sono associati a proposizioni mutuamente incompatibili. Viceversa, nell’approccio dovuto a von Neumann e Birkhoff, che corrisponde alla cosiddetta logica quantistica standard, ∨ e ∧ vengono usati come veri e propri connettivi (soddisfacenti un’altra algebra rispetto ai connettivi usuali), anche quando connettono proiettori che corrispondono a proposizioni incompatibili per cui non esistono sistemi di misura in grado di assegnare a P e Q un valore di verit` a contemporaneamente. Il significato fisico di tali connettivi `e pertanto poco chiaro. Per questa ragione il punto di vista della Logica Quantistica standard `e stato criticato dai fisici (vedi il capitolo 5 di [Bon97] per una discussione approfondita). In realt` a vi sono almeno tre questioni che hanno portato allo stallo se non al fallimento del programma di Birkhoff e von Neumann di trovare l’impostazione fisica pi` u profonda della Meccanica Quantistica in una Logica Quantistica basata sulla teoria dei reticoli ortomodulari. (a) La mancanza di distributivit` a della Logica Quantistica rende difficile l’interpretazione del formalismo in termini di una struttura logica. (b) A dispetto di grandi sforzi, non sembra possibile una ragionevole generalizzazione dell’operatore implicazione e quindi non c’`e un vero sistema deduttivo nella Logica Quantistica.
276
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(c) La Logica Quantistica `e rimasta un linguaggio proposizionale, dato che non `e stato possibile trovare una estensione alla logica dei predicati. Negli ultimi anni, diversi autori hanno introdotto nuovi approcci formali, in un certo senso pi` u profondi, della Logica Quantistica `a la Birkhoff e von Neumann, in particolare impiegando la teoria dei topos [DI08, HLS09].
7.4 Le proposizioni e gli stati relativi a sistemi quantistici In questa sezione daremo i primi due assiomi della formulazione generale della Meccanica Quantistica, precisando come sono descritte matematicamente le proposizioni dei sistemi quantistici e gli stati dei sistemi quantistici, facendo uso di un opportuno spazio di Hilbert. Caratterizzeremo tali stati attraverso un importante teorema dovuto a Gleason. Infine mostreremo che gli stati quantistici formano un insieme convesso e possono essere costruiti come combinazioni lineari di stati estremali detti stati puri, che sono in corrispondenza biunivoca con gli elementi (raggi) dello spazio proiettivo associato allo spazio di Hilbert del sistema fisico. 7.4.1 Assiomi A1 e A2: proposizioni, stati di sistemi quantistici e il teorema di Gleason In base a quanto visto nella sezione precedente, assumeremo il seguente assioma della Meccanica Quantistica dove, come gi`a fatto precedentemente, indichiamo con la stessa lettera proposizioni e proiettori corrispondenti. A1. Le proposizioni riguardanti un sistema quantistico S sono in corrispondenza biunivoca con (un sottoinsieme de) il reticolo (rispetto all’inclusione di sottospazi) P(HS ) dei proiettori ortogonali di uno spazio di Hilbert (complesso) e separabile HS , detto spazio di Hilbert associato ad S. Inoltre: (1) La compatibilit` a tra proposizioni corrisponde alla commutativit` a dei rispettivamente associati proiettori ortogonali; (2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione P ≤ Q per i proiettori associati; (3) I (operatore identit` a) e 0 (operatore nullo) corrispondono rispettivamente alla proposizione sempre vera ed a quella sempre falsa; (4) la negazione di una proposizione P , ¬P corrisponde al proiettore ortogonale ¬P = I − P ; (5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q; (6) se {Qn }n∈N `e un insieme numerabile di proposizioni a due a due compatibili, hanno senso fisico le proposizioni corrispondenti a ∨n∈N Qn e ∧n∈N Qn .
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
277
Osservazione 7.21. La richiesta che lo spazio HS sia separabile verr` a chiarita pi` u avanti quando considereremo sistemi quantistici concreti e daremo una rappresentazione esplicita di HS . Malgrado la questione sia alquanto sottile, d’ora in poi assumeremo che il sottoinsieme di P(HS ) che descrive le proposizioni del sistema sia tutto P(HS ) Possiamo anche dare un secondo assioma che riguarda gli stati quantistici. L’idea, basata su QM1 e QM2 (e sulle successive osservazioni) `e che uno stato quantistico al tempo t assegni la “probabilit` a” che sia vera ogni proposizione del sistema. L’idea `e quella di generalizzare il concetto di misura σ-additiva di probabilit` a. Invece di definirla su una σ-algebra, la dobbiamo pensare come definita sull’insieme dei proiettori associati alle proposizioni sul sistema. Sappiamo che ogni insieme massimale di proposizioni compatibili definisce un’algebra di Boole σ-finita, che `e una generalizzazione di una σ-algebra su cui si definiscono le misure. La richiesta naturale `e quindi la seguente. A2 (forma provvisoria). Uno stato ρ al tempo t su un sistema quantistico S `e un’applicazione ρ : P(HS ) → [0, 1] tale che: (1) ρ(I) = 1; (2) se {Pi }i∈N ⊂ P(HS ) soddisfa: Pi Pj = 0 per i = j, allora ρ s-
+∞
Pi
=
i=0
+∞
ρ(Pi ) .
i=0
Osservazioni 7.22. (1) La richiesta (1) dice semplicemente che la proposizione sempre vera ha probabilit` a certa di essere vera su ogni stato. (2) La richiesta (2) vale evidentemente anche per proposizioni in numero finito: `e sufficiente che definitivamente Pi = 0. (3) La richiesta (2) pu` o essere riscritta come: ρ (∨i∈N Pi ) =
+∞
ρ(Pi ) ,
i=1
per ogni classe di proposizioni {Pi }i∈N ⊂ P(HS ) compatibili e che si esclu+∞ dono a vicenda a due a due, per cui i=0 Pi = ∨i∈N Pi esiste sempre per la teorema 7.20. +∞ La prova dell’esistenza di i=0 Pi `e comunque la seguente. Nelle ipotesi fatte, le ridotte della serie definiscono operatori autoaggiunti idempotenti e quindi N proiettori ortogonali. Quindi Pi ≤ I per (e) della proposizione 3.53. i=0 N+1 N Inoltre i=0 Pi ≥ i=0 Pi come `e immediato provare. Quindi per la pro` posizione 3.56 esiste il limite in senso forte della successione delle ridotte. E
278
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
immediato provare che tale limite `e ancora idempotente ed autoaggiunto per cui `e un proiettore ortogonale. ` chiaro che ogni stato ρ determina l’equivalente di una misura positiva (4) E σ-additiva di probabilit` a in ogni insieme massimale di proiettori commutanti P0 (Hs ) che, come visto, `e una diretta generalizzazione del concetto di σalgebra. In questo senso abbiamo definito un’estensione del concetto di misura di probabilit` a. (5) Il lettore deve essere messo in guardia dall’idea di identificare la “misura di probabilit` a” ρ con una vera misura di probabilit` a su una σ-algebra: Il fatto che ora consideriamo anche proposizioni incompatibili in senso quantistico, cambia completamente le regole della probabilit` a condizionata. La probabilit` a che “sia vera P quando `e verificata Q” segue delle regole diverse da quelle in teoria della probabilit` a classica se P e Q sono incompatibili nel senso quantistico. Osservazione importante. Quando assegniamo uno stato ci saranno dunque delle proposizioni con probabilit` a 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto a tali proposizioni, e proposizioni con probabilit` a inferiore a 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto a tali proposizioni. Riguardo alla prima classe di proposizioni, possiamo pensare che esse corrispondano a propriet` a che il sistema effettivamente abbia nello stato considerato. Assumendo l’interpretazione standard della Meccanica Quantistica, in cui la probabilit` a non ha significato epistemico, dobbiamo concludere che le propriet` a relative alla seconda classe di proposizioni non sono definite nello stato considerato. Un esempio importante dal punto di vista fisico `e il seguente. Consideriamo le proposizioni PE che corrispondono alla propriet` a di un sistema fisico dato da una particella quantistica descritta sulla retta reale: “la particella ha posizione nel boreliano E ∈ B(R)”. Se lo stato ρ del sistema assegna ad ogni PE , con E limitato, probabilit` a inferiore a 1 (ed `e facile esibire uno di questi stati come vedremo pi` u avanti trattando il principio di indeterminazione di Heisenberg che come vedremo `e un teorema) dobbiamo concludere che: la posizione della particella, nello stato ρ, non `e definita. Da questo punto di vista risulta chiaro che la descrizione spaziale delle particelle come punti di una variet` a (in questo caso R) che rappresenta “lo spazio fisico di quiete” di un sistema di riferimento, non gioca pi` u un ruolo centrale a differenza di quanto accade in fisica classica. In un certo senso tutte le propriet` a (che possono assumere valori diversi a seconda dello stato) di un sistema fisico sono messe sullo stesso piano e lo “spazio” in cui descrivere il sistema ed i suoi stati `e uno spazio di Hilbert. Dal punto di vista matematico, la domanda che dobbiamo porci immediatamente `e se esistano davvero applicazioni ρ che godano delle propriet` a enunciate in A2.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
279
Dato uno spazio di Hilbert separabile H, mostriamo che esistono effettivamente applicazioni del tipo detto. Ovviamente la dimostrazione funziona anche, e diventa banale, nel caso in cui H abbia dimensione finita. Ricordiamo che B1 (H) indica lo spazio degli operatori di classe traccia su H (vedi il capitolo 4). Proposizione 7.23. Sia H spazio di Hilbert separabile e T ∈ B1 (H) un operatore positivo (e quindi autoaggiunto) con traccia di valore 1. Se definiamo ρT : P(H) → R come ρT (P ) := tr(T P ) per ogni P ∈ P(H) allora: (a) ρT (P ) ∈ [0, 1] per ogni P ∈ P(H), (b) ρT (I) = 1, (c) se {Pi }i∈N ⊂ P(H) soddisfa: Pi Pj = 0 per i = j, allora +∞ +∞ ρT sPi = ρT (Pi ) . i=0
i=1
Dimostrazione. Notiamo che T P `e di classe traccia per ogni P ∈ P(H) per (b) del teorema 4.30 essendo P limitato, per cui ha senso calcolare tr(T P ). La positivit` a di T assicura che gli autovalori di T sono tutti reali non negativi ((c) in proposizione 3.49). Mostriamo che in realt` a gli autovalori cadono tutti in [0, 1]. T `e un operatore compatto autoaggiunto (in quanto positivo). Usando la decomposizione vista nel teorema 4.21, tenendo conto che |A| = A (perch´e A ≥ 0), e che quindi, nella decomposizione polare di A = U |A|, vale U = I, troviamo: mλ T = λ (uλ,i | ) uλ,i . (7.14) λ∈σp (A) i=1
Sopra σp (A) `e l’insieme degli autovalori di A e, se λ > 0, {uλ,i }i=1,...,mλ `e una base dell’autospazio associato a λ ∈ σp (A). Infine, la convergenza `e nella topologia uniforme. Possiamo riscrivere lo sviluppo di sopra come: T = λj (uj | )uj , (7.15) j
dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a base hilbertiana di H l’insieme degli autovettori detti, aggiungendo una base per il nucleo di T (la base complessiva `e comunque al pi` u numerabile perch´e H `e separabile). Calcolando la traccia di T sulla base degli uj , nelle nostre ipotesi abbiamo λj , 1 = tr(T ) = j
per cui λj ∈ [0, 1]. Si osservi che l’identit`a di sopra prova anche (b) essendo T I = I. Sia ora P ∈ P(H), Calcolando la traccia di T P sulla base detta: tr(T P ) = λj (uj |P uj ) . j
280
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Dato che (uj |P uj ) = (P uj |P uj ), abbiamo che 0 ≤ (uj |P uj ) ≤ ||P ||2||uj ||2 ≤ 1. dove abbiamo tenuto conto del fatto che ||uj || = 1 e che ||P || ≤ 1 ((e) in proposizione 3.53). In definitiva: 0≤ λj (uj |P uj ) ≤ λj = 1 j
j
per cui vale (a). Proviamo (c). Scegliamo una base hilbertiana {ui,j }j∈Ii in ogni spazio Pi (H). Lasciamo al lettore la verifica del fatto che, nelle nostre ipotesi, B := {ui,j }j∈Ii ,i∈N `e una base hilbertiana per il sottospazio chiuso su cui proietta il +∞ proiettore ortogonale P = s- i=0 Pi . Possiamo quindi completare B a base hilbertiana di H unendola con una base hilbertiana B di P (H)⊥ . Usando la continuit` a di T e (d) di proposizione 3.53: " # ρT (P ) = tr T s(u| )u = tr s(u| )T u . u∈B
u∈B
Ora calcoliamo la traccia usando la base hilbertiana B ∪ B :
v (u|v)T u = (u |T u ) , ρT (P ) =
v∈B∪B
u∈B
(7.16)
u∈B
dove si `e tenuto conto del fatto che, se u, v ∈ B ∪ U , (v|u) = δuv ed inoltre gli elementi di B sono ortogonali a quelli di B . Con una analoga procedura troviamo che: Ii +∞ +∞ ρT (Pi ) = (ui,j |T ui,j ) . i=1
i=1 j=1
Possiamo sempre ingrandire ogni insieme Ii fino a N definendo ui,j := 0 se j > sup Ii . In tal caso possiamo scrivere: +∞ i=1
ρT (Pi ) =
∞ +∞
(ui,j |T ui,j ) =
i=1 j=1
dμ(i) N
N
(ui,j |T ui,j )dμ(j) .
dove μ `e la misura che conta i punti in N e si `e tenuto conto di (c) di proposizione 3.22, notando che (ui,j |T ui,j ) ≥ 0 per ogni coppia i, j e quindi anche: N
(ui,j |T ui,j )dμ(j) ≥ 0
per ogni i ∈ N.
Con la stessa interpretazione l’ultima somma in (7.16) pu`o essere vista come: ρT (P ) = (u |T u ) = (ui,j |T ui,j ) dμ(i) ⊗ dμ(j) . u∈B
N×N
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
281
Dato che i numeri (ui,j |T ui,j ) sono non negativi e che l’integrale di sopra `e convergente, il teorema di Fubini-Tonelli, assicura che: +∞
ρT (Pi ) =
i=1
dμ(i)
N
N
(ui,j |T ui,j )dμ(j)
= N×N
(ui,j |T ui,j ) dμ(i) ⊗ dμ(j) = ρT (P ) ,
che `e l’enunciato nel punto (c).
Il seguente notevolissimo teorema (di cui daremo solo una traccia della sua complessa dimostrazione) dovuto a Gleason [Gle57] porta ad una caratterizzazione completa delle funzioni che soddisfano l’assioma A2. Teorema 7.24. (Di Gleason.) Sia H uno spazio di Hilbert, di dimensione finita ≥ 3, oppure di dimensione infinita e separabile. Per ogni funzione μ : P(H) → [0, +∞) con μ(I) < +∞ e tale che soddisfi (2) in A2, esiste un operatore T ∈ B1 (H) positivo tale che: μ(P ) = tr(T P )
per ogni P ∈ P(H).
Dimostrazione. Definiamo una frame function (non negativa) su uno spazio, H, di Hilbert infinitodimensionale separabile oppure di dimensione finita, come una funzione f : SH → [0, +∞), dove SH := {x ∈ H | ||x|| = 1}, tale che, per ogni base hilbertiana {xi }i∈K ⊂ H: f(xi ) < +∞ . i∈K
Usando risultati di von Neumann (vedi l’articolo di Gleason citato), si prova il seguente lemma. Lemma 7.25. Su uno spazio di Hilbert separabile o di dimensione finita ≥ 3, per ogni frame function f esiste un operatore limitato ed autoaggiunto T tale che f(x) = (x|T x) per ogni x ∈ SH . ` Consideriamo allora i proiettori ortogonali Px := (x| ) x per ogni x ∈ SH . E immediato verificare che, nelle nostre ipotesi su μ, f(x) := μ(Px ) definisce una frame function al variare di x, dato che: μ ≥ 0 ed inoltre risulta: f(xi ) = μ(Pxi ) = μ Pxi = μ (I) < +∞ . i∈K
i∈K
i∈K
Per il lemma di sopra, ci deve essere un operatore autoaggiunto T tale che μ(Px) = (x|T x) per ogni x ∈ SH . Dato che (x|T x) ≥ 0 per ogni x, T `e un operatore positivo e quindi T = |T | (infatti: |T |2 = T ∗ T per il teorema di decomposizione polare, ma T ∗ T = T 2 nelle nostre ipotesi, e valendo l’unicit` a
282
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
delle radici quadrate positive teorema 3.57). Se {xi }i∈K ⊂ H `e una base hilbertiana, deve allora valere: +∞ > μ(I) = f(xi ) = (xi |T xi ) = (xi | |T |xi) . i∈K
i∈K
i∈K
Per definizione di operatore di classe traccia (definizione 4.28), T = |T | `e dunque un operatore di classe traccia. Sia infine P ∈ P(H). Possiamo scegliere una base Hilbertiana di P (H): {xi }i∈J e completarla a base Hilbertiana di H aggiungendo una base hilbertiana {xi }i∈J di P (H)⊥ . In tal caso, J `e numerabile (o finito) per il teorema 3.31, inoltre: P = sP xi i∈J
per (d) di proposizione 3.53, infine: P xi P xj = 0 se i = j sono elementi di J. Allora, dato che P xi = xi se i ∈ J e P xi = 0 se i ∈ J : μ(P ) = μ(Pxi ) = (xi |T xi ) = (xi |T P xi) = tr(T P ) . i∈J
i∈J
i∈J∪J
Osservazioni 7.26. (1) La dimostrazione di Gleason funziona anche per spazi di Hilbert definiti sul campo reale. (2) Si pu` o notare che l’operatore T ha traccia 1 se μ(I) = 1, come nel caso considerato nell’assioma A2. (3) Se il campo dello spazio di Hilbert `e complesso, come in tutti i casi considerati in questo libro e come nell’assioma A2, l’operatore T associato a μ `e unico: ogni altro operatore T di classe traccia che soddisfa μ(P ) = tr(T P ) per ogni P ∈ P(H) deve anche soddisfare: (x|(T − T )x) = 0 per ogni x ∈ H. Infatti, se x = 0 ci` o `e ovvio, mentre se x = 0 possiamo sempre completare a base hilbertiana il vettore x/||x|| e, se Px `e il proiettore su < x >, la condizione tr((T − T )Px) = 0 si scrive, sulla base detta: ||x||−2(x|(T − T )x) = 0. Per l’esercizio 3.10 ci`o implica che T − T = 0. (4) La richiesta di spazio di Hilbert di dimensione > 2 `e irrinunciabile come ora proviamo, esibendo un controesempio. Si verifica subito che, su C2 , i proiettori ortogonali sono 0, I e tutte le matrici della forma: 3 1 I+ Pn := ni σi , con n = (n1 , n2 , n3 ) ∈ R3 t.c. |n| = 1, 2 i=2
dove σ1 , σ2, σ3 sono le matrici di Pauli: + + + * * * 01 0 −i 1 0 , σ2 = , σ3 = . σ1 = 10 i 0 0 −1
(7.17)
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
283
Vi `e corrispondenza biunivoca tra i proiettori Pn ed i punti n ∈ S2 , la sfera in dimensione 2 da raggio 1. Le funzioni μ che soddisfano le richieste in del teorema di Gleason possono quindi pensarsi come funzioni definite su S2 ∪ {0, I}. Le richieste nel teorema di Gleason si riducono a: μ(0) = 0, μ(I) = 1 e μ(n) = 1 − μ(−n). Gli operatori positivi di classe traccia con traccia unitaria, si verificano essere tutti e soli quelli della forma: 3 1 ρu = I+ con u ∈ R3 t.c. |u| ≤ 1 . ui σi (7.18) 2 i=2
Se · indica l’ordinario prodotto scalare in R3 , vale: tr(ρu Pn ) =
1 (1 + u · n) , 2
come si prova eseguendo esplicitamente il calcolo ed usando la forma data delle matrici di Pauli. L’applicazione μ definita da μ(0) = 0, μ(I) = 1 e, per ogni n ∈ S2 e per un fissato v ∈ S2 : μ(Pn ) =
1 1 + (v · n)3 , 2
soddisfa le ipotesi nel teorema di Gleason. Tuttavia si verifica facilmente che non ci sono operatori ρu di forma (7.18) tali che μ(Pn ) := tr(ρu Pn ) per ogni proiettore ortogonale Pu , cio`e, non ci sono u ∈ R3 con |u| ≤ 1 tali che: (1 + u · n) = 1 + (v · n)3 per ogni n ∈ S2 . Il teorema di Gleason insieme alle considerazioni esposte sopra, unitamente al fatto che tutti i sistemi quantistici noti hanno spazio di Hilbert con dimensione che soddisfa le ipotesi del teorema di Gleason4 , conducono alla seguente riformulazione dell’assioma A2. A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , `e un operatore positivo di classe traccia con traccia unitaria su HS . La probabilit` a che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ).
4 Le particelle con spin 1/2 ammettono uno spazio di Hilbert – in cui si definisce l’osservabile spin – di dimensione 2. La stessa cosa accade per lo spazio di Hilbert in cui viene descritta la polarizzazione della luce (elicit`a del fotone). Tuttavia questi sistemi fisici, quando descritti completamente, per esempio includendo i gradi di libert` a posizionali o legati all’impulso, sono rappresentabili in uno spazio di Hilbert infinitodimensionale separabile.
284
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Possiamo quindi dare la seguente definizione. Definizione 7.27. Sia H spazio di Hilbert separabile. Un operatore di classe traccia, positivo e con traccia uguale a 1 si dice stato su H. L’insieme degli stati su H si indica con S(H). Osservazione importante. Il teorema di Gleason ha una conseguenza fisica fondamentale che distingue nettamente gli stati dei sistemi classici da quelli dei sistemi quantistici. I sistemi classici ammettono stati completamente deterministici, descritti da quelli che abbiamo chiamato stati sharp: misure di Dirac con supporto su un punto nello spazio delle fasi al tempo considerato. Tali misure assumono solo i valori 0 e 1 e sono quindi stati in cui ogni proposizione `e certa oppure `e falsa e non ci sono possibilit` a intermedie. Analoghi stati non esistono per sistemi quantistici descritti in spazi di Hilbert infinitodimensionali. La prova `e elementare: se x appartiene all’insieme SH dei vettori di norma unitaria e Px `e il proiettore ortogonale (x|·)x, ogni stato ρ, per il teorema di Gleason, determina una funzione, evidentemente continua, SH x → μ(Px ) = (x|ρx). Dato che SH `e connesso5 e che le funzioni continue mandano connessi in connessi, μ(Px ) deve essere connesso al variare di x. Se μ assume solo valori 0 oppure 1, deve essere (x|ρx) = 0 per ogni x e quindi si averebbe ρ = 0 che violerebbe tr(ρ) = 1, oppure (x|ρx) = 1 per ogni x e quindi si avrebbe ρ = I, che non `e di classe traccia nel caso infinitodimensionale. Questo risultato negativo ha rilevanza nei tentativi di costruire modelli classici della meccanica quantistica introducendo “variabili nascoste”, perch´e pone dei severi vincoli su tali modelli. 7.4.2 Stati puri, stati misti, ampiezze di transizione Passiamo a studiare l’insieme degli stati S(HS ) se HS `e lo spazio di Hilbert associato al sistema quantistico S. Dobbiamo preliminarmente ricordare alcune nozioni. Ricordiamo finita di che in uno spazio vettoriale X, una combinazione lineare vettori i∈F αi xi `e detta convessa se αi ∈ [0, 1] per i ∈ F e i∈F αi = 1. C ⊂ X `e detto convesso se, per ogni coppia x, y ∈ C, λx + (1 − λ)y ∈ C 5
Tale insieme `e infatti connesso per archi continui e dunque connesso. Diamo una traccia della dimostrazione di tale fatto. Se x, y ∈ SH allora ci sono due casi. Nel primo caso x = eiα0 y per qualche α0 > 0 e quindi x `e connesso a y dalla curva, continua rispetto alla topologia dello spazio di Hilbert e tutta inclusa in S, [0, α0 ] α → eiα x. Nel secondo caso x `e combinazione lineare di y e di un vettore y ∈ SH perpendicolare a y, che si ottiene costruendo una base ortonormale nel sottospazio generato da y e x, quando tale base ammetta y come primo vettore. Dato che ||x|| = ||y|| = ||y || = 1 e che y ⊥ y , deve allora essere x = eiα cos βy + eiδ sin βy per una terna di reali α, β, δ. Allora x `e connesso ad y tramite una curva, continua e completamente contenuta in SH , che si ottiene variando questi tre parametri separatamente in tre opportuni intervalli.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
285
per ogni λ ∈ [0, 1] (conseguentemente tutte combinazioni lineari convesse di elementi di C appartengono a C). Se C `e convesso, e ∈ C `e detto estremale se non `e scrivibile come e = λx + (1 − λ)y con λ ∈ (0, 1) e x, y ∈ C \ {e}. Definizione 7.28. Sia X spazio vettoriale sul campo K = C o R e si consideri la relazione di equivalenza su X: u ∼ v se e solo se v = αu per qualche α ∈ K \ {0}. Lo spazio quoziente X/∼ `e detto spazio proiettivo associato a X. Gli elementi di X/∼ diversi da [0] (classe di equivalenza del vettore nullo) sono detti raggi di X. Proposizione 7.29. Sia (H, ( | )) uno spazio di Hilbert separabile. (a) S(H) `e un sottoinsieme convesso di B1 (H). (b) Gli elementi estremali di S(H) sono tutti e soli quelli della forma: ρψ := (ψ| )ψ ,
per ogni vettore ψ ∈ H con ||ψ|| = 1.
Pertanto esiste una corrispondenza biunivoca tra l’insieme degli stati estremali e l’insieme dei raggi di H, che associa allo stato estremale (ψ| )ψ il raggio [ψ]. (c) Ogni stato ρ ∈ S(H) soddisfa: ρ ≥ ρρ ed `e estremale se e solo se soddisfa: ρρ = ρ . (d) Ogni stato ρ ∈ S(H) `e una combinazione lineare di stati estremali, includendo le combinazioni lineari infinite nella convergenza definita dalla topologia uniforme. In particolare esiste sempre una decomposizione: ρ= pφ (φ| )φ φ∈N
dove N `e una base hilbertiana di H fatta di autovettori di ρ, pφ ∈ [0, 1] per ogni φ ∈ N e: pφ = 1 . φ∈N
Dimostrazione. (a). Presi due stati ρ, ρ `e chiaro che λρ+(1−λ)ρ `e ancora un operatore di classe traccia in quanto gli operatori di classe traccia formano un sottospazio di B(H) (teorema 4.30). Dalle propriet` a di linearit` a della traccia (proposizione 4.32): tr[λρ + (1 − λ)ρ ] = λtrρ + (1 − λ)trρ = λ1 + (1 − λ)1 = 1 .
286
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Infine, se f ∈ H e λ ∈ [0, 1], tenendo conto che ρ e ρ sono positivi: (f|(λρ + (1 − λ)ρ )f) = λ(f|ρf) + (1 − λ)(f|ρ f) ≥ 0 . Quindi λρ + (1 − λ)ρ `e uno stato se ρ, ρ sono stati e λ ∈ [0, 1]. (b) e (d). Consideriamo ρ ∈ S(H). ρ `e un operatore compatto autoaggiunto (in quanto positivo). Usando la decomposizione vista nel teorema 4.21, tenendo conto che |ρ| = ρ (perch´e ρ ≥ 0), e che quindi, nella decomposizione polare di ρ = U |ρ|, vale U = I, troviamo: ρ=
mλ
λ (uλ,i | ) uλ,i .
(7.19)
λ∈σp (ρ) i=1
Sopra σp (ρ) `e l’insieme degli autovettori di ρ e, se λ > 0, {uλ,i }i=1,...,mλ `e una base dell’autospazio associato a λ ∈ σp (ρ). Infine, la convergenza `e nella topologia uniforme. Questo sviluppo da solo prova (d). Completando a base hilbertiana ∪λ>0 {uλ,i }i=1,...,mλ aggiungendo una base per Kerρ, dalla proposizione 4.32, otteniamo che deve anche essere: 1 = tr(ρ) = mλ λ . (7.20) λ∈σp (ρ)
` immediato verificare Supponiamo ora che ρψ := (ψ| )ψ , con ||ψ|| = 1. E che ρψ ∈ S(H). Vogliamo provare che ρψ `e estremale in S(H). Assumiamo pertanto che esistano ρ, ρ ∈ S(H) e λ ∈ (0, 1) per cui: ρψ = λρ + (1 − λ)ρ . Mostreremo che ρ = ρ = ρψ . ` chiaro che (completando Consideriamo il proiettore ortogonale Pψ = (ψ| )ψ. E ψ a base Hilbertiana): tr(ρψ Pψ ) = 1. Ne consegue che: 1 = λtr(ρPψ ) + (1 − λ)tr(ρ Pψ ) . Dato che λ ∈ (0, 1) e 0 ≤ tr(ρPψ ) ≤ 1, 0 ≤ tr(ρ Pψ ) ≤ 1, questo `e possibile solo se tr(ρPψ ) = tr(ρ Pψ ) = 1. Proviamo allora che tr(ρPψ ) = 1 e tr(ρ Pψ ) = 1 implicano che ρ = ρ = ρψ . Decomponendo ρ come in (7.19), tr(ρPψ ) = 1 si riscrive:
λj |(uj |ψ)|2 = 1 ,
(7.21)
j
dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a base hilbertiana di H l’insieme degli
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
287
autovettori detti, aggiungendo una base per il nucleo di ρ (la base complessiva `e comunque al pi` u numerabile perch´e H `e separabile). Per ipotesi: λj = 1 , (7.22)
j
|(uj |ψ)|2 = 1 .
(7.23)
j
Dato che λj ∈ [0, 1] e |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, avremo che valgono anche: λ2j ≤ 1 , (7.24)
j
|(uj |ψ)|4 ≤ 1 .
(7.25)
j
Per cui la successione dei λj e quella dei |(uj |ψ)|2 sono in 2 (N). L’identit`a (7.21) insieme alle (7.24) e (7.25) ed alla disuguaglianza di Cauchy-Schwarz in 2 (N), implicano infine che deve essere: λ2j = 1 , (7.26)
j
|(uj |ψ)|4 = 1 .
(7.27)
j
Dato che λj ∈ [0, 1] per ogni j ∈ N, (7.22) e (7.26) sono compatibili solo se tutti i λi sono nulli eccetto uno, λp , che vale esattamente 1. Nello stesso modo, dato che |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, (7.23) e (7.27) sono compatibili solo se tutti i numeri |(uj |ψ)| sono nulli, eccetto uno, |(uk |ψ)|, che vale 1. Dato che gli ui formano una base hilbertiana e ||ψ|| = 1, deve dunque essere che ` chiaro che deve essere k = p altrimenti tr(ρPψ ) = 0. ψ = αuk , dove |α| = 1. E Essendo: ρ= λj (uj | )uj , j
in base a quanto trovato, abbiamo finalmente che: ρ = λk (uk | )uk = 1 · (uk | )uk = α−1 α−1 (ψ| )ψ = |α|−1(ψ| )ψ = (ψ| )ψ = ρψ . Con la stessa procedura si prova che ρ = ρψ . Se uno stato ρ non `e del tipo (ψ| )ψ, si potr` a comunque decomporre come: ρ= λj (uj | )uj , j
in cui almeno due valori p = q per cui λp = λq sono entrambi non nulli e quindi, in particolare, λp , 1 − λp ∈ (0, 1). In tal caso potremo riscrivere ρ
288
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
come: ρ = λp (up | )up + (1 − λp )
j=p
λj (uj | )uj . (1 − λp )
(up | )up `e uno stato come gi` a detto ed `e immediato verificare che anche: λj ρ := (uj | )uj , (1 − λp ) j=p
`e uno stato di S(H) (ovviamente ρ = (up | )up per costruzione essendo uq ∼ up). Abbiamo quindi provato che ρ non `e estremale. L’applicazione f che associa allo stato estremale (ψ| )ψ il raggio [ψ] `e ben definita. Infatti, cominciamo a notare che, per definizione di stato estremale ||ψ|| = 1, per cui ψ = 0 e quindi [ψ] `e un raggio. Uno stesso stato estremale pu` o essere scritto in vari modi diversi: vale infatti (come `e immediato provare tenendo conto che deve essere ||φ|| = 1) che (ψ| )ψ = (φ| )φ se e solo se ψ = eiα φ per qualche α ∈ R. Ma allora, per definizione di raggio, [ψ] = [φ]. Mostriamo che l’applicazione f `e iniettiva. Se φ e ψ hanno norma unitaria e [ψ] = [φ] allora ψ = eiα φ per qualche α ∈ R e quindi (ψ| )ψ = (φ| )φ. Infine l’applicazione f `e suriettiva, perch´e, se [φ] `e un raggio e quindi ||φ|| = 0, ci sar`a ψ ∈ [φ] con ||ψ|| = 1. In tal caso f((ψ| )ψ) = [φ] perch´e ψ = αφ per qualche α ∈ C non nullo. (c). Dimostriamo prima la seconda affermazione. Se ρ `e estremale, ρρ = ρ come si prova immediatamente usando la forma data in (b) per gli stati estremali. Decomponendo uno stato ρ come (con il significato spiegato sopra): ρ= λj (uj | )uj , j
si ha subito che: ρρ =
λ2j (uj | )uj .
j
Se `e ρρ = ρ, passando alle tracce, dovr` a essere: λ2j = λj = 1 j
j
con λj ∈ [0, 1]. Si prova facilmente che questo `e possibile solo se tutti i λj sono nulli eccetto uno, λk , il cui valore `e 1. Ma allora: ρ= λj (uj | )uj = 1 · (uk | )uk , j
che `e uno stato estremale per (b). Proviamo la prima affermazione. Sia x = j αj uj un vettore arbitrario di H (si ricordi che gli uj definiscono una base hilbertiana di H), allora, dato che λj ∈ [0, 1]: (x|ρρx) = λ2j (x|uj )(uj |x) = λ2j |αj |2 j
j
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
≤
j
λj |αj |2 =
289
λj (uj |x)(uj |x) = (x|ρx) .
j
Quindi ρρ ≤ ρ.
Possiamo dare la seguente definizione. Definizione 7.30. Sia (H, ( | )) uno spazio di Hilbert separabile. (a) gli elementi estremali in S(H) sono detti stati puri ed il loro insieme `e indicato con Sp (H), gli stati non estremali sono detti stati misti o miscele. (b) Se vale: ψ= α i φi , i∈I
con I finito o numerabile (e la convergenza della serie `e nella topologia di H nel secondo caso), dove i vettori φi ∈ H sono tutti non nulli e 0 = αi ∈ C, si dice che lo stato (ψ| )ψ `e sovrapposizione coerente degli stati (φi | )φi /||φi ||2. (c) Se ρ ∈ S(H) soddisfa: ρ= pi ρi i∈I
con I finito, ρi ∈ S(H) e 0 = pi ∈ [0, 1] per ogni i ∈ I ed infine i pi = 1, si dice che lo stato ρ `e sovrapposizione incoerente o miscela degli stati (eventualmente puri) ρi . (d) Se ψ, φ ∈ H soddisfano ||ψ|| = ||φ|| = 1: (i) il numero complesso (ψ|φ) viene detto ampiezza di transizione o ampiezza di probabilit` a dello stato (φ| )φ sullo stato (ψ| )ψ, (ii) il numero reale non negativo |(ψ|φ)|2 viene detto probabilit` a di transizione dello stato (φ| )φ sullo stato (ψ| )ψ. Osservazioni 7.31. (1) I vettori dello spazio di Hilbert di un sistema quantistico associati a stati puri vengono spesso detti, in letteratura fisica, funzioni d’onda. La motivazione di tale terminologia `e dovuta alla prima formulazione della Meccanica Quantistica in termini di Meccanica Ondulatoria (vedi capitolo 6). (2) La possibilit` a di costruire stati puri con vettori non nulli che sono combinazione lineare di vettori associati ad altri stati puri `e quello che, nel gergo della Meccanica Quantistica, si chiama principio di sovrapposizione degli stati (puri). (3) Si osservi che in (c), nel caso in cui ρi = ψi (ψi | ), non `e richiesto che (ψi |ψj ) = 0 se i = j. Tuttavia `e immediato provare che se I `e finito, nel caso di ρi stato misto o puro e pi ∈ [0, 1] per ogni i ∈ I con i pi = 1, allora: ρ= pi ρi i∈I
`e di classe traccia (`e questo `e ovvio perch´e gli operatori di classe traccia formano uno spazio vettoriale e ogni ρi `e di classe traccia), `e positivo (perch´e combinazione lineare con coefficienti positivi di operatori positivi) ed ha traccia
290
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
unitaria perch´e, per le propriet` a di linearit` a della traccia (proposizione 4.32): pi ρi = pi trρi = pi · 1 = 1 . trρ = tr i∈I
i∈I
i∈I
La decomposizione di ρ su una base hilbertiana di suoi autovettori pu` o considerarsi un caso limite della decomposizione di sopra quando I `e infinito numerabile, ρi = ψi (ψi | ) e (ψi |ψj ) = δij . ` importante notare che: in generale, un fissato stato misto ammette pi` E u di una decomposizione incoerente in termini di stati puri e misti. (4) Si consideri lo stato puro ρψ ∈ Sp (H), che quindi si scriver` a come ρψ = (ψ| )ψ per qualche vettore ψ ∈ H con ||ψ|| = 1. Il punto che vogliamo sottolineare qui `e che tale stato puro `e anche un proiettore ortogonale Pψ := (ψ| )ψ e, di conseguenza, deve corrispondere ad una proposizione sul sistema. L’interpretazione naturale ed ingenua6 di tale proposizione `e che essa corrisponda all’affermazione: “lo stato del sistema `e lo stato puro individuato dal vettore ψ”. Tale interpretazione `e dovuta al fatto che, se ρ ∈ S(H), allora tr(ρPψ ) = 1 se e solo se ρ = (ψ| )ψ. Infatti, se ρ = (ψ| )ψ, allora completando a base hilbertiana ψ e facendo la traccia su tale base, risulta immediatamente che tr(ρPψ ) = 1. Supponiamo viceversa che valga tr(ρPψ ) = 1 per lo stato ρ. Sotto tali ipotesi deve essere ρ = (ψ| )ψ come dimostrato nella prova della proposizione 7.29. (5) Il punto (4) consente di dare un’interpretazione al modulo quadro dell’ampiezza di transizione (φ|ψ). Se ||φ|| = ||ψ|| = 1, come richiesto nella definizione di ampiezza di transizione, risulta immediatamente che: tr(ρψ Pφ ) = |(φ|ψ)|2 , dove ρψ := (ψ| )ψ e Pφ = (φ| )φ. Tenendo allora conto di (4), concludiamo che: |(φ|ψ)|2 `e la probabilit` a che, essendo lo stato (al tempo t) individuato dal vettore ψ, diventi lo stato individuato da φ in seguito a processo di misura sul sistema (al tempo t). Si osservi che |(φ|ψ)|2 = |(ψ|φ)|2 , per cui la probabilit` a di transizione dello stato individuato da ψ sullo stato individuato da φ coincide con l’analoga probabilit` a con i ruoli dei due vettori scambiati. Questo fatto non `e, a priori, per nulla fisicamente evidente.
6
Non possiamo fare a meno di notare una certa confusione di livelli semantico/sintattico in questa interpretazione. Tuttavia, per come l’interpretazione viene usata dai fisici, non crea problemi, ma potrebbe crearne in una formulazione rigorosa dal punto di vista logico formale.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
291
7.4.3 Assioma A3: stati successivi ai processi di misura e preparazione degli stati La formulazione standard della Meccanica quantistica assume il seguente assioma su ci`o che succede al sistema fisico S, nello stato ρ ∈ S(HS ) al tempo t, quando viene sottoposto ad un processo di misura riguardante la proposizione P ∈ P(HS ), se la proposizione risulta essere verificata (e quindi in particolare tr(ρP ) > 0 prima della misura). A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato del sistema immediatamente dopo la misura `e: P ρP ρP := . tr(ρP ) In particolare se ρ `e puro ed `e individuato dal vettore ψ con ||ψ|| = 1, lo stato del sistema immediatamente dopo la misura `e ancora puro ed `e individuato dal vettore: Pψ ψP = . ||P ψ|| ` ovvio che, in entrambi i casi, ρP e ψP definiscono stati. Nel primo caso E infatti ρP `e positivo, di classe traccia con traccia unitaria, nel secondo caso, vale ||ψP || = 1. Osservazioni 7.32. (1) Come gi`a sottolineato precedentemente, la misura di una propriet` a o di una grandezza fisica avviene facendo interagire il sistema con un apparato di misura (supposto macroscopico e soggetto alle leggi della fisica classica). La Meccanica Quantistica nella sua formulazione standard non stabilisce cosa sia un apparato di misura, ma solo che ne esistano, e nemmeno `e in grado di descrivere l’interazione tra strumento di misura e sistema quantistico al di fuori della schematizzazione di A3. Esistono vari punti di vista e congetture su come completare la descrizione fisica del processo di misura, chiamato nel gergo della Meccanica quantistica collasso o riduzione dello stato o della funzione d’onda. Ma per varie ragioni nessuna delle proposte attuali `e completamente soddisfacente [Des80, Bon97, Ghi97, Alb00]. Una proposta molto interessante `e stata fatta nel 1985 da G.C. Girardi, T. Rimini e A. Weber (Physical Review D34, 1985 p.470) in cui si descrive in modo dinamico non lineare il processo di misura della posizione e lo si assume non dovuto ad uno strumento di misura ma ad un processo di autolocalizzazione. Purtroppo l’idea ha ancora diversi problemi, in particolare non ammette in modo ovvio una descrizione relativistica. (2) L’assioma A3 si riferisce a misure non distruttive, anche dette misure indirette [BrKh95], in cui il sistema fisico misurato (tipicamente una particella) non viene assorbito/distrutto dallo strumento di misura.
292
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(3) Gli strumenti di misura si usano comunemente per preparare un sistema in uno stato. Dal punto di vista teorico la preparazione di uno stato puro viene fatta nel modo seguente. Si sceglie un numero finito di proposizioni compatibili P1 , . . . , Pn, in maniera tale che il sottospazio su cui proietta P1 ∧ · · · ∧ Pn = P1 · · · Pn sia unidimensionale. Ossia P1 · · · Pn = (ψ| )ψ per qualche vettore con ||ψ|| = 1. (L’esistenza di tali proposizioni `e nota per praticamente tutti i sistemi fisici quantistici che si usano sperimentalmente.) Quindi si eseguono misure contemporanee delle proposizioni Pi su vari esemplari identici del sistema fisico considerato (es. elettroni) di cui per` o non si conoscono gli stati iniziali. Se, per uno di tali sistemi, tutte le misure di tutte le proposizioni hanno dato esito positivo, immediatamente dopo le misure, lo stato del sistema `e quello individuato dal vettore ψ e si dice che il sistema `e stato preparato in tale stato. Normalmente ad ogni proiettore Pi `e associata una grandezza fisica Ai misurabile sul sistema e Pi definisce la proposizione “la grandezza Ai cade nell’insieme Ei ”. Quindi di fatto, per preparare un sistema (disponibile in un numero arbitrario di copie identiche) nello stato puro ψ, si misurano contemporaneamente una serie di grandezze fisiche Ai compatibili e si selezionano i sistemi in cui gli esisti delle misure di Ai sono caduti in tutti i prefissati insiemi Ei . (4) Vediamo come si possono costruire stati misti miscelando stati puri. Si considerino una quantit` a q1 di copie identiche del sistema S preparate nello stato puro associato a ψ1 , una analoga quantit` a q2 di copie identiche dello stesso sistema S preparate nello stato puro associato a ψ2 e via di seguito fino a ψn . Se si mischiano tali sistemi, dopo la miscela, ciascuno di essi si trover`a nello stato misto: ρ=
n
pi (ψi | )ψi ,
i=1
n dove pi := qi / i=1 qi . Si noti che in generale `e falso che (ψi |ψj ) = 0 se i = j per cui, l’espressione di sopra per ρ non `e la decomposizione su una base hilbertiana di autovettori di ρ stesso. Questa procedura potrebbe fare pensare che esistano due tipi di probabilit` a, una intrinseca dovuta alla natura quantistica degli stati ψi e l’altra epistemica, inglobata nelle probabilit` a pi . In realt` a non `e vero: una volta creato lo stato misto con la procedura detta sopra, non c’`e pi` u alcun modo, all’interno della Meccanica Quantistica, di distinguere gli stati della miscela. Per esempio, si osservi che la stessa miscela ρ si sarebbe potuta ottenere miscelando stati puri diversi da quelli individuati dai vettori ψi . In particolare, si sarebbero potuti usare quelli della decomposizione di ρ in termini di una base hilbertiana di suoi autovettori. Dal punto di vita fisico, facendo misure di qualsiasi genere (assumendo gli assiomi della Meccanica Quantistica fino ad ora enunciati) non sarebbe possibile distinguere le due miscele.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
293
7.4.4 Regole di superselezione e settori coerenti I sistemi quantistici noti sono tali che non tutti i vettori ψ normalizzati a 1 determinano stati ammissibili fisicamente. Ci sono ragioni teoriche di vario genere (sulle quali non ci soffermiamo ora, ma torneremo in seguito con un importante esempio) che implicano l’esistenza di cosiddette regole di superselezione. In base a tali regole, lo spazio di Hilbert del sistema H risulta essere una somma diretta ortogonale (al pi` u numerabile perch`e lo spazio somma `e numerabile) di sottospazi chiusi detti settori coerenti: H = H1 ⊕ H2 ⊕ · · · e gli unici stati, individuati da singoli vettori, fisicamente ammissibili sono quelli rappresentati da vettori in H1 , oppure H2 , oppure H3 ,, ... Ma non sono fisicamente ammessi stati individuati da combinazioni lineari di vettori appartenenti a spazi coerenti distinti. Dal punto di vista fisico, i settori coerenti sono i sottospazi di H associati ad una classe di proposizioni mutuamente esclusive – cio`e i proiettori ortogonali P1 , P2 , . . . che proiettano su tali spazi mutuamente ortogonali, con i Pi = I (la somma `e in senso forte se `e eseguita su un insieme infinito di termini). La proposizione associata a Pi corrisponde all’asserto che una certa grandezza, quella che determina la regola di superselezione, ha un certo valore. Pi` u in generale la grandezza non `e richiesta assumere un valore preciso in ciascuno di questi sottospazi, ma solo in una precisa classe di valori, dichiarata dalla proposizione stessa. Vediamo due corrispondenti esempi. (1) Come primo esempio citiamo la regola di superselezione della carica elettrica per i sistemi quantistici elettricamente carichi. Essa richiede che: ogni vettore ψ che determina uno stato del sistema, deve verificare una proposizione PQ del tipo: “il valore della carica del sistema vale Q” per qualche valore Q. Matematicamente quindi deve essere tr(PQ (ψ| )ψ) = 1 per qualche valore della carica Q, che equivale a dire PQψ = ψ per qualche valore della carica Q. In altre parole: non sono ammessi stati, individuati da singoli vettori, in cui la carica non ha un valore definito. Questa richiesta `e ovvia in fisica classica, ma non lo `e in meccanica quantistica, dove un sistema elettricamente carico, a priori, potrebbe ammettere stati in cui la carica non `e definita. Si osservi che la richiesta che lo spazio di Hilbert del sistema sia separabile richiede che i valori possibili Q per la carica elettrica, cio`e i settori coerenti a carica definita, siano al pi` u una quantit` a numerabile e quindi la carica elettrica non pu` o variare con continuit` a. (2) Un’altra regola di superselezione riguarda il momento angolare di ogni sistema fisico. Dalla meccanica quantistica `e noto che il modulo del momento angolare al quadrato J 2 , quando `e in uno stato definito, pu` o assumere solo valori interi oppure semi interi (in unit` a i2 = h/2π dove h `e la solita costante di Planck). Esiste allora una decomposizione dello spazio di Hilbert del sistema
294
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
fisico in due sottospazi chiusi ortogonali. Uno in cui J 2 ha valori interi ed uno in cui J 2 ha valori semi interi. La regola di superselezione del momento angolare richiede che i vettori che rappresentano stati del sistema non siano ` importante notare che combinazione lineare di vettori nei due sottospazi. E uno stato puro pu` o quindi essere a momento angolare non definito, in quanto il vettore associato allo stato `e combinazione lineare di vettori corrispondenti a stati puri con diversi valori del momento angolare, tuttavia, a causa della regola di superselezione, tali valori devono essere tutti interi oppure tutti semi interi. Nel caso di presenza di regole di superselezione associate alla decomposizione di H nella somma diretta in settori coerenti: H= Hk , (7.28) k∈K
possiamo definire gli spazi degli stati e degli stati puri di ciascun settore: S(Hk ), Sp (Hk ). Possiamo identificare questi insiemi con sottoinsiemi di S(H) e Sp (H) rispettivamente, in base al seguente ovvio argomento: se M `e un sottospazio chiuso dello spazio di Hilbert H, possiamo identificare A ∈ B(M) con un operatore di B(H), semplicemente estendendolo come l’operatore nullo su M⊥ . Se A `e positivo di classe traccia, la sua estensione rimane tale ed il valore della traccia `e conservata. Se A `e della forma (ψ| )ψ, con ψ ∈ M e ||ψ|| = 1, l’estensione rimane identica. Nel caso in esame possiamo identificare ogni S(Hk ), Sp (Hk ) con un corrispondente sottoinsieme di S(H) e Sp (H) rispettivamente, estendendo ciascuno stato ρ, misto o puro, all’operatore nullo su H⊥ k . Con tale identificazione abbiamo subito che S(Hk ) ∩ S(Hj ) = ∅ e Sp (Hk ) ∩ Sp (Hj ) = ∅ se k = j. Gli stati puri fisicamente ammissibili per il sistema fisico descritto su H, questi saranno tutti e soli quelli dell’insieme: , Sp (H)ammiss := Sp (Hk ) . (7.29) k∈K
` ragionevole assumere che gli stati misti fisicamente ammissibili per il sistema E fisico descritto su H siano quelli che si riescono a costruire come miscele degli stati puri ammissibili. Quindi, gli stati misti fisicamente ammissibili saranno tutte e sole le possibili le combinazioni lineari convesse finite degli elementi dell’insieme: , S(Hk ) . (7.30) k∈K
Possiamo ammettere anche combinazioni convesse infinite, in riferimento a qualche topologia operatoriale, ma non discuteremo ora questo caso. Osservazione 7.33. La richiesta che gli stati puri ammissibili siano quelli nell’insieme (7.29) ovvero, per gli stati misti, che siano dati da combinazioni lineari convesse di stati nell’insieme (7.30), implica immediatamente che
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
295
ciascuno di tali stati ρ (puro o misto) soddisfi i vincoli: ρPk = Pk ρ
per ogni k ∈ K
(7.31)
dove Pk `e il proiettore ortogonale sul settore coerente Hk . In realt` a vale anche il viceversa quando Ran(ρ) ⊂ ⊕k∈F Hk , per qualche F ⊂ K finito, oppure ρ ∈ Sp (H). Infatti, nel caso di ρ misto, tenendo conto del fatto che k∈K Pk = I (nella topologia operatoriale forte), e Pk Ph = 0 se h = k, le richieste (7.31) implicano immediatamente: ρ = s-
Pk ρ s-
k∈K
Ph
= s-
h∈K
=
pk
k∈F∗
Pk ρPk =
k∈K
Pk ρPk
k∈F
Pk ρPk = pk ρk , tr(Pk ρPk ) k∈F∗
dove F∗ ⊂ F `e il sottoinsieme dei k ∈ F per i quali pk := tr(Pk ρPk ) = 0 e Pk ρPk quindi pk > 0. Si noti, che per costruzione ρk := tr(P ∈ S(Hk ) se k ∈ F∗ . k ρPk ) Infine, oltre a pk ≥ 0 vale, usando il fatto che F `e finito (si usa solo in questo punto): 1 = trρ = tr pk ρk = pk trρk = pk . k∈F
k∈F
k∈F
Quindi, se ρ ∈ S(H) soddisfa Ran(ρ) ⊂ ⊕k∈F Hk per un insieme finito F e verifica i vincoli (7.31), allora ρ = k∈F∗ pk ρk `e una combinazione lineare convessa di elementi ρk ∈ S(Hk ) come volevamo. Sia infine ρ = (ψ| )ψ puro. Dalla decomposizione ortogonale di H nei sottospazi coerenti Hk abbiamo subito che: 1 = ||ψ||2 = ||Pk ψ||2 . (7.32) k∈K
La richiesta (7.31) implica immediatamente che: Pk ψ = (ψ|Pk ψ)ψ e quindi, sostituendo sopra, usando Pk Pk = Pk e Pk = Pk∗: 1 = ||ψ||2 =
||Pk ψ||2 =
k∈K
=
k∈K
|(Pk ψ|Pk ψ)|2 =
|(ψ|Pk ψ)|2 1
k∈K
||Pk ψ||4 .
(7.33)
k∈K
Essendo 0 ≤ ||Pk ψ||4 < ||Pk ψ||2 se ||Pk ψ|| < 1, (7.32) e (7.33) sono possibili insieme, solo se ||Pk ψ|| = 0 per k ∈ F \ {k0 } e ||Pk0 ψ|| = 1. Questo significa ρ ∈ Sp (Hk0 ).
296
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
7.5 Le osservabili come Misure a Valori di Proiezione su R Vogliamo ora introdurre la nozione di osservabile come misura a valori di proiezione (PVM). Tale nozione `e il centro della formulazione matematica della meccanica quantistica nelle formulazioni standard. Nei prossimi capitoli estenderemo e preciseremo meglio tale nozione dal punto di vista matematico, fino a formulare e dimostrare il teorema di decomposizione spettrale per operatori autoaggiunti non limitati che usa le PVM, nel suo enunciato. 7.5.1 Assioma A4: la nozione di osservabile In Meccanica Quantistica, le grandezze fisiche valutabili sui sistemi fisici e che hanno comportamento descritto in QM1 e QM2 sono dette osservabili. Ci occupiamo ora di esse. Come discusso nella sezione 7.2.5, `e ragionevole pensare di etichettare gli esiti delle misure di una grandezza fisica con gli insiemi di Borel di R. Dal pun(A) to di vista fisico `e naturale supporre che i proiettori ortogonali PE associati all’osservabile A siano commutanti l’uno con l’altro al variare di E ∈ B(R) (la σ-algebra di Borel di R), in quanto ci si aspetta che le proposizioni del tipo (A) PE := “Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , siano tutte compatibili al variare di E ∈ B(R). Altrimenti non avremmo un’osservabile, ma grandezze incompatibili distinte. Dato che l’esito della misura cade in E ed anche in E se e solo se cade in E ∩ E , assumiamo che (A) (A) (A) (A) PE ∧ PE = PE∩E . Assumiamo che valga anche PR = I, perch´e l’esito (A) della misura cade sicuramente in R, per cui PR `e la proposizione sempre vera, indipendentemente dallo stato sul quale si misura. Infine, per motivi fisicamente evidenti e tenendo conto del significato logico di ∨, `e ragionevole supporre che, per ogni classe finita o numerabile di boreliani di R, {En }n∈N , valga: (A) (A) ∨n∈N PEn = P∪n∈N En . Si potrebbe estendere la richiesta a classi infinite di cardinalit` a arbitaria, ma noi ci fermeremo alla numerabilit` a, come abbiamo fatto nel caso classico. Possiamo allora dare la seguente definizione. Definizione 7.34. Se H `e uno spazio di Hilbert, un’applicazione A, che as(A) socia ad ogni E ∈ B(R) un proiettore ortogonale PE ∈ P(H), `e detta osservabile se valgono le propriet` a che seguono: (A) (A) (A) (A) (a) PE PE = PE PE per ogni coppia E, E ∈ B(R); (A) (A) (A) (b) PE ∧ PE = PE∩E per ogni coppia E, E ⊂ B(R);
7.5 Le osservabili come Misure a Valori di Proiezione su R
297
(A)
(c) PR = I; (d) per ogni famiglia {En }n∈N ⊂ B(R), vale: (A)
(A)
∨n∈N PEn = P∪n∈N En . Osservazioni 7.35. (A) (1) Si dimostra immediatamente che la classe {PE }E∈B(R) `e una σ-algebra di Boole definita rispetto alla solita relazione d’ordine parziale ≤ tra proiettori. (A) (2) In generale {PE }E∈B(R) non `e massimale rispetto alla commutativit`a dei proiettori. ` chiaro che, con la definizione data sopra, ogni osservabile altro non `e (3) E che un omomorfismo di σ-algebre di Boole, dalla σ-algebra di Borel B(R) alla σ-algebra di Boole dei proiettori {PE }E⊂B(R) . La definizione di osservabile pu` o essere riformulata in modo equivalente, ma matematicamente pi` u semplice da maneggiare. Vale la seguente proposizione a tal fine. Proposizione 7.36. Sia H spazio di Hilbert. Un’applicazione P : B(R) → B(H) `e un’osservabile se e solo se soddisfa i seguenti requisiti. (a) P (B) ≥ 0 per ogni B ∈ B(R); (b) P (B)P (B ) = P (B ∩ B ) per ogni coppia B, B ∈ B(R); (c) P (R) = I; (d) per ogni famiglia {Bn }n∈N ⊂ B(R) con Bn ∩ Bm = ∅ se n = m, vale: s-
+∞
P (Bn ) = P (∪n∈N Bn ) .
n=0
Dimostrazione. Se P : B(R) → B(H) `e un’osservabile le propriet`a (a), (b), (c), (d) della proposizione 7.36 sono banalmente verificate. Dobbiamo mostrare che se P : B(R) → B(H) soddisfa tali propriet` a allora `e un’osservabile. Includiamo tutti gli operatori P (B) con B ∈ B(R) in un insieme massimale di proiettori commutanti (che esiste per il lemma di Zorn), P0 (H) e d’ora in poi lavoreremo in tale insieme senza perdere generalit`a. (a) implica che ogni P (B) `e autoaggiunto per (f) in proposizione 3.49, (b) implica che P (B)P (B) = P (B ∩B) = P (B) per cui tutti gli operatori P (B) sono proiettori ortogonali. Inoltre (b) implica anche che P (B)P (B ) = P (B ∩B ) = P (B ∩B) = P (B )P (B) per cui tutti i proiettori commutano tra di loro. Usando la prima identit` a in (i) di (b) di teorema 7.20, la condizione (b) di sopra si riscrive P (B) ∧ P (B ) = P (B ∩ B ). Per concludere `e sufficiente provare la propriet` a (d) della definizione 7.34. Consideriamo una classe numerabile di insiemi {En }n∈N ⊂ B(R) in generale non disgiunti a due a due. Vogliamo provare che esiste ∨n∈N P (En ) e vale ∨n∈N P (En ) = P (∪n∈NEn ) .
298
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Per fare ci` o definiamo la classe di insiemi boreliani a due a due disgiunti: {Bn }n∈N con B0 := E0 e, per n > 0, Bn = En \ (E1 ∪ · · · ∪ En−1) . Si verifica facilmente che: ∪pn=0 En = ∪pn=0 Bn
per ogni p ∈ N ∪ {+∞}.
Da questa identit` a, usando la propriet` a I − P (B) = P (R \ B) ed usando ricorsivamente la seconda identit` a in (i) di (b) di teorema 7.20, si ricava facilmente che: ∨pn=0 P (En ) = ∨pn=0 P (Bn ) per ogni n ∈ N, e quindi: ∨pn=0 P (En ) =
p
P (Bn ) ,
(7.34)
n=0
dove abbiamo tenuto conto che la propriet` a (d) nella tesi di questa proposizione implica che: p p P (Bn ) , ∨n=0 P (Bn ) = n=0
per una classe finita di insiemi disgiunti Bn (la classe finita pu`o sempre essere completata ad una classe numerabile aggiungendo infinite copie dell’insieme vuoto). Possiamo, per concludere, prendere il limite forte per p → +∞ in (7.34). Tale limite esiste per (b) in teorema 7.20 e vale anche, nelle nostre ipotesi: ∨n∈N P (En ) = s- lim
p
p→+∞
P (Bn ) = P (∪n∈NBn ) = P (∪n∈NEn ) .
n=0
Questo conclude la dimostrazione.
Osservazioni 7.37. (1) Si osservi che (c) e (d) da sole implicano che I = P (I ∪ ∅) = I + P (∅) per cui P (∅) = 0 . (2) Se B ∈ B(R) allora R \ B ∈ B(R) e R = B ∪ (R \ B). Quindi da (d), prendendo B0 = B, B1 = R \ B e tutti i rimanenti Bk = ∅ abbiamo che: I = P (B) + P (R \ B). In altre parole vale anche ¬P (B) = P (R \ B) .
La proposizione appena provata consente di identificare in modo biunivoco le osservabili con enti matematici ben noti in letteratura: le misure a valori di proiezione su R. Tale nozione sar`a generalizzata nel prossimo capitolo.
7.5 Le osservabili come Misure a Valori di Proiezione su R
299
Definizione 7.38. Un’applicazione P : B(R) → B(H), con H spazio di Hilbert, che soddisfa le richieste (a), (b), (c) e (d) della proposizione 7.36 `e detta misura a valori di proiezione (PVM) su R oppure equivalentemente misura spettrale su R. Possiamo enunciare il quarto assioma della formulazione matematica generale della Meccanica Quantistica. A4. Ogni osservabile A sul sistema quantistico S `e descritta da una misura a valori di proiezione su R, P (A), nello spazio di Hilbert del sistema HS , in modo tale che, se E `e un boreliano di R, il proiettore P (A)(E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”.
7.5.2 Operatori autoaggiunti associati a osservabili: motivazioni fisiche e esempi elementari In questa sezione daremo l’idea fondamentale di come si possano associare operatori autoaggiunti ad osservabili. In altre parole daremo le motivazioni fisiche per i teoremi spettrali che studieremo nei capitoli 8 e 9. Nel caso di un sistema classico, descritto al tempo t sullo spazio delle fasi Ft , come sappiamo, le osservabili corrispondono a quelle che abbiamo chiamato grandezze fisiche, cio`e funzioni Borel-misurabili f : Ft → R. Ad ogni grandezza fisica f possiamo associare la classe di tutte le proposizioni/boreliani della forma: (f) PE := “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , ovvero, in termini insiemistici: (f)
PE := f −1 (E) ∈ B(Ft ) . (f)
Le proposizioni 7.15 e 7.16 hanno chiarito che {PE }E∈B(R) `e una σ-algebra (f) (di Boole) e l’applicazione B(R) E → PE ∈ B(Ft ) `e un omomorfismo di σ-algebre di Boole. La situazione `e identica nel caso quantistico, quando (A) consideriamo la classe {PE }E∈B(R) delle proposizioni/proiettori associata ad un’osservabile A: tale classe `e una σ-algebra di Boole e l’applicazione B(R) (A) E → PE ∈ P(H) `e un omomorfismo di σ-algebre di Boole. Se ci limitiamo (f) (A) a confrontare le classi {PE }E∈B(R) e {PE }E∈B(R) la struttura `e del tutto analoga. Nel caso classico per`o esiste la funzione f che permette di costruire (f) la classe {PE }E∈B(R) , racchiudendo, da sola, tutta l’informazione possibile (f) della classe di proposizioni PE . Questo `e un fatto banale perch´e noi abbiamo definito tali proposizioni/insiemi partendo da f! Nel caso quantistico, quando
300
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili (A)
`e assegnata un’osservabile {PE }E∈B(R) non c’`e nulla, per il momento, che (A) possa corrispondere ad una funzione f che “generi” la PVM {PE }E∈B(R) . Esiste un corrispondente quantistico ad f? Per cercare di rispondere discutiamo pi` u approfonditamente il legame tra (f) la funzione f e la classe {PE }E∈B(R) ad essa associata. Sappiamo costruire la seconda dalla prima, ma a noi interesserebbe ricostruire la prima a partire dalla seconda, dato che nella formulazione quantistica partiamo dal corrispon(f) (f) dente di {PE }E∈B(R) . In effetti risulta che dalla σ-algebra {PE }E∈B(R) si pu` o ricostruire f con una certa procedura di limite che ricorda una procedura di integrazione. Per illustrare questo punto, abbiamo bisogno di un risultato tecnico. Ricordiamo che se (X, Σ) `e uno spazio misurabile, una funzione Σ-misurabile s : X → C `e detta semplice se assume solo un numero finito di valori. Proposizione 7.39. Sia (X, Σ) spazio misurabile. Se S(X) `e lo spazio delle funzioni semplici su X rispetto a Σ, M (X) `e lo spazio delle funzioni, a valori in C, Σ-misurabili e Mb (X) ⊂ M (X) `e il sottospazio delle funzioni limitate, vale quanto segue. (a) S(X) `e denso in M (X) in senso puntuale. (a) S(X) `e denso in Mb (X) rispetto alla topologia della norma || ||∞. (c) Se f ∈ M (X) assume valori reali non negativi, esiste {sn }n∈N ⊂ S(X) con: 0 ≤ s0 ≤ s1 ≤ · · · ≤ sn (x) → f(x)
se n → +∞ per ogni x ∈ X
e la convergenza `e anche rispetto alla norma || ||∞ quando f ∈ Mb (X). ` sufficiente provare la tesi nel caso di funzioni a valori reali, il Dimostrazione. E caso complesso si ottiene facilmente da questo, decomponendo le funzioni a valori complessi in parte reale ed immaginaria. Definiamo f+ (x) := sup{0, f(x)} e f− (x) := inf{0, f(x)} per x ∈ X; allora f = f+ + f− , dove f+ ≥ 0 e f− ≤ 0 sono, come noto, misurabili essendo f misurabile. Ora costruiamo una successione di funzioni semplici che tende a f+ , tale costruzione dimostra, tra le altre cose, il punto (c) dato che f = f+ se f ≥ 0. Per 0 < n ∈ N fissato, costruiamo una partizione del semi asse reale [0, +∞) fatta da boreliani En,i e En con:
* i−1 i En,i := , En := [n, +∞) , , 2n 2n con 1 ≤ i ≤ n2n . Quindi, per ogni suddetto n, definiamo la classe di insiemi in Σ: (f) Pn,i := f −1 (En,i ) , Pn(f) := f −1 (En ) . Infine poniamo, s0 (x) := 0 se x ∈ X e, per ogni n ∈ N \ {0}: n
sn :=
n2 i−1 i=1
2n
χP (f) + nχP (f) . n,i
n
(7.35)
7.5 Le osservabili come Misure a Valori di Proiezione su R
301
Per costruzione 0 ≤ sn ≤ sn+1 ≤ f per n = 1, 2, . . .. Inoltre, per ogni fissato x ` quindi evidente che risulta |f+ (x)−sn (x)| ≤ 1/2n se n `e abbastanza grande. E sn → f+ puntualmente se n → +∞. La stima |f+ (x)−sn (x)| ≤ 1/2n `e uniforme in x se f+ `e limitata (basta che sia n > sup f+ ), in tal caso la convergenza sn → f+ vale anche nel senso uniforme. Si costruisce similmente, decomponendo il semiasse reale negativo con partizioni analoghe a quella di sopra, una (−) successione di funzioni semplici, sn ≤ 0 che converge puntualmente a f− . (−) La successione delle funzioni semplici sn + sn converge puntualmente a f e uniformemente se f `e limitata. ` chiaro dunque che, assegnata la grandezza classica f : Ft → R misurabile, E possiamo ricostruirla usando una successione di funzioni che sono costanti e (f) differenti da zero solo su insiemi della classe {PE }E∈B(R) . Senza perdere generalit` a concentriamoci sul caso f : Ft → R+ e supponiamo anche che f sia limitata, in modo tale che in (7.35) possiamo trascurare, per n abbastanza grande: (i) tutti gli intervalli En e (ii) gli En,i con il primo estremo ((i−1)2−n ) superiore, diciamo, a (sup f)+1/2n : la controimmagine di tali insiemi secondo f `e l’insieme vuoto. In questo caso la somma nella definizione di sn in (7.35) si pu` o troncare, ottenendo: f = lim
n 2+2 sup f
n→+∞
i=1
i−1 χ (f) . 2n Pn,i
(7.36)
Questo limite pu`o essere visto come una procedura di integrazione rispetto ad una “misura a valori di funzioni caratteristiche” ν (f) : B(R) E → χf −1 (E) ∈ S(X) che associa ad ogni insieme di Borel (nello spazio dei valori assumibili dalla funzione) E ⊂ R, una funzione caratteristica χf −1 (E) : X → C. Si osservi (f)
e approssimativamente il valore che f assume in Pn,i – e tale infatti che, i−1 2n ` stima diventa sempre pi` u precisa quanto pi` u n diventa grande – ed il secondo membro di (7.36) non `e altro che una “somma di Cauchy”. La (7.36) potrebbe essere scritta formalmente: f = λdν (f)(λ) . (7.37) R
Non ci interessa qui andare a fondo in questa analogia, che si pu`o portare avanti in modo rigoroso dando un significato matematicamente rigoroso all’integrale scritto di sopra, perch´e siamo interessati al caso quantistico. In tal caso una formula analoga a (7.37) esiste e definisce un operatore autoaggiunto associato ad un’osservabile che corrisponde a f. Da tale operatore pu` o essere (A) ricostruita, a posteriori, l’osservabile {PE }E∈B(R) in modo simile a quanto (f)
si fa per ottenere {PE }E∈B(R) da f. Vedremo tutto ci`o in modo generale e rigoroso nei prossimi capitoli. Viceversa ora presentiamo un esempio elementare di osservabile e mostriamo come associare a essa un operatore autoaggiunto.
302
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Esempi 7.40. (1) Consideriamo un sistema quantistico, descritto su uno spazio di Hilbert H, e consideriamo per esso una grandezza fisica che, dal punto di vista fisico possa assumere solo una quantit` a discreta e finita di valori distinti {an }n=1,···,N ⊂ R. Cominciamo con il mostrare come associare a tale grandezza un’osservabile, (A) che indicheremo la lettera A, data da una classe di proiettori ortogonali PE con E ∈ B(R). Postuliamo che esista una classe di proiettori ortogonali non nulli etichettati sugli an , {Pan }n=1,···,N tale che Pan Pam = 0 se n = m (che equivale, per aggiunzione, a Pam Pan = 0 se n = m) ed inoltre: N
Pan = I .
(7.38)
n=1
Il significato di Pan sar`a ovviamente: “il valore della grandezza A, in seguito a misura di essa sul sistema, risulta essere esattamente an ”. ` chiaro che la richiesta Pan Pam = Pam Pan = 0, ossia Pan ∧Pam = 0, se n = m E corrisponde alla duplice richiesta fisica che (a) le proposizioni Pan e Pam siano fisicamente compatibili, ma (b) la misura dell’osservabile non possa produrre contemporaneamente il valore an ed anche il valore distinto am (infatti la proposizione associata al proiettore nullo `e quella impossibile). La richiesta N n=1 Pan = I, altrimenti scrivibile come Pa1 ∨ · · · ∨ Pan = I, corrisponde alla richiesta che almeno una delle proposizioni Pan debba risultare verificata in seguito ad una misura dell’osservabile A. L’osservabile A : B(R) → P(H) `e costruita come segue: per ogni boreliano E ⊂ R (A) (A) PE := Pan , con P∅ := 0 . (7.39) an ∈E
La verifica delle propriet` a (a), (b), (c) e (d) della proposizione 12.14 `e ora immediata per costruzione. (2) Riferendoci all’esempio (1), possiamo associare all’osservabile A un operatore, che indicheremo ancora con la stessa lettera A. La definizione `e la seguente: N A := an Pan . (7.40) n=0
L’operatore A `e limitato ed autoaggiunto per costruzione essendo combinazione lineare a coefficienti reali di operatori autoaggiunti ed ha una ulteriore propriet` a interessante: l’insieme degli autovalori σp (A) di A coincide con i valori assumibili dall’osservabile A. La prova di ci` o `e diretta: se 0 = u ∈ Pan (H) allora Pam u = Pam Pan u = u se n = m oppure 0 se n = m. Inserendo questo risultato in (7.40), si ha subito che Au = an u per cui an ∈ σp (A). Viceversa, se u = 0 `e autovettore di A con
7.5 Le osservabili come Misure a Valori di Proiezione su R
303
autovalore λ (che deve essere reale dato che A = A∗ ), deve risultare da (7.40): λu =
N
an Pan u .
n=0
D’altra parte, essendo an Pan = I, modificando il primo membro dell’identit` a di sopra, deve risultare: N
λPan u =
n=0
N
an Pan u ,
n=0
e quindi: N
(λ − an )Pan u = 0 .
(7.41)
n=0
Se applichiamo infine Pm ad ambo membri e ricordiamo che Pm Pn = δm,n Pn , otteniamo le N identit` a: (λ − am )Pam u = 0 . Se queste identit`a fossero tutte risolte da Pm u = 0 per ogni m avremmo un assurdo dovendo essere: 0 = u = Iu =
N
Pan u .
n=0
o pu` o Quindi ci deve essere qualche n in (7.41) per cui λ = an . Si noti che ci` accadere per un solo valore di n essendo per ipotesi gli an distinti. In definitiva l’autovalore λ di A deve coincidere con uno dei valori an . Abbiamo provato che l’insieme degli autovalori di A coincide con i valori assumibili dall’osservabile A. L’operatore autoaggiunto A gioca qui un ruolo analogo a quello giocato (f) dalla funzione f nel caso di una grandezza classica {PE }E∈T (R) . Nei prossimi capitoli svilupperemo una procedura che consente di associare in modo univoco ad ogni osservabile A (cio`e ad ogni misura a valori di proiezione su R) un operatore autoaggiunto (generalmente non limitato) che indicheremo con la stessa lettera A, estendendo quanto trovato negli esempi precedenti. I valori assumibili dall’osservabile saranno dati dagli elementi dello spettro completo dell’operatore σ(A) che, come vedremo, `e un insieme generalmente pi` u grande dell’insieme σp (A) degli autovalori. Lo strumento centrale da utilizzare sar`a la procedura d’integrazione rispetto ad una misura a valori di proiezione, che corrisponde alla generalizzazione dell’espressione: f(λ)Pλ =: f(λ) dP (A)(λ) , λ∈σp (A)
σ(A)
304
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(cfr (7.38) con f : λ → 1 e (7.40) con f : λ → λ ) al caso in cui i valori λ sono infiniti e possono variare in modo continuo in tutto lo spettro di A. In particolare dovranno valere le identit` a, la cui interpretazione verr`a dalla teoria delle misure spettrali: (A) A= λ dP (λ) , I = 1 dP (A)(λ) . σ(A)
σ(A)
7.5.3 Misure di probabilit` a associate a coppie stato - osservabile Un’altra propriet` a notevole delle misure a valori di proiezione su R `e la seguente, che avr`a importanti conseguenze nelle applicazioni fisiche. Proposizione 7.41. Sia H uno spazio di Hilbert e A = {PE }E∈B(R) una misura a valori di proiezione su R. Se ρ ∈ S(H) `e uno stato, l’applicazione (A) μρ : E → tr(ρPE ) `e una misura di Borel di probabilit` a su R. (A)
Dimostrazione. La prova `e elementare. Basta provare che μρ `e positiva, σ(A) additiva e μρ (R) = 1. R `e di Hausdorff e localmente compatto, per cui ogni misura positiva σ-additiva sull’algebra di Borel `e una misura di Borel. Decomponiamo ρ come al solito su una base hilbertiana di suoi autovettori: ρ= pj (ψj | )ψj , j∈N (A)
dove i numeri pj sono non negativi e la loro somma `e 1. Vale: μρ (E) = tr(ρPE ) ≥ 0 dato che i proiettori ortogonali sono operatori positivi, i numeri (A) Pj sono non negativi e che tr(ρPE ) = j∈N pj (ψj |PE ψj ). Inoltre μρ (R) = 1 dato che, valendo PR = I, pj (ψj |Iψj ) = trρ = 1 . j∈N (A)
Proviamo la σ-additivit` a di μρ . Se {En }n∈N `e una classe di boreliani disgiunti a due a due e E := ∪n∈N En , allora vale, tenendo conto di (d) della proposizione 7.39: +∞ +∞ +∞ +∞
+∞ > tr(ρPE ) = pj ψj PEi ψj = pj (ψj |PEi ψj ) .
j=0
i=0
j=0 i=0
Dato che pj ≥ 0 e (ψj |PEi ψj ) ≥ 0, il teorema di Fubini permette di interscambiare le serie di sopra, ottenendo: tr(ρPE ) =
+∞ +∞ i=0 j=0
pj (ψj |PEi ψj ) =
+∞ i=0
tr(ρPEi ) .
7.5 Le osservabili come Misure a Valori di Proiezione su R
305
In altre parole, se {En }n∈N `e una classe di boreliani disgiunti a due a due allora: +∞ μρ(A) (∪n∈N En ) = μρ(A) (En ) . n=0
Questo conclude la dimostrazione.
Esempi 7.42. (1) Consideriamo l’osservabile A che assume un numero finito N di valori discreti an vista negli esempi (1) e (2) in 7.40, usando le stesse notazioni usate ivi. Sia A (7.40) l’operatore autoaggiunto associato all’osservabile. Fissiamo uno stato ρ ∈ S(H) e consideriamo la sua misura di probabilit` a relativa (A) all’osservabile {PE }E∈T (R) . Per costruzione, se E ∈ T (R): (A) tr(ρPan ) = pn δan (E) μρ(A) (E) := tr(ρPE ) = an ∈E
an
con: pn := tr(ρPan ) . Quindi: μρ(A) =
pn δan ,
(7.42)
an
dove abbiamo usato le misure di Dirac δan centrate nei punti an : δa (E) = 1 se a ∈ E, oppure δa (E) = 0 se a ∈ E. Si osservi che 0 ≤ pn ≤ 1 e n pn = 1 per costruzione. Quindi la misura di probabilit` a associata allo stato ρ e riferita all’osservabile A `e di fatto una combinazione lineare convessa di misure di Dirac. (2) Il valore medio dell’osservabile A sullo stato ρ, A ρ ed il suo scarto quadratico medio ΔA2ρ sullo stato ρ, possono essere scritti in modo sintetico usando l’operatore A (7.40) associato all’osservabile nel modo che segue. Per definizione di valore medio: A ρ = a dμρ(A)(a) . R
D’altra parte, tenendo conto dell’espressione (7.42) si ha: a dμρ(A) (a) = p n an = an tr(ρPan ) . R
n
n
Usando infine (7.40) e le propriet` a lineari della traccia, concludiamo che: A
ρ
= tr(Aρ) .
(7.43)
Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.43) che, se A ψ indica il valor medio di A sullo stato individuato dal vettore ψ: A ψ = (ψ|Aψ) (7.44)
306
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Per definizione lo scarto quadratico medio `e: ΔA2ρ = a2 dμρ(A) (a) − A R
2 ρ
.
Procedendo come nel caso del valor medio: a
2
R
dμρ(A) (a)
=
n
pn a2n
=
a2n tr(ρPan )
= tr ρ
n
a2n Pan
.
n
Si osservi ora che: A2 = an Pan am Pam = an am Pan Pam = a2n Pan = A2 , n
m
n,m
n
dove abbiamo usato Pan Pam = δn,m Pn . In definitiva: 2 ΔA2ρ = tr ρA2 − (tr (ρA)) .
(7.45)
Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.45) che, se ΔA2ψ indica lo scarto quadratico medio di A sullo stato individuato dal vettore ψ: 2 ΔA2ψ = ψ|A2 ψ − (ψ|Aψ) = ψ| A2 − A 2ψ ψ . (7.46) Le formule che abbiamo scritto negli esempi di sopra concernenti i valori medi e gli scarti quadratici medi di osservabili in fissati stati, sono in realt`a valide in casi pi` u generali (con opportune ipotesi tecniche), come sar`a provato nella proposizione 10.5, quando avremo definito in maniera del tutto generale la procedura per associare operatori autoaggiunti ad osservabili.
Esercizi 7.1. Provare che per ogni algebra di Boole X, se a ∈ X allora ¬a `e l’unico elemento a soddisfare (i) e (ii) di (c) nella definizione 7.11. 7.2. Provare che in ogni algebra di Boole X valgono le identit` a di De Morgan (7.5) e (7.6). 7.3. Provare che un’algebra di Boole `e σ-completa se e solo se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo inferiore. 7.4. Provare che un omomorfismo di algebre di Boole h : X → Y preserva l’ordinamento: se per a, b ∈ X vale a ≤ b, allora vale anche h(a) ≤ h(b).
Esercizi
307
7.5. Provare che se h : X → Y `e un omomorfismo di σ-algebre di Boole allora vale la (7.7) 7.6. Dimostrare la proposizione 7.14. 7.7. Dimostrare la proposizione 7.15. un insieme di proiettori ortogonali a due a due commutanti 7.8. Sia P(H) nello spazio di Hilbert H. Mostrare che esiste un insieme P0 (H) di proiettori e che `e massimale rispetto alla condizioortogonali che include l’insieme P(H) ne di commutativit` a (cio`e ogni proiettore ortogonale in H che commuta con gli elementi di P0 (H) `e contenuto in P0 (H)). Suggerimento. Usare il lemma di Zorn rispetto alla relazione d’ordine dell’inclusione insiemistica, nell’insieme parzialmente ordinato i cui elementi sono le classi di proiettori a due a due commutanti.
8 Teoria Spettrale I: generalit` a e operatori normali di B(H) in spazi di Hilbert Il matematico gioca un gioco in cui egli stesso inventa le regole. Il fisico gioca un gioco in cui le regole sono fornite dalla Natura. Ma, con il passare del tempo, diventa sempre pi` u evidente che le regole che il matematico trova interessanti sono quelle che la Natura ha scelto. Paul Adrien Maurice Dirac
In questo capitolo, di carattere puramente matematico, introduciamo i primi rudimenti di teoria spettrale per operatori (generalmente non limitati) su spazi normati, fino ad arrivare alla nozione di misura spettrale ed al teorema di decomposizione spettrale per operatori normali in B(H) con H spazio di Hilbert. Il teorema spettrale per operatori autoaggiunti non limitati sar`a trattato nel prossimo capitolo. Nella prima parte del capitolo introdurremo il concetto di risolvente e di spettro di un operatore e, pi` u in generale, di un elemento di un’algebra di Banach con unit` a. Ne studieremo alcune propriet`a generali. Lo spettro di un operatore `e un insieme di numeri complessi che generalizza il concetto di insieme degli autovalori. Il teorema spettrale prova che ogni operatore (in questo libro: limitato normale, oppure autoaggiunto non necessariamente limitato) pu` o essere decomposto tramite una procedura di integrazione dello spettro, rispetto ad una opportuna misura a “valori di proiezione”. In definitiva, tale teorema pu`o essere visto come una generalizzazione negli spazi di Hilbert del teorema di diagonalizzazione delle matrici normali a coefficienti in C. Gli strumenti matematici necessari per formulare il teorema spettrale sono utili anche per altri fini. Vedremo infatti che, attraverso di essi, `e possibile dare una nozione di “operatore funzione di un secondo operatore”. Tale nozione ha molteplici applicazioni in fisica matematica. Il legame della teoria spettrale con la Meccanica Quantistica risiede nel fatto che le misure a valori di proiezione non sono altro che le osservabili definite nel capitolo precedente. Attraverso il teorema spettrale, le osservabili risultano essere in corrispondenza biunivoca con operatori autoaggiunti (generalmente non limitati) e gli spettri di tali operatori costituiscono gli insiemi degli esiti possibili delle misure quando si misurano le osservabili. La corrispondenza tra osservabili e operatori autoaggiunti permetter` a di sviluppare la formulazione della teoria quantistica in stretto legame con la meccanica Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
310
8 Teoria Spettrale I: operatori limitati
classica, nella quale, le osservabili sono le grandezze fisiche rappresentate da funzioni a valori reali. Esaminiamo con pi` u dettaglio il contenuto del capitolo. Nella prima sezione definiremo, come detto sopra i concetti di: spettro, risolvente, operatore risolvente, discutendone le propriet` a pi` u importanti ed in particolare la formula del raggio spettrale. Tali nozioni saranno estese al caso astratto di elementi di algebre di Banach o C ∗ -algebre, includendo la dimostrazione del teorema di Gelfand-Mazur. Nella sezione successiva costruiremo alcuni ∗-omomorfismi continui di C ∗algebre di funzioni indotti da operatori limitati autoaggiunti in spazi di Hilbert, che saranno lo strumento fondamentale per fare il primo passo verso il teorema spettrale. Nella quarta sezione, introdurremo la nozione di misura spettrale o misura a valori di proiezione (PVM) e definiremo la nozione di integrale di una funzione limitata rispetto ad una misura a valori di proiezione. L’ultima sezione sar´a dedicata alla formulazione ed alla dimostrazione del teorema spettrale per operatori limitati normali (in particolare autoaggiunti o unitari) ed alla discussione di risultati tecnici correlati. Dimostreremo infine l’utile teorema di Fuglede.
8.1 Spettro e risolvente In questa sezione ci occuperemo delle nozioni e dei risultati fondamentali della teoria spettrale in spazi normati, di Banach e di Hilbert ed anche in contesti pi` u generali di algebre di Banach e C ∗ -algebre. Nel seguito faremo uso della teoria delle funzioni analitiche definite su sottoinsiemi aperti di C ed a valori in uno spazio di Banach sul campo complesso [Rud82], piuttosto che in C. Definizione 8.1. Se (X, || ||) `e uno spazio di Banach sul campo C e Ω ⊂ C `e un aperto non vuoto, f : Ω → X `e detta analitica se, per ogni z0 ∈ Ω esiste δ > 0 con: +∞ f(z) = (z − z0 )n an per ogni z ∈ Bδ (z0 ), n=0
dove Bδ (z0 ) ⊂ Ω, an ∈ X per ogni n ∈ N e la convergenza della serie `e riferita alla topologia indotta dalla norma || ||. La teoria delle funzioni analitiche a valori in spazi di Banach `e essenzialmente la stessa delle funzioni analitiche a valori complessi che supponiamo nota, con l’unica differenza che, sull’immagine delle funzioni, il valore assoluto deve essere sostituito con la norma dello spazio di Banach. Le definizioni, gli enunciati dei teoremi e le loro dimostrazioni sono gli stessi del caso elementare, se si tiene conto di tale precisazione.
8.1 Spettro e risolvente
311
8.1.1 Nozioni fondamentali Partiamo dal caso operatoriale lavorando con operatori definiti in spazi normati. Ricordiamo che, se X `e uno spazio vettoriale, dire che (definizione 5.1) “A `e un operatore in X”, significa che A : D(A) → X, dove il dominio di A, D(A) ⊂ X, `e un sottospazio, in generale non chiuso, di X. Definizione 8.2. Sia A un operatore nello spazio normato X. (a) Si dice insieme risolvente di A l’insieme ρ(A) dei λ ∈ C tali che siano soddisfatte le seguenti tre condizioni insieme: (i) Ran(A − λI) = X, (ii) (A − λI) : D(A) → X `e iniettivo, (iii) (A − λI)−1 : Ran(A − λI) → X `e limitato. (b) Se λ ∈ ρ(A), si dice operatore risolvente di A l’operatore: Rλ (A) := (A − λI)−1 : Ran(A − λI) → D(A) . (c) Si dice spettro di A l’insieme σ(A) := C \ ρ(A). Lo spettro di A `e unione dei seguenti tre sottoinsiemi disgiunti: (i) lo spettro puntuale di A, σp (A), costituito dai numeri complessi λ per cui l’operatore A − λI non `e iniettivo, (ii) lo spettro continuo di A, σc (A), costituito dai numeri complessi λ per cui l’operatore A − λI `e iniettivo e vale l’identit` a Ran(A − λI) = X, ma (A − λI)−1 non `e limitato, (iii) lo spettro residuo di A, σr (A), costituito dai numeri complessi λ per cui l’operatore A − λI `e iniettivo, ma Ran(A − λI) = X. Osservazioni 8.3. ` chiaro che σp (A) contiene tutti e soli gli autovalori di A (vedi defini(1) E zione 3.48). Nel caso in cui X = H `e uno spazio di Hilbert e gli autovettori di A formano una base hilbertiana di H, si dice che A ha spettro puntuale puro. Si osservi che questo non significa, in generale, che σp (T ) = σ(T ); per esempio gli operatori autoaggiunti compatti hanno tutti spettro puntuale puro, tuttavia 0 pu` o essere un punto dello spettro continuo. (2) Esistono altre decomposizioni dello spettro [ReSi80, AbCi97] nel caso in cui X = H sia spazio di Hilbert e A sia operatore normale di B(H), oppure autoaggiunto in H. Ne esamineremo brevemente qualcuna nel capitolo seguente, dopo aver dimostrato il teorema spettrale per operatori autoaggiunti non limitati. Per uno studio pi` u dettagliato di tali classificazioni, per operatori rilevanti in Meccanica Quantistica, si veda [ReSi80, AbCi97]. Cominciamo a fare qualche assunzione pi` u specifica, assumendo che X sia spazio di Banach e lavorando con operatori chiusi. In particolare il seguente risultato si applica quindi a T ∈ B(X) oppure, se X = H `e spazio di Hilbert, si applica a T : D(H) → H autoaggiunto o coincidente con l’aggiunto di un operatore in H, tenendo conto del teorema 5.9.
312
8 Teoria Spettrale I: operatori limitati
Teorema 8.4. Sia T un operatore chiuso nello spazio di Banach X = {0}. Valgono i seguenti fatti. (a) λ ∈ ρ(T ) se e solo se T − λI `e una biezione di D(T ) su X. (b) (i) ρ(T ) `e aperto, (ii) σ(T ) `e chiuso, (iii) se ρ(T ) = ∅, ρ(T ) λ → Rλ (T ) ∈ B(H) `e analitica. (c) Se D(T ) = X (e quindi T ∈ B(X)), allora: (i) ρ(T ) = ∅, (ii) σ(T ) = ∅ `e compatto (iii) |λ| ≤ ||T || per ogni λ ∈ σ(T ). (d) Per ogni λ, μ ∈ ρ(T ) vale l’equazione risolvente: Rλ (T ) − Rμ (T ) = (λ − μ)Rλ (T )Rμ (T ) . Osservazioni 8.5. (1) A commento della precisazione che appare nel punto (c), si osservi che, se X `e spazio di Banach e D(T ) = T , allora vale che T : D(T ) → X `e chiuso se e solo se T ∈ B(X), per il teorema 2.104 del grafico chiuso. (2) Il punto (a) del teorema `e spesso tecnicamente utile perch´e in virt` u di esso, nelle ipotesi stabilite, per verificare se λ ∈ ρ(T ) non `e necessario controllare le propriet` a topologiche di densit` a di Ran(T −λI) e di limitatezza di (T −λI)−1 , ma `e sufficiente controllare la propriet`a algebrica che T − λI : D(T ) → X sia biettiva. Prova del teorema 8.4. (a). Se λ ∈ ρ(T ), basta provare che Ran(T − λI) = X. Dato che (T − λI)−1 `e continuo, esiste K ≥ 0 per cui ||(T − λI)−1 x|| ≤ K||x|| per ogni x = (T − λI)y ∈ Ran(T − λI). Di conseguenza, per ogni y ∈ D(T ) vale: ||y|| ≤ K||(T − λI)y|| . (8.1) Dato che Ran(T − λI) = X, se x ∈ X, esister`a una successione {yn }n∈N ⊂ D(T ) per cui (T − λI)yn → x per n → +∞. Da (8.1) concludiamo che {yn }n∈N `e successione di Cauchy e quindi ammette limite y ∈ X. Essendo T un operatore chiuso, dovr` a essere y ∈ D(T ) e (T − λI)y = x, per cui x ∈ Ran(T − λI). Abbiamo provato che Ran(T − λI) = X, come volevamo. Supponiamo ora che T −λI sia una biezione di D(T ) su X; per provare la tesi `e sufficiente mostrare che (T −λI)−1 `e continuo. Poich´e T `e chiuso, allora anche T − λI `e chiuso, cio`e ha grafico chiuso. Dato che T − λI `e una biezione, segue subito che anche (T − λI)−1 ha grafico chiuso ed `e quindi chiuso. Essendo (T − λI)−1 definito su tutto X per ipotesi, il teorema 2.104 del grafico chiuso prova immediatamente che (T − λI)−1 `e limitato. (b). Se μ ∈ ρ(T ), la serie: S(λ) :=
+∞ n=0
(λ − μ)n Rμ (T )n+1
8.1 Spettro e risolvente
313
converge assolutamente nella norma operatoriale (e quindi nella topologia uniforme) se: |λ − μ| < 1/||Rμ(T )|| . (8.2) Infatti vale: +∞
|λ − μ|n ||Rμ(T )n+1 || ≤
n=0
+∞
|λ − μ|n ||Rμ(T )||n+1
n=0
= ||Rμ(T )||
+∞
| (λ − μ) ||Rμ(T )|| |n .
n=0
L’ultima serie `e una serie geometrica di ragione |(λ−μ)||Rμ (T )|||, che converge in quanto | (λ − μ) ||Rμ(T )|| | < 1 per la (8.2). Se λ soddisfa la condizione di sopra, applicando T − λI = (T − μI) + (μ − λ)I a sinistra ed a destra di S(λ) svilupatto in serie come visto sopra, si ottiene immediatamente che (usando anche la definizione Rμ (T )0 := I): (T − λI)S(λ) = IX mentre: S(λ)(T − λI) = ID(T ) . Abbiamo provato che se μ ∈ ρ(T ), c’`e un intorno aperto di μ tale che, per ogni punto λ di tale intorno, esiste ed `e limitato l’inverso, destro e sinistro, di T − λI da X a D(T ). Quindi, per (a), tale intorno `e incluso in ρ(T ) e allora ρ(T ) `e aperto e σ(T ) = C \ ρ(T ) `e chiuso. Inoltre Rλ (T ) `e sviluppabile in serie di Taylor nell’intorno di ogni punto di ρ(T ) secondo la topologia operatoriale uniforme, per cui, per definizione, ρ(T ) λ → Rλ (T ) `e una funzione analitica da ρ(T ) a valori nello spazio di Banach B(X). (c). Nel caso D(T ) = X, essendo T chiuso e X spazio di Banach, il teorema del grafico chiuso implica che T `e limitato. Se λ ∈ C soddisfa |λ| > ||T ||, allora la serie: +∞ S(λ) = (−λ)−(n+1) T n n=0 0
(T := I), converge assolutamente nella norma operatoriale. Per computo diretto si verifica che, come nel caso precedente, valgono effettivamente le identit` a: (T − λI)S(λ) = I e anche: S(λ)(T − λI) = I , e quindi S(λ) = Rλ (T ) per (a). Quindi, per (a), ogni λ ∈ C con |λ| > ||T || appartiene a ρ(T ), che `e dunque non vuoto. Inoltre, se λ ∈ σ(T ), deve valere |λ| ≤ ||T ||, per cui, se σ(T ) `e non vuoto, allora `e compatto perch´e chiuso e limitato. Mostriamo che σ(T ) = ∅. Supponiamo per assurdo che σ(T ) = ∅. In
314
8 Teoria Spettrale I: operatori limitati
tal caso λ → Rλ (T ) `e definita su tutto C. Fissiamo f ∈ X (duale di X) e x ∈ X e consideriamo la funzione a valori complessi: ρ(T ) λ → g(λ) := f(Rλ (T )x). Questa funzione `e sicuramente analitica in ogni componente connessa dell’insieme aperto ρ(T ), perch´e, per quanto provato sopra, se μ ∈ ρ(T ), in un intorno di μ tutto contenuto in ρ(T ), si ha lo sviluppo di Taylor: f(Rλ (T )x) :=
+∞
(λ − μ)n f(Rμ (T )n+1 x) ,
n=0
dove abbiamo sfruttato la continuit` a di f, ed il fatto che la serie converge nella topologia uniformemente (e quindi anche in quella debole). Dunque, nell’ipotesi in cui σ(T ) = ∅, g `e una funzione analitica su tutto C. Notiamo ancora che per |λ| > ||T || vale anche lo sviluppo: g(λ) := f(Rλ (T )x) =
+∞
(−λ)−(n+1) f(T n x) .
n=0
Dato che tale serie converge assolutamente (per il teorema di Abel sulle serie di potenze), possiamo scrivere, per |λ| ≥ 1 + ||T ||: |g(λ)| ≤ |λ|−1
+∞
|λ|−n |f(T n x)| ≤
n=0
K , |λ|
per qualche K > 0. Quindi la funzione |g|, essendo continua ovunque e maggiorata da K|λ−1 | per |λ| ≥ Λ per qualche costante Λ, deve essere limitata su tutto il piano complesso. Essendo anche analitica su tutto il piano complesso, g deve essere costante per il teorema di Liouville. Annullandosi |g(λ)| all’infinito, g deve essere la funzione nulla. Allora f(Rλ (T )x) = 0. Dato che il risultato vale per ogni f ∈ X , il corollario 2.68 di Hahn-Banach (che richiede X = {0}), implica che deve essere ||Rλ(T )x|| = 0. Dato che anche x ∈ X = {0} era arbitrario, dobbiamo concludere che Rλ (T ) = 0 per ogni λ ∈ ρ(T ). Ma allora `e impossibile che Rλ (T ) sia l’operatore inverso di T − λI. L’assurdo prova che l’ipotesi σ(T ) = ∅ non pu` o verificarsi. (d). L’equazione risolvente si prova come segue. Valgono le equazioni: (T − λI)Rλ (T ) = I
e
(T − μI)Rμ (T ) = I .
Esplicitando i prodotti: T Rλ (T ) − λRλ (T ) = IX e T Rμ (T ) − μRμ (T ) = IX . Moltiplicando a sinistra la prima equazione per Rμ (T ) e la seconda per Rλ (T ), sottraendo i risultati ottenuti membro a membro e tenendo conto che Rμ (T )Rλ (T ) = Rλ (T )Rμ (T ) e che Rμ(T )T Rλ (T ) = Rλ (T )T Rμ (T ), si ottiene l’equazione risolvente. La prima relazione di commutazione scritta sopra segue dall’evidente identit`a: (T − μI)(T − λI) = (T − λI)(T − μI)
8.1 Spettro e risolvente
315
che ne implica un’analoga per gli operatori inversi; la seconda relazione di commutazione si prova come segue: Rμ (T )T Rλ (T ) = Rμ (T )(T − λI)Rλ (T ) + Rμ (T )λIRλ (T ) = Rμ (T )I + λRμ (T )Rλ (T ) = Rμ (T ) + λRλ (T )Rμ (T ) = (I + λRλ (T ))Rμ (T ) = (Rλ (T )(T − λI) + λRλ (T ))Rμ (T ) = Rλ (T )T Rμ (T ) . Questo conclude la dimostrazione.
8.1.2 Algebre di Banach: teorema di Gelfand-Mazur, raggio spettrale, formula di Gelfand Passiamo ora al caso pi` u astratto a livello di algebre di Banach con unit` ae C ∗-algebre con unit` a (definizioni 2.36 e 3.40 rispettivamente). Ricordiamo che se X `e uno spazio normato, allora B(X) `e un’algebra di Banach con unit` a per (i) di (c) del teorema 2.54. Se H `e uno spazio di Hilbert, allora B(X) `e una C ∗-algebra con unit` a, in cui l’involuzione `e data dalla coniugazione hermitiana di operatori, per il teorema 3.43. Per cominciare estendiamo la definizione di risolvente e spettro in termini astratti, usando come modello B(X), con X spazio di Banach e tenendo conto che in tal caso vale il teorema 8.4 per gli elementi di B(X). Definizione 8.6. Sia A un’algebra di Banach con unit` a I e a ∈ A. (a) Il risolvente di a `e l’insieme: ρ(a) := {λ ∈ C | ∃(a − λI)−1 ∈ A inverso destro e sinistro di (a − λI)} . (b) Lo spettro di a `e l’insieme: σ(a) := C \ ρ(a). In tal caso abbiamo il seguente teorema che generalizza al caso astratto la parte del teorema 8.4 che si applica agli operatori di B(X). Teorema 8.7. Sia A = {0} un’algebra di Banach con unit` a I. Per ogni a ∈ A valgono i fatti seguenti. (a) ρ(a) = ∅ `e aperto, σ(a) = ∅ `e compatto e vale: |λ| ≤ ||a|| , per ogni λ ∈ σ(a). (b) ρ(a) λ → Rλ (a) := (a − λI)−1 ∈ A `e una funzione analitica. (c) Se λ, μ ∈ ρ(a) vale l’equazione risolvente: Rλ (a) − Rμ (a) = (λ − μ)Rλ (a)Rμ (a) . Dimostrazione. La dimostrazione `e la stessa delle propriet`a (b), (c) e (d) del teorema 8.4, tenendo anche conto di (1) nell’osservazione 8.5 e rimpiazzando, nella dimostrazione della propriet` a (c) del teorema 8.4, f(Rλ (T )x) con f(Rλ (a)), dove f ∈ A duale topologico di A visto come spazio di Banach.
316
8 Teoria Spettrale I: operatori limitati
Un immediato corollario del teorema precedente `e un importante risultato, noto come teorema di Gelfand-Mazur. Teorema 8.8. (Di Gelfand-Mazur.) Se B = {0} `e un’algebra di Banach con unit` a, in cui ogni elemento non nullo ammette inverso, allora B `e isomorfa in modo naturale a C (quindi, in particolare, B deve essere commutativa). Dimostrazione. Se x ∈ B allora σ(x) = ∅ per (a) del teorema precedente. Allora x − cI non `e invertibile per qualche c ∈ C per definizione di spettro. Nelle nostre ipotesi deve essere x − cI = 0 e quindi x = cI. c `e unicamente fissato x, dato che cI = c I se c = c . L’applicazione B x → c ∈ C `e un isomorfismo di algebre di Banach come si prova immediatamente. In base ad (a) del teorema 8.7, se a ∈ A, il suo spettro `e contenuto nel cerchio di raggio ||a|| centrato nell’origine di C. Tuttavia potrebbe esserci un cerchio di raggio pi` u piccolo, con lo stesso centro, che racchiude σ(a). A tal fine si enuncia la seguente definizione. Definizione 8.9. Sia A algebra di Banach con unit` a. Il raggio spettrale di a ∈ A `e il numero reale non negativo: r(a) := sup{|λ| | λ ∈ σ(a)} . La definizione si applica in particolare al caso A = B(X) con X spazio di Banach. Esiste una celebre formula per il calcolo del raggio spettrale, dovuta al matematico Gelfand. Otterremo la formula di Gelfand usando un risultato sullo spettro di polinomi di elementi di A. Proposizione 8.10. Siano A algebra di Banach con unit` a I, a ∈ A e p = p(z) un polinomio complesso nella variabile z ∈ C. Valgono i seguenti fatti. (a) Se p(a) indica l’elemento di A ottenuto sostituendo al numero z l’elemento a in p(z) ed interpretando in modo ovvio ogni potenza an (a0 := I), vale: σ(p(a)) = p(σ(a)) := {p(λ) | λ ∈ σ(a)} .
(8.3)
(Il risultato si applica in particolare al caso A = B(X) con X spazio di Banach.) (b) Se A `e anche C ∗-algebra con unit` a, lo spettro di a∗ soddisfa: σ(a∗ ) = σ(a) := {λ | λ ∈ σ(a)} .
(8.4)
(Il risultato si applica in particolare al caso A = B(H) con H spazio di Hilbert.) Dimostrazione. (a). Se α1 , . . . , αn sono .nle radici di un polinomio q (non necessariamente distinte), vale q(z) = c i=1 (z − αi ), per qualche complesso c.
8.1 Spettro e risolvente
317
.n
Quindi q(a) = c i=1 (a − αi I). Sia λ ∈ σ(a): allora (a − λI) non `e invertibile per definizione; definiamo μ := p(λ). Consideriamo il polinomio q := p − μ. Dato che q(λ) = 0, uno dei fattori della decomposizione di q scritta sopra sar`a (z − λ). Di conseguenza, scegliendo opportunamente l’ordine delle radici e tenendo conto che gli elementi a − αi I commutano tra di loro, si ha: # "n−1 n−1 / / (a − αi I) (a − λI) = c(a − λI) (a − αi I) . p(a) − μI = c i=1
i=1
Come conseguenza, p(a) − μI non potr` a essere invertibile, essendo a − λI non invertibile, per definizione deve allora essere μ ∈ σ(p(a)). Abbiamo quindi provato che p(σ(a)) ⊂ σ(p(a)). Per concludere proviamo l’altra inclusione. Sia μ ∈ . σ(p(a)): poniamo q = p − μ e decomponiamo il polinomio q come n q(z) = c i=1 (z − αi ). Avremo l’analoga decomposizione: n / p(a) − μI = c (a − αi I) . i=1
Se tutte le radici αi appartenessero a ρ(a), allora ogni (a − αi I) : X → X sarebbe invertibile e quindi sarebbe invertibile p(a) − μI, cosa che `e esclusa per ipotesi. Di conseguenza ci sar`a una radice αk tale che (a − αk I) non `e invertibile e quindi αk ∈ σ(a). Ma allora p(αk ) − μ = 0 e dunque μ ∈ p(σ(a)), il che implica p(σ(a)) ⊃ σ(p(a)). (b). (a − λI) `e invertibile se e solo se `e invertibile (a − λI)∗ = a∗ − λI `e per (c) di proposizione 3.41 e quindi vale la tesi. Teorema 8.11. Siano A algebra di Banach con unit` a e a ∈ A. (a) Il raggio spettrale di a si pu` o ottenere dalla formula di Gelfand: r(a) = lim ||an ||1/n , n→+∞
dove il limite a secondo membro esiste sempre. (Il risultato si applica in particolare al caso A = B(X) con X spazio di Banach.) (b) Se A `e una C ∗ -algebra con unit` a e a `e normale (cio`e a∗ a = aa∗ ), allora vale sempre r(a) = ||a|| ; (8.5) di conseguenza:
||a|| = r(a∗ a)1/2
per ogni a ∈ A.
(8.6)
(Il risultato si applica in particolare al caso A = B(H) con H spazio di Hilbert.) Dimostrazione. (a). Per (a) di proposizione 8.10 si ha (σ(a))n = σ(an ), per cui r(a)n = r(an ) ≤ ||an|| e quindi vale: r(a) ≤ lim inf ||an||1/n . n
(8.7)
318
8 Teoria Spettrale I: operatori limitati
(Si noti che, al contrario del limite inferiore, che esiste sempre, il limite potrebbe non esistere.) Se |λ| > r(a), allora vale: Rλ (a) =
+∞
(−λ)−(n+1) an ,
(8.8)
n=0
perch´e, per il teorema di Hadamard, il bordo del cerchio di convergenza di una serie di potenze di Laurent di una funzione analitica `e quello che passa nella singolarit` a pi` u vicina al punto all’infinito. Nel caso in esame, dato che tutte le singolarit` a appartengono allo spettro σ(a), il bordo del cerchio di convergenza `e dato dai punti λ ∈ C con |λ| > r(a). In definitiva, la serie di sopra converge per ogni λ ∈ C tale che |λ| > r(a) e quindi converger`a assolutamente in ogni cerchio, centrato nel punto all’infinito, che passa per un tale λ. In particolare varr` a: |λ|−(n+1)||an || → 0 , se n → +∞, per ogni λ ∈ C con |λ| > r(a). Per ogni > 0, deve accadere allora che, definitivamente: ||an||1/n < 1/n |λ|(n+1)/n = (|λ|)1/n|λ| , a che lim supn ||an||1/n ≤ per cui, essendo (|λ|)1/n → 1 per n → +∞, accadr` |λ| per ogni λ ∈ C con |λ| > r(a). Dato che possiamo avvicinarci a piacere al valore di r(a) con |λ|, dovr` a accadere che lim supn ||an ||1/n ≤ r(a). Tenendo conto di (8.7), abbiamo infine che: r(a) ≤ lim inf ||an ||1/n ≤ lim sup ||an ||1/n ≤ r(a) . n
n
Questo prova che esiste il limite di ||an ||1/n per n → +∞ e che esso coincide con r(a). (b). Per (a) di proposizione 3.41 abbiamo che ||an || = ||a||n se a `e normale. Applicando la formula di Gelfand, si ha: r(a) = lim ||an ||1/n = lim (||a||n)1/n = ||a|| . n→+∞
n→+∞
La (8.6) segue immediatamente dalla propriet` a delle C ∗ -algebre: ||a∗ a|| = 2 ||a|| valida per ogni elemento a e tenendo conto che a∗ a `e autoaggiunto e quindi normale. Questo completa la dimostrazione. L’identit` a (8.6) mostra che la norma di una fissata C ∗ -algebra `e unicamente individuata: non `e possibile cambiare la norma, lasciando immutata la struttura di ∗ -algebra, in modo da ottenere ancora una C ∗ -algebra. Inoltre la norma `e completamente determinata dalle propriet`a algebriche: dato che il raggio spettrale si ricava dallo spettro, che si costruisce per via completamente algebrica. La (8.6) ha un importante conseguenza.
8.1 Spettro e risolvente
319
Corollario 8.12. Se φ : A → B `e uno ∗ -omomorfismo tra le C ∗ -algebre con unit` a A e B, allora `e continuo valendo: ||φ(a)||B ≤ ||a||A per ogni a ∈ A. Se φ `e un ∗ -isomorfismo, allora `e anche isometrico: ||φ(a)||B = ||a||A per ogni a ∈ A. Dimostrazione. Se λ ∈ ρ(a), allora λ ∈ ρ(φ(a)), come segue immediatamente dal fatto che φ `e uno ∗ -omomorfismo. Quindi σ(φ(a)) ⊂ σ(a) e dunque r(φ(a)) ≤ r(a) se a `e normale. La (8.6) implica subito che ||φ(a)||2B = rB (φ(a)∗ φ(a)) = rB (φ(a∗ a)) ≤ rA (a∗ a) = ||a||2A. La seconda affermazione `e ora ovvia ripetendo la prova per φ−1 . Osservazioni 8.13. (1) Ci si pu` o chiedere se esistano C ∗ -algebre che non siano algebre concrete di operatori su spazi di Hilbert. La risposta `e negativa, anche se l’identificazione tra una C ∗ -algebra ed una C ∗ -algebra di operatori non `e univocamente fissata. Vale infatti il seguente importantissimo risultato [BrRo02]. Teorema 8.14. (Di Gelfand-Naimark.) Se A `e una C ∗-algebra con unit` a, allora esiste uno spazio di Hilbert H ed uno ∗ -isomorfismo (isometrico) φ : A → B, dove B ⊂ B(H) `e una sotto C ∗ -algebra di B(H). La terna (H, B, φ) non `e univocamente fissata da A. (2) L’immagine φ(A) di uno ∗ -omomorfismo di C ∗ -algebre, φ : A → B, `e sempre una sotto C ∗ -algebra di B [BrRo02]. Dal corollario 8.12 segue allora che φ `e isometrico se φ `e iniettivo, ma non necessariamente suriettivo. 8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert Torniamo a considerare il caso concreto di operatori unitari e di operatori autoaggiunti in spazi di Hilbert e discutiamone la struttura dello spettro. Usando la definizione 8.2, lavoriamo nel caso generale, considerando anche operatori non limitati con dominio non massimale. Proposizione 8.15. Sia H spazio di Hilbert. Valgono i seguenti fatti. (a) Se A `e operatore autoaggiunto in H (non necessariamente limitato e non definito su tutto H in generale), allora: (i) σ(A) ⊂ R, (ii) σr (A) = ∅, (iii) autospazi di A con autovalori (cio`e punti di σp (A)) distinti sono ortogonali1 . (b) Se U ∈ B(H) `e operatore unitario, allora: (i) σ(U ) `e un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1}, (ii) σr (U ) = ∅. 1 L’analoga propriet` a per operatori normali (e quindi unitari o autoaggiunti limitati) in B(H) `e gi` a stata provata in (b) della proposizione 3.49.
320
8 Teoria Spettrale I: operatori limitati
(c) Se T ∈ B(H) `e operatore normale, allora: (i) σr (T ) = σr (T ∗ ) = ∅, (ii) σp (T ∗ ) = σp (T ), dove la barra indica la coniugazione complessa, (iii) σc(T ∗ ) = σc (T ), dove la barra indica la coniugazione complessa. Dimostrazione. (a). Cominciamo con (i). Supponiamo λ = μ + iν con ν = 0 e proviamo che λ ∈ ρ(A). Se x ∈ D(A), vale: ((A−λI)x|(A−λI)x) = ((A−μI)x|(A−μI)x)+ν 2 (x|x)+iν[(Ax|x)−(x|Ax)]. L’ultimo addendo `e nullo perch´e A `e autoaggiunto. Concludiamo che: ||(A − λI)x|| ≥ |ν| ||x|| . Con la stessa procedura si trova anche che: ||(A − λI)x|| ≥ |ν| ||x|| . a ||(A−λI)−1 || ≤ Gli operatori A−λI e A−λI saranno dunque iniettivi e varr` −1 −1 |ν| , dove (A − λI) : Ran(A − λI) → D(A). Notiamo ora che vale: ⊥
Ran(A − λI) = [Ran(A − λI)]⊥ = Ker(A∗ − λI) = Ker(A − λI) = {0} , dove, nell’ultimo passaggio, si `e tenuto conto del fatto che A − λI `e iniettivo. Riassumendo, vale che: A − λI `e iniettivo, (A − λI)−1 `e limitato e ⊥
Ran(A − λI) = {0}, cio`e Ran(A − λ) `e denso in H; quindi λ ∈ ρ(A), per definizione di insieme risolvente. Passiamo a (ii). Supponiamo che λ ∈ σ(A), ma che λ ∈ σp (A). In tal caso A − λI deve essere iniettivo e quindi Ker(A − λI) = {0}. Essendo A = A∗ e λ ∈ R per (i), vale allora Ker(A∗ − λI) = {0}, per cui [Ran(A − λI)]⊥ = Ker(A∗ − λI) = {0} e quindi Ran(A − λI) = H. Di conseguenza λ ∈ σc (A). La prova di (iii) `e immediata: se λ = μ e Au = λu, Av = μv, allora, tenendo conto del fatto che λ, μ ∈ R e che A = A∗ , (λ − μ)(u|v) = (Au|v) − (u|Av) = (u|Av) − (u|Av) = 0 ; essendo λ − μ = 0, deve essere (u|v) = 0. (b). (i) Il fatto che σ(U ) sia chiuso segue subito da (b) del teorema 8.4, dato che ogni operatore unitario `e definito su tutto H, limitato e, quindi, chiuso. Essendo ||U || = 1, da (c) dello stesso teorema segue anche che σ(U ) `e un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| ≤ 1}. Per concludere, consideriamo la serie: +∞ S(λ) = λn (U ∗ )n+1 n=0
dove |λ| < 1. Tenendo conto che ||U || = ||U ∗|| = 1, si vede immediatamente che la serie converge assolutamente nella norma operatoriale e quindi definisce
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
321
un operatore di B(H). Tenendo infine conto che U ∗ U = U U ∗ = I ed usando la serie scritta sopra, si ha che: (U − λI)S(λ) = S(λ)(U − λI) = I . Per (a) del teorema 8.4, deve allora essere λ ∈ ρ(U ). In definitiva: σ(U ) `e un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1}. (ii) La tesi `e conseguenza di (i) di (c), essendo normale ogni operatore unitario. (c). Ricordiamo che, se T ∈ B(H) `e normale, allora λ ∈ C `e autovalore di T se e solo se λ `e autovalore di T ∗ ((i) di (b) in proposizione 3.49). Questo fatto da solo prova (ii). Essendo le tre parti dello spettro disgiunte e valendo σ(T ) = σ(T ∗ ) ((b) proposizione 8.10), per provare (iii) basta dimostrare (i). Supponiamo che λ ∈ σ(T ), ma che λ ∈ σp (T ). Essendo σ(T ) = σ(T ∗ ) e σp(T ) = σp (T ∗ ), questo equivale a dire che λ ∈ σ(T ∗ ), ma che λ ∈ σp (T ∗ ). In tal caso T ∗ − λI deve essere iniettivo e quindi Ker(T ∗ − λI) = {0}. Allora (per (d) di proposizione 3.38) [Ran(T − λI)]⊥ = Ker(T ∗ − λI) = {0} e quindi Ran(T − λI) = H (dove la barra indica qui la chiusura!). Di conseguenza λ ∈ σc(T ). In altre parole σr (T ) = ∅. La dimostrazione per T ∗ `e la stessa, usando il fatto che (T ∗ )∗ = T ((b) di proposizione 3.38).
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati In questa sezione dimostreremo come sia possibile rappresentare un’algebra di funzioni f misurabili limitate in termini di un’algebra di operatori costituita da corrispondenti funzioni di un operatore f(T ). Pi` u precisamente, costruire mo una trasformazione continua ΦT : Mb (K) → B(H), che conservi la struttura di C ∗ -algebra, da uno spazio di funzioni misurabili limitate e definite su un compatto K, allo spazio degli operatori limitati e definiti su uno spazio di Hilbert H (vedi (4) in esempi 2.39 e (1) in esempi 3.42). La trasformazione suddetta `e “generata” da un operatore autoaggiunto T ∈ B(H) e K = σ(T ). T (f) come f(T ), per motivi che saranno Nei prossimi capitoli interpreteremo Φ suggeriti dall’interpretazione fisica in relazione con la nozione di osservabile. Il primo passo per costruire tali trasformazioni consiste nello studio di funzioni polinomiali di T e T ∗ , nel caso pi` u generale in cui T ∈ B(H) sia un operatore normale. Per ragioni tecniche `e conveniente, in certi casi, esprimere tali polinomi in funzione di due variabili autoaggiunte che ora introduciamo. Consideriamo un operatore normale T ∈ B(H), dove H `e uno spazio di Hilbert. Possiamo sempre decomporre T e T ∗ in combinazioni lineari di due operatori autoaggiunti, X, Y , commutanti tra di loro: T = X + iY ,
T ∗ = X − iY ,
(8.9)
T − T∗ . 2i
(8.10)
essendo per definizione: X :=
T + T∗ , 2
Y :=
322
8 Teoria Spettrale I: operatori limitati
Gli operatori X e Y sono evidentemente autoaggiunti per costruzione. La prova del fatto che X e Y commutano `e immediata, in virt` u della commutativit` a di T e T ∗ . La decomposizione (8.9) `e analoga a quella dei numeri complessi in parte reale ed immaginaria: z = x + iy ,
z = x − iy ,
(8.11)
z−z . 2i
(8.12)
essendo per definizione x :=
z+z , 2
y :=
` importante precisare che si possono considerare z e Osservazione 8.16. E z come variabili indipendenti, biunivocamente legate alle variabili x, y. I polinomi e, pi` u in generale, le funzioni di x e y, sono allora in corrispondenza biunivoca con le funzioni di z e z: alla funzione f = f(z, z) si pu` o associare la funzione g = g(x, y), definita come g(x, y) := f(x +iy, x −iy) e, viceversa, alla funzione g = g(x, y) si pu` o associare la funzione f1 = f1 (z, z), definita come ` chiaro che vale f1 = f identicamente. f1 (z, z) := g((z + z)/2, (z − z)/2i). E Sfrutteremo tale possibilit`a in seguito. Definiamo l’applicazione φT che associa ad un polinomio a coefficienti complessi p = p(x, y), (x, y) ∈ R2 , l’operatore normale p(X, Y ) (definito nel modo pi` u ovvio, interpretando i prodotti di numeri x e y come composizione di operatori X e Y e definendo X 0 := Y 0 := I). φT ha delle caratteristiche interessanti, la cui verifica `e immediata, tenendo conto del fatto che X e Y (e dunque le loro potenze) commutano: (a) `e lineare: φT (αp + βp ) = αφT (p) + βφT (p ) per ogni α, β ∈ C, (b) trasforma il prodotto di polinomi nella composizione di operatori: φT (p· p ) = φT (p) ◦ φT (p ), (c) trasforma il polinomio costante 1 nell’operatore identit`a: φT (1) = I. Queste propriet` a, per definizione (cfr A7 in definizione 2.36), rendono φT un omomorfismo di algebre con unit` a, definito sulla ∗ -algebra con unit` a dei polinomi complessi ed a valori nella C ∗-algebra B(H). Ci sono altre propriet` a di φT interessanti: (d) φT manda il polinomio R2 (x, y) → z = x + iy, che indicheremo un po’ impropriamente con z, nell’operatore T . Cio`e: φT (z) = T , (e) se p denota il polinomio complesso coniugato del polinomio p (cio`e p(x, y) = p(x, y) per ogni (x, y) ∈ R2 ), vale φT (p)∗ = φT (p), (f) se, per A ∈ B(H), valgono AT = T A e AT ∗ = T ∗ A, allora AφT (p) = φT (p)A per ogni polinomio p. C’`e infine un’altra interessante propriet` a, che si riscontra quando T = T ∗ e si restringe il dominio dei polinomi considerati al compatto σ(T ) ⊂ R. In tal caso ogni polinomio complesso p = p(x, y) definito sul compatto σ(T ) si pu` o scrivere come funzione della sola variabile z = x, dato che y = 0.
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
323
Dato che φT (p) = p(T ) `e un operatore normale, in virt` u di (b) del teorema 8.11, deve valere: ||p(T )|| = r(p(T )) = sup{|μ| ∈ C | μ ∈ σ(p(T ))} . La proposizione 8.10 implica allora che: ||φT (p)|| = sup{|p(z)| | z ∈ σ(T )} .
(8.13)
In altre parole, se dotiamo l’algebra dei polinomi su σ(T ) della norma ||||∞, φT risulta essere un’isometria. Questo risultato, come vedremo tra poco, pu` o essere esteso, con opportune precisazioni, al caso di funzioni non necessariamente polinomiali. Occupiamoci ora, in modo specifico, del caso in cui T sia autoaggiunto. Ricordiamo che C(X) indica lo spazio delle funzioni continue sullo spazio topologico X a valori complessi, come visto nel capitolo (vedi (4) in esempi 2.39 e (1) in esempi 3.42), tale spazio `e una C ∗-algebra commutativa con unit`a se X `e compatto, in tal caso la norma `e quella dell’estremo superiore || ||∞ e l’involuzione `e data dalla coniugazione complessa. Proposizione 8.17. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto. (a) Esiste un unico omomorfismo continuo, ΦT : C(σ(T )) → B(H), dalla C ∗-algebra commutativa con unit` a C(σ(T )) alla C ∗ -algebra con unit` a B(H), che gode della propriet` a: ΦT (x) = T ,
dove x indica il polinomio σ(T ) x → x.
(8.14)
(b) ΦT gode delle ulteriori seguenti propriet` a: (i) `e isometrico: per ogni f ∈ C(σ(T )) vale ||ΦT (f)|| = ||f||∞, (ii) se, per A ∈ B(H), vale AT = T A, allora vale anche AΦT (f) = ΦT (f)A per ogni f ∈ C(σ(T )), (iii) ΦT `e uno ∗ -omomorfismo: ΦT (f ) = ΦT (f)∗ per ogni f ∈ C(σ(T )). Dimostrazione. (a). Dimostriamo l’esistenza. Lo spettro σ(T ) ⊂ R `e compatto per (c) del teorema 8.4 ed `e spazio topologico di Hausdorff perch´e tale `e R, quindi possiamo applicare il teorema 2.40 di Stone-Weierstrass. Lo spazio P (σ(T )) dei polinomi p = p(x), con x ∈ σ(T ), a coefficienti complessi, costituisce una sottoalgebra di C(σ(T )) che contiene l’unit`a, data dalla funzione di valore costantemente pari a 1, separa i punti di σ(T ) (se x1 , x2 ∈ σ(T ) con x1 = x2 , il polinomio p(x) := x − x1 su σ(T ) `e tale che p(x1 ) = 0, ma p(x2 ) = 0) ed `e chiusa rispetto alla coniugazione complessa. Il teorema 2.40 di Stone-Weierstrass assicura che lo spazio dei polinomi considerati `e denso in C(σ(T )). Consideriamo l’applicazione (definita prima della proposizione 8.17): φT : P (σ(T )) p → p(X, Y ) ∈ B(H) . Sappiamo che φT `e lineare e vale inoltre ||φT (p)|| = ||p||∞ per (8.13), il che implica la continuit`a di φT . Per la proposizione 2.57, esiste allora un unico
324
8 Teoria Spettrale I: operatori limitati
operatore lineare ΦT : C(σ(T )) → B(H) limitato che estende φT su C(σ(T )) e con la stessa norma. Tale operatore `e un omomorfismo di algebre con unit`a in quanto: (a) `e lineare, (b) soddisfa ΦT (f · g) = ΦT (f)ΦT (g) per continuit` a (dato che, banalmente, ci` o `e vero sulla sottoalgebra dei polinomi per definizione di φT ), (c) trasforma la funzione che vale costantemente 1 ∈ P (σ(T )) nell’operatore identit` a I ∈ B(H) per definizione di φT . La (8.14) `e banalmente vera in virt` u della propriet` a (d) dell’applicazione φT . Passiamo all’unicit` a: ogni altro omomorfismo χT di algebre con unit` a che soddisfa (8.14), deve coincidere con ΦT sullo spazio dei polinomi. (Infatti, deve essere T = χT (x) = ΦT (x) e quindi, usando pi` u volte il fatto che il prodotto di polinomi `e trasformato nella composizione di operatori, T n = χT (xn ) = ΦT (xn ); inoltre, l’ulteriore identit` a I = χT (1) = ΦT (1) vale per definizione di omomorfismo tra algebre con unit` a. Usando la linearit` a, si ottiene che, per ogni p ∈ P (σ(T )), vale p(T ) = χT (p) = ΦT (p).) Se χT `e anche continuo, per l’unicit` a dell’estensione continua coincider`a con ΦT ovunque. (b). Le propriet` a (i) e (ii) si provano immediatamente se f `e un polinomio e quindi si estendono direttamente per continuit` a al caso di f ∈ C(σ(T )). Infine l’omomorfismo `e uno ∗ -omomorfismo in quanto, se {pn } `e una successione di polinomi che tende, uniformemente su σ(T ), alla funzione continua f, {pn } tender` a, uniformemente su σ(T ), alla funzione continua f ; d’altra parte, come visto sopra (cfr propriet`a (e) di φT ), ΦT (pn ) = ΦT (pn )∗ e l’operazione di coniugazione hermitiana `e continua nella topologia operatoriale uniforme. Per la continuit` a di ΦT , dovr` a quindi essere: ΦT (f ) = ΦT (f)∗ . Ricordiamo che se X `e uno spazio topologico, B(X) indica la σ-algebra di Borel su X. La C ∗ -algebra delle funzioni f : X → C Borel-misurabili e limitate `e indicata con Mb (X) (vedi (3) in esempi 2.39 e (1) in esempi 3.42) con Mb (X). Rimanendo nel caso T = T ∗ , la proposizione appena provata pu` o essere estesa dimostrando l’esistenza e l’unicit` a di un analogo omomorfismo di algebre con unit` a tra Mb (σ(T )) e B(H) (dove la topologia usata su σ(T ) `e quella indotta dalla topologia di R ⊃ σ(T )). Questo risultato ha molteplici conseguenze. In particolare sar`a il cardine della parte di dimostrazione che riguarda l’esistenza della misura spettrale, nella prova del teorema spettrale 8.34. Teorema 8.18. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto. T : Mb (σ(T )) → B(H), dalla (a) Esiste un unico omomorfismo continuo, Φ ∗ C -algebra commutativa con unit` a Mb (σ(T )) (riferita alla norma || ||∞), alla C ∗-algebra con unit` a B(H), tale che: (i) vale l’identit` a: T (x) = T , Φ
dove x `e la funzione σ(T ) x → x ,
(8.15)
(ii) se {fn }n∈N ⊂ Mb (σ(T )) `e limitata e converge puntualmente a f :
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
σ(T ) → C, allora:
325
T (f) = w- lim Φ T (fn ) . Φ n→+∞
T gode delle ulteriori seguenti propriet` (b) Φ a: T si riduce all’omomorfismo isometrico ΦT su C(σ(T )) di proposizio(i) Φ ne 8.17, T (f)|| ≤ ||f||∞, (ii) per ogni f ∈ Mb (σ(T )) vale ||Φ T (f)A per ogni T (f) = Φ (iii) se, per A ∈ B(H), vale AT = T A, allora AΦ f ∈ Mb (σ(T )), T (f ) = Φ T (f)∗ per ogni f ∈ Mb (σ(T )), T `e uno ∗ -omomorfismo: Φ (iv) Φ (v) se {fn }n∈N ⊂ Mb (σ(T )) `e limitata e converge puntualmente a f : σ(T ) → C, allora: T (f) = s- lim Φ T (fn ) , Φ n→+∞
T (f) ≥ 0. (vi) se f ∈ Mb (σ(T )) assume solo valori reali e f ≥ 0, allora Φ Dimostrazione. (a). Fissati x, y ∈ H, l’applicazione: Lx,y : C(σ(T )) f → (x|ΦT (f)y) ∈ C `e lineare e ||Lx,y || `e dato da: sup{|Lx,y (f)| | f ∈ C(σ(T )) , ||f||∞ = 1} ≤ ||x|| ||y|| sup{||ΦT (f)|| | f ∈ C(σ(T )) , ||f||∞ = 1} (dove si `e usata la disuguaglianza di Cauchy-Schwarz), da cui, usando il fatto che ΦT `e isometrico, troviamo: ||Lx,y || ≤ ||x|| ||y|| , e quindi Lx,y `e limitato. Per il teorema 2.62 della rappresentazione di Riesz per le misure complesse, esiste un’unica misura complessa μx,y sul compatto σ(T ) ⊂ C tale che, per ogni f ∈ C(σ(T )), si abbia: Lx,y (f) = (x|ΦT (f)y) = f(λ) dμx,y (λ) ; (8.16) σ(T )
vale inoltre |μx,y |(σ(T )) = ||Lx,y || ≤ ||x||||y||. Notiamo per inciso che se x = y, allora μx,x `e una misura reale, positiva e finita: infatti, se f ∈ C(σ(T )) assume solo valori reali, vale ΦT (f) = ΦT (f)∗ per (iii) di (b) nella proposizione 8.17, per cui: f(λ) h(λ)d|μx,x(λ)| = f(λ) h(λ)d|μx,x (λ)| σ(T )
σ(T )
= (x|ΦT (f)x) = (ΦT (f)x|x)
326
8 Teoria Spettrale I: operatori limitati
= (x|ΦT (f)x) =
σ(T )
f(λ) h(λ)d|μx,x(λ)| ,
dove abbiamo decomposto dμx,x in hd|μx,x|, essendo h una funzione misurabile di modulo unitario individuata quasi ovunque da μx,x e |μx,x| la misura positiva finita associata a μx,x detta variazione totale (vedi (1) in esempi 2.58). Per linearit` a, la relazione: f(λ) h(λ)d|μx,x(λ)| = f(λ) h(λ)d|μx,x (λ)| σ(T )
σ(T )
deve valere anche quando f ∈ C(σ(T )) prende valori complessi. Il teorema 2.62 di Riesz sulle misure complesse assicura allora che hd|μx,x| = hd|μx,x|, per cui h(λ) = h(λ) quasi ovunque, ma essendo |h(λ)| = 1, segue che h(λ) = 1 quasi ovunque e quindi μx,x `e una misura reale, positiva e finita (perch´e tale `e |μx,x|). Usiamo (8.16) per estendere Lx,y (f) al caso generale in cui f ∈ Mb (σ(T )), dato che il secondo membro `e comunque ben definito: se g ∈ Mb (σ(T )), g(λ) dμx,y (λ) . (8.17) Lx,y (g) := σ(T )
Dovr` a essere, per propriet`a generali delle misure complesse (cfr. (1) in esempi 2.58): |Lx,y (g)| ≤ ||g||∞|μx,y |(σ(T )) ≤ ||g||∞||x|| ||y|| . (8.18) Per costruzione, se g ∈ C(σ(T )) `e fissata, (x, y) → Lx,y (g) `e anti lineare in x e lineare in y. Si pu` o dimostrare che ci` o continua a valere anche per g ∈ Mb (σ(T )). Proviamo per esempio la linearit`a in y, l’anti linearit` a si prova analogamente. Da cui si ha che, per x, y, z ∈ H e g ∈ Mb (σ(T )) fissati, se α, β ∈ C, allora vale α g(λ) dμx,y (λ) + β g(λ) dμx,z (λ) = g(λ) dν(λ) , (8.19) σ(T )
σ(T )
σ(T )
dove ν `e la misura complessa definita da ν(E) := αμx,y (E)+βμx,z (E) per ogni boreliano E ⊂ σ(T ). Tenendo conto di come abbiamo definito le misure μx,y (cfr. (8.16)) e sfruttando la linearit` a del prodotto scalare di H nell’argomento di destra, si ricava subito che, per ogni f ∈ C(σ(T )) inserita in (8.19) al posto di g, sussiste l’identit`a: f(λ) dμx,αy+βz (λ) = f(λ) dν(λ) . σ(T )
σ(T )
Il teorema di Riesz assicura a questo punto che μx,αy+βz = ν. Pertanto, (8.19) pu` o essere riscritta, per ogni g ∈ Mb (σ(T )): g(λ) dμx,y (λ) + β g(λ) dμx,z (λ) = g(λ) μx,αy+βz (λ) . α σ(T )
σ(T )
σ(T )
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
327
Abbiamo provato che Lx,y (g) `e lineare in y per ogni fissato x ∈ H e ogni g ∈ Mb (σ(T )). La (8.18) implica la limitatezza dell’operatore lineare y → Lx,y (g) e quindi, per il teorema 3.17 (ancora di Riesz), fissati g ∈ Mb (σ(T )) e x ∈ H, esiste un unico vettore vx ∈ H tale che Lx,y (g) = (vx |y) per ogni y ∈ H. Dato che vx `e lineare in x (perch´e Lx,y (g) `e anti lineare in x e il prodotto scalare (vx |y) `e anti lineare in vx ), esister`a anche un unico operatore g(T ) ∈ L(H) per cui vx = g(T ) x per ogni x ∈ H. E quindi Lx,y (g) = (g(T ) x|y). La condizione (8.18) implica subito che g(T ) `e limitato, infatti: ||g(T ) x||2 = |(g(T ) x|g(T ) x)| = |Lx,g(T ) x (g)| ≤ ||g||∞ ||x|| ||g(T ) x|| , da cui
||g(T ) x|| ≤ ||g||∞ ||x||
e quindi ||g(T ) || ≤ ||g||∞. Posto g(T ) := g(T )∗ , abbiamo provato che, per g ∈ Mb (σ(T )), esiste un unico operatore g(T ) ∈ B(H) tale che, per ogni coppia x, y ∈ H: Lx,y (g) = (x|g(T )y) . L’applicazione lineare: T : Mb (σ(T )) f → f(T ) ∈ B(H) , Φ dove, per ogni x, y ∈ H: Lx,y (f) = (x|f(T )y) :=
σ(T )
f(λ) dμx,y (λ) ,
`e, per costruzione, un’estensione di ΦT : in particolare vale (8.15). L’estensione T (f)|| ≤ ||f||∞ per ogni f ∈ Mb (σ(T )), infatti: `e continua in quanto ||Φ T (f)|| = ||f(T )|| = ||f(T )∗ || = ||f(T ) || ≤ ||f||∞ . ||Φ T estende l’omomorfismo di algebre con unit` a ΦT , per provare che Dato che Φ T (f · T `e un omomorfismo di algebre con unit`a `e sufficiente mostrare che Φ Φ g) = ΦT (f)ΦT (g) quando f, g ∈ Mb (σ(T )). Se le due funzioni appartengono a C(σ(T )), la tesi `e vera per il teorema precedente. Supponiamo f, g ∈ C(σ(T )); allora: T (f · g)y) = (x|Φ T (f)Φ T (g)y) = f · g dμx,y = (x|Φ f dμx,ΦT (g)y . σ(T )
σ(T )
Il teorema di Riesz sulle misure complesse citato prima implica che la misura dμx,ΦT (g)y coincida con la misura g dμx,y . Quindi, se f ∈ Mb (σ(T )), si ha: f · g dμx,y = f dμx,ΦT (g)y . σ(T )
σ(T )
328
8 Teoria Spettrale I: operatori limitati
Da questo segue che, per ogni coppia x, y ∈ H, per ogni f ∈ Mb (σ(T )) e g ∈ C(σ(T )): T (f)Φ T (g)y) = (Φ T (f)∗ x|Φ T (g)y) f · g dμx,y = f dμx,ΦT (g)y = (x|Φ σ(T )
σ(T )
= σ(T )
g dμΦT (f)∗ x,y .
Ragionando come sopra e usando il teorema di Riesz, si ha che l’uguaglianza f · g dμx,y = g dμΦT (f)∗ x,y , (8.20) σ(T )
σ(T )
valida per ogni g ∈ C(σ(T )), implica fdμx,y = dμΦT (f)∗ x,y e dunque la (8.20) deve essere vera per ogni coppia x, y ∈ H e per ogni coppia f, g ∈ Mb (σ(T )). Quindi, con tali scelte del tutto generali: T (f · g)y) = (x|Φ f · g dμx,y = g dμΦT (f)∗ x,y σ(T )
σ(T )
T (f)∗ x|Φ T (g)y) = (x|Φ T (f)Φ T (g)y) = (Φ da cui:
x (Φ =0. T (f · g) − ΦT (f)ΦT (g))y
Scegliendo x coincidente con il secondo argomento del prodotto scalare, si trova che: T (f · g)y = Φ T (f)Φ T (g)y Φ per ogni y ∈ H e per ogni coppia f, g ∈ Mb (σ(T )), da cui T (f · g) = Φ T (f)Φ T (g) . Φ La propriet`a (ii) di (a) vale in conseguenza di (v) di (b), che proviamo sotto, indipendentemente da (ii) di (a). T quando sodPer concludere la dimostrazione di (a), proviamo l’unicit`a di Φ disfa le condizioni dette in (a). Se Ψ : Mb (σ(T )) → B(H) soddisfa le condizioni T sui polinomi, e quindi, per continuit` a, coincide in (a), allora coincide con Φ con ΦT su C(σ(T )). Per fissati x, y ∈ H, l’applicazione νx,y : E → (x|Ψ (χE )y) , dove E `e un qualsiasi boreliano di σ(T ) e χE la sua funzione caratteristica, `e una misura complessa su σ(T ). Infatti νx,y (∅) = (x|Ψ (0)y) = 0; inoltre, se {Sk }k∈N `e una famiglia di boreliani a due a due disgiunti, si ha: n
νx,y (∪k Sk ) = (x|Ψ (χ∪k Sk )y) = x lim Ψ χSk y
n→+∞ k=0
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
= lim
n
n→+∞
(x|Ψ (χSk )y) =
k=0
+∞
329
νx,y (Sk ) ,
k=0
dove il primo membro `e sempre finito e abbiamo tenuto conto della condizione (ii) di (a) e del fatto che, puntualmente: χ∪k Sk =
+∞
χSk .
(8.21)
k=0
Si osservi che la (8.21) non dipende dall’ordine con cui si etichettano gli insiemi Sk , essendo la serie di termini positivi. Di conseguenza, la relazione: νx,y (∪k Sk ) =
+∞
νx,y (Sk )
k=0
vale indipendentemente dall’ordinamento della serie e quindi, per un noto teorema, la serie converge assolutamente. Abbiamo provato che νx,y `e una misura complessa. Tenendo conto della linearit` a di Ψ e del prodotto scalare, nonch´e della definizione di integrale di una funzione semplice, si arriva facilmente a dimostrare che: s(x) dνx,y = (x|Ψ (s)y) σ(T )
per ogni funzione semplice s ∈ S(σ(T )). Se f ∈ Mb (σ(T )) e {sn } ⊂ S(σ(T )) converge uniformemente a f (tale successione esiste per (b) di proposizione 7.39), allora, in virt` u della continuit` a di Ψ nella norma || ||∞ e del teorema della convergenza dominata, si ha che, per ogni f ∈ Mb (σ(T )), vale: f dνx,y . (8.22) (x|Ψ (f)y) = σ(T )
In particolare, questo fatto deve valere per f ∈ C(σ(T )), sul quale spazio Ψ T . Di conseguenza, in virt` u del teorema 2.62 di Riesz sulle misucoincide con Φ re complesse, la misura νx,y coincide con la misura complessa μx,y introdotta T come: all’inizio della dimostrazione, attraverso la quale abbiamo definito Φ T (f)y) = f dμx,y , (x|Φ σ(T )
per x, y ∈ H e f ∈ Mb (σ(T )). Ma allora, essendo νx,y = μx,y , (8.22) implica T (f) per ogni f ∈ Mb (σ(T )). che Ψ (f) = Φ (b). Bisogna dimostrare solo (iii), (iv), (v) e (vi), dato che gli altri punti sono stati dimostrati nella prova di (a). La propriet` a (iii) vale nel caso in cui f ∈ C(σ(T )), come noto da (b) della proposizione 8.17. Allora: T (f)Ay) = (x|AΦ T (f)y) f dμx,Ay = (x|Φ σ(T )
330
8 Teoria Spettrale I: operatori limitati
T (f)y) = = (A∗ x|Φ
σ(T )
f dμA∗ x,y ,
per ogni coppia di vettori x, y ∈ H e per ogni f ∈ C(σ(T )). Il teorema 2.62 di Riesz sulla rappresentazione delle misure complesse sui Boreliani assicura allora che μA∗ x,y = μx,Ay , e quindi: f dμx,Ay = f dμA∗ x,y (x|ΦT (f)Ay) = σ(T )
σ(T )
T (f)y) = (x|AΦ T (f)y) , = (A∗ x|Φ per ogni coppia di vettori x, y ∈ H e per ogni f ∈ Mb (σ(T )). Per l’arbitrariet` a T (f) se f ∈ Mb (σ(T )) e T A = AT . T (f)A = AΦ dei vettori x, y, vale: Φ Passiamo a provare (iv). Se x ∈ H e g ∈ Mb (σ(T )), tenendo conto che μx,x `e reale, si ha: T (g)x) = T (g)x|x) = (x|Φ T (g)∗ x) . (x|Φ g dμx,x = g dμx,x = (Φ σ(T )
σ(T )
T (g) − Φ T (g)∗ )x) = 0 per ogni x ∈ H. Dall’esercizio 3.10 segue Quindi (x|(Φ ∗ che ΦT (g) = ΦT (g) . Dimostriamo (v). Sia {fn }n∈N ⊂ Mb (σ(T )) una successione, limitata (in valore assoluto) da K > 0, che converge a f : σ(T ) → C. Quindi ||f||∞ ≤ K e f `e misurabile, dunque f ∈ Mb (σ(T )). Fissati x, y ∈ H e usando (iv) di (b), T (fn ) − Φ T (f))x||2 = ((Φ T (fn ) − Φ T (f))x|(Φ T (fn ) − Φ T (f))x) ||(Φ T (|f − fn |2 )x) . T (fn − f)x) = (x|Φ T (fn − f)∗ Φ = (x|(Φ L’ultimo termine si pu` o scrivere come: 2 |f − fn | dμx,x = σ(T )
σ(T )
|f − fn |2 hd|μx,x| ,
dove |μx,x| `e la misura positiva (detta variazione totale) associata alla misura reale (con segno) μx,x e h `e una funzione misurabile di valore assoluto costante pari a 1 [Rud82]. (In realt` a, come abbiamo provato nel punto (a) di questa dimostrazione, μx,x `e una misura reale positiva, per cui |μx,x| = μx,x e h = 1.) Dato che `e: |μx,x|(σ(T )) < +∞ , per il teorema della convergenza dominata |h||f − fn |2 converge a 0 in T (fn ) − Φ T (f))x||2 → 0 per ogni L1 (σ(T ), |μx,x |). Quindi, se n → +∞, ||(Φ scelta di x ∈ H. Per finire dimostriamo (vi). Se Mb (σ(T )) f ≥ 0, allora f = g 2 dove vale T (f) = Φ T (g · g) = Φ T (g)Φ T (g). Inol0 ≤ g ∈ Mb (σ(T )). Pertanto, per (a), Φ ∗ T (g) = Φ T (g) (per (iv)), per cui: Φ T (g · g) = Φ T (g)∗ Φ T (g) = Φ T (g). Il tre Φ secondo membro `e evidentemente positivo.
8.3 Misure a Valori di Proiezione (PVM)
331
8.3 Misure a Valori di Proiezione (PVM) In questa sezione introdurremo le misure a valori di proiezione, anche dette misure spettrali o PVM. Esse sono lo strumento centrale per enunciare i teoremi spettrali. Si tratta della generalizzazione della nozione di misura sulla σ-algebra di Borel di uno spazio topologico X, ammettendo che l’immagine della misura non cada in R, ma nell’insieme dei proiettori ortogonali P(H) di uno spazio di Hilbert H: B(X) E → P (E) ∈ P(H) . Con tale nozione potremo integrare funzioni producendo operatori. Vedremo, T studiato nella sezione precedente, assoin particolare, che l’omomorfismo Φ ciato ad un operatore autoaggiunto limitato T , non `e altro che un integrale rispetto ad una di tali misure generata dall’operatore autoaggiunto T : ΦT (f) = f(x)dP (T ) (x) . σ(T )
Abbiamo gi` a incontrato le misure a valori di proiezione nel capitolo 7 (definizione 7.38), nella situazione particolare in cui la σ-algebra su cui `e definita la PVM fosse B(R). Un’osservabile quantistica, nel senso stabilito nel capitolo precedente `e un caso particolare di tali misure spettrali in virt` u della proposizione 7.36. 8.3.1 Misure a Valori di Proiezione (PVM) dette anche misure spettrali Per introdurre le misure a valori di proiezione, richiamiamo alcuni fatti topologici generali che risulteranno utili nel seguito. Definizione 8.19. Uno spazio topologico (X, T ) `e detto essere a base numerabile o numerabile di secondo tipo, se esiste una classe numerabile T0 ⊂ T (appunto la “base numerabile”) tale che ogni insieme aperto si possa ottenere come unione di elementi di T0 . Se (X, T ) `e a base numerabile vale il lemma di Lindel¨ of: Teorema 8.20. (Lemma di Lindel¨ of.) Sia (X, T ) spazio topologico a base numerabile. Se {Uα }α∈I `e una classe di aperti che ricopre l’insieme B ⊂ X, cio`e ∪α∈I Uα ⊃ B, allora `e possibile estrarre un sotto ricoprimento numerabile da {Uα }α∈I . In altre parole esiste una scelta di indici αn ∈ I, con n ∈ N tale che ∪n∈NUαn ⊃ B. Rn (e quindi Cn ), dotato della topologia standard, `e a base numerabile: T0 pu` o essere presa come la classe delle palle aperte di raggi razionali e centri dati da punti con coordinate razionali (con segno).
332
8 Teoria Spettrale I: operatori limitati
Ricordiamo infine che, se T, U ∈ B(H) con H spazio di Hilbert, T ≥ U significa (x|T x) ≥ (x|U x) per ogni x ∈ H (vedi la definizione 3.46 ed i commenti ad essa). Definizione 8.21. Siano H uno spazio di Hilbert, (X, T ) uno spazio topologico a base numerabile e B(X) la σ-algebra di Borel su X. Un’applicazione: P : B(X) → B(H) `e detta misura a valori di proiezione su X (PVM), oppure equivalentemente misura spettrale su X, se soddisfa i seguenti requisiti. (a) P (B) ≥ 0 per ogni B ∈ B(X); (b) P (B)P (B ) = P (B ∩ B ) per ogni coppia B, B ∈ B(X); (c) P (X) = I; (d) se {Bn }n∈N ⊂ B(X), con Bn ∩ Bm = ∅ per n = m, vale: s-
+∞
P (Bn ) = P (∪n∈N Bn ) .
n=0
Il supporto di P `e l’insieme chiuso: supp(P ) := X \
A.
A∈T ,P (A)=0
Quando X = Rn o Cn , P `e detta limitata se supp(P ) `e limitato. Un’altra collegata ed utile definizione `e la seguente. Definizione 8.22. Se P : B(X) → B(H) `e una PVM, f : X → C Borel misurabile `e detta essenzialmente limitata rispetto a P se: P ({x ∈ X | |f(x)| ≥ M }) = 0
per qualche M < +∞.
(8.23)
(P )
Se f `e essenzialmente limitata, l’estremo inferiore ||f||∞ dell’insieme dei valori M ≥ 0 che soddisfano (8.23) `e detto (semi) norma essenziale di f rispetto a P . Abbiamo subito una proposizione che enuncia le propriet` a fondamentali delle PVM. In particolare, risulta che P (E) ∈ P(H), dove P(H) indica, come al solito, la classe dei proiettori ortogonali sullo spazio di Hilbert H. Proposizione 8.23. Sia P : B(X) → B(H) una PVM nel senso della definizione 8.21. Valgono i fatti seguenti. (a) P (B) ∈ P(H) per ogni B ∈ B(X), in particolare P (∅) = 0 proiettore su {0}. (b) Vale la propriet` a di isotonia: P (C) ≤ P (B) se B, C ∈ B(X) e C ⊂ B. (c) Vale la propriet` a di subadditivit` a: se Bn ∈ B(X) per n ∈ N, allora: (x |P (∪n∈N Bn ) x) ≤ (x|P (Bn )x) per ogni x ∈ H. n∈N
8.3 Misure a Valori di Proiezione (PVM)
333
(d) Vale P (supp(P )) = I e quindi: (i) P (B) = P (B ∩ supp(P )) se B ∈ B(X) (ii) P (C) = 0 se C ⊂ X \ supp(P ) e C ∈ B(X). Dimostrazione. (a). Gli operatori P (B) sono idempotenti P (B)P (B) = P (B∩ B) = P (B) per (b) nella def 8.21 e autoaggiunti perch´e limitati e positivi (per (a) in def. 8.21) per cui sono proiettori ortogonali. Usando poi (c) e (d) di def. 8.21 abbiamo I = P (X ∪ ∅) = I + P (∅), per cui P (∅) = 0. (b) B = C ∪ (B \ C) e C ∩ (B \ C) = ∅ per cui, da (d) in def. 8.21: P (B) = P (C) + P (B \ C). Essendo P (B \ C) ≥ 0, vale P (C) ≤ P (B). (c) Definiamo B := ∪n∈N Bn e la successione {Cn }n∈N con C0 := B0 , C1 := B1 \ B0 , C2 := B2 \ (B0 ∪ B1 ) e via di seguito. Evidentemente Ck ∩ Ch = ∅ se h = k e B = ∪n∈N Cn . Di conseguenza, +∞ per (d) di def. 8.21, +∞ P (B) = s- n=0 P (Ck ) e quindi: (x|P (B)x) = n=0 (x|P (Ck )x). Dato che Ck ⊂ Bk per ogni k ∈ N, per isotonia varr` a anche (x|P (Ck )x) ≤ (x|P (Bk )x) +∞ e pertanto: (x|P (B)x) ≤ n=0 (x|P (Bk )x). (d) P (supp(P )) = I `e evidentemente equivalente (per (d) di def. 8.21 ristretto al caso finito) a P (A) = 0, dove A := X \ supp(P ). Per provare che P (A) = 0 notiamo che, per definizione A `e unione di aperti con misura spettrale nulla. Dato che X `e numerabile di secondo tipo, possiamo estrarre un sotto ricoprimento numerabile dal ricoprimento detto. In altre parole, vale A = ∪n∈N An con P (An ) = 0 per ogni n ∈ N. Usando la subadditivit` a per ogni x ∈ H: 0 ≤ ||P (A)x||2 = (P (A)x|P (A)x) = (x|P (A)x) ≤
(x|P (An )x) = 0
n∈N
per cui P (A) = 0. La propriet` a (ii) segue immediatamente per isotonia. Con la definizione di A detta, la propriet` a (i) segue decomponendo B = (B ∩ supp(P )) ∪ (B ∩ A), da cui, per (d) della def. 8.21, P (B) = P (B ∩ supp(P )) + P (B ∩ A), ed usando infine (i). Osservazioni 8.24. (1) La coppia di condizioni (a) e (b) nella definizione 8.21 pu` o essere sostituita equivalentemente con la richiesta che ogni P (B) sia un proiettore ortogonale. Il fatto che ogni P (B) nella definizione 8.21 sia un proiettore ortogonale `e provato in (a) della proposizione 8.23. Il fatto che, se ogni P (B) `e proiettore ortogonale e valgono (c) e (d) della definizione 8.21, allora valgono anche (a) e (b) della stessa definizione sar` a provato nel lemma 9.16. (2) Se f : X → C `e Borel misurabile, la propriet` a (ii) in (d) implica immediatamente la prima disuguaglianza di sotto (la seconda `e ovvia): (P ) ||f||∞ ≤ ||fsupp(P ) ||∞ ≤ ||f||∞ .
(8.24)
L’insieme delle funzioni Borel misurabili essenzialmente limitate rispetto a P (P ) `e uno spazio vettoriale e || ||∞ `e una seminorma su tale spazio.
334
8 Teoria Spettrale I: operatori limitati
(3) In questo libro lavoreremo solo con PVM definite su σ-algebre di Borel B(X) ricavate da spazi topologici X a base numerabile. Tale requisito non `e strettamente necessario e quasi tutta la teoria si potrebbe sviluppare lavorando con σ-algebre generiche (vedi per esempio [Rud91]). La nostra scelta `e unicamente dettata dalla comodit`a. In primo luogo, in questo modo, il supporto della PVM soddisfa le propriet` a enunciate in (d) della proposizione appena provata, che rendono utile la nozione di supporto, inoltre il teorema di decomposizione spettrale viene enunciato su C (o R), che ha topologia a base numerabile. 8.3.2 Integrale di funzioni misurabili limitate rispetto a una PVM Passiamo ora a costruire una procedura d’integrazione di funzioni misurabili limitate f : X → C rispetto ad una misura a valori di proiezione P : B(X) → B(H). Ricordiamo che, se X `e uno spazio dotato di una σ-algebra Σ, s : X → C, che sia misurabile rispetto a Σ, `e detta funzione semplice quando assume solo un numero finito di valori. Notazione 8.25. Se X `e uno spazio topologico, S(X) denota lo spazio vettoriale delle funzioni semplici su X, relative a σ-algebra di Borel B(X). Supponiamo che sia assegnata una PVM su X, spazio topologico a base numerabile, a valori in B(H), per uno spazio di Hilbert H. Consideriamo una funzione s ∈ S(X). Possiamo sempre scriverla come, per opportuni ci ∈ C e I finito: s= ci χEi . (8.25) i∈I
Poich´e, per definizione, una funzione semplice assume solo un numero finito di valori distinti, questa espressione `e univocamente fissata da s se si richiede che gli insiemi Ei siano misurabili e a due a due disgiunti, e i numeri complessi ci siano tutti distinti. Definiamo l’integrale di s rispetto a P come l’operatore di B(H): s(x) dP (x) := ci P (Ei ) . (8.26) X
i∈I
Osservazione 8.26. Se non si richiede che i numeri ci nell’espressione di s scritta sopra siano distinti, ci sono molte possibilit`a nello scrivere s come combinazione lineare di funzioni caratteristiche di insiemi misurabili disgiunti. Tuttavia si prova facilmente, ripetendo la stessa dimostrazione del caso in cui si lavori con una misura ordinaria, che l’integrale di s non dipende dalla rappresentazione di s scelta.
8.3 Misure a Valori di Proiezione (PVM)
335
L’applicazione: I : S(X) s →
X
s(x) dP (x) ∈ B(X) ,
(8.27)
`e lineare, ovvero I ∈ L(S(X), B(X)), come `e facile dimostrare tenendo conto dell’osservazione precedente. Essendo S(X) e B(X) spazi normati, L(S(X), B(X)) `e dotato della norma operatoriale. I risulta essere un operatore limitato rispetto a tale norma. Proviamolo consideriamo s ∈ S(X) della forma in (8.25), tenendo conto che gli insiemi Ek sono a due a due disgiunti, per cui: P (Ej )P (Ei ) = P (Ej ∩ Ei ) = 0 se i = j oppure P (Ej )P (Ei ) = P (Ei ) se i = j. Se x ∈ H:
⎛ ⎞
||I(s)x||2 = (I(s)x|I(s)x)2 = ⎝ ci P (Ei )x
cj P (Ej )x ⎠
j∈I i∈I =
( ci P (Ej )∗ P (Ei )x| cj x) =
i,j∈I
=
( ci P (Ej )P (Ei )x| cj x)
i,j∈I
|ci |2 (x|P (Ei )x) ≤ sup |ci |2 i∈I
i∈I
(x|P (Ei )x) ,
i∈I
a ed dove I ⊂ I `e costituito dagli indici per cui P (Ei ) = 0. Per subadditivit` isotonia: (x|P (Ei)x) ≤ (x|P (∪i∈I Ei )x) ≤ (x|P (X)x) = (x|x) = ||x||2 . i∈I Tenendo infine conto che, banalmente ||s||P ∞ = sup i∈I |ci |, essendo I fini2 2 P 2 to, concludiamo che: ||I(s)x|| ≤ ||x|| (||s||∞) , da cui, prendendo l’estremo superiore sui vettori x ∈ H con ||x|| = 1: (P ) ||I(s)|| ≤ ||s||∞ . (P )
Tuttavia, dato che ||s||∞ coincide con uno dei valori finiti assunti da |s|, diciamo |ck |, se scegliamo x ∈ P (Ek )(H) (che `e = {0} per costruzione), valendo x = P (Ek )x, avremo che: I(s)x = ci P (Ei )x = ci P (Ei )P (Ek )x = ck P (Ek )x = ck x . i∈I
i∈I (P )
Pertanto, scegliendo x con ||x|| = 1, si ottiene ||I(s)x|| = ||s||∞ . Concludiamo che I `e sicuramente continua su S(X) ⊂ Mb (X) nella norma || ||∞, valendo per quanto appena provato e per (8.24): (P ) ||I(s)|| = ||s||∞ ≤ ||s supp(P ) ||∞ ≤ ||s||∞ .
(8.28)
336
8 Teoria Spettrale I: operatori limitati
Con questo risultato possiamo passare a definire l’integrale di funzioni Borelmisurabili limitate, estendendo I, per linearit` a e continuit`a, a tutto lo spazio di Banach Mb (X) delle funzioni f : X → C Borel-misurabili e limitate. Mb (X) contiene S(X) come sottospazio denso nella norma || ||∞ , per (b) di proposizione 7.36. L’operatore I : S(X) → B(X) `e continuo. Per la proposizione 2.57, esiste ed `e unico un operatore limitato da Mb (X) in B(X) che estende I. Definizione 8.27. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X. (a) L’unica estensione limitata I : Mb (X) → B(X) dell’operatore I : S(X) → B(X) (vedi (8.26) e (8.27)) si chiama operatore integrale rispetto a P . (b) Per ogni f ∈ Mb (X): f(x) dP (x) := I(f) X
`e detto integrale di f rispetto alla misura a valori di proiezione P . (c) Sia f : X → C Borel-misurabile, non necessariamente limitata. Se f E ∈ Mb (E) con E ⊂ B(X), allora si definisce: f(x) dP (x) := χE (x)f(x) dP (x) . X
E
Se g ∈ Mb (E), con E ⊂ B(X), allora si definisce: g(x) dP (x) := g0 (x) dP (x) , X
E
dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x ∈ E. Osservazione 8.28. Se P `e una misura spettrale su X e supp(P ) = X, possiamo restringere P ad una misura spettrale P supp(P ) su supp(P ) (dotato della topologia indotta da X), definendo P supp(P ) (E) := P (E) per ogni boreliano E ⊂ B(supp(P )). Il fatto che P supp(P ) sia una PVM `e di verifica immediata usando la proposizione 8.23, specialmente il punto (d). Da (i) nel punto (d) segue immediatamente che, per ogni s ∈ S(X): sdP = sdP = ssupp(P ) dP supp(P ) , X
supp(P )
supp(P )
dove il secondo integrale `e interpretato nel senso di (c) nella definizione 8.27. Dato che, se S(X) sn → f rispetto alla norma || ||∞, allora S(X) sn supp(P ) → f supp(P ) rispetto alla stessa norma, applicando la definizione di integrale rispetto a P per una f ∈ Mb (X), risulta subito che: fdP = fdP = fsupp(P ) dP supp(P ) per ogni f ∈ Mb (X). X
supp(P )
supp(P )
(8.29)
8.3 Misure a Valori di Proiezione (PVM)
337
Esempi 8.29. (1) Facciamo un esempio concreto affinch´e la procedura non sembri troppo astratta. In realt` a, il seguente esempio, con un’estensione, esaurisce tutti i casi possibili, come vedremo pi` u avanti. Consideriamo uno spazio di Hilbert H = L2 (X, μ), dove X `e uno spazio topologico a base numerabile e μ `e una misura positiva σ-additiva sulla σalgebra di Borel di X. Una misura spettrale su H si ottiene definendo, per ogni ψ ∈ L2 (X, μ) e E ∈ B(X): (P (E)ψ)(x) := χE (x)ψ(x) ,
per quasi ogni x ∈ X .
(8.30)
Si prova facilmente che l’applicazione B(X) E → P (E) definisce effettivamente una misura spettrale su L2 (X, μ). Vogliamo ora capire come siano fatti gli operatori X f(x) dP (x) per ogni funzione di Mb (X). Notiamo che se ψ ∈ L2 (X, μ) e f ∈ Mb (X), allora f · ψ ∈ L2 (X, μ), dove · indica la moltiplicazione delle due funzioni punto per punto, infatti: |f(x)ψ(x)|2 dμ(x) ≤ ||f||2∞ |ψ(x)|2 dμ(x) < +∞ . X
X
In particolare, abbiamo anche provato che, se f ∈ Mb (X) e ψ ∈ L2 (X, μ), allora: ||f · ψ|| ≤ ||f||∞||ψ|| . Da ci`o segue immediatamente che: Se {fn }n∈N ⊂ Mb (X) e fn → f ∈ Mb (X) nella norma || ||∞ per n → +∞, allora anche fn · ψ → f · ψ nella convergenza di L2 (X, μ). Notiamo inoltre che, se s ∈ S(X), l’operatore X s(x) dP (x) si scrive esplicitamente usando (8.30) e (8.26): risulta subito che, per ogni ψ ∈ L2 (X), vale:
s(y) dP (y)ψ (x) = s(x)ψ(x) . X
u di Pertanto, se {sn } ⊂ S(X) converge uniformemente a f ∈ Mb (X) (in virt` (b) di proposizione 7.39, una siffatta successione esiste per ogni f ∈ Mb (X)), si ha: sn · ψ = sn (x) dP (x)ψ → f(x) dP (x)ψ X
X
quando n → +∞, per la definizione di integrale mediante l’estensione continua I di I. D’altra parte abbiamo visto all’inizio che nelle nostre ipotesi (con fn := sn ) vale anche sn · ψ → f · ψ nel senso di L2 (X) per n → +∞, per cui:
f(y) dP (y)ψ (x) = f(x)ψ(x) per quasi ogni x ∈ X, (8.31) X
per ogni f ∈ Mb (X) ed ogni ψ ∈ L2 (X, μ). (2) Come secondo esempio, consideriamo una base Hilbertiana N in uno spazio di Hilbert H separabile. Possiamo mettere su N la topologia discreta data
338
8 Teoria Spettrale I: operatori limitati
dall’insieme delle parti di N . In tale topologia gli insiemi contenenti singoli punti sono aperti, la σ-algebra di Borel associata a tale topologia coincide con la stessa topologia e coincide quindi con l’insieme delle parti di N . Si osservi che N `e numerabile di secondo tipo essendo H separabile. Se E ⊂ N `e un boreliano, consideriamo il sottospazio chiuso HE := < {z}z∈E >. Il proiettore ortogonale che proietta su tale spazio `e (cfr. (d) in proposizione 3.53): P (E) := s(z| )z , z∈E
essendo E base hilbertiana di HE . Si verifica subito che P : B(N ) E → P (E) `e effettivamente una misura a valori di proiezione. Infine si pu`o dimostrare che, se f : N → C `e una funzione limitata, vale: f(z) dP (z) = sf(z) (z| ) z . (8.32) N
z∈N
La prova di ci` o si pu` o ottenere dall’esempio (1), usando il fatto che (teorema 3.29) H `e isomorfo come spazio di Hilbert, sotto l’isometria suriettiva U : H → L2 (N, μ) che associa a x ∈ H la funzione z → ψx (z) := (z|x), allo spazio L2 (N, μ), dove μ `e la misura che conta i punti di N . Si verifica subito che effettivamente Q(E) := U P (E)U −1 `e l’operatore moltiplicativo in L2 (N, μ), che moltiplica per la funzione caratteristica di E: in tal modo si ottiene (come `e possibile verificare) una misura spettrale Q : B(N ) E → Q(E) del tipo di quelle introdotte nell’esempio (1). Usando la definizione di integrale di una funzione f ∈ Mb (X) tramite l’integrale di funzioni semplici, per le quali vale evidentemente: −1 s(z) dQ(z) = ci Q(Ei ) = U ci P (Ei )U = U s(z) dP (z)U −1 , N
i
si ricava:
N
i
f(z) dQ(z) = U
N
f(z) dP (z)U −1 ,
(8.33)
N
per la continuit` a della composizione di operatori in B(H). La (8.31) implica che: f(z) dQ(z)ψ = f · ψ . (8.34) N
Usando (8.33) e (8.34), si ha che: f(z) dP (z)φ = U −1 f · U φ = f(z) (z|φ) z , N
z∈N
dove abbiamo ricordato la definizione di U (cfr. teorema 3.29): U : H φ → {(z|φ)}z∈N ∈ L2 (N, μ)
8.3 Misure a Valori di Proiezione (PVM)
e la sua inversa: U −1 : L2 (N, μ) {αz }z∈N →
339
αz z ∈ H .
z∈N
In definitiva, abbiamo provato che, come volevamo: f(z) dP (z) = sf(z) (z| ) z . N
z∈N
(3) Come terzo esempio, presentiamo una generalizzazione dell’esempio (2). Consideriamo un insieme X che assumiamo dotato di una topologia a base numerabile per la quale valga anche che ogni insieme {x}, con x ∈ X, appartenga alla σ-algebra di Borel B(X) associata alla topologia. Per esempio, ci`o accade se X `e numerabile e si dota X della topologia discreta, ma si possono fare altri esempi ovvi: se `e X = R dotato della topologia standard, oppure se `e X := {0} ∪ {±1/n | n = 1, 2, . . .} ⊂ R e si dota X della topologia indotta da quella di R. Definiamo una classe di proiettori ortogonali, Pλ : H → H, sullo spazio di Hilbert H, per ogni λ ∈ X. Per avere una PVM richiediamo che valgano i seguenti fatti: (a) P λ Pμ = 0 per λ, μ ∈ X con λ = μ; (b) λ∈X ||Pλ ψ||2 < +∞ , per ogni ψ ∈ H; (c) λ∈X Pλ ψ = ψ , per ogni ψ ∈ H. Dalla richiesta (b) segue che solo una quantit` a al pi` u numerabile (cfr. proposizione 3.22) di elementi Pλ ψ sono non nulli, anche nel caso in cui X sia non numerabile; allora, tenendo anche conto del fatto che, per (a), i vettori Pλ ψ e Pμ ψ sono ortogonali se λ = μ, per il lemma 3.26 la somma in (c) `e ben definita e pu` o essere riordinata arbitrariamente. Il fatto che le richieste (a), (b) e (c) sono compatibili si verifica esibendo una classe di proiettori ortogonali che le soddisfano contemporaneamente. Il caso pi` u semplice `e fornito dalla classe dei proiettori P ({z}), z ∈ N , dell’esempio (2) nel caso in cui X `e una base hilbertiana. Un ulteriore esempio, in cui X non `e una base hilbertiana, sar` a presentato in (2) di esempi 8.39. Un caso in cui le condizioni (a), (b) e (c) sono verificate si ha considerando un operatore autoaggiunto compatto T , definendo X = σp (T ) ed infine definendo Pλ con λ ∈ σp (T ) come il proiettore ortogonale sull’autospazio con autovalore λ. La topologia su X sar`a quella indotta da R. Dai teoremi 4.17 e 4.18 segue facilmente che le condizioni (a), (b) e (c) sono verificate. Riscriveremo le due ultime richieste in forma sintetica come: sPλ = I . (8.35) λ∈X
Con le condizioni poste, si verifica facilmente che P : B(X) → B(H), definita in modo tale che, per ogni E ⊂ B(X), valga P (E) = sPλ , (8.36) λ∈E
340
8 Teoria Spettrale I: operatori limitati
`e una misura a valori di proiezione su H. La somma λ∈E Pλ ψ esiste sempre in H, per ogni ψ ∈ H, e non dipende dall’ordinamento: ci` o segue subito dalla condizione (b), tenendo conto di lemma 3.26. Vogliamo ora dimostrare che, per ogni f ∈ Mb (X): f(x) dP (x) = sf(x)Px . (8.37) X
x∈X
Si osservi che il secondo membro `e ben definito e pu` o essere riordinato a piacimento, per il lemma 3.26, essendo, per ogni ψ ∈ H: ||f(x)Px ψ||2 ≤ ||f||2∞ ||Pxψ||2 = ||f||2∞ (Px ψ|Pxψ) x∈X
=
x∈X
||f||2∞
(ψ|Px2 ψ) x∈X =
=
||f||2∞
x∈X
(ψ|Px ψ) =
||f||2∞
x∈X
||f||2∞(ψ|ψ)
ψ Px ψ
x∈X
=
||f||2∞||ψ||2
,
dove la penultima uguaglianza vale per (8.35). Se s ∈ S(X) `e una funzione semplice, applicando la definizione di integrale di funzione semplice e (8.36), segue subito che, per ogni ψ ∈ H: s(x) dP (x)ψ = ci P (Ei )ψ = s(x)Px ψ = s(x)Px ψ , (8.38) X
i
i
x∈Ei
x∈X
dove, nella seconda uguaglianza, abbiamo sfruttato il fatto che dall’espressione di s(x) = i ci χEi si ha ci = s(x) per ogni x ∈ Ei . Se {sn } ⊂ S(X) e sn → f ∈ Mb (X) uniformemente, allora, per ogni ψ ∈ H: f(x) dP (x)ψ − sn (x) dP (x)ψ → 0 , (8.39) X
X
per n → +∞, per la definizione di integrale di funzioni misurabili limitate. D’altra parte, per (8.38) e usando la (a), si ottiene:
2
f(x) Px ψ − sn (x) dP (x)ψ
X x∈X
=
|f(x) − sn (x)|2 ||Pxψ||2 ≤ ||f − sn ||2∞||ψ||2 .
x∈X
L’ultimo membro tende a zero se n → +∞. Per (8.39) e per l’unicit` a del limite in H, deve allora valere che, per ogni ψ ∈ H: f(x) Pxψ = f(x) dP (x)ψ , x∈X
pertanto vale (8.37).
X
8.3 Misure a Valori di Proiezione (PVM)
341
8.3.3 Propriet` a degli operatori ottenuti integrando funzioni limitate rispetto a PVM Esaminiamo in questa sezione le propriet`a dell’operatore integrale, dividendole in due parti. Vale il seguente teorema che stabilisce le prime propriet` a dell’operatore integrale. Riguardo a (v) in (c), ricordiamo che se B(X) `e la σ-algebra di Borel di uno spazio topologico X, il supporto di una misura μ su B(X), indifferentemente se positiva σ-additiva o complessa (vedi l’Appendice per la prima e (1) in esempi 2.58 per la seconda), `e l’insieme chiuso supp(μ) ⊂ X, dato dal complemento all’unione di tutti gli aperti A ⊂ X per cui μ(A) = 0. Teorema 8.30. Sia X spazio topologico a base numerabile, (H, ( | )) spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione. Valgono i fatti seguenti. (a) Per ogni f ∈ Mb (X),
(P )
f(x) dP (x)
= ||f||∞ ≤ ||f supp(P ) ||∞ . (8.40)
X
(b) L’operatore integrale rispetto alla misura di proiezione P `e positivo: f(x) dP (x) ≥ 0 se vale 0 ≤ f ∈ Mb (X) . X
(c) Per ogni coppia ψ, φ ∈ H, si consideri l’applicazione:
μψ,φ : B(X) E → ψ
χE dP (x)φ . X
Valgono le propriet` a seguenti di μψ,φ : (i) μψ,φ `e una misura complessa su X, detta misura spettrale complessa associata a ψ e φ, (ii) se ψ = φ, μψ := μψ,ψ `e una misura positiva finita su X, detta misura spettrale (positiva) associata a ψ, (iii) μψ,φ (X) = (ψ|φ) e, in particolare, μψ (X) = ||ψ||2 , (iv) per ogni funzione f ∈ Mb (X) vale:
ψ f(x) dP (x)φ = f(x) dμψ,φ (x) , (8.41) X
X
(v) vale supp(μψ,φ ) ⊂ supp(|μψ,φ |) ⊂ supp(P ) e supp(μψ ) ⊂ supp(P ). Dimostrazione. (a). Consideriamo una successione di funzioni semplici tale (P ) che sn → f nella norma || ||∞. Di conseguenza: ||sn −f||∞ ≤ ||sn −f||∞ → 0 e (P ) (P ) (P ) (P ) quindi, dato che |||sn||∞ −||f||∞ | ≤ ||sn −f||∞ , concludiamo che ||sn ||∞ → (P ) (P ) ||f||∞ . Sappiamo anche che || X sn dP || = ||sn ||∞ dalla (8.28). Dato che
342
8 Teoria Spettrale I: operatori limitati
dalla definizione di integrale di funzioni limitate segue che: || X sn dP || → (P ) (P ) || X fdP ||, concludiamo che deve essere: ||sn ||∞ → ||f||∞ = || X fdP || e quindi vale la prima uguaglianza in (8.40). La disuguaglianza segue dalla propriet` a di supp(P ) come discusso nell’osservazione 8.28. (b). Usando (c) della proposizione 7.39, se 0 ≤ f ∈ Mb (X), esiste una successione di funzioni semplici {sn }n∈N , con 0 ≤ sn ≤ sn+1 ≤ f per ogni n, che converge uniformemente a f. Di conseguenza, tenendo conto della definizione dell’integrale rispetto a P e del uniforme implica fatto che la convergenza quella debole, otteniamo che (ψ| X sn dP ψ) → (ψ| fdP ψ) per n → +∞ per X ogni ψ ∈ H. Per avere la positivit` a di X fdP `e allora sufficiente provare che (ψ| X sn dP ψ) ≥ 0 per ogni n. Direttamente da (8.26) troviamo che:
(n) (n)
ψ sn dP ψ = ψ P (Ei ) ψ ≥ 0 , ci X
i∈In
(n)
dato che ogni proiettore ortogonale `e un operatore positivo ed i numeri ci sono non negativi, essendo sn ≥ 0. (c). Notiamo che, per (8.26), si ha:
μψ,φ (E) = ψ χE (x) dP (x)φ = (ψ|1 · P (E)φ) = (ψ|P (E)φ) , (8.42) X
ed `e (ψ|P (E)ψ) ≥ 0. Allora, la propriet` a definitoria (d) della misura a valori di proiezione data in definizione 8.21, unitamente alla continuit` a del prodotto scalare, implicano che μψ,φ `e una misura complessa sulla σ-algebra di Borel B(X) (vedi la definizione in (1) in esempi 2.58); inoltre, la stessa (d) unitamente alla (a) di definizione 8.21 implicano che, se ψ = φ, μψ `e una misura positiva sigma-additiva, finita, sulla σ-algebra di Borel B(X). Infine la (c) di definizione 8.21 comporta che μψ,φ (X) = (ψ|φ), e in particolare μψ (X) = (ψ|ψ) = ||ψ||2 . Dato che μψ e |μψ,φ| sono misure finite, l’integrale associato ad esse `e continuo nella norma || ||∞ su Mb (X). (Infatti, per ogni f ∈ Mb (X), vale:
f(x) dμψ,φ (x) ≤ |f(x)| d|μψ,φ(x)| ≤ ||f||∞ |μψ,φ|(X) ,
X
X
da cui segue la continuit` a dell’integrale nella norma dell’estremo superiore.) Se sn ∈ S(X), usando (8.42) e (8.26) si prova immediatamente che vale:
ψ sn (x) dP (x)φ = sn (x) dμψ,φ (x) . X
X
Se ora f ∈ Mb (X) e {sn }n∈N ⊂ S(X) converge a f per n → +∞ in senso uniforme (cfr. (b) proposizione 7.39), usando la continuit` a del prodotto scalare e la continuit` a dell’integrale associato a μψ,φ rispetto alla convergenza uniforme, si ha subito che:
ψ
f(x) dP (x)φ = ψ
lim sn (x) dP (x)φ X
n→+∞
X
8.3 Misure a Valori di Proiezione (PVM)
343
ψ
sn (x) dP (x)φ = lim = lim sn (x) dμψ,φ(x) n→+∞ n→+∞ X X = f(x) dμψ,φ (x) . X
Proviamo la (v). La tesi equivale a dire che X \ supp(μψ,φ) ⊃ X \ supp(P ). Sia x ∈ X \ supp(P ): allora esiste un aperto A ⊂ X tale che x ∈ A e P (A) = 0. Per isotonia P (B) = 0 se B(X) B ⊂ A. Di conseguenza:
μψ,φ (B) = χA (x) dP (x) = ψ
χB (x) dP (x)φ = (ψ|P (B)φ) = 0 . X
X
Dalla definizione di variazione totale (vedi (1) in esempi 2.58) |μψ,φ|(A) = 0, per cui x ∈ X \ supp(|μψ,φ |). Essendo poi |μψ,φ|(A) ≥ |μψ,φ(A)| per ogni A ∈ B(X), in particolare con A aperto, si ha: supp(μψ,φ ) ⊂ supp(|μψ,φ |). Il caso di μψ `e analogo. Questo completa la dimostrazione del teorema. Osservazioni 8.31. (1) Bisogna notare che se vogliamo che le misure positive μψ definite sulla σ-algebra di Borel di X, siano misure di Borel propriamente dette, bisogna anche richiedere che lo spazio X sia di Hausdorff e localmente compatto, per definizione di misura di Borel ([Rud82] e vedi l’Appendice). Nei casi concreti, per esempio lavorando con PVM che definiscono lo sviluppo spettrale di operatori, X `e sempre (un sottoinsieme di) R o R2 e pertanto queste ipotesi sono soddisfatte. ` utile osservare che la misura complessa μψ,φ si decompone nella combi(2) E nazione lineare complessa di 4 misure positive finite μχ . Essendo μψ,φ (E) = (ψ|P (E)φ) = (P (E)ψ|P (E)φ), dall’identit` a di polarizzazione (3.4), abbiamo: μψ,φ(E) = μψ+φ (E)−μψ−φ (E)−iμψ+iφ (E)+iμψ−iφ (E)
per ogni E ∈ B(X).
Il seguente teorema stabilisce la pi` u importante propriet` a delle misure a valori di proiezione: il fatto che diano luogo a ∗-omomorfismi di C ∗ -algebre. Tale ingrediente sar`a essenziale nel provare il teorema spettrale che dimostreremo subito dopo. Teorema 8.32. Siano H uno spazio di Hilbert, X uno spazio topologico a base numerabile e P : B(X) → B(H) una misura a valori di proiezione. Valgono i fatti seguenti. (a) L’operatore integrale: I : Mb (X) f → f(x)dP (x) ∈ B(H) X
a Mb (X) alla C ∗`e uno ∗-omomorfismo continuo dalla C ∗-algebra con unit` algebra con unit` a B(H). In altre parole, oltre a valere (8.40), valgono anche:
344
8 Teoria Spettrale I: operatori limitati
(i) se 1 denota la funzione costante con valore unitario su X, allora: 1 dP (x) = I , X
(ii) per ogni coppia f, g ∈ Mb (X) e per ogni α, β ∈ C: (αf(x) + βg(x)) dP (x) = α f(x)dP (x) + β g(x)dP (x) , X
X
X
(iii) per ogni coppia f, g ∈ Mb (X): f(x) dP (x) g(x) dP (x) = f(x)g(x) dP (x) , X
X
X
(iv) per ogni f ∈ Mb (X) vale:
∗ f(x) dP (x) = f(x)dP (x) . X
X
(b) Se ψ ∈ H e f ∈ Mb (X), allora vale:
2
f(x) dP (x)ψ
= |f(x)|2 dμψ (x) .
X
X
(c) Se {fn }n∈N ⊂ Mb (X) `e limitata e converge puntualmente a f : X → C, allora esiste l’integrale di f rispetto alla misura spettrale P e vale: f(x) dP (x) = s- lim fn (x) dP (x) . n→+∞
X
X
(d) Se X = R2 , dotato della topologia euclidea standard, e se supp(P ) `e limitato, allora, pensando σ(T ) come sottoinsieme di R2 , si ha: supp(P ) = σ(T ) ,
dove:
z dP (x, y) ,
T := supp(P )
essendo z la funzione R2 (x, y) → z := x + iy. Osservazioni 8.33. (1) La propriet` a (iii) di (a) implica, in particolare, la seguente propriet`a di commutazione di operatori: f(x) dP (x) g(x) dP (x) = g(x) dP (x) f(x) dP (x) , X
X
X
X
per ogni coppia f, g ∈ Mb (X). (2) Da (iv) e da (iii) di (a) segue che, per ogni f ∈ Mb (X), l’operatore f(x) dP (x) `e normale. X
8.3 Misure a Valori di Proiezione (PVM)
345
Prova del teorema 8.32. (a). Le uniche propriet` a non del tutto banali sono (iii) e (iv). Proviamo la prima. Scegliamo due successioni di funzioni semplici {sn } e {tm } che tendono uniformemente a f e g rispettivamente. Per computo diretto si verifica che sn (x) dP (x) tm (x) dP (x) = sn (x)tm (x) dP (x) . X
X
X
Per m fissato, essendo tm limitata, sn · tm tende uniformemente a f · tm per n → +∞. Tenendo conto della continuit` a (nel senso di (a) di teorema 8.30) e della linearit` a dell’integrale come funzione della funzione integranda e prendendo il limite per n → +∞ nell’identit` a di sopra, si ottiene: f(x) dP (x) tm (x) dP (x) = f(x)tm (x) dP (x) , X
X
X
dove si `e tenuto conto del fatto che la composizione di operatori limitati `e continua nei due argomenti. Con la stessa procedura, tenendo conto che f · tm tende uniformemente a f · g se m → +∞, si ottiene (iii). La propriet` a (iv) si verifica scegliendo una successione di funzioni semplici {sn } che tendono uniformemente a f. Per ψ, φ ∈ H, direttamente dalla definizione di integrale di una funzione semplice (tenendo conto che i proiettori ortogonali sono autoaggiunti), si verifica che:
sn (x) dP (x)ψ φ = ψ sn (x) dP (x)φ . X
X
Si osservi che sn → f uniformemente per n → +∞. Quindi, usando la continuit` a e la linearit` a dell’integrale come funzione della funzione integranda (nel senso di (a) di teorema 8.30), tenendo conto della continuit` a del prodotto scalare, e prendendo il limite per n → +∞ dell’identit` a di sopra, si ottiene:
f(x) dP (x)ψ φ = ψ f(x) dP (x)φ X
X
e quindi:
* X
f(x) dP (x) −
X
∗ +
ψ
φ = 0 . f(x) dP (x)
Dato che ψ, φ ∈ H sono arbitrari, si conclude che deve valere (iv). (b). Se ψ ∈ H, usando (iii) e (iv) di (a), si ha subito che vale:
2
f(x) dP (x)ψ
= ψ |f(x)|2 dP (x)ψ = |f(x)|2 dμψ (x) ,
X
X
X
dove, nell’ultima uguaglianza, abbiamo tenuto conto di (c) in teorema 8.30. (c). Per prima cosa notiamo che f ∈ Mb (X), dato che `e una funzione misurabile, essendo limite di funzioni misurabili, ed `e limitata dalla stessa costante
346
8 Teoria Spettrale I: operatori limitati
che limita la successione delle fn . Se ψ ∈ H, la linearit` a dell’integrale e (b) implicano immediatamente che:
2
f(x) dP (x) − fn (x) dP (x) ψ
= |f(x) − fn (x)|2 dμψ (x) .
X
X
X
La misura μψ `e finita, per cui le funzioni costanti sono integrabili. Per ipotesi, |fn | < K < +∞ per ogni n ∈ N, quindi |f| ≤ K e pertanto |fn − f|2 ≤ (|fn | + |f|)2 < 4K 2 . Dato che |fn − f|2 → 0 puntualmente, possiamo applicare il teorema della convergenza dominata, ottenendo che, per n → +∞,
!
f(x) dP (x)ψ − fn (x) dP (x)ψ
= |f(x) − fn (x)|2 dμψ (x) → 0 .
X
X
X
Data l’arbitrariet` a di ψ ∈ H, questo risultato prova (c). (d). Se supp(P ) `e limitato, dato che `e chiuso per definizione, sar` a compatto e su di esso ogni funzione continua sar` a limitata. L’applicazione R2 (x, y) → zχ (x, y) ∈ C `e dunque limitata, per cui T := supp(P ) z dP (x, y) := supp(P ) zχsupp(P ) (x, y) dP (x, y) `e ben definito ed `e un operatore normale in B(H) R2 e quindi, in particolare, il suo spettro residuo `e vuoto per (c) di proposizione 8.15. Per definizione di insieme risolvente, la tesi `e equivalente all’affermazione: C λ ∈ supp(P ) se e solo se λ ∈ ρ(T ). Proviamo che λ ∈ supp(P ) implica λ ∈ ρ(T ). Tenendo conto che R2 (x, y) → z = x + iy `e limitata su supp(P ), supponiamo che λ ∈ supp(P ). In tal caso c’`e un aperto di R2 , A (x0 , y0 ) con x0 + iy0 = λ, tale che P (A) = 0. Segue facilmente che (x, y) → (z−λ)−1 `e limitata sull’insieme chiuso supp(P ). Allora esiste l’operatore di B(H): 1 dP (x, y) . z − λ supp(P ) In virt` u di (iii) e (i) di (a), vale: 1 dP (x, y) (z − λ) dP (x, y) supp(P ) z − λ supp(P ) 1 = (z − λ) dP (x, y) dP (x, y) supp(P ) supp(P ) z − λ 1 dP (x, y) = 1 dP (x, y) = I , = supp(P )
R2
che pu` o essere scritto anche come, tenendo conto di (i) e (ii) di (a): 1 1 dP (x, y)(T − λI) = (T − λI) dP (x, y) = I . supp(P ) z − λ supp(P ) z − λ
8.3 Misure a Valori di Proiezione (PVM)
347
In altre parole, T − λI `e una biezione di H su H. Per (a) del teorema 8.4. Mostriamo ora che λ ∈ ρ(T ) implica che λ ∈ supp(P ). Per dimostrare questo fatto, proviamo la proposizione equivalente: λ ∈ supp(P ) implica λ ∈ σ(T ) = σp(T ) ∪ σc(T ). Se λ ∈ supp(P ), pu` o accadere che T −λI : H → H non sia iniettivo: in tal caso λ ∈ σp (T ) e la dimostrazione finisce. Supponiamo invece che T − λI : H → H sia iniettivo e mostriamo che l’operatore inverso (T − λI)−1 : Ran(T − λI) → H non pu` o essere limitato, per cui λ ∈ σc(T ). Per provare questo fatto, `e sufficiente mostrare che, se λ ∈ supp(P ), per ogni n = 1, 2, . . . esiste ψn ∈ H, con ψn = 0, tale che: ||(T − λI)ψn ||/||ψn|| ≤ 1/n . (Infatti, nelle nostre ipotesi, vale ψn = (T − λ)−1 φn per ogni n = 1, 2, . . ., con φn = 0 per avere ψn = 0. Allora si ha: 1/n ≥ ||(T − λI)ψn ||/||ψn|| = ||(T − λI)(T − λI)−1 φn ||/||(T − λI)−1 φn || . In altre parole, per ogni n = 1, 2, . . ., esiste φn ∈ H, con φn = 0, tale che: ||(T − λI)−1 φn || ≥n. ||φn|| Allora (T − λI)−1 non pu` o essere limitato e quindi λ ∈ σc (T ).) Se λ ∈ supp(P ), ogni aperto A λ deve soddisfare P (A) = 0. Posto x0 +iy0 := λ, consideriamo la classe di dischi aperti Dn ⊂ R2 , centrati in (x0 , y0 ) e di raggio 1/n, con n = 1, 2, . . .. Dato che P (Dn ) = 0, esister`a ψn = 0 tale che ψn ∈ P (Dn )(H). In tal caso, si ha: (T − λI)ψn = (z − λ) dP (x, y)ψn supp(P )
= supp(P )
(z − λ) dP (x, y)
supp(P )
χDn (z) dP (x, y)ψn ,
dove abbiamo tenuto conto di P (Dn ) = R2 χDn (z) dP (x, y) e di P (Dn )ψn = ψn . Usando (iii) di (a) del presente teorema, troviamo allora: (T − λI)ψn = χDn (z)(z − λ)dP (x, y) . R2
Quindi, dalla propriet` a (b), otteniamo: ||(T − λI)ψn ||2 = |χDn (z)|2 |z − λ|2 dμψn (x, y) ≤ R2
= n−2
R2
R2
1 dμψn (x, y) = n−2 ||ψn ||2 ,
1 · n−2 dμψn (x, y)
348
8 Teoria Spettrale I: operatori limitati
dove, nell’ultima uguaglianza, abbiamo usato il fatto che μψn (R2 ) = ||ψn ||2 per la (iii) di (c) in teorema 8.30. Estraendo le radici quadrate ad ambo i membri, si ha infine: ||(T − λI)ψn || ≤ 1/n . ||ψn|| Questo conclude la dimostrazione.
8.4 Teorema spettrale per operatori normali in B(H) Abbiamo accumulato un numero sufficiente di risultati da poter ora enunciare e provare il primo importante teorema di decomposizione spettrale per operatori normali in B(H). In questa sezione dimostreremo poi un’altra versione dello stesso teorema, che riguarda un’utile rappresentazione spettrale, degli operatori normali limitati T in termini di operatori moltiplicativi su spazi L2 opportuni, costruiti sullo spetto di T . Infine enunceremo e dimostreremo un notevole risultato tecnico noto come Teorema di Fuglede. 8.4.1 Teorema di decomposizione spettrale per operatori limitati normali Il teorema di decomposizione spettrale mostra come ogni operatore normale di B(H) si possa sempre costruire integrando una certa PVM, che ha supporto dato dallo spettro dell’operatore e che `e unicamente determinata dall’opera` importante osservare per le applicazioni, che il teorema `e valido, tore stesso. E in particolare, per operatori autoaggiunti in B(H) e per operatori unitari, che sono sottocasi di operatori normali. Teorema 8.34. (Teorema di decomposizione spettrale per operatori in B(H) normali.) Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Valgono i fatti seguenti. (a) Esiste, `e unica e limitata una misura a valori di proiezione P (T ) su R2 (dotato della topologia standard) tale che: T = z dP (T ) (x, y) , (8.43) supp(P (T ) )
dove z `e la funzione R2 (x, y) → z := x + iy ∈ C. (a)’ Se T `e autoaggiunto oppure unitario, l’enunciato (a) si pu` o precisare ulteriormente sostituendo R2 , rispettivamente, con R oppure con S1 := {(x, y) ∈ R2 | x2 + y2 = 1} . (b) Vale:
supp(P (T ) ) = σ(T ) .
8.4 Teorema spettrale per operatori normali in B(H)
349
In particolare, per λ = x + iy ∈ C (rispettivamente λ = x ∈ R, oppure λ = x + iy ∈ S1 ) valgono i seguenti fatti: (i) λ ∈ σp (T ) se e solo se P (T )({λ}) = 0, (ii) λ ∈ σc (T ) se e solo se P (T ) ({λ}) = 0 e, per ogni aperto Aλ ⊂ R2 (rispettivamente, R oppure S1 ) con Aλ λ, `e P (T )(Aλ ) = 0, (iii) se λ ∈ σ(T ) `e un punto isolato, allora λ ∈ σp (T ), (iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ H con ||φ|| = 1 e 0 < ||T φ − λφ || ≤ . (c) Se f ∈ Mb (σ(T )), l’operatore σ(T ) f(x, y) dP (T )(x, y) commuta con tutti gli operatori di B(H) che commutano con T e T ∗ . Osservazione 8.35. La propriet` a (iv) di (b) afferma in pratica che, se λ ∈ σc(T ), bench´e non esistano autovettori di T con λ come autovalore (dato che lo spettro continuo e quello discreto sono disgiunti), possiamo comunque costruire vettori che risolvono l’equazione degli autovalori con approssimazione arbitrariamente buona. Prova del teorema 8.34. (a), (a)’ e (c). Unicit` a. Dimostriamo prima di tutto l’unicit` a della misura spettrale. Prima di tutto si noti che se una misura spettrale P soddisfa (8.43) deve avere supporto limitato, dato che la funzione z non `e limitata su insiemi non limitati ed il secondo membro di (8.43) deve quindi intendersi nel senso di (c) della definizione 8.27. Siano dunque P e P misure a valori di proiezione con supporto limitato (e quindi compatto, essendo supp(P ) chiuso in R2 per definizione) e tali che: T = z dP (x, y) = z dP (x, y) . (8.44) supp(P )
supp(P )
Da tale relazione, usando (i), (ii), (iii) e (iv) di (a) nel teorema 8.32, segue che, per ogni polinomio p = p(z, z), vale: p(T, T ∗ ) = p(x + iy, x − iy) dP (x, y) supp(P )
= supp(P )
p(x + iy, x − iy) dP (x, y) ,
u ovvio, ossia traducendo la dove il polinomio p(T, T ∗ ) `e definito nel modo pi` moltiplicazione nella composizione di operatori e ponendo T 0 := I e (T ∗ )0 := I. Se u, v ∈ H sono arbitrari, per ogni polinomio complesso p = p(z, z) su R2 , avremo allora che:
p(z, z) dμu,v (x, y) = u p(z, z) dP (x, y)v
supp(P ) supp(μu,v )
350
8 Teoria Spettrale I: operatori limitati
= u p(z, z) dP (x, y)v = p(z, z) dμu,v (x, y) .
supp(P ) supp(μu,v ) Le due misure complesse μu,v e μu,v sono quelle introdotte in (c) del teorema 8.30 (con u e v sostituiti da ψ e φ.) supp(μu,v ) e supp(μu,v ) sono compatti di R2 (per (v) di (c) in teorema 8.30), e pertanto esiste un compatto K ⊂ R2 che include entrambi i supporti. Estendiamo in modo ovvio le due misure su K senza alterarne il supporto, definendo la misura di un boreliano E di K come μu,v (E ∩ supp(μu,v )) e la stessa cosa per la misura rispetto a μu,v . Dato che i polinomi in z, z a coefficienti complessi individuano biunivocamente tutti i polinomi complessi q(x, y) nelle variabili reali x, y (tramite la solita sostituzione z := x + iy e z := x − iy per cui p(x + iy, x − iy) = q(x, y)), possiamo riscrivere le identit`a di sopra in termini di polinomi, a coefficienti complessi, nelle variabili reali (x, y) ∈ K: p(x + iy, x − iy) dμu,v (x, y) = p(x + iy, x − iy) dμu,v (x, y) . K
K
Per il teorema 2.40 di Stone-Weierstrass, l’algebra dei polinomi complessi q(x, y) `e densa rispetto alla norma dell’estremo superiore nello spazio C(K). Concludiamo che l’algebra dei polinomi complessi della forma p(x + iy, x − iy) ristretti al compatto K `e densa, nella norma dell’estremo superiore, nello spazio C(K). Dato che gli integrali rispetto a misure complesse sono funzionali continui nella norma dell’estremo superiore, deve valere: f(x, y) dμu,v (x, y) = f(x, y) dμu,v (x, y) per ogni f ∈ C(K) . K
K
Il teorema 2.62 di Riesz per le misure complesse assicura che le due misure estese a K devono coincidere. Di conseguenza, le misure non ancora estese a K devono avere lo stesso supporto e coincidere. Quindi, usando (iv) in (c) del teorema 8.30, abbiamo che, per ogni coppia di vettori u, v ∈ H e per ogni funzione misurabile g limitata su R2 , vale:
u g(x, y) dP (x, y)v = u g(x, y) dP (x, y)v ,
supp(P )
supp(P ) cio`e:
u
g(x, y) dP (x, y)v
R2
e quindi:
= u
g(x, y) dP (x, y)v
,
R2
g(x, y) dP (x, y) = R2
g(x, y) dP (x, y) ,
R2
per l’arbitrariet` a di u e v. Se E `e un arbitrario boreliano di R2 e si sceglie
8.4 Teorema spettrale per operatori normali in B(H)
351
g = χE , l’identit` a di sopra implica infine che: P (E) = R2
χE (x, y) dP (x, y) =
R2
χE (x, y) dP (x, y) = P (E) .
Questo prova che P = P . Inoltre osserviamo che, in virt` u di (8.44) e di (d) in teorema 8.32, si ha supp(P (T )) = σ(T ). L’unicit` a per i casi presentati in (a)’ `e conseguenza di quanto appena provato, del fatto che supp(P (T ) ) = σ(T ) e di (a) (i) e (b) (i) in proposizione 8.15. Esistenza. Passiamo a provare l’esistenza della misura spettrale P (T ). Divideremo la dimostrazione in due casi: il caso in cui T `e autoaggiunto, ed il caso in cui T non lo `e. T associato a T coCaso di T autoaggiunto. Si consideri lo ∗ -omomorfismo Φ me nel teorema 8.18. Se E `e un boreliano di R, definiamo E := E ∩ σ(T ) T (χE ). E ` chiaro che P (T ) (E) `e idempotente, essendo e quindi: P (T )(E) := Φ T un omomorfismo e valendo χE · χE = χE . Inoltre, la propriet` a (vi) di Φ (b) in teorema 8.18 ed il fatto che le funzioni caratteristiche sono positive implicano che P (T ) (E) ≥ 0 e quindi P (T ) (E) `e anche autoaggiunto. In definitiva ogni P (T ) (E) `e un proiettore ortogonale. Si verifica immediatamente che B(R) E → P (T )(E) `e una misura a valori di proiezione: P (T )(E) ≥ 0 come provato sopra; (b) di definizione 8.21 segue dal fatto che χE · χF = χE ∩F T `e omomorfismo; la propriet` e dal fatto che Φ a (c) di definizione 8.21 segue T (χσ(T ) ) = I, valida per definizione di omomorfismo immediatamente da Φ di algebre con unit` a (cfr. (a) del teorema 8.18); infine, la propriet` a (d) della definizione 8.21 segue da (v) di (b) in teorema 8.21, tenendo conto del fatto N che, puntualmente, limN→+∞ n=0 χEn = χ∪n∈N En quando gli insiemi En sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P (T )) `e limitato in quanto supp(P (T )) ⊂ σ(T ), il secondo dei quali `e compatto per (c) del teorema 8.4. Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto della linearit` a dell’operatore integrale associato a P (T ) e della linearit` a di ΦT , segue immediatamente che: T (s σ(T ) ) = Φ
s(x) dP (T )(x) ,
supp(P (T ) )
per ogni funzione semplice s : R → C. Dato che entrambi i funzionali sono continui rispetto alla topologia dell’estremo superiore (ii) in (b) di teorema 8.18 e (a) di teorema 8.30, applicando la proposizione 7.39 si ha che: T (f σ(T ) ) = Φ
supp(P (T ) )
f(x) dP (T ) (x) ,
(8.45)
352
8 Teoria Spettrale I: operatori limitati
per ogni funzione f : R → C misurabile e limitata. In particolare, quindi, per (i) in (a) del teorema 8.18: T = x dP (T )(x) . supp(P (T ) )
Riguardo alla prova di (c), si osservi che (8.45) mostra anche che A ∈ B(H) commuta con supp(P (T ) ) f(x, y) dP (T ) (x, y) se A commuta con T , perch´e, sotT (f σ(T ) ) come conseguenza di (iii) in to le ipotesi dette, A commuta con Φ (b) di teorema 8.18. Caso di T normale non autoaggiunto. Decomponiamo T come in (8.9) mediante gli operatori X, Y ∈ B(H) autoaggiunti e commutanti, definiti in (8.10). Siano P (X) e P (Y ) le misure spettrali limitate definite su R, associate rispettivamente a X e Y secondo la prima parte di questa dimostrazione. Si osservi che risulta P (X) (E)P (Y ) (F ) = P (Y ) (F )P (X)(E) per ogni coppia di boreliani E, F ⊂ R. Infatti, per (8.45), vale: X (χE ) = P (X) (E) = Φ χE (x) dP (X)(x) . R
Il secondo membro commuta con tutti gli operatori di B(H) che commutano con X (per (iii) di (b) del teorema 8.18), pertanto P (X) (E)Y = Y P (X) (E) per ogni boreliano E ⊂ R. Con lo stesso ragionamento abbiamo allora che i proiettori P (Y ) (F ) (F ∈ B(R)) associati a Y , commutando con tutti gli operatori che commutano con Y , dovranno commutare con P (X) (E). In definitiva, tutti gli operatori: P (E × F ) := P (X) (E)P (Y ) (F ) , con E, F boreliani di R, sono a loro volta proiettori ortogonali. Da (8.10) segue immediatamente (ricordando anche che ||T ∗|| = ||T ||) che valgono le disuguaglianze ||X|| ≤ ||T || e ||Y || ≤ ||T ||. Dato che supp(P (X) ) = σ(X), supp(P (Y ) ) = σ(Y ), per (c) del teorema 8.4 i supporti delle misure P (X) e P (Y ) saranno contenuti nel segmento [−||T ||, ||T ||]. Nel seguito della dimostrazione, K denoter`a il compatto di R2 definito come: K := [−||T ||, ||T ||] × [−||T ||, ||T ||] . D’ora in poi, una funzione a gradini su K sar`a una funzione g : K → C esprimibile come: g(x, y) := gij χEi ×Fj , (8.46) (i,j)∈L
dove L `e un insieme finito di indici, gij ∈ C e Ei , Fj ⊂ K sono boreliani K tali che: (Ei × Fj ) ∩ (Er × Fs ) = ∅ se (i, j) = (r, s) . G(K) indicher` a lo spazio vettoriale su C delle funzioni a gradini. G(K) ha la struttura di una ∗ -algebra con unit` a, che `e sotto ∗ -algebra con unit` a di Mb (K).
8.4 Teorema spettrale per operatori normali in B(H)
353
Infatti: G(K) contiene solo funzioni misurabili limitate, `e chiusa rispetto alla combinazione lineare di funzioni, `e chiusa rispetto al prodotto punto per punto, `e chiusa rispetto alla coniugazione complessa e contiene la funzione che vale costantemente 1. Definiamo l’operatore lineare Ψ0 : G(K) → B(H): Ψ0 (g) := gij P (Ei × Fj ) . (8.47) (i,j)∈L
Si verifica facilmente che, se la stessa funzione a gradini g ammette due differenti rappresentazioni del tipo (8.46), il valore di Ψ0 (g) `e il medesimo quando valutato sulle due differenti rappresentazioni. Ψ0 : G(K) → B(H) `e uno ∗ -omomorfismo di algebre con unit`a, in quanto per costruzione `e lineare, trasforma i prodotti di funzioni a gradini in prodotti di operatori, trasforma la coniugazione complessa nella coniugazione hermitiana ed associa alla funzione costante di valore unitario l’operatore identit` a. Esattamente lo stesso procedimento con cui abbiamo dimostrato, prima di enunciare la definizione 8.27, che l’integrale delle funzioni semplici secondo una misura spettrale `e una funzione continua dell’integrando rispetto alla norma || ||∞ (e rispetto alla norma della topologia uniforme in B(H)), prova che Ψ0 : G(K) → B(H) `e continua nella norma || ||∞ (e rispetto alla norma della topologia uniforme in B(H)). In particolare vale: ||Ψ0 (g)|| ≤ ||g||∞ . Infine, se A ∈ B(H) commuta con T e T ∗ , allora commuter`a con le loro combinazioni lineari e quindi, in particolare, con X e Y . Ma allora, ripetendo la dimostrazione gi` a fatta sopra per la commutativit` a dei proiettori delle misure spettrali di X e Y , si prova che A commuta con i proiettori ortogonali della misura spettrale di X e con quelli della misura spettrale di Y . Di conseguenza, se A commuta con T e T ∗ , commuter`a anche con Ψ0 (g) per ogni g ∈ G(K). Passiamo ad estendere Ψ0 alle funzioni continue. Il cosiddetto “teorema dell’oscillazione limitata” dell’analisi elementare assicura che possiamo approssimare arbitrariamente, nella norma dell’estremo superiore, funzioni reali continue su K con funzioni reali a gradini su K; decomponendo le funzioni complesse in parte reale ed immaginaria, il risultato si generalizza a funzioni a valori complessi. In altre parole, G(K) `e denso in C(K) nella norma || ||∞. Usando la proposizione 2.57, possiamo estendere in modo unico Ψ0 : G(K) → B(H) ad uno ∗ -omomorfismo continuo di C ∗ -algebre ΨT : C(K) → B(H) che soddisfa: ||ΨT (f)|| ≤ ||f||∞ ,
per ogni f ∈ C(K)
(8.48)
e tale che ΨT (f)A = AΨT (f) per ogni f ∈ C(K) e ogni A ∈ B(H) che commuta con T e T ∗ . Per costruzione, tale ∗ -omomorfismo gode delle propriet` a: ΨT (x) = X , ΨT (y) = Y , ΨT (x + iy) = T ,
(8.49) (8.50) (8.51)
354
8 Teoria Spettrale I: operatori limitati
dove x, y, x + iy indicano le funzioni su K definite rispettivamente come ` chiaro che la terza propriet` (x, y) → x, (x, y) → y, (x, y) → x + iy. E a segue per linearit` a dalle prime due. La prima identit` a si prova come segue. Sia {sn }n∈N una successione di funzioni semplici su [−||T ||, ||T ||] che converge uniformemente alla funzione x ristretta a tale intervallo (tale successione esiste per (b) di proposizione 7.39). Possiamo definire la successione di funzioni a gradini su K, {gn }n∈N, come gn (x, y) := sn (x) per ogni n ∈ N. Tale successione tende ovviamente alla funzione (x, y) → x su K nella topologia della norma dell’estremo superiore. Si verifica subito che, per costruzione, vale: sn dP (X) (x) = Ψ0 (gn ) . [−||T ||,||T ||]
Prendendo il limite per n → +∞ della relazione precedente, il secondo membro tende a ΨT (x) e il primo membro tende a (si tenga conto che supp(P (X) ) = σ(X) ⊂ [−||T ||, ||T ||]) x dP (X) (x) = x dP (X)(x) = X , [−||T ||,||T ||]
supp(P (X) )
per la continuit` a dell’operatore integrale e per il punto (a), gi` a dimostrato, di questo teorema. Abbiamo in tal modo provato che vale (8.49). Con una dimostrazione analoga si prova (8.50), e quindi (8.51) segue per linearit` a. Usando la stessa dimostrazione del teorema 8.18, possiamo infine univocamente estendere ΨT : C(K) → B(H) ad uno ∗ -omomorfismo di C ∗ -algebre a scritte ΨT : Mb (K) → B(H), che soddisfa (8.51) e gode di tutte le propriet` in (b) del teorema 8.18, con la differenza che si deve rimpiazzare ovunque σ(T ) con K e ΦT con ΨT (che, al contrario del primo, in generale non `e isometrico) e rafforzando l’ipotesi in (iii) richiedendo che A commuti anche con T ∗ , oltre che con T . A questo punto la dimostrazione procede come nel caso di T autoaggiunto. Definiamo E := E ∩ K, dove E ⊂ R2 `e un qualsiasi boreliano. Quindi po` chiaro che P (T ) (E) `e idempotente, essendo niamo: P (T )(E) := ΨT (χE ). E a (vi) di ΨT un omomorfismo e valendo χE · χE = χE . Inoltre, la propriet` (b) in teorema 8.18, che, come detto sopra, vale anche per ΨT , unitamente al fatto che le funzioni caratteristiche sono positive, implica che P (T )(E) ≥ 0, e quindi P (T ) (E) `e anche autoaggiunto. In definitiva ogni P (T )(E) `e un proiettore ortogonale. Si verifica immediatamente che B(R2 ) E → P (T )(E) `e una misura a valori di proiezione: P (T )(E) ≥ 0 come provato sopra; (b) di definizione 8.3 segue dal fatto che χE · χF = χE ∩F e dal fatto che ΨT `e omomorfismo; la propriet` a (c) di definizione 8.21 segue immediatamente da ΨT (χK ) = 1; infine, la propriet` a (d) della definizione 8.21 segue da (v) di (b) in teorema 8.18, che, come detto sopra, N vale anche per ΨT , tenendo conto del fatto che, puntualmente, limN→+∞ n=0 χEn = χ∪n∈N En quando gli insiemi En sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P (T ) )
8.4 Teorema spettrale per operatori normali in B(H)
355
`e limitato, in quanto supp(P (T )) ⊂ K, il secondo dei quali `e compatto per costruzione. Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto della linearit` a di ΨT , segue immediatamente che: ΨT (s K ) = s(x, y) dP (T )(x, y) , R2
per ogni funzione semplice s : R2 → C. Dato che entrambi i funzionali sono continui rispetto alla topologia dell’estremo superiore ((ii) in (b) di teorema 8.18, valido anche per ΨT , e (a) di teorema 8.30), applicando la (b) di proposizione 7.39 si ha che: ΨT (f K ) = f(x, y) dP (T )(x, y) , (8.52) R2
per ogni funzione f : R2 → C misurabile e limitata. In particolare, quindi, per (8.51) si ha: T = (x + iy) dP (T )(x, y) . supp(P (T ) )
Si osservi che (8.52) mostra anche che A ∈ B(H) commuta con R2 f(x, y) dP (T )(x, y) se A commuta con T e T ∗ , perch´e, sotto le nostre ipotesi, A commuta con ΨT (f K ), come detto sopra. Quindi anche la dimostrazione di (c) `e conclusa. (b). Facciamo la dimostrazione per il caso generico in cui T non sia autoaggiunto e nemmeno unitario; la dimostrazione si specializza facilmente a tali casi. Il fatto che supp(P (T ) ) = σ(T ) `e immediata conseguenza di (d) del teorema 8.32. Proviamo (i). Scriveremo P in luogo di P (T ) per semplicit`a notazionale. Sia λ := x0 + iy0 un complesso arbitrario. Tenendo conto di (iii) di (a) in teorema 8.32, vale: T P ({(x0 , y0 )}) = (x + iy)χ{(x0 ,y0 )} (x, y) dP (x, y) σ(T )
=
σ(T )
=λ σ(T )
(x0 + iy0 )χ{(x0 ,y0 )} (x, y) dP (x, y)
χ{(x0 ,y0 )} (x, y) dP (x, y) = λP ({(x0 , y0 )}) .
In definitiva: T P ({(x0 , y0 )}) = λP ({(x0 , y0 )}) . Concludiamo che, se P ({(x0 , y0 )}) = 0, allora λ := x0 + iy0 `e autovalore per T , dato che un qualsiasi vettore u = 0 appartenente al sottospazio su cui proietta P ({(x0 , y0 )}) `e un autovettore con autovalore λ.
356
8 Teoria Spettrale I: operatori limitati
Supponiamo viceversa che T u = λu con u = 0 e λ := x0 + iy0 . Allora (cfr. (b) m di (i) in proposizione 3.49) T ∗ u = λu, T n (T ∗ )m u = λn λ u e, per linearit` a, p(T, T ∗ )u = p(x + iy, x − iy) dP (x, y)u = p(λ, λ)u (8.53) supp(P )
per ogni polinomio p = p(x + iy, x − iy), dove abbiamo usato il fatto che l’integrale definisce uno ∗ -omomorfismo. Ogni polinomio p = p(x + iy, x − iy) `e anche un polinomio complesso q = q(x, y) nelle variabili reali x e y, definendo punto per punto q(x, y) := p(x + iy, x − iy) e tale corrispondenza `e biunivoca. Dato che con i polinomi q(x, y) possiamo approssimare a piacimento le funzioni continue f(x, y) nella norma dell’estremo superiore, la seconda uguaglianza in (8.53) varr` a anche se, al posto del polinomio p(x + iy, x − iy) = q(x, y), si ` facile provare che, se λ = considera una funzione continua f = f(x, y). E x0 + iy0 , allora χ{(x0 ,y0 )} `e il limite puntuale di una successione limitata di funzioni continue fn . In definitiva, usando (c) di teorema 8.30 ed il teorema della convergenza dominata (tenendo conto che μu `e finita), vale:
χ (x, y)dP (x, y) u (u|P{(x0 ,y0)} u) = u
supp(P ) {(x0 ,y0 )}
= supp(P )
χ{(x0 ,y0 )} (x, y)dμu (x, y) = lim
n→+∞
supp(P )
fn (x, y)dμu (x, y)
u fn (x, y)dP (x, y) u = lim (u|fn (x0 , y0 )u) = lim n→+∞ n→+∞
supp(P ) = χ{(x0 ,y0 )} (x0 , y0 )(u|u) . Pertanto, tenendo conto del fatto che i proiettori ortogonali sono idempotenti ed autoaggiunti e che χ{(x0 ,y0 )} (x0 , y0 ) = 1 per definizione, si ha: (P{(x0 ,y0 )} u|P{(x0,y0)} u) = (u|u) = 0 . Questo prova che P{(x0 ,y0 )} = 0. Passiamo a provare (ii). Dato che σc(T ) ∪ σp (T ) = σ(T ) (per (i) di (c) in proposizione 8.15) e σc(T ) ∩ σp (T ) = ∅ per definizione, deve essere che λ ∈ σc(T ) se e solo se λ ∈ σ(T ) e λ ∈ σp (T ). Dato che supp(P (T ) ) = σ(T ), l’affermazione che λ ∈ σ(T ), equivale a dire che, per ogni aperto A di R2 che contiene (x0 , y0 ) con x0 + iy0 = λ, deve essere P (A) = 0. D’altra parte, per (i), λ ∈ σp (T ) significa P (T ) ({(x0 , y0 )}) = 0. Proviamo (iii). Se λ = x0 + iy0 ∈ C `e un punto isolato di σ(T ), allora, per definizione, c’`e un aperto A {(x0 , y0 )} che non interseca la parte rimanente di σ(T ). Se fosse P ({(x0 , y0 )}) = 0 non potrebbe essere λ ∈ supp(P (T ) ), valendo in tal caso P (A) = 0. Di conseguenza deve necessariamente essere P (T )({(x0 , y0 )}) = 0. Per (i) deve allora valere che λ ∈ σp (T ).
8.4 Teorema spettrale per operatori normali in B(H)
357
La prova di (iv) `e stata data nella dimostrazione di (d) del teorema 8.32, in cui abbiamo provato, tra le altre cose, che se λ ∈ σc(T ), allora, per ogni n > 0 naturale, esiste ψn ∈ H con ||ψn || = 0 e 0 < ||T ψn − λψn ||/||ψn|| ≤ 1/n. Per provare (iv) `e allora sufficiente definire φn := ψn /||ψn || con n tale che 1 ≤ n per il valore di fissato. 8.4.2 Teorema di rappresentazione spettrale per operatori normali in B(H) e teorema di Fuglede Il prossimo importante teorema fornisce una rappresentazione spettrale di ogni operatore normale di B(H), mostrando che, di fatto, ogni operatore normale limitato pu` o essere visto come un operatore moltiplicativo quando lo si rappresenta in un opportuno spazio L2 . Definizione 8.36. Se H `e uno spazio di Hilbert e {Hα }α∈A `e una famiglia, di cardinalit` a arbitraria, di suoi sottospazi chiusi, scriveremo H = ⊕α∈A Hα e diremo che H `e somma diretta hilbertiana dei sottospazi Hα , se i sottospazi Hα sono a due a due ortogonali e vale H = < {Hα }α∈A >. Osservazione 8.37. In riferimento alla decomposizione ortogonale H = ⊕α∈A Hα nel senso appena definito, lasciamo al lettore la semplice dimostrazione delle seguenti identit`a. Esse derivano dal fatto che l’unione di basi hilbertiane, scelte in ogni Hα , `e una base hilbertiana per H. Per ogni vettore ψ ∈ H vale (nel senso della definizione 3.20) ||ψ||2 = ||Pα ψ||2 (8.54) α∈A
dove Pα `e il proiettore ortogonale su Hα , per ogni α ∈ A. Vale anche (tenendo conto del lemma 3.26) ψ= Pα ψ (8.55) α∈A
dove la serie pu` o essere riordinata a piacimento. La somma si intende come una serie o una somma finita dato che solo una quantit`a al pi` u numerabile di vettori Pα ψ `e non nulla ((b) proposizione 3.22). Teorema 8.38. (Teorema di rappresentazione spettrale per operatori in B(H) normali.) Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Sia P (T ) la misura spettrale associata a T secondo (a) (o (a)’) del teorema 8.34. ` possibile decomporre H come una somma diretta hilbertiana H = (a) E ⊕α∈A Hα (con A al pi` u numerabile se H `e separabile), dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le propriet` a seguenti: (i) per ogni α ∈ A, valgono T Hα ⊂ Hα e T ∗ Hα ⊂ Hα , (ii) per ogni α ∈ A esiste una misura di Borel positiva finita μα , sullo spettro σ(T ) ⊂ R2 ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), μα ),
358
8 Teoria Spettrale I: operatori limitati
tali che, se f ∈ Mb (σ(T )), Uα
f(x, y)dP
(T )
Hα Uα−1 = f· ,
(x, y)
σ(T )
in particolare valgono: Uα T Hα Uα−1 = (x + iy)· ,
Uα T ∗ Hα Uα−1 = (x − iy)·
dove f· `e l’operatore moltiplicativo per f su L2 (σ(T ), μα ): (f · g)(x, y) = f(x, y)g(x, y) quasi ovunque su σ(T ) se g ∈ L2 (σ(T ), μα ) , (ii)’ se T `e autoaggiunto oppure unitario, per ogni α ∈ A esiste una misura di Borel positiva finita, sui boreliani di σ(T ) ⊂ R oppure, rispettivamente σ(T ) ⊂ S1 , ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), μα ), tali che, se f ∈ Mb (σ(T )), Uα in particolare,
f(x)dP (T )(x)
σ(T )
Hα Uα−1 = f· ,
Uα T Hα Uα−1 = x· ,
dove f· `e l’operatore moltiplicativo per f su L2 (σ(T ), μα ): per ogni g ∈ L2 (σ(T ), μα ), (f · g)(x) = f(x)g(x) quasi ovunque su σ(T ) . (b) Vale σ(T ) = supp{μα }α∈A , dove supp{μα }α∈A `e il complemento dell’insieme dei numeri λ ∈ C (rispettivamente R, S1 ) per cui esiste un aperto Aλ ⊂ C (rispettivamente R, S1 ) tale che Aλ λ e μα (Aλ ) = 0 per ogni α ∈ A. (c) Se H `e separabile, esistono uno spazio con misura (MT , ΣT , μT ), dove vale μT (MT ) < +∞, una funzione limitata FT : MT → C (e rispettivamente R oppure S1 a seconda che T sia autoaggiunto oppure unitario), un operatore unitario UT : H → L2 (MT , μT ), tali che: UT T UT−1 f (m) = FT (m)f(m) , UT T ∗ UT−1 f (m) = FT (m)f(m) per ogni f ∈ H.
(8.56)
Dimostrazione. (a) Dimostriamo (i), (ii) e (iii). La prova per (ii)’ `e analoga a quella per (ii). Supponiamo inizialmente che esista un vettore ψ ∈ H tale che il sottospazio vettoriale Hψ contenente i vettori di H del tipo σ(T ) g(x, y) dP (T )(x, y)ψ, con
8.4 Teorema spettrale per operatori normali in B(H)
359
g ∈ Mb (σ(T )) sia denso in H. Se μψ `e la misura spettrale associata a ψ, che dunque `e una misura finita perch´e: dμψ = ||ψ||2 ; supp(P (T ) )
deve risultare supp(μψ ) ⊂ supp(P (T ) ) per (iv) di (c) del teorema 8.30. Consideriamo lo spazio di Hilbert L2 (σ(T ), μψ ) e l’operatore lineare suriettivo g(x, y) dP (T )(x, y)ψ ∈ Hψ . Vψ : Mb (σ(T )) g → σ(T )
Dato che μψ `e finita, Mb (σ(T )) ⊂ L2 (σ(T ), μψ ) come sottospazio. Tenuto conto di ci` o risulta che, per ogni coppia g1 , g2 ∈ Mb (σ(T )): g1 (x, y)g2 (x, y) dμψ (x, y) σ(T )
= σ(T )
g1 (x, y) dP
(T )
(T ) (x, y)ψ g2 (x, y) dP (x, y)ψ ,
σ(T )
che equivale a scrivere: g1 (x, y)g2 (x, y) dμψ (x, y) = (Vψ g1 |Vψ g2 ) .
(8.57)
(8.58)
σ(T )
La dimostrazione di (8.57) si ottiene notando che, se E, E ⊂ σ(T ) sono boreliani, usando (iv) di (c) di teorema 8.30, (iii) di (a) di teorema 8.32 e (iv) di (a) di teorema 8.32, si ha:
(T ) χE χE dμψ = χE∩E dμψ = ψ χE∩E dP ψ =
σ(T ) σ(T ) σ(T )
(T ) (T ) (T ) χE χE dP ψ = ψ χE dP χE dP ψ ψ
σ(T )
σ(T ) σ(T )
(T ) (T ) χE dP ψ χE dP ψ ; =
σ(T ) σ(T ) per linearit` a (ed anti linearit` a) del prodotto scalare e dell’integrale, se s e t sono funzioni semplici, dovr` a ancora valere:
(T ) (T ) st dμψ = s dP ψ t dP ψ .
σ(T ) σ(T ) σ(T ) Tenendo conto della proposizione 7.39, usando la definizione di integrale di una funzione misurabile limitata secondo una misura spettrale, il teorema della
360
8 Teoria Spettrale I: operatori limitati
convergenza dominata rispetto alla misura finita μψ ed infine la continuit` a del prodotto scalare, l’identit` a appena provata implica (8.57). Abbiamo provato che Vψ `e un’isometria suriettiva da Mb (σ(T )) a Hψ . Si osservi che Mb (σ(T )) `e denso in L2 (σ(T ), μψ ) in quanto, se g ∈ L2 (σ(T ), μψ ), le funzioni gn := χEn ·g, con: En := {(x, y) ∈ σ(T ) | |g(x, y)| < n} sono in Mb (σ(T )) e gn → g nel senso di L2 (σ(T ), μψ ), per il teorema della convergenza dominata (essendo |gn − g|2 → 0, per n → +∞, puntualmente e valendo |gn − g|2 ≤ 2|g|2 ∈ L1 (σ(T ), μψ )). Possiamo quindi estendere unicamente Vψ ad un operatore isometrico suriettivo Vψ : L2 (σ(T ), μψ ) → Hψ , il cui inverso sar` a indicato con Uψ . Nelle ipotesi fatte Hψ = H. Se f ∈ Mb (σ(T )), direttamente da (8.57) e facendo uso di (iii) in (a) di teorema 8.32, abbiamo che: σ(T )
g1 (x, y)f (x, y)g2 (x, y) dμψ (x, y)
(T ) g1 (x, y) dP (x, y)ψ f (x, y)g2 (x, y) dP (x, y)ψ = σ(T ) σ(T ) = g1 (x, y) dP (T ) (x, y)ψ f (x, y) dP (T ) (x, y) g2 (x, y) dP (T ) (x, y)ψ σ(T ) σ(T ) σ(T ) (T ) = Vψ g1 f (x, y) dP (x, y)Vψ g2 . σ(T )
(T )
Abbiamo quindi provato che, per ogni terna di funzioni g1 , g2 , f ∈ Mb (σ(T )), vale: g1 (x, y)f(x, y)g2 (x, y) dμψ (x, y) σ(T )
=
(T ) Vψ g1 f(x, y) dP (x, y)Vψ g2 .
σ(T )
L’operatore f· : L2 (σ(T ), μψ ) → L2 (σ(T ), μψ ), moltiplicativo per la funzione f ∈ Mb (σ(T )), `e limitato come `e facile provare; di conseguenza, tenendo conto che Mb (σ(T )) `e denso in L2 (σ(T ), μψ ), della definizione di Uψ , del fatto che: f(x, y) dP (T )(x, y) σ(T )
`e limitato e, infine, della continuit` a del prodotto scalare, abbiamo che: g1 (x, y)f(x, y)g2 (x, y) dμψ (x, y) σ(T )
=
Uψ−1 g1
f(x, y) dP
σ(T )
(T )
(x, y)Uψ−1 g2
,
8.4 Teorema spettrale per operatori normali in B(H)
per ogni coppia di funzioni g1 , g2 ∈ L2 (σ(T ), μψ ). In altre parole: Uψ f(x, y) dP (T )(x, y)Uψ−1 = f · .
361
(8.59)
σ(T )
Passiamo a considerare il caso in cui non esista alcun vettore ψ con Hψ = H. In tal caso, sia ψ un vettore arbitrario in H. Denotiamo con Hψ lo spazio vettoriale dei vettori σ(T ) f(x, y) dP (T )(x, y)ψ per ogni f ∈ Mb (σ(T )). Vale T (Hψ ) ⊂ Hψ e T ∗ (Hψ ) ⊂ Hψ , infatti, per ogni f ∈ Mb (σ(T )), si ha ((a) teorema 8.34 e (iii) in (a) di teorema 8.32): (T ) (T ) T f(x, y) dP ψ = (x + iy) dP f(x, y) dP (T )ψ σ(T )
σ(T )
=
σ(T )
(x + iy)f(x, y) dP (T ) ψ ,
σ(T )
(x + per cui T σ(T ) f(x, y) dP (T )ψ ∈ Hψ dato che la funzione (x, y) → iy)f(x, y) `e un elemento di Mb (σ(T ))). La dimostrazione per T ∗ `e analoga, usando il fatto che: T∗ = (x − iy) dP (T ) . σ(T )
Per continuit` a, vale anche T (Hψ ) ⊂ Hψ e T ∗ (Hψ ) ⊂ Hψ . Definendo Uψ come fatto sopra, vale la (8.59). Mostriamo ora come costruire un altro sottospazio chiuso, Hψ ortogonale a Hψ , invariante sotto T e T ∗ e che verifichi la (8.59) per una corrispondente isometria suriettiva Uψ : Hψ → L2 (σ(T ), μψ ). Se ψ ⊥ Hψ allora
(T ) ψ f(x, y) dP (x, y)ψ = 0 ,
σ(T ) per ogni f ∈ Mb (σ(T )). Ma allora, per le propriet` a dell’integrale rispetto a misure spettrali ((iii) e (iv) di (a) in teorema 8.32) vale anche, per ogni coppia g, f ∈ Mb (σ(T )):
g dP (T )ψ f dP (T )ψ = ψ g dP (T ) f dP (T )ψ
σ(T )
σ(T ) σ(T ) σ(T )
= ψ g(x, y)f(x, y) dP (T )(x, y)ψ = 0 , dove si `e tenuto conto che g · f ∈ Mb (σ(T )) nelle ipotesi fatte. In definitiva, se ψ ⊥ Hψ allora Hψ `e ortogonale a Hψ e quindi lo stesso fatto vale per le rispettive chiusure per la continuit`a del prodotto scalare. Lo spazio Hψ `e invariante sotto T e T ∗ (la dimostrazione `e la stessa che per Hψ ) ed `e verificata (8.59) per una corrispondente isometria suriettiva Uψ : Hψ → L2 (σ(T ), μψ )
362
8 Teoria Spettrale I: operatori limitati
(la prova `e quella data all’inizio di questa dimostrazione). In questo modo, scegliendo classi di vettori {ψα } opportunamente, si possono costruire classi di sottospazi chiusi Hα = Hψα , ciascuno dotato di un’isometria suriettiva Uα : Uα : Hα → L2 (σ(T ), μψ ), in modo tale che gli spazi (a) siano ortogonali a due a due, (b) siano separatamente invarianti sotto T e T ∗ e (c) verifichino: Uα f(x, y) dP (T )(x, y) Hα Uα−1 = f· (8.60) σ(T )
per ogni f ∈ Mb (σ(T )). Indichiamo con C l’insieme di tali classi di sottospazi. Possiamo mettere in C la relazione d’ordine parziale data dall’inclusione insiemistica. Con tale relazione d’ordine parziale, ogni sottoinsieme ordinato di C `e limitato superiormente, per cui, per il Lemma di Zorn, ci deve essere in C un elemento massimale {Hα }α∈A. Il sottospazio banale H0 := {0} (per esso μ0 `e la misura nulla – per cui L2 (σ(T ), μ0 ) contiene solo il vettore nullo – e U0 trasforma il vettore nullo di {0} nel vettore nullo di L2 (σ(T ), μ0 )) `e contenuto in {Hα }α∈A : se non fosse contenuto {Hα }α∈A ∪ {H0 } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Se esiste ψ ∈ H con ψ ⊥ Hα per ogni α ∈ A e ψ = 0, potremmo costruire uno spazio Hψ , differente da tutti gli Hα , ma che gode delle propriet` a (a), (b) e (c). Allora {Hα }α∈A ∪ {Hψ } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Concludiamo che, se ψ `e ortogonale a tutti gli spazi Hα allora ψ = 0. In altre parole, < {Hα }α∈A > = H e quindi, essendo gli spazi a due a due ortogonali: H = ⊕α∈A Hα . Passiamo a provare (b) nel caso generale di T normale, il caso di T autoaggiunto e T unitario si provano specializzando la dimostrazione in modo ovvio. Proveremo che vale la doppia implicazione equivalente alla tesi: λ ∈ supp{μα }α∈A ⇔ λ ∈ ρ(T ). ⇒. Se λ ∈ supp{μα }α∈A, sia DR un disco aperto di raggio R > 0 centrato in λ con μα (DR ) = 0 per ogni α ∈ A, tale disco esiste sempre nelle ipotesi fatte. Si verifica subito che, in ogni spazio L2 (σ(T ), μα ), l’operatore moltiplicativo per (x + iy − λ)−1 `e limitato con norma non superiore a 1/R (indipendentemente da α) ed `e l’inverso destro e sinistro dell’operatore moltiplicativo per (x+iy −λ). Sia Rλ (α) : Hα → Hα l’operatore Uα−1 (x+iy −λ)−1 ·Uα . Rλ (α) ha la stessa norma dell’operatore moltiplicativo (x +iy −λ)−1 ·, dato che Ua `e isometrico suriettivo, per cui vale anche ||Rλ (α)|| ≤ 1/R. Si definisca l’operatore Rλ : H → H tale che: Pα ψ → Rλ (α)Pα ψ , Rλ : α∈A
α∈A
per ogni ψ ∈ H. Tenendo conto di quanto detto nella nota precedente e del fatto che gli spazi Hα sono invarianti per T e per Rλ (che si riduce a Rλ (α) su ciascuno di essi), si verifica facilmente che, vale ||Rλ || ≤ 1/R ed inoltre Rλ (T − λI) = (T − λI)Rλ = I. Infatti, dato che RanRλ (α) = Hα , si ha: ||Rλ ψ||2 = || Rλ (α)Pα ψ||2 = || Pa Rλ (α)Pα ψ||2 α∈A
α∈A
8.4 Teorema spettrale per operatori normali in B(H)
= =
||PaRλ (α)Pα ψ||2
α∈A
||Rλ(α)Pα ψ||2 ≤ R−2
α∈A
||Pα ψ||2 = R−2 ||ψ||2 .
α∈A
Inoltre: (T − λI)Rλ ψ = (T − λI)Rλ
363
(T − λI)Rλ Pα ψ =
α∈A
Pα ψ
α∈A
(T − λI) Hα Rλ (a)Pα ψ =
α∈A
IPα ψ = ψ ,
α∈A
per cui: (T − λI)Rλ = I. Similmente: Rλ (T − λI)ψ = Rλ (T − λI)
Pα ψ
α∈A
Rλ (T − λI)Pα ψ =
α∈A
Rλ (a)(T − λI) Hα Pα ψ =
α∈A
IPα ψ = ψ ,
α∈A
per cui: Rλ (T − λI) = I. Per (a) di teorema 8.4, λ ∈ ρ(T ). ⇐. Supponiamo ora che λ ∈ ρ(T ) per cui esiste (T − λI)−1 : H → H inverso destro e sinistro di T − λI ed operatore limitato. Definiamo > 0 in modo tale che valga ||(T − λI)−1 || =: 1/. Sosteniamo che allora μα (D ) = 0 per ogni α ∈ A, dove D `e il disco aperto di raggio centrato in λ. Procediamo per assurdo. Supponiamo sia falso quanto affermato per ultimo, allora esister`a β ∈ A tale che μβ (D ) > 0. Sia Dδ ⊂ D un secondo disco aperto centrato in un punto di D con raggio δ tale che 0 < δ < e μβ (Dδ ) > 0, se non esistesse un siffatto Dδ sarebbe μβ (D ) = 02 . Consideriamo un vettore ψ ∈ H \ {0} definito dal fatto che Pα ψ = 0 se α = β e Uβ ψ = f tale che suppf ⊂ Dδ . Possiamo sempre ridefinire ψ per un fattore moltiplicativo, in modo tale che ||ψ|| = 1. Vale allora, essendo |x + iy − λ| < se x + iy ∈ Dδ : ||(T − λI)ψ||2 = |(x + iy) − λ|2 |f(x, y)|2 dμβ (x, y) Dδ
< 2
|f(x, y)|2 dμβ (x, y) = 2 .
Dδ
Quindi vale: ||(T − λI)ψ|| < . 2
Per ogni z ∈ D, possiamo scegliere un disco aperto centrato in z di raggio positivo δ < in modo tale che Dδ ⊂ D . In tal modo abbiamo un ricoprimento dell’insieme D fatto da suoi sottoinsiemi aperti. Per il lemma di Lindel¨of, possiamo (i) (i) estrarre un sotto ricoprimento numerabile {Dδi }i∈N . Valendo D = ∪i∈NDδi dovr` a (i) (i) anche essere: μβ (E ) ≤ i∈N μβ (Dδi ). Se fosse μβ (Dδi ) = 0 per ogni i, avremmo che μβ (D) = 0.
364
8 Teoria Spettrale I: operatori limitati
D’altra parte, per definizione di norma di un operatore: ||(T − λI)−1 || ≥
||(T − λI)−1 φ|| ||φ||
per ogni φ ∈ H \ {0}. Di conseguenza, posto (T − λI)−1 φ = ψ, vale ||(T − λI)−1 || ≥
||ψ|| , ||(T − λI)ψ||
e pertanto: 1/ ≥
1 > 1/ , ||(T − λI)ψ||
che `e assurdo. Concludiamo la dimostrazione provando (c). Nel caso di H separabile, consideriamo la classe di vettori ortogonali {ψn }n∈N costruita come gli {ψα }α∈A di sopra, con la differenza che che ora α `e indicato con n ∈ N. Siamo liberi +∞di scegliere i vettori detti in modo che ||ψn ||2 = 2−n . Definiamo MT := n=1 σ(T ), cio`e MT `e l’unione disgiunta di infinite copie di σ(T ). Infine definiamo μT richiedendo che si restringa a μn sullacopia n-esima di σ(T ). Deve esser chia+∞ 2 ro che in questo modo μT (MT ) = e n=0 ||ψn || < +∞. La funzione FT ` ovviamente quella che si restringe alla funzione (x + iy)· su ogni componente σ(T ). In questo modo FT risulta essere limitata dato che ogni copia di σ(T ) `e limitato. L’operatore UT `e costruito in modo ovvio attraverso gli Un . Esempi 8.39. (1) Consideriamo l’operatore T su H := L2 ([0, 1] × [0, 1], dx⊗ dy) definito da: (T f)(x, y) = xf(x, y) quasi ovunque su X := [0, 1] × [0, 1], per ogni f ∈ H. Si verifica facilmente che tale operatore `e limitato, autoaggiunto e con spettro σ(T ) = σc (T ) = [0, 1]. Una misura spettrale su R a supporto limitato che riproduce T come integrale, (T ) `e quella data dai proiettori ortogonali PE definiti come operatori moltiplicativi per le funzioni caratteristiche χE con E := (E ∩ [0, 1]) × [0, 1], per ogni boreliano E ⊂ R. Infatti, usando i lemmi A e B dell’esempio (1) in esempi 8.29, e con una scelta opportuna per i domini delle funzioni usate, si verifica che, per ogni g ∈ Mb (X): g(λ) P (λ)f
(x, y) = g(x)f(x, y) ,
[0,1]
Quindi in particolare: λ P (λ)f [0,1]
quasi ovunque su X .
(x, y) = xf(x, y) ,
quasi ovunque su X ,
8.4 Teorema spettrale per operatori normali in B(H)
e quindi:
365
T =
λ dP (λ) , [0,1]
come volevamo. Questa misura spettrale `e allora l’unica, su R, a soddisfare (a) del teorema spettrale. Ci interessiamo ora al punto (c) dell’enunciato del teorema spettrale. Una decomposizione di H come quella precisata in tale punto si ottiene nel modo seguente. Sia {un }n∈N una base hilbertiana di L2 ([0, 1], dy). Consideriamo quindi i sottospazi di H := L2 ([0, 1] × [0, 1], dx ⊗ dy) dati da, per ogni n ∈ N, Hn := {f · un | f ∈ L2 ([0, 1], dx)} . ` facile verificare che questa classe di sottospazi soddisfa, rispetto a T , tutte le E richieste del punto (c) del teorema. In particolare, per costruzione Hn `e isomorfo a L2 ([0, 1], dx) secondo la trasformazione isometrica suriettiva: f · un → f e quindi μn = dx. (2) Consideriamo un operatore compatto autoaggiunto T ∈ B(H) nello spazio di Hilbert H. Per il teorema 4.17, σp (T ) `e un insieme discreto di punti in R, con eventualmente il punto 0 come unico punto di accumulazione. Di conseguenza, σ(T ) = σp (T ), eccetto il caso in cui 0 `e punto di accumulazione di σp (T ), ma 0 ∈ σp (T ). In questo caso (essendo σ(T ) chiuso, per il teorema 8.4) σ(T ) = σp(T ) ∪ {0} e 0 `e l’unico elemento di σc (T ) (essendo σr (T ) = ∅ per la proposizione 8.15). Seguendo l’esempio (3) in esempi 8.29, possiamo definire una misura a valori di proiezione su R che `e nulla fuori da σ(T ): PE := sPλ λ∈E
con E ⊂ σ(T ) e con Pλ proiettore ortogonale sull’autospazio con autovalore λ, se λ `e autovalore, Pλ = 0 (proiettore nullo) altrimenti. Quest’ultima possibilit` a pu` o capitare solo se λ = 0 e 0 non `e autovalore. Seguendo l’esempio (3) in esempi 3.12, troviamo che: λP (λ)ψ = λPλ ψ , σ(T )
λ∈σ(T )
per ogni ψ ∈ H. D’altra parte, per il teorema 4.18, vale anche: λPλ = T , λ∈σ(T )
dove abbiamo definito P0 = 0 se 0 ∈ σc(T ). L’enunciato del teorema 4.18 precisa che tale decomposizione vale nella topologia operatoriale uniforme se si segue un ordine opportuno nell’etichettare gli autovalori. Seguendo tale ordinamento, vale anche che, per ogni ψ ∈ H: λPλ ψ = T ψ . λ∈σ(T )
366
8 Teoria Spettrale I: operatori limitati
Possiamo interpretare la somma a primo membro nel senso degli integrali rispetto alla misura a valori di proiezione su σ(T ) definita sopra. Ci` o prova anche che la serie a primo membro pu`o essere riordinata a piacimento (quando i proiettori sono applicati su un vettore ψ ∈ H). Si osservi infine che, per costruzione, supp(P ) = σ(T ). Concludiamo che: la misura su σ(T ) definita sopra `e la misura spettrale di T , unicamente associata a T dal teorema spettrale. Inoltre, la decomposizione spettrale di T coincide con la decomposizione di T nella topologia forte sui suoi autospazi : T = sλPλ , λ∈σp (T )
l’eventuale punto 0 ∈ σc (T ) non fornisce contributo all’integrale.
Per concludere il paragrafo enunciamo due teoremi. Il primo `e il seguente notevole risultato, noto come teorema di Fuglede, che stabilisce che affinch`e un operatore B ∈ B(H) commuti con A∗ , con A ∈ B(H) normale, `e sufficiente che commuti con A. Questo risultato non `e affatto ovvio ed ha immediate conseguenze in base ai teoremi provati. Per esempio, in base a (c) del teorema 8.34 di decomposizione spettrale, se B commuta con A allora commuta con tutti gli operatori σ(T ) f(x, y)dP (A) (x, y), per ogni funzione misurabile limitata f : σ(T ) → C. Teorema 8.40. (Di Fuglede.) Sia H spazio di Hilbert. Se A ∈ B(H) `e normale e B ∈ B(H) commuta con A, allora B commuta anche con A∗ . ∗
∗
Dimostrazione. Per s ∈ C, si consideri la funzione Z(s) = e−sA BesA , dove gli esponenziali sono definiti per via spettrale come integrali delle funzioni C s → e∓s(x−iy) rispetto alla misura spettrale di A, P (A) . Al solito porremo (∓s(x−iy))n e che, z = x + iy e z = x − iy. Si osservi ora che e∓s(x−iy) = +∞ n=0 n! per s fissato, la convergenza `e uniforme in (x, y) su ogni compatto, come σ(A). In particolare questo implica che l’insieme delle ridotte della serie `e limitato nella norma || ||∞. Per (c) del teorema 8.32, usando ancora la PVM associata ad A dal teorema spettrale, abbiamo che deve valere: ∓sA∗
e
= s-
+∞ n=0
(∓sA∗ )n . n!
(8.61)
Usando il fatto che A commuta con A∗ e con B, esprimendo Z(s)Aψ usando lo sviluppo di sopra, si trova che AZ(s)ψ = Z(s)Aψ per ogni ψ ∈ H. Concludiamo che Z(s) commuta con A∗ , A e quindi con tutte le sue funzioni per il teorema spettrale 8.38. Quindi: ∗
∗
Z(s) = Z(s)e+sA e−sA = e−sA e+sA BesA e−sA = e−sA ∗
∗
∗
+sA
BesA
∗
−sA
.
Dove abbiamo usato le identit` a e−sA e+sA = e−sA +sA e e+sA e−sA = I che si provano esattamente come per gli esponenziali di numeri, tenendo conto
8.4 Teorema spettrale per operatori normali in B(H)
367
dello sviluppo (8.61) e del fatto che A e A∗ commutano. Con la stessa tecnica ∗ ∗ ∗ si prova subito che Us := e−sA +sA = esA −sA e Us∗ = Us−1 . Quindi Us `e unitario e ||Z(s)|| = ||U BU ∗|| ≤ ||U || ||B|| ||U ∗|| = 1||B||1 = ||B||. La funzione C s → (ψ|Z(s)φ) `e allora limitata su tutto il piano complesso. Se tale funzione fosse intera (cio`e analitica su tutto C), per il teorema di Liouville, potremmo concludere che si tratta di una funzione costante. Assumiamo che la funzione detta sia intera e quindi che sia costante. Di conseguenza, tenendo conto dell’arbitrariet` a di ψ, φ deve essere, Z(s) = Z(0) per ogni s ∈ C. Que∗ ∗ ∗ ∗ sta identit` a si scrive esplicitamente: e−sA BesA = B, cio`e BesA = esA B. ∗ ∗ Conseguentemente (ψ|BesA φ) = (ψ|esA Bφ) per ogni ψ, φ ∈ H. L’identit` a ∗ ∗ appena trovata pu` o essere riscritta (B ∗ ψ|esA φ) = (ψ|esA Bφ) e poi, in base alle propriet` a delle PVM e dal teorema spettrale: esz dμB∗ ψ,φ = esz dμψ,Bφ , K
K
dove K ⊂ R2 ≡ C `e un compatto abbastanza grande da contenere i supporti delle misure dei due integrali. Possiamo derivare entrambi i membri in s, per s = 0, passando la derivata sotto il segno di integrale, applicando il teorema C.8 in Appendice (tenendo conto che le derivate degli integrandi sono funzioni di (s, (x, y)) continue e quindi limitate sul compatto C × K, con C un secondo compatto che contiene nel suo interno s = 0). Il risultato `e: zdμB∗ ψ,φ = zdμψ,Bφ , K
K
che pu` o essere scritto (ψ|BA∗ φ) = (ψ|A∗ Bφ). Per l’arbitrariet` a di ψ e φ, questo significa che B commuta con A∗ : BA∗ = A∗ B. Rimane da provare che C s → (ψ|Z(s)φ) sia una funzione analitica, cosa che proviamo ora. Usando lo sviluppo dell’esponenziale (8.61) e la continuit` a del prodotto scalare, si ha: (ψ|Z(s)φ) =
+∞ +∞ (−s)n+m (ψ|(A∗ )n B(A∗ )m φ) . n!m! n=0 m=0
(8.62)
Possiamo interpretare questa doppia serie come un integrale doppio iterato nella misura che conta i naturali; useremo tale misura su N nel seguito, indicandola con dμ(n). Dato che, dalla disuguaglianza di Schwarz e da note propriet` a della norma operatoriale:
(−s)n+m
(|s| ||A||)n (|s| ||A||)m ∗ n ∗ m
(ψ|(A ||B|| ||ψ|| ||φ|| ) B(A ) φ)
n!m!
≤ n! m! e che la funzione positiva su N×N a secondo membro `e integrabile nella misura prodotto (l’integrale `e ovviamente e|s| ||A||e|s| ||A||||B|| ||ψ|| ||φ||), per il teoren+m ma di Fubini-Tonelli, la funzione (n, m) → (−s) (ψ|(A∗ )n B(A∗ )m φ) =: n!m!
368
8 Teoria Spettrale I: operatori limitati
fs (n, m) `e L1 nella misura prodotto e la (8.62) pu` o essere riscritta: fs (n, m)dμ(n) ⊗ dμ(m) . (ψ|Z(s)φ) =
(8.63)
N×N
Usando il teorema della convergenza dominata abbiamo infine che: fs (n, m)dμ(n) ⊗ dμ(m) N×N
=
lim
N→+∞
N×N
χ{(n,m)∈N×N | n+m≤N} fs (n, m)dμ(n) ⊗ dμ(m) .
Esplicitando il secondo membro in termini di somme: (ψ|Z(s)φ) =
lim
N→+∞
N
M =0 n+m=M
(−s)n+m (ψ|(A∗ )n B(A∗ )m φ) , n!m!
cio`e, possiamo scrivere: (ψ|Z(s)φ) =
+∞
CN sN
∀s ∈ C ,
(8.64)
N=0
dove: CN = (−1)N
n+m=N
(ψ|(A∗ )n B(A∗ )m φ) . n!m!
La (8.64) afferma che (ψ|Z(s)φ) `e esprimibile come una serie di potenze in s, con s che varia in tutto il piano complesso. Conseguentemente C s → (ψ|Z(s)φ) `e una funzione intera come volevamo. Osservazione 8.41. Il teorema ammette un’estensione al caso in cui l’operatore normale A della tesi non sia limitato, ma L’operatore B, che commuta con A, sia limitato. Questa `e la formulazione originale data da Fuglede [Fug50] che per`o richiede la teoria spettrale per operatori normali non limitati che noi non svilupperemo. Il secondo teorema `e un diretto corollario del teorema di decomposizione spettrale e del teorema 8.32. La dimostrazione `e lasciata per esercizio al lettore. Teorema 8.42. Siano H spazio di Hilbert e T ∈ B(H) operatore normale. L’applicazione ΨT : Mb (σ(T )) → B(H), dove: f(x, y) dP (T ) (x, y) per ogni f ∈ Mb (σ(T )), ΨT (f) = σ(T )
∗
`e l’unico -omomorfismo continuo, dalla C ∗ -algebra commutativa con unit` a, Mb (σ(T )) riferita alla norma || ||∞, alla C ∗ -algebra con unit` a B(H), tale che:
Esercizi
369
(i) vale l’identit` a ΨT (z) = T ,
dove z `e la funzione σ(T ) (x, y) → z := x + iy ,
(8.65)
(ii) se {fn }n∈N ⊂ Mb (σ(T )) `e limitata e converge puntualmente a f : σ(T ) → C, allora: ΨT (f) = w- lim ΨT (fn ) . n→+∞
Esercizi 8.1. Si supponga che valgano le ipotesi del teorema 8.4 con X = H spazio di Hilbert. Mostrare che se Rλ (T ) `e un operatore compatto per λ = λ0 ∈ ρ(T ), allora `e compatto per ogni λ ∈ ρ(T ). Suggerimento. Si usi l’equazione risolvente e le propriet` a dello spazio degli operatori compatti. 8.2. Sia H = 2 (N) e si consideri l’operatore: T : (x0 , x1 , x2, . . .) → (0, x0 , x1, . . .) . Determinare lo spettro di T . 8.3. Siano H spazio di Hilbert e T = T ∗ ∈ B(H) compatto. Mostrare che se dim(RanT ) non `e finita, allora σc (T ) = ∅ ed `e costituito da un punto solo. Suggerimento. Decomporre T come nel teorema 4.18, tenere conto del teorema 4.17 ed infine del fatto che σ(T ) `e chiuso per il teorema 8.4. 8.4. Costruire un operatore autoaggiunto con spettro puntuale denso in [0, 1]. Suggerimento. Si consideri lo spazio di Hilbert H = 2 (N), si numerino i razionali in [0, 1] secondo un ordine qualsiasi: r0 , r1 , . . . e si definisca l’operatore T : (x0 , x1 , x2 , . . .) → (r0 x0 , r1 x1 , r2 x2 , . . .) con dominio D(T ) dato dalle successioni (x0 , x1 , x2, . . .) ∈ 2 (N) tali che +∞
|rn xn |2 < +∞ .
n=0
8.5. Mostrare che se T `e autoaggiunto sullo spazio di Hilbert H e λ ∈ ρ(T ), allora Rλ (T ) `e un operatore normale di B(H) che soddisfa: Rλ (T )∗ = Rλ (T ) .
370
8 Teoria Spettrale I: operatori limitati
8.6. Dimostrare che lo spettro residuo di un operatore unitario `e vuoto in modo diretto, senza cio`e ridursi a considerare gli operatori unitari come operatori normali. Soluzione. Se λ ∈ σr (U ), allora Ran(U − λI) non `e denso, per cui esiste f = 0 normale a Ran(U − λI). Allora, per ogni g ∈ H: (f|λg) = (f|U g) e quindi (λf|g) = (U ∗ f|g) per ogni g ∈ H. Di conseguenza: U ∗ f = λf. Facendo agire U membro a membro, troviamo f = λU f, che implica U f = λf perch´e, essendo |λ| = 1, vale 1/λ = λ. Quindi λ ∈ σp (U ) e ci`o `e assurdo, essendo lo spettro puntuale e lo spettro residuo disgiunti; pertanto σr (U ) = ∅. 8.7. Mostrare che se U : H → H, con H spazio di Hilbert, `e operatore isometrico non suriettivo, allora σr (U ) = ∅. Suggerimento. Provare che 0 ∈ σ(U ). U − 0I `e iniettivo, ma Ran(U − 0I) = RanU non `e denso. Se fosse denso accadrebbe che, per ogni f ∈ H, esisterebbe {fn }n∈N ⊂ H con U fn → f. Conservando U la norma, {fn } sarebbe di Cauchy perch´e lo `e {U fn }, ma allora, se fn → g, avremmo U g = f. Dato che f ∈ H `e arbitrario, avremmo che U `e suriettivo, cosa esclusa a priori. 8.8. Se P : X → B(H) `e una PVM, provare che (1) l’insieme delle funzioni f : X → C Borel misurabili essenzialmente limitate rispetto a P `e uno spazio (P ) vettoriale e (2) che || ||∞ `e una norma su tale spazio. 8.9. Sia A un operatore nello spazio di Hilbert H con dominio D(A) e sia U : H → H un’isometria suriettiva tra spazi di Hilbert. Provare che, se A := U −1 AU : D(A ) → H , con D(A ) = U −1 D(A), allora σp (A) = σp (A ), σp(A) = σp (A ), σr (A) = σr (A ). 8.10. Si consideri l’operatore posizione Xi definito in definizione 5.21. Mostrare che σ(Xi ) = σc (Xi ) = R. 8.11. Si consideri l’operatore impulso Xi definito in definizione 5.26. Mostrare che σ(Pi ) = σc (Pi ) = R. Suggerimento. Usare la proposizione 5.30. 8.12. Se σ(A) = σ(B), per due operatori A e B in uno spazio di Hilbert, allora `e vero che σp (A) = σp (B)? Suggerimento. Considerare l’operatore dell’esercizio 8.4 e l’operatore moltiplicativo per la coordinata x in L2 ([0, 1], dx), dove dx `e la misura di Lebesgue su R. 8.13. Si consideri l’operatore di Volterra A : L2 ([0, 1], dx) → L2 ([0, 1], dx): x f(t)dt , (Af)(x) = 0
e se ne studi lo spettro e si provi che σ(A) = σc (A) = {0}.
Esercizi
371
Traccia della soluzione. Si ricordi che, essendo [0, 1] di misura di Lebesgue finita, L2 ([0, 1], dx) ⊂ L1 ([0, 1], dx) in modo da poter applicare la teoria dell’integrale di Lebesgue come funzione dell’estremo superiore d’integrazione (in particolare il teorema C.6). Si osservi anche che lo spettro di A non pu` o essere vuoto per il teorema 8.4 dato che A `e limitato e dunque chiuso. Se λ = 0, (λ−1 A)n , se `e n abbastanza grande, `e un operatore di contrazione come provato nell’esercizio 4.18. Per il teorema del punto fisso λ = 0 non pu` o essere autovalore, perch´e l’unica soluzione ψ dell’equazione agli autovalori λ−1 Aψ = ψ pu` o solo essere ψ = 0, inaccettabile come autovettore. Tenendo conto che A `e compatto, il lemma 4.47 assicura che, se 0 = λ (e quindi anche λ ∈ σp (A)), allora Ran(A − λI) = H (lo spazio di Hilbert L2 ([0, 1], dx)) e, dato che A − λI `e biettivo, (A − λI)−1 : H → H `e limitato per il teorema dell’operatore inverso limitato. Pertanto λ ∈ σ(A) se λ = 0. Dunque l’unico punto dello spettro `e λ = 0. Da (b) del teorema C.6 segue che non esistono vettori non nulli che soddisfano Aψ = 0. Concludiamo che 0 ∈ σr (A) ∪ σc(A). Se fosse 0 ∈ σr (A) avremmo che Ran(A) non `e denso in L2 ([0, 1], dx), cio`e Ker(A∗ ) = {0}, dato che H = Ran(A) ⊕ Ker(A∗ ) Questo fatto `e impossibile 1 dato che (A∗ f)(x) = x f(t)dt (vedi l’esercizio 3.18) e applicando nuovamente (b) del teorema C.6 troveremmo una contraddizione. 8.14. Considerare l’operatore T limitato ed autoaggiunto su H := L2 ([0, 1], dx) che moltiplica le funzioni per x2 : (T f)(x) := x2 f(x) . Trovarne la misura spettrale. Suggerimento. Costruire una trasformazione unitaria da H a L2 ([0, 1], dy) che trasformi l’operatore moltiplicativo per x2 nell’operatore moltiplicativo per y. 8.15. Considerare l’operatore T limitato ed autoaggiunto su H L2 ([−1, 1], dx) che moltiplica le funzioni per x2 :
:=
(T f)(x) := x2 f(x) . Trovarne la misura spettrale. Suggerimento. Ragionare come nell’esercizio 8.14, dopo avere decomposto: L2 ([−1, 1], dx) = L2 ([−1, 0], dx) ⊕ L2 ([0, 1], dx) . 8.16. Se T ∈ B(H), con H spazio di Hilbert, `e un operatore normale, dimostrare che, per ogni α ∈ C, αT e = eα(x+iy) dP (T )(x, y) , σ(T )
372
8 Teoria Spettrale I: operatori limitati
dove il primo membro `e definito come, rispetto alla topologia operatoriale uniforme: +∞ n n α T αT . e := n! n=0 +∞ n n Suggerimento. La serie n=0 α n!z converge assolutamente ed uniformemente in ogni cerchio chiuso di raggio finito centrato nell’origine di C. Inoltre, per ogni polinomio p(z) (dove z = x + iy), vale: p(T ) = p(x + iy) dP (T )(x, y) . σ(T )
Usare il primo punto del teorema 8.30. 8.17. Dimostrare il teorema 8.42. Suggerimento. L’unica cosa da dimostrare `e l’unicit` a dello ∗ -omomorfismo continuo che soddisfa (i) e (ii). A tal fine si osservi che ogni siffatto ∗ a coinomomorfismo coincide con ΨT sui polinomi p(z, z). Quindi, per continuit` a prosegue cide con ΨT su C(σ(T )). A questo punto la dimostrazione di unicit` come per la parte corrispondente della prova del teorema 8.18.
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni Il linguaggio della matematica si rivela irragionevolmente efficace nelle scienze naturali, un dono meraviglioso che non comprendiamo n´ e meritiamo. Eugene Paul Wigner
In questo capitolo, che probabilmente `e il pi` u tecnico del libro, esamineremo varie questioni matematiche legate pi` u o meno direttamente alla teoria spettrale per operatori autoaggiunti non limitati. Nella prima sezione, estenderemo il teorema spettrale provato nel capitolo precedente, al caso di operatori autoaggiunti non limitati. Per fare ci` o, estenderemo la procedura di integrazione di rispetto a misure spettrali, al caso di funzioni non limitate. Con questa estensione e facendo uso della trasformata di Cayley, dimostreremo il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Daremo quindi due esempi fisicamente importanti di operatori autoaggiunti non limitati e della loro decomposizione spettrale: l’hamiltoniano dell’oscillatore armonico e gli operatori posizione ed impulso. Enunceremo infine un teorema di rappresentazione spettrale per operatori autoaggiunti non limitati ed introdurremo la nozione di PVM congiunta (joint spectral measure). La seconda, molto breve, sezione sar`a dedicata alla procedura di esponenziazione di operatori non limitati, in relazione alla nozione di vettore analitico introdotto precedentemente. Nella terza ci concentreremo sulla teoria dei gruppi ad un parametro fortemente continui di operatori unitari. In primo luogo proveremo l’equivalenza delle varie richieste di continuit` a. Quindi proveremo il teorema di von Neumann sulla continuit` a delle dei gruppi ad un parametro misurabili di operatori unitari, e successivamente dimostreremo il teorema di Stone e qualche importante conseguenza. In particolare daremo un utile criterio, basato sui gruppi unitari ad un parametro generati da operatori autoaggiunti, per stabilire quando le misure spettrali di due operatori autoaggiunti commutano. La quarta sezione sar`a dedicata alla nozione di prodotto tensoriale hilbertiano di spazi di Hilbert ed a quella di prodotto tensoriale di operatori (in generale non limitati) ed alle relative propriet` a spettrali. Come esempio ed applicazione studieremo gli operatori associati al momento angolare orbitale di una particella quantistica. Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
374
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
La quinta sezione riguarder`a l’estensione del teorema di decomposizione polare al caso di operatori non limitati, chiusi e densamente definiti. In tale sede discuteremo anche le propriet`a notevoli degli operatori della forma A∗ A, con A densamente definito e chiuso, e delle radici quadrate di operatori autoaggiunti positivi non limitati. L’ultima sezione riguarder`a l’enunciato, la dimostrazione e qualche diretta applicazione del teorema di Kato-Rellich, che stabilisce criteri affinch´e un operatore autoaggiunto, perturbato additivamente tramite un operatore simmetrico, dia ancora luogo ad un operatore autoaggiunto.
9.1 Teorema spettrale per operatori autoaggiunti non limitati Ci occuperemo ora di generalizzare parte delle definizioni e dei risultati ottenuti nella sezione precedente. In particolare vogliamo dimostrare il teorema di decomposizione spettrale nel caso di operatori autoaggiunti non limitati. L’importanza in fisica di tale teorema risiede nel fatto che, nella Meccanica Quantistica, la maggior parte degli operatori autoaggiunti che rappresentano osservabili di concreto interesse fisico sono operatori non limitati. Il caso tipico `e dato dall’operatore posizione introdotto nel capitolo 5. 9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali Nel seguito faremo spesso uso della seguente naturale definizione. Definizione 9.1. Sia X spazio m vettoriale complesso, T operatore in X con dominio D(T ) e p(x) = k=0 ak xk un polinomio di grado m a coefficienti complessi. (a) L’operatore p(T ) nello spazio X `e definito sostituendo T alla variabile x, con T 0 := I, T 1 := T , T 2 := T T , ecc. (b) Il dominio D(p(T )) di p(T ) `e, in conformit` a con la definizione 5.1: D(p(T )) :=
m 0
D(ak T k ) ,
(9.1)
k=0
con D(ak T · · · T ) dato in definizione 5.1. L’estensione dei risultati del capitolo precedente al caso di operatori non limitati necessita prima di tutto la definizione di integrazione di funzioni non limitate rispetto a PVM. Se P `e una misura spettrale sullo spazio topologico a base numerabile X, nel senso della definizione 8.21, e se f : X → C `e una funzione misurabile (rispetto all’algebra di Borel di X), ma non necessariamente limitata, la scrittura: X f(x)dP (x) non ha alcun senso fino ad ora. Cerchiamo quindi di dare un significato a tale integrale.
9.1 Teorema spettrale per operatori autoaggiunti non limitati
375
Consideriamo un vettore ψ ∈ H, spazio di Hilbert della PVM P , tale che: |f(x)|2 dμψ (x) < +∞ , (9.2) X
dove la misura spettrale rispetto a ψ, μψ , `e quella definita in (c) del teorema 8.30. Possiamo sempre trovare una successione di funzioni misurabili e limitate, fn , tali che fn → f per n → +∞ nel senso della norma di L2 (X, μψ ). Per esempio, come si prova facilmente dal teorema della convergenza dominata di Lebesgue, basta considerare la successione di funzioni fn := χFn · f, dove χFn `e la funzione caratteristica dell’insieme Fn := {x ∈ X | |f(x)| < n}. Usando (iii) di (a) e (b) del teorema 8.32, si ricava immediatamente che vale l’identit`a:
2
fn (x)dP (x)ψ − fm (x)dP (x)ψ
= |fn (x) − fm (x)|2 dμψ (x) . (9.3)
X
X
X
Pertanto la successione di vettori X fn (x)dP (x)ψ converge a qualche vettore, che indicheremo con X f(x)dP (x)ψ: f(x)dP (x)ψ := lim fn (x)dP (x)ψ . (9.4) n→+∞
X
X
Potremmo usare la (9.4) per definire l’integrale, rispetto a P ,della funzione misurabile non limitata f. La definizione `e ben posta perch´e X f(x)dP (x)ψ non dipende dalla successione {fn }n∈N. Se infatti {gn }n∈N `e un’altra successione di funzioni misurabili limitate che converge a f nel senso della norma di L2 (X, μψ ), procedendo come sopra, otteniamo:
2
fn (x)dP (x)ψ − gn (x)dP (x)ψ
= |fn (x) − gn (x)|2 dμψ (x)
X
X
e pertanto:
X
lim
n→+∞
X
fn (x)dP (x) = lim
n→+∞
X
gn (x)dP (x) .
Se usiamo la (9.4) come definizione di integrale di una funzione non limitata, dobbiamo tenere conto del fatto che l’operatore ottenuto non `e definito su tutto lo spazio di Hilbert, ma solo su quei vettori che soddisfano (9.2). Ovviamente dobbiamo anche controllare che i vettori che soddisfano (9.2) formino un sottospazio di H. Per provare ci`o e molto altro, abbiamo ancora bisogno di un lemma che lega le propriet` a della misura spettrale μψ a quelle delle misure μφ,ψ quando `e rispettata la condizione (9.2), per ψ ∈ H. Lemma 9.2. Sia X spazio topologico a base numerabile, P : B(X) → B(H) una PVM, con H spazio di Hilbert, e f : X → C una funzione misurabile. Se, per φ, ψ ∈ H, le misure μψ e μφ,ψ sono definite come nel teorema 8.30 e vale: |f(x)|2 dμψ (x) < +∞ , X
376
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
allora f ∈ L1 (X, |μφ,ψ |) e !
X
|f(x)|d|μφ,ψ (x)| ≤ ||φ||
X
|f(x)|2 dμψ (x) .
(9.5)
Dimostrazione. Se f `e limitata, da (iv) in (c) nel teorema 8.30:
φ |f(x)|dP (x)ψ = |f(x)|dμφ,ψ (x) . X
X
Come conseguenza del teorema di Radon-Nikodym (vedi (1) in esempi 2.58), esiste una funzione h : X → C con |h(x)| = 1 su X, tale che dμφ,ψ = hd|μφ,ψ |, e quindi:
−1 |f(x)|d|μφ,ψ (x)| = |f(x)|h (x)dμφ,ψ (x) = φ
|f (x)|h−1 (x)dP (x)ψ . X
X
X
Usando (b) del teorema 8.32 e notando che ||f(x)|h−1 (x)|2 = |f(x)|2 , abbiamo:
−1
|f(x)|d|μφ,ψ (x)| ≤ ||φ||
|f(x)|h (x)dP (x)ψ
X
X
! = ||φ||
X
|f(x)|2 dμψ (x) .
Sia ora f non limitata. Definiamo le funzioni limitate fn := χFn · f come detto sopra, in modo tale che 0 ≤ |fn (x)| ≤ |fn+1 (x)| → |f(x)| per n → +∞. Per il teorema della convergenza monotona, tenendo conto del fatto che f ∈ L2 (X, dμψ ), troviamo: |f(x)|d|μφ,ψ (x)| = lim |fn (x)|d|μφ,ψ (x)| X
≤ ||φ|| lim
n→+∞
n→+∞
X
X
!
! |fn
(x)|2 dμ
ψ (x)
Questo prova la tesi nel caso generale.
= ||φ||
X
|f(x)|2 dμψ (x) < +∞ .
Il seguente teorema mette insieme i risultati tecnici della precedente discussione, enunciando le prime propriet` a generali degli integrali di funzioni non limitate rispetto ad una misura spettrale. Teorema 9.3. Sia X spazio topologico a base numerabile, B(X) la sua σalgebra di Borel di X, H spazio di Hilbert e P : B(X) → B(H) una PVM. Per ogni f : X → C Borel misurabile si definisca:
Δf := ψ ∈ H
|f(x)|2 dμψ (x) < +∞ . (9.6) X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
Valgono allora i seguenti fatti. (a) Δf `e un sottospazio denso di H. (b) L’applicazione: f(x)dP (x) : Δf ψ → f(x)dP (x)ψ , X
377
(9.7)
X
con secondo membro definito in (9.4), per una qualsiasi successione di funzioni misurabili limitate {fn }n∈N convergente a f in L2 (X, μψ ), definisce un operatore lineare. (c) Se fsupp(P ) `e limitata allora: Δf = H
e
f(x)dP (x) = X
supp(P )
f(x)dP (x) ∈ B(H) ,
dove il secondo membro della seconda identit` a `e l’operatore definito in (c) di definizione 8.27. Dimostrazione. (a) e (b). Dobbiamo per prima cosa provare che, per ogni fissata f : X → C misurabile, se φ, ψ ∈ Δf allora φ + ψ ∈ Δf e cφ ∈ Δf per c ∈ C arbitrario. Si osservi che Δf contiene almeno il vettore nullo di H per cui `e non vuoto. Se φ, ψ ∈ Δf e E ∈ B(X) si ha: ||PE (φ + ψ)||2 ≤ (||PE φ|| + ||PE ψ||)2 ≤ 2||PE φ||2 + 2||PE ψ||2 , da cui, essendo μχ (E) = (χ|PE χ) = (χ|PE PE χ) = (PE χ|PE χ) = ||PE χ||2, si ha: μφ+ψ (E)2 ≤ 2(μφ (E) + μψ (E)) . Questa identit` a implica che, se L2 (X, μφ) f e L2 (X, μψ ) f, allora vale 2 anche L (X, μφ+ψ ) f. Cio`e, se φ, ψ ∈ Δf allora φ + ψ ∈ Δf . D’altra parte, essendo μcφ(E) = |c|2 (PE φ|φ) = |c|2 μφ (E), `e chiaro che f ∈ L2 (X, μcφ) se f ∈ L2 (X, μφ ) e c ∈ C. Cio`e, se φ∈ Δf allora cφ ∈ Δf . Quindi Δf `e un sottospazio. Il fatto che l’applicazione X f(x)dP (x) : Δf ψ → X f(x)dP (x)ψ sia lineare segue immediatamente dal fatto che l’integrale di una funzione limitata rispetto ad una PVM `e un operatore lineare. Passiamo a provare che Δf `e denso in H. Fissata f come nelle ipotesi, si definisca: En := {x ∈ X | n − 1 ≤ |f(x)| < n} ,
per ogni n ∈ N con n ≥ 1.
Si osservi che En ∩ Em = ∅ se n = m e ∪n En = X. Della definizione 8.21 segue immediatamente che i sottospazi chiusi Hn := P (En )H sono a due a due ortogonali e, per la propriet` a (d) della suddetta definizione, le combinazioni lineari finite di elementi di tutti gli spazi Hn definiscono un sottospazio denso
378
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
in H. Mostriamo che Δf contiene tali combinazioni lineari. Dal teorema della convergenza monotona, se ψ ∈ H: X
2
|f(x)| dμψ (x) = lim
k→+∞
k n=1
X
|χEn (x)f(x)|2 dμψ (x) ≤ +∞ .
(9.8)
L’integrale nella sommatoria pu` o essere trascritto, usando (b) in teorema 8.32:
χEn (x)f(x)dP (x)ψ χEn (x)f(x)dP (x)ψ . X
X
D’altra parte, visto che x → χEn (x)f(x) `e limitata e χEn = χEn · χEn , usando (iii) in (a) di teorema 8.32 si ha: χEn (x)f(x)dP (x)ψ = χEn (x)f(x)dP (x) χEn (x)dP (x)ψ X
X
= X
X
χEn (x)f(x)dP (x) ◦ P (En )ψ .
a: Se quindi ψ ∈ Hn , essendo i proiettori P (Em ) ortogonali a due a due, varr` χEk (x)f(x)dP (x)ψ = 0, se k = n . X
Di conseguenza, nelle ipotesi dette per ψ, la serie in (9.8) si riduce a: 2 2 |f(x)| dμψ (x) = |χEn (x)f(x)| dμψ (x) ≤ n2 dμψ (x) = n2 ||ψ||2 < +∞. X
X
X
Concludiamo che Hn ⊂ Δf , per ogni n = 1, 2, . . .. Dato che Δf `e un sottospazio conterr`a anche il sottospazio denso delle combinazioni lineari finite di elementi di tutti gli spazi Hn . Pertanto Δf `e denso. (c). Per f : X → C, definiamo: Fk := {x ∈ X | |f(x)| < k} .
(9.9)
Supponiamo ora che f supp(P ) sia limitata. Definiamo le funzioni misurabili limitate: fn := χsupp(P ) · f + gn dove gn = χFn · χX\supp(P ) · f. In tal caso, essendo supp(μψ ) ⊂ supp(P ) per (v) del teorema 8.30, per ogni ψ ∈ H, avremo f ∈ L2 (X, μψ ), e quindi Δf = H, dato che μf `e finita, e: |fn (x) − f(x)|2 dμψ (x) = |f(x) − f(x)|2 dμψ (x) = 0 . X
supp(P )
Di conseguenza, banalmente, fn → f nel senso di L2 (X, μψ ) per ogni ψ ∈ H e quindi: f(x)dP (x)ψ := lim fn (x)dP (x)ψ = lim χsupp(P ) fn (x)dP (x)ψ X
n→+∞
X
n→+∞
X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
= lim
n→+∞
379
X
χsupp(P ) f(x)dP (x)ψ =
X
χsupp(P ) f(x)dP (x)ψ
f(x)dP (x)ψ ,
=: supp(P )
dove l’ultimo integrale `e definito nel senso di (c) di definizione 8.27 e pertanto l’operatore supp(P ) f(x)dP (x) `e in B(H). Passiamo al successivo teorema che, in particolare, precisa le varie propriet`a di composizione degli integrali di misure spettrali, caratterizzando in modo molto preciso i domini degli operatori coinvolti. In riferimento all’enunciato, ricordiamo che, per una coppia di operatori A e B la notazione A ⊂ B significa che l’operatore B `e un’estensione dell’operatore A (vedi definizione 5.2). Teorema 9.4. Sia X spazio topologico a base numerabile, B(X) la sua σalgebra di Borel di X, H spazio di Hilbert e P : B(X) → B(H) una PVM. Per ogni f : X → C Borel misurabile, usando le stesse notazioni del teorema 9.3, valgono i seguenti fatti. (a) X f(x)dP (x) : Δf → H `e un operatore chiuso. (b) X f(x)dP (x) `e autoaggiunto se f `e reale e pi` u in generale:
∗ f(x)dP (x) = f(x)dP (x) e risulta Δf = Δf . (9.10) X
X
(c) Se f : R → C e g : R → C sono misurabili, D denota il dominio naturale (definizione 5.1) e f · g il prodotto punto per punto: f(x)dP (x) + g(x)dP (x) ⊂ (f + g)(x)dP (x) (9.11) X
D
X
X
f(x)dP (x) + g(x)dP (x) = Δf ∩ Δg
X
dove = sostituisce ⊂ in (9.11) se e solo se Δf+g = Δf ∩ Δg . f(x)dP (x) g(x)dP (x) ⊂ (f · g)(x)dP (x) X
D
(9.12)
X
X
f(x)dP (x) g(x)dP (x) = Δf·g ∩ Δg
X
(9.13)
X
(9.14)
X
dove = sostituisce ⊂ in (9.13) se e solo se Δf·g ⊂ Δg . In particolare: f(x)dP (x) f(x)dP (x) = |f(x)|2 dP (x) (9.15) X
D
X
X
f(x)dP (x) f(x)dP (x) = Δ|f|2 .
X
X
(9.16)
380
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Inoltre:
X
f(x)dP (x) g(x)dP (x) Δf ∩Δg ∩Δf·g
=
X
X
g(x)dP (x) f(x)dP (x) Δf ∩Δg ∩Δf·g .
(9.17)
X
Infine, se f `e limitata sul boreliano E ⊂ X, allora ΔχE ·f = H e: χE (x)dP (x) f(x)dP (x) ⊂ f(x)dP (x) χE (x)dP (x) X
X
X
X
= (χE · f)(x)dP (x) ∈ B(H). X
(d) Se X = R, p : R → C `e un polinomio di grado m ∈ N e T := allora: p(T ) = p(x)dP (x) e vale D(p(T )) = D(T m ) = Δp .
(9.18) X
xdP (x),
(9.19)
R
(e) Definita μφ,ψ come in (c) del teorema 8.30, X f(x)dP (x) `e l’unico operatore in H con dominio Δf tale che, per ogni ψ ∈ Δf e φ ∈ H:
f(x)dμφ,ψ (x) . (9.20) φ f(x)dP (x)ψ = X
X
(f ) Per ogni ψ ∈ Δf si ha:
2
f(x)dP (x)ψ
= |f(x)|2 dμψ (x) .
X
(g) L’operatore
X
(9.21)
X
f(x)dP (x) `e positivo per f positiva, cio`e:
ψ
f(x)dP (x)ψ ≥ 0 per ogni ψ ∈ Δf , se f(x) ≥ 0 per x ∈ X. (9.22) X
(h) Se X `e uno spazio topologico a base numerabile e φ : X → X `e Borelmisurabile (cio`e φ−1 (E ) ∈ B(X) se E ∈ B(X )), allora B(X ) E → P (E ) := P (φ−1 (E )) `e una PVM su X e, per ogni funzione Borel-misurabile f : X → C: f(x )dP (x ) = (f ◦ φ)(x)dP (x) e vale Δf = Δf◦φ , X
X
avendo indicando con Δf il dominio dell’operatore di sinistra.
(9.23)
9.1 Teorema spettrale per operatori autoaggiunti non limitati
381
Dimostrazione. Prima di tutto notiamo che (f) segue immediatamente per continuit` a dalla analoga propriet` a, valida per funzioni limitate, stabilita in (b) del teorema 8.32, usando la nostra definizione di integrale di funzioni non limitate. Nello stesso modo (b) del teorema 8.30 implica (g). Infatti se f ≥ 0, ψ ∈ Δf , la successione di funzioni χFn · fn ≥ 0 converge a f in L2 (X, μψ ) per cui:
0 ≤ ψ (χFn · f(x))dP (x)ψ → ψ f(x)dP (x)ψ , se n → +∞, X X e quindi ψ X f(x)dP (x)ψ ≥ 0. Passiamo ai rimanenti punti. (a). Mostriamo che T := X f(x)dP (x) definito su Δf `e un operatore chiuso. Per dimostrare questo cominciamo con il notare che, se definiamo gli operatori limitati (con gli Fk definiti in (9.9)): χFk (x)f(x)dP (x) , (9.24) Tk := X
allora, per ogni ψ ∈ Δf , vale: (1) T PFk ψ = PFk T ψ = Tk ψ e (2) Tk ψ → T ψ per k → +∞. La dimostrazione di (1) si ottiene similmente a quella di (c) del teorema 9.3, mentre quella di (2) segue dalla discussione che precede l’enunciato del lemma 9.2. Sia quindi {ψn }n∈N ⊂ Δf tale che ψn → ψ ∈ H e T ψn → φ, per n → +∞. Mostriamo che ψ ∈ Δf e T ψ = φ dimostrando, in tal modo, la chiusura di T . Vale, per (1) e per il fatto che PFk → I in senso forte se k → +∞: Tk ψ = lim Tk ψn = lim PFk T ψn = PFk φ → φ in H se k → +∞. n→+∞
n→+∞
Se definiamo φk := Tk ψ e teniamo conto di quanto abbiamo appena trovato, abbiamo che: χFk (x)f(x)dP (x)ψ = φk → φ in H se k → +∞. (9.25) X
Quindi, da (b) del teorema 8.32: χFk (x)|f(x)|2 dμψ (x) = ||φk ||2 → ||φ||2 < +∞ X
se n → +∞.
Il teorema della convergenza monotona assicura allora che f ∈ L2 (X, μψ ), cio`e che ψ ∈ Δf . Riscrivendo l’identit` a in (9.25) come Tk ψ = φk e calcolando il limite per k → +∞ usando (2), abbiamo infine che: T ψ = φ, che `e quanto volevamo provare. (b). Il fatto che Δf = Δf `e una ovvia conseguenza della definizione di Δf e ∗ del fatto che |f| = |f |. Mostriamo ora che X f(x)dP (x) ⊂ X f(x)dP (x) . Infatti, se ψ ∈ Δf , φ ∈ Δf e fn → f in L2 (X, μφ ) e quindi fn → f in L2 (X, μψ ), dove le fn sono limitate, vale:
ψ
f(x)dP (x)φ = lim ψ
fn (x)dP (x)φ X
n→+∞
X
382
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
= lim
n→+∞
X
fn (x)dP (x)ψ
φ = f(x)dP (x)ψ
φ X
dove abbiamo usato la definizione dell’integrale di f e f rispetto a P e la propriet` a (iv) in (a) del teorema 8.32 degli integrali di funzioni limitate fn . ∗ Quanto trovato significa che X f(x)dP (x) ⊂ X f(x)dP (x) . Mostriamo ora ∗ che vale anche l’inclusione: X f(x)dP (x) ⊃ X f(x)dP (x) provando che: ∗ ⊂ Δf . Definiamo T := X f(x)dP (x) e gli operatori D X f(x)dP (x) limitati Tk come in (9.24). Fissiamo ψ ∈ D(T ∗ ). Allora esiste h ∈ H tale che, per ogni φ ∈ Δf : (ψ|T φ) = (h|φ). Scegliendo φ = Tk∗ ψ otteniamo (ψ|Tk Tk∗ ψ) = (h|Tk∗ ψ), dove abbiamo usato T Tk∗ = Tk Tk∗ che si prova da Tk∗ = PFk Tk∗ , che segue subito da T PFk = Tk vista sopra. Abbiamo trovato che: ||Tk∗ ψ||2 = (h|Tk∗ ψ). Allora ||Tk∗ψ||2 ≤ ||Tk∗ψ|| ||h||, cio`e ||Tk∗ψ|| ≤ ||h||. Di conseguenza, usando (b) del teorema 8.32: χFk (x)|f(x)|2 dμψ (x) ≤ ||h||2 per ogni k ∈ N, X
che implica che ψ ∈ Δf , per il teorema della convergenza monotona. Abbiamo provato che D(T ∗ ) ⊂ Δf che era quanto volevamo provare. (c). Le formule (9.11), (9.12) ed il commento sotto di esse seguono banalmente dalle definizioni date e dalla definizione di dominio naturale. Passiamo a dimostrare (9.13) e (9.14). Assumiamo inizialmente che f sia limitata in modo tale che Δf·g ⊂ Δg , e ψ ∈ Δg . Sia {gn }n∈N una successione di funzioni misurabili limitate che converge a g in L2 (X, dμg ). Allora f · gn → f · g in L2 (X, dμg ) e quindi, tenendo conto che gli integrali di f, gn , f · gn sono tutti nel senso della definizione 8.27 e che vale (iii) di (a) del teorema 8.32, abbiamo subito che per n → +∞: f(x)dP (x) gn (x)dP (x)ψ = (f · gn )(x)dP (x)ψ → (f · g)(x)dP (x)ψ. X
Dato che
X
X
X
X
fdP `e continua, abbiamo provato che se f `e limitata e ψ ∈ Δg : f(x)dP (x) g(x)dP (x)ψ = (f · g)(x)dP (x)ψ . (9.26)
X
X
X
Se ora φ := X gdP ψ, tenendo conto di (f), l’identit` a trovata mostra che: |f(x)|2 dμφ (x) = |(f · g)(x)|2 dμψ (x) se f `e limitata e ψ ∈ Δg . (9.27) X
X
Sia ora f misurabile arbitraria e quindi, eventualmente, illimitata. Dato che (9.27) vale per ogni funzione limitata, varr` a anche per quelle illimitate. Dato che
D
f(x)dP (x) X
g(x)dP (x) X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
383
contiene tutti i vettori ψ ∈ Δg tali che φ ∈ Δf e che questo succede, per (9.27), se e solo se ψ ∈ Δf·g , noi concludiamo che:
D f(x)dP (x) gdP (x) = Δg ∩ Δf·g . X
X
Se ora φ ∈ Δg ∩ Δf·g , se ψ = X g(x)dP (x)φ, e se fn := χFn · f (con gli insiemi Fn definiti come fatto precedentemente), allora fn → f in L2 (X, μψ ), fn · g → f · g in L2 (X, μφ) e ora (9.26) e (f) (con fn al posto di f) implicano che: f(x) dP (x) g(x) dP (x)φ = f(x) dP (x)ψ = lim fn (x) dP (x)ψ = X
X
= lim
n→+∞
n→+∞
X
X
(fn · g)(x) dP (x)φ =
X
X
(f · g)(x) dP (x)φ .
Questo conclude la dimostrazione di (9.13) e (9.14). L’inclusione (9.13) unitamente al fatto che in essa = si sostituisce a ⊂ se e solo se Δg ⊃ Δf·g , implica facilmente (9.17) e (9.18). Riguardo a (9.17), vale Δf ⊃ Δf·f = Δ|f|2 dal momento che, essendo μψ finita, se ψ ∈ Δ|f(x)|2 X
|f(x)|2 dμψ (x) =
! ≤
X
X
|f(x)|2 · 1dμψ (x)
! |f(x)|4 dμψ (x)
X
12 dμψ (x) < +∞ .
(d). Cominciamo a notare che, in base a (9.13) e (9.11), vale: p(x) dP (x) . p(T ) ⊂ X
Di conseguenza, la tesi `e vera quando D(p(T )) = Δp . Dimostriamo questa identit` a cominciando a provare che vale: D(T n ) = Δxn
per n ∈ N.
(9.28)
La prova si ottiene per induzione come segue. Per n = 0, 1, l’identit` a `e vera: D(T 0 ) = Δ1 = H, D(T ) = Δx. Assumiamo che sia vera per n e proviamo che lo `e per n + 1: D(T n+1 ) = Δxn+1 . Dobbiamo cio`e provare che D(T T n ) = Δx◦xn . Usando la specificazione sui domini subito dopo (9.14), sappiamo che questo `e vero se e solo se Δx◦xn ⊂ Δxn . Questa inclusione `e verificata dal momento che μψ `e sempre una misura positiva finita e |xn+1 | > |xn | fuori da un compatto J ⊂ R per cui, se ψ ∈ Δxn+1 , allora: 2n 2n |x| dμψ (x) = |x| dμψ (x) + |x|2ndμψ (x) R
R\J
J
384
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
≤ ≤
R
R\J
|x|
|x|2n+2dμψ (x) + sup |x|2n J
2n+2
dμψ (x) + sup |x|
2n
J
1dμψ (x) J
R
1dμψ (x) < +∞ .
Si osservi che, dato che sar`a utile tra poco, abbiamo in particolare verificato che: D(T n+1 ) = Δxn+1 ⊂ Δxn = D(T n ) . Per concludere la dimostrazione di D(p(T )) = Δp , calcoliamo separatamente i due membri e proviamo che coincidono. Sia am = 0 il coefficiente di grado massimo del polinomio p. Dato che D(T n+1 ) ⊂ D(T n ) e che, nel caso generale, D(A + B) = D(A) ∩ D(B), abbiamo immediatamente che: D(p(T )) = D(T m ) .
(9.29)
Passiamo a calcolare Δp . Dato che Δxn+1 ⊂ Δxn si ha subito che Δxm ⊂ Δp . Dimostriamo l’inclusione opposta. Dato che |p(x)|/|x|m → |am | se |x| → +∞, risulta che: |p(x)|/|x|m ≤ |am | + > 0, per ogni > 0, se x `e fuori da un certo compatto sufficientemente grande J ⊂ R. Pertanto, se ψ ∈ Δp , allora: |x|2mdμψ R
|p(x)|2 2m ≤ |x| dμψ + |x| dμψ ≤ dμψ + sup |x| dμψ 2 J R\J J R\J (|am | + ) R 1 2 2m ≤ |p(x)| dμ + sup |x| dμψ < +∞ , ψ (|am | + )2 R J R
2m
2m
e quindi ψ ∈ Δxm . Concludiamo che Δp ⊂ Δxm e quindi Δp = Δxm . Da (9.28) e (9.29) abbiamo infine che Δp = Δxm = D(T m ) = D(p(T )) e questo conclude la dimostrazione. (e). Definiamo le solite funzioni limitate fn := χFn · f che tendono a f nel senso di L2 (X, μψ ). Abbiamo allora che, tenendo conto della definizione di integrale di f, ma anche di (iv) in (c) nel teorema 8.30:
φ
f(x)dP (x) ψ = lim φ
fn (x)dP (x) ψ n→+∞
X
X
= lim
n→+∞
X
fn (x)dμφ,ψ (x) .
Per concludere, proviamo che: lim (fn (x) − f(x))dμφ,ψ (x) = 0 . n→+∞
X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
385
Infatti dal lemma 9.2 (usando le stesse notazioni usate nella dimostrazione del lemma):
(fn (x) − f(x))dμφ,ψ (x) = (fn (x) − f(x))h(x)d|μφ,ψ (x)|
X
X
!
≤
X
|fn (x) − f(x)|d|μφ,ψ (x)| ≤ ||φ||
X
|fn (x) − f(x)|2 dμψ (x) → 0
per n → +∞, dalla definizione di X f(x)dP (x)ψ. La propriet` a di unicit` a segue ora immediatamente. Se T : Δf → H soddisfa la stessa propriet`a di f(x)dP (x), allora T := T − X f(x)dP (x) verifica (φ|T ψ) = 0 per ogni X φ ∈ H, qualunque sia ψ ∈ Δf . Pertanto, scegliendo φ = T ψ, risulta ||T ψ|| = 0 e dunque T = X f(x)dP (x). (f). Diamo solo una traccia della dimostrazione, dal momento che `e elementare anche se lunga. Il fatto che P sia un PVM si verifica subito, controllando che tutte le richieste siano soddisfatte. Se f `e una funzione semplice, l’asserto (9.23) vale banalmente. Usando la definizione 8.27, si generalizza facilmente (9.23) alle funzioni misurabili limitate e quindi, facendo uso della definizione di integrale che abbiamo dato sopra nel caso di f misurabile non limitata, (9.23) si estende al caso generale. Corollario 9.5. Nelle ipotesi del teorema 9.3, se f : X → C `e Borel misurabile, i seguenti fatti sono equivalenti. (a) Δf = H. (b) f `e essenzialmente limitata rispetto alla PVM P (vedi definizione 8.22). (c) X f(x)dP (x) ∈ B(H). Se vale (a),(b) e (c) allora:
(P ) ||f||∞ ≤
fdP
. X
Dimostrazione. Si noti che (a) e (c) u del teorema sono equivalenti in virt` 2.104 del grafico chiuso, dato che X fdP `e chiuso per (a) del teorema 9.4. Dimostriamo che (b) implica (c). Definiamo Fn := {x ∈ X | |f(x)| < n}. Allora, se fn := χFn · f, vale fn → f puntualmente per n → +∞. Se f `e essenzialmente limitata allora, se n `e abbastanza grande f − fn `e diverso da 0 su un insieme Gn ∈ B(X) con P (Gn ) = 0. Pertanto: f + (−fn )dP = χGn (f − fn )dP = f − fn dP χGn dP X
X
=
X
f − fn dP
X
X
P (Gn ) = 0 .
Dunque, per (c) del teorema 9.4, X f(x)dP (x) = − X (−fn (x))dP (x) che `e in B(H) (essendo −fn ) limitata, per (c) del teorema 9.3. Proviamo ora che
386
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
se vale (c) allora vale (b). Consideriamo ora f : X → C Borel sommabile, senza ipotesi di limitatezza ed assumiamo che valga (c) (che `e equivalente ad (a)). Consideriamo la solita successione di funzioni definite sopra fn ∈ Mb (X). Vale, per (8.40):
(P )
||fn ||∞ =
fχn dP
=
fdP χFn dP
≤
fdP
χFn dP
X
X
X
≤
fdP
=: M < +∞ .
X
X
X
Si osservi ora che, per costruzione: {x ∈ X | |f(x)| ≥ M } ⊂ ∪n∈N {x ∈ X | |fn (x)| ≥ M }. Pertanto, per isotonia e subadditivit` a: (ψ|P ({x ∈ X | |fn (x)| ≥ M })ψ) = 0 , (ψ|P ({x ∈ X | |f(x)| ≥ M }ψ) ≤ n∈N (P )
che significa che ||f||∞ ≤ M < +∞ come volevamo.
Possiamo ora dare la seguente definizione basata sulla (9.7), che estende la nozione di integrale di una funzione rispetto ad una PVM. Possiamo anche sfruttare la propriet` a (e) del teorema 9.4 per dare una definizione equivalente pi` u elegante. Definizione 9.6. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione. (a) Se f : X → C `e una funzione misurabile con Δf definito come in (9.6), l’operatore X
f(x)dP (x) : Δf → H
definito in (9.7) `e detto integrale di f rispetto alla misura a valori di proiezione P . Equivalentemente, X f(x)dP (x) `e definibile come l’unico operatore S : Δf → H che soddisfa: (φ |Sψ ) = f(x)dμφ,ψ (x) , per ogni φ ∈ H e ogni ψ ∈ Δf , X
dove la misura complessa spettrale μφ,ψ `e definita in (c) del teorema 8.30. (b) Per ogni E ⊂ B(X) e per ogni f : X → C Borel misurabile oppure g : E → C Borel misurabile, gli integrali: f(x) dP (x) := χE (x)f(x) dP (x) e g(x) dP (x) := g0 (x) dP (x) , E
X
E
X
dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x ∈
E, sono detti, rispettivamente, integrale di f su E e integrale di g su E (rispetto PVM P ).
9.1 Teorema spettrale per operatori autoaggiunti non limitati
387
Osservazioni 9.7. (1) Per (c) del teorema 9.3, la definizione data estende quella gi` a data in definizione 8.27 per il caso di funzioni limitate. (2) Con la definizione data, per ogni f : X → C Borel misurabile, vale: f(x)dP (x) = f(x)dP (x) e quindi f(x)dP (x) = 0 . X
supp(P )
X\supp(P )
(9.30) La prova `e immediata: dato che χsupp(P ) `e limitata, possiamo calcolarne l’integrale usando la definizione valida per funzioni limitate per le quali, direttamente dalla definizione (usando il fatto che χsupp(P ) `e una funzione semplice): 1dP := χsupp(P ) dP = P (supp(P )) = I , supp(P )
X
dove abbiamo usato (c) di proposizione 8.23 nell’ultimo passaggio. A questo punto usando la seconda identit` a in (9.18): f(x)dP (x) = f(x)dP (x) χsupp(P ) (x)dP (x)
X
= supp(P )
X
X
χsupp(P ) (x)f(x)dP (x) =:
f(x)dP (x) . supp(P )
L’altra identit` a in (9.30) segue nello stesso modo usando P (X \ supp(P )) = 0. Esempi 9.8. (1) Consideriamo la misura spettrale: P : B(N ) E → PE =
z(z| )
z∈E
introdotta in (2) di esempi 8.29 su una base hilbertiana N di uno spazio di Hilbert separabile H, dotando N di struttura di spazio topologico a base numerabile con la topologia banale dell’insieme delle parti. Ci interessa arrivare a scrivere una formula esplicita per l’integrale di funzioni f : N → C non limitate, facendo uso della 2 definizione (9.4). Nel caso che stiamo studiando, la condizione |f(z)| dμψ (z) < +∞ si specializza nella richieN 2 2 sta |f(z)| |(z|ψ)| < +∞. Vogliamo mostrare che, anche nel caso di z∈N funzioni f illimitate, si ottiene ancora la formula: f(z)dP (z) = sf(z)z(z| ) , N
z∈N
provata in (2) di esempi 8.29 per funzioni f limitate. Infatti, se {Nn }n∈N `e una classe di sottoinsiemi finiti di N con Nn+1 ⊃ Nn e ∪n∈N Nn = N , la successione
388
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
di funzioni limitate fn := nel senso della norma L2 (N, μψ ), χNn · f2 converge 2 per ogni ψ ∈ H tale che z |f(z)| |(z|ψ)| < +∞, come semplice applicazione del teorema della convergenza dominata di Lebesgue. Pertanto, in base alla definizione (9.4) adottata per l’integrale di una funzione non limitata rispetto ad una PVM, abbiamo che, se z∈N |f(z)|2 |(z|ψ)|2 < +∞, allora: f(z)dP (z)ψ := lim fn (z)dP (z)ψ . (9.31) n→+∞
N
N
D’altra parte, dato che fn `e limitata, per quanto provato in (2) di esempi 8.29: fn (z)dP (z)ψ = sfn (z)(z|ψ) = f(z)z(z|ψ) , N
z∈N
z∈Nn
dove, nella seconda identit` a la somma `e finita, dato che Nn contiene un numero finito di punti. La definizione (9.31) si riduce allora a: f(z)dP (z)ψ = lim f(z)z(z|ψ) , n→+∞
N
cio`e:
f(z)dP (z) = sN
z∈Nn
f(z)z(z| ) .
(9.32)
z∈N
Nella prossima sezione vedremo un esempio concreto di operatore autoaggiunto non limitato costruito con questo tipo di misura spettrale. (2) In riferimento a (1) in esempi 8.29, consideriamo la stessa misura spettrale definita in quell’esempio. Consideriamo quindi uno spazio di Hilbert H = L2 (X, μ), dove X `e uno spazio topologico a base numerabile e μ `e una misura sulla σ-algebra di Borel di X. La misura spettrale su H che vogliamo prendere in considerazione si ottiene definendo, per ogni ψ ∈ L2 (X, μ) e E ∈ B(X): (P (E)ψ)(x) := χE (x)ψ(x) ,
per quasi ogni x ∈ X .
(9.33)
Si osservi che in questo caso, se ψ ∈ H, la misura μψ risulta: |ψ(x)|2 dμ(x) , per ogni E ∈ B(X) . μψ (E) = (ψ|P (E)ψ) = E
Di conseguenza, se g : X → C `e Borel misurabile, risulta che: g(x)dμψ (x) = g(x)|ψ(x)|2 dμ(x) . X
X
Abbiamo provato in (1) in esempi 8.29, che se f : X → C `e Borel misurabile e limitata, allora:
f(y) dP (y)ψ (x) = f(x)ψ(x) per ogni ψ ∈ L2 (X, μ), X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
per quasi ogni x ∈ X.
389
(9.34)
Mostriamo che il risultato si generalizza a funzioni Borel misurabili non limitate, purch`e ψ ∈ Δf . Se f : X → C `e misurabile non limitata, consideriamo una successione di funzioni misurabili limitate fn tali che fn → f per n → +∞ nel senso di L2 (X, μψ ), quando ψ ∈ Δf . In altre parole, in base all’espressione esplicita della misura μψ ottenuta sopra, deve essere: |fn (x) − f(x)|2 |ψ(x)|2 dμ(x) → 0 per n → +∞. X
Tenendo conto di (9.34) risulta allora immediatamente che: |f(x) − fn (x)|2 |ψ(x)|2 dμ(x) → 0 per n → +∞. ||f · ψ − fn · ψ||2H = X
Conseguentemente, in base alla definizione di integrale di f rispetto a P , concludiamo che: per ogni ψ ∈ Δf , dove f : X → C `e misurabile anche non limitata, vale sempre:
f(x)dP (x)ψ (y) = f(y)ψ(y) per quasi ogni y ∈ X. (9.35) X
9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati Siamo ora in grado di enunciare e provare il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Ci limiteremo ad enunciare e provare tale teorema per il caso di operatori non limitati autoaggiunti. Tuttavia `e possibile estendere il risultato agli operatori non limitati normali [Rud91]. Teorema 9.9. (Decomposizione spettrale per operatori autoaggiunti non limitati.) Sia T operatore autoaggiunto (non necessariamente limitato) nello spazio di Hilbert H. Valgono i seguenti fatti. (a) Esiste ed `e unica una PVM, P (T ) : B(R) → B(H), tale che: λ dP (T )(λ) . (9.36) T = R
(b) Vale l’identit` a:
supp(P (T ) ) = σ(T )
(9.37)
e valgono, in particolare, i seguenti fatti: (i) λ ∈ σp (T ) se e solo se P (T )({x}) = 0, (ii) λ ∈ σc (T ) se e solo se P (T ) ({x}) = 0 e, per ogni aperto Ax ⊂ R con Ax x, risulta P (T )(Ax ) = 0, (iii) se λ ∈ σ(T ) `e un punto isolato, allora λ ∈ σp (T ), (iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ D(T ) con ||φ|| = 1 e 0 < ||T φ − λφ || ≤ .
390
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Dimostrazione. (a) Sia V la trasformata di Cayley di T . V `e un operatore unitario per il teorema 5.33, dato che T `e autoaggiunto. Se S1 := {(x, y) ∈ R2 | x2 +y2 = 1}, definiamo X := S1 \{(1, 0)} e nel seguito z = x+iy. Dotiamo X della topologia indotta da R2 (o, che `e lo stesso, da S1 ) e consideriamone (V ) la σ-algebra di Borel B(X) ⊂ B(S1 ). Sia infine P0 la misura spettrale di 1 V in S , che esiste per (a)’ nel teorema 8.34 di decomposizione spettrale. Se z = x + iy, vale dunque: (V ) V = zdP0 (x, y) . (9.38) S1
I − V `e iniettiva per (i) in (b) del teorema 5.33 e di conseguenza 1 = 1 + (V ) (V ) i0 ∈ σp (V ) = supp(P0 ). A sua volta questo implica che P0 ({(1, 0)}) = 0 per (ii) in (b) di teorema 8.34. Consideriamo allora la classe di proiettori ortogonali: (V ) P (V ) : B(X) E → P0 (E) ∈ P(H) , dove abbiamo tenuto conto del fatto che B(X) ⊂ B(S1 ). Si verifica subito che P (V ) `e una PVM su X, dato che tutte le richieste della definizione di PVM (definizione 8.21) sono automaticamente soddisfatte per costruzione, eccetto (V ) P (V ) (X) = I che comunque `e vera dato che P0 ({(1, 0)}) = 0: (V )
P (V ) (X) := P0 (V )
= P0
(V )
(X) = P0
(V )
(S1 ) − P0
(S1 \ {(1, 0)})
({(1, 0)}) = I − 0 = I .
Per lo stesso motivo, l’integrale di una funzione s semplice su S1 rispetto a (V ) P0 coincide banalmente con quello di sX rispetto a P (V ) . Dalla costruzione dell’integrale di funzioni limitate, segue immediatamente che, se f ∈ Mb (S1 ), (V ) e quindi fX ∈ Mb (X), allora X fX dP (V ) = X fdP0 . Tenendo infine conto del fatto che, con ovvie notazioni, comunque scegliamo φ, ψ ∈ H e E ⊂ B(S1 ): (P (V ) )
μφ,ψ
(V )
(E \ {(1, 0)}) = (φ|P (V ) (E \ {(1, 0)})ψ) = (φ|P0 (V )
= (φ|P0
(P
(V )
(E)ψ) = μφ,ψ0
)
(E \ {(1, 0)})ψ)
(E) ,
applicando la definizione di integrale di funzioni misurabili si trova che deve (V ) valere X f X dP (V ) = X fdP0 per ogni f : S1 → C Borel misurabile. In particolare quindi, da (9.38) e omettendo di scrivereX per semplicit`a: V = zdP (V ) (x, y) . (9.39) X
Definiamo ora la funzione a valori in R, misurabile non limitata su X: f(z) := i
1+z 1−z
z ∈X,
(9.40)
9.1 Teorema spettrale per operatori autoaggiunti non limitati
391
e quindi integriamola rispetto alla misura spettrale P (V ) su X, ottenendo l’operatore (non limitato in generale): T := f(z)dP (V ) (x, y) . (9.41) X
Dato che f assume valori reali (quando (x, y) ∈ X), l’operatore T `e necessariamente autoaggiunto per (b) di teorema 9.4. L’identit`a f(z)(1−z) = i(1+z), in virt` u di (c) del teorema 9.4, implica (si tenga conto che la condizione perch´e valga = al posto di ⊂ nella (9.13) `e soddisfatta, come si prova facilmente): T (I − V ) = i(I + V ) .
(9.42)
In particolare (9.42) implica che Ran(I − V ) ⊂ Δf =: D(T ). Dal teorema 5.33 sappiamo per`o che vale anche: T (I − V ) = i(I + V )
e D(T ) = Ran(I − V ) ⊂ Δf .
Per confronto con (9.42), concludiamo che T deve essere un’estensione autoaggiunta di T . Dato che T = T ∗ e quindi non ammette estensioni autoaggiunte proprie ((c) in proposizione 5.16), deve essere T = T . Abbiamo ottenuto che: T = f(z)dP (V ) (x, y) . (9.43) X
La funzione f : X → R `e in realt` a biettiva e pertanto ricopre tutto R. Applicando allora (h) del teorema 9.4, abbiamo finalmente che: B(R) E → P (T )(E) := P (V ) (f −1 (E)) `e una PVM su R ed inoltre (9.43) pu` o essere riscritta come la (9.36): λdP (T ) (λ) .
T = R
Questo `e lo sviluppo spettrale che volevamo provare esistere. Passiamo all’unicit` a della misura spettrale che soddisfa (9.36). Sia P una PVM su R con: T = λdP (λ) . R
La trasformata di Cayley si pu`o allora scrivere, in base a (c) del teorema 9.4: λ−i V = (T − iI)(T + iI)−1 = dP (λ) . λ + i R Usando (h) dello stesso teorema e dove f : X → R `e la stessa funzione biettiva misurabile con inversa misurabile, definita in (9.40): V = zdP (f(x, y)) , X
392
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
dove B(X) F → Q(F ) := P (f(F )) risulta essere una PVM su X, che possiamo estendere in modo ovvio ad una PVM su S1 definendo Q0 (F ) := Q(F \ {(1, 0)}) per ogni F ∈ B(S1 ) e quindi ottenere: V = zdQ0 (x, y) . S1
Dato che vale anche (9.38), per l’unicit` a della misura spettrale associata ad un operatore normale limitato per il teorema 8.34, deve accadere che: (V ) Q0 (F ) = P0 (F ) per ogni boreliano di S1 e quindi Q(F ) = P (V ) (F ) per ogni boreliano di X. Di conseguenza per ogni E ∈ B(R) dovr` a anche valere: Q(f −1 (E)) = P (V ) (f −1 (E)), cio`e P (E) = P (T ) (E), che `e quanto volevamo dimostrare. (b). Passiamo a dimostrare che σ(T ) = supp(P (T )). Dimostreremo equivalentemente che λ0 ∈ ρ(T ) se e solo se λ0 ∈ supp(P (T ) ). Per prima cosa proviamo che λ0 ∈ supp(P (T ) ) implica λ0 ∈ ρ(T ). Infatti, nell’ipotesi fatta su λ0 , esiste un intervallo aperto (a, b) ⊂ R \ supp(P (T ) ) con λ0 ∈ (a, b). Di conseguenza: I = R χR\(a,b)dP da cui usando l’ultimo risultato in (c) del teorema 9.4: 1 1 dP (T ) (λ) = dP (T ) (λ) χR\(a,b)dP = R λ − λ0 R λ − λ0 R 1 χR\(a,b)(λ) dP (T )(λ) . λ − λ0 R Applicando (c) del teorema 9.4, dato che nell’ultimo integrale la funzione integranda `e limitata concludiamo che l’operatore: 1 Rλ0 (T ) := dP (T )(λ) ∈ B(H) . λ − λ0 R Inoltre, sempre per (c) del teorema 9.4, prestando attenzione ai domini su cui ha senso definire il prodotto di operatori, otteniamo: Rλ0 (T )(T − λ0 I) = ID(T ) ,
(T − λ0 I)Rλ0 (T ) = I .
Si osservi che la seconda identit`a vale su tutto H e pertanto abbiamo da essa che deve anche valere: Ran(T − λ0 I) = H. L’operatore Rλ0 (T ) `e quindi, come la notazione suggerisce, il risolvente di T associato a λ0 , per (a) del teorema 8.4 e quindi, per definizione, λ0 ∈ ρ(T ). Passiamo ora a provare che λ0 ∈ ρ(T ) implica λ0 ∈ supp(P (T )). Nelle ipotesi dette per λ0 , P (T )({λ0 }) = (T ) 0, altrimenti esisterebbe ψ ∈ P{λ0} (H) \ {0} che implicherebbe (per (c) del teorema 9.4): (T ) Tψ = λdP (T )(λ)P{λ0 } ψ = λdP (T ) (λ) χ{λ0 } (λ)dP (T ) (λ)ψ = R
R
λχ{λ0 } (λ)dP (T ) (λ)ψ =
R
R
R
(T )
λ0 χ{λ0 } (λ)dP (T ) (λ)ψ = λ0 P{λ0} ψ = λ0 ψ
9.1 Teorema spettrale per operatori autoaggiunti non limitati
393
e dunque ψ ∈ σp (T ), che `e impossibile, dato che λ0 ∈ ρ(T ). Ulteriormente, nelle stesse ipotesi su λ0 esiste l’operatore risolvente cio`e (essendo T chiuso e valendo (a) e (b) in teorema 8.4) l’operatore Rλ0 (T ) ∈ B(H), che soddisfa: (T − λ0 I)Rλ0 (T ) = I
e
Rλ0 (T )(T − λ0 I) = ID(T ) .
D’altra parte, da (c) del teorema 9.4 e tenendo conto che, P (T ) ({λ0 }) = 0, si trova subito (facendo attenzione ai domini sui quali valgono le identit` a):
1 dP (T ) (λ) (T − λ0 I) = ID(T ) , λ − λ 0 R 1 (T − λ0 I) dP (T )(λ) = I . λ − λ0 R 1 Si osservi che dalla prima identit` a si evince anche che il dominio di R λ−λ 0 (T ) dP (λ) `e D(T − λ0 I), cio`e con tutto lo spazio H, per quanto detto sopra. 1 Non `e importante come abbiamo definito la funzione λ → λ−λ esattamente 0 (T ) per λ = λ0 , dato che P ({λ0 }) = 0. Per l’unicit` a dell’operatore inverso deve allora essere: 1 dP (T )(λ) = Rλ0 (T ) , λ − λ 0 R dunque l’operatore a primo membro deve essere limitato. Supponiamo allora, per assurdo, che sia λ0 ∈ supp(P (T )), allora ogni aperto che contiene λ0 e quindi, in particolare, ogni intervallo In := (λ0 −1/n, λ0 +1/n), deve soddisfare (T ) P (T )(In ) = 0. Sia allora ψn ∈ PIn (H) \ {0} per ogni n = 1, 2, . . .. Senza perdere generalit`a supponiamo anche che: ||ψn|| = 1. Con questa scelta ed usando (f) del teorema 9.4, si ottiene che:
2
1 1 ||Rλ0 (T )ψn ||2 =
dP (T )(λ)ψn
= dμψn (λ) λ − λ |λ − λ0 |2 0 R In 1 1 ≥ inf dμψn (λ) ≥ inf = n2 → +∞ se n → +∞. In |λ − λ0 |2 I In |λ − λ0 |2 n o essere limitato. Pertanto abbiamo raggiunto l’assurdo che Rλ0 (T ) non pu` Quindi deve valere λ0 ∈ supp(P (T ) ). Dimostriamo ora che vale (i). Come visto nella dimostrazione appena conclusa, se P (T ) ({x}) = 0, allora x ∈ σp(T ). Supponiamo ora che x ∈ σp(T ). Dalla definizione di trasformata di Cayley V di T , segue facilmente che ((x − i)/(x + i)) ∈ σp (V ). Possiamo allora applicare (i) in (b) del teorema 8.34 per l’operatore normale V (dato che `e unitario) sostituito a T nell’enunciato di quel teorema. Concludendo che P (V ) ({ x−i x+i }) = 0. Per come abbiamo ricavato la PVM associata a T da quella associata a V , segue immediatamente che P (T ) (x) = P (V ) ({ x−i x+i }) = 0. Passiamo a dimostrare (ii). Per (a) in proposizione 8.15, x ∈ σc (T ) significa che (1) x ∈ σ(T ), ma (2) x ∈ σp (T ). L’affermazione (1) equivale a x ∈ supp(P (T ) )
394
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
e quindi ogni aperto Ax che include x deve verificare P (T ) (Ax ) = 0, la (2) equivale quindi a dire P (T )({x}) = 0 (altrimenti, per (i) avremmo un assurdo). La prova di (iii) `e immediata, se x ∈ supp(P (T ) ) ed `e un punto isolato, deve essere P (T ) ({x}) = 0, altrimenti x non potrebbe appartenere a supp(P (T ) ), applicando (i) segue la tesi. Per concludere dimostriamo (iv). Se x ∈ σc (T ), allora applicando (ii) per la classe di intervalli In := (x − 1/n, x + 1/n), con n = 1, 2, . . ., deve risultare (T ) P (T )(In ) = 0. Scegliamo pertanto ψn ∈ PIn (H), per ogni n e tale che ||ψn|| = 1. Avremo allora che:
||T ψn − xψn ||2 = (λ − x)dP (T )(λ)ψn
(λ − x)dP (T )(λ)ψn = R
R
R
(T ) (λ − x)dP (T )(λ)PIn ψn
(λ − x)dP (T )(λ)ψn . R
Applicando (c) in teorema 9.4, l’ultimo prodotto scalare si scrive χIn (x)(λ − x)2 dμψn (λ) ≤ sup(λ − x)2 dμψn (λ) = R
In In
= n−2
dμψn (λ) = n−2
In
R
dμψn (λ) = n−2 ||ψn ||2 .
Abbiamo trovato che, per ogni n = 1, 2, . . ., esiste ψn = 0, con ||ψn || = 1 e tale che: ||T ψn − xψn || ≤ 1/n. Questo implica immediatamente la tesi in quanto x ∈ σp (T ) per ipotesi e dunque 0 < ||T ψn − xψn ||. Dopo il teorema spettrale, possiamo dare una utile definizione per le applicazioni in meccanica quantistica. Definizione 9.10. Si consideri un operatore autoaggiunto T nello spazio di Hilbert H e sia f : R → C una funzione Borel misurabile. L’operatore: f(T ) := f(x)dP (T )(x) , (9.44) R (T )
con dominio, se μψ (E) := (ψ|P (T ) (E)ψ) per ogni E ∈ B(R): D(f(T )) = Δf := ψ ∈ H
|f(x)|2 dμ(T ) (x) < +∞ ψ
R
`e detto funzione f dell’operatore T . Osservazioni 9.11. (1) Il teorema spettrale consente una differente decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H. Un decomposizione `e quella in
9.1 Teorema spettrale per operatori autoaggiunti non limitati
395
spettro discreto, σd (T ), e spettro essenziale, σess (T ) := σ(T ) \ σd (T ), dove: σd (T ) :=
) (
(T ) u numerabile per qualche > 0 . λ ∈ σ(T ) dim P(λ−,λ+)(H) al pi` Si dimostra facilmente che λ ∈ σd (T ) se e solo se λ `e un punto isolato di σ(T ). Di conseguenza, per il teorema 9.9, σd (T ) ⊂ σp (T ). Tuttavia, in generale, non `e vera l’inclusione opposta, perch´e possono esserci punti di σp (T ) non isolati (si pensi al caso in cui 0 `e un autovalore ed anche punto di accumulazione dello spettro di alcuni operatori compatti autoaggiunti). (2) Una terza decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H, si ottiene decomponendo lo spazio di Hilbert nel sottospazio chiuso Hp generato dagli autovettori e nel suo ortogonale: H = Hp ⊕ H⊥ p . Si ⊂ D(T ) e tali spazi sono invarianti sotto l’azione vede facilmente che Hp , H⊥ p di T . Con ovvie notazioni: T = T Hp ⊕T H⊥ . p Vale ovviamente σp (T ) := σ(T Hp ), mentre si definisce lo spettro puramente continuo σpc (T ) := σ(T H⊥ ). Risulta σ(T ) = σp (T ) ∪ σpc (T ). Si noti che p questa decomposizione non `e necessariamente in due insieme disgiunti e nel caso generale σpc (T ) = σc(T ). (3) Una quarta decomposizione dello spettro, per un operatore, T : D(T ) → H sullo spazio di Hilbert H (ma la definizione si pu`o dare per un generico spazio normato), `e quella in spettro puntuale approssimato, σpa (T ) e spettro residuo puro σrp (T ) := σ(T ) \ σps (T ), dove: σpa (T ) := 1
2 λ ∈ σ(T ) | (T − λI)−1 : Ran(T − λI) → D(T ) non esiste o non `e limitato.
Osservando che la non limitatezza di (T − λI)−1 `e equivalente al fatto che esiste δ > 0 con ||(T − λI)ψ|| ≥ δ||ψ|| per ogni ψ ∈ D(T ), si dimostra immediatamente il seguente risultato che giustifica la terminologia. λ ∈ σpa (T ) se e solo se, per ogni > 0, esiste ψ ∈ D(T ) con ||ψ|| = 1 tale che: ||T ψ − λψ|| ≤ . Dato che, per gli operatori autoaggiunti, la propriet` a di sopra vale per ogni λ ∈ σc (T ) per (b) del teorema 8.34, ma anche per λ ∈ σp (T ) banalmente, e tenendo conto che σ(T ) = σp (T ) ∪ σc (T ) nel caso in esame, concludiamo che σpa(T ) = σ(T ) e σrp (T ) = ∅ per tutti gli operatori autoaggiunti. (4) Dato che supp(P (T ) ) = σ(T ), la definizione (9.44) pu` o equivalentemente essere scritta: f(T ) := f(x)dP (T ) (x) . (9.45) σ(T )
396
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Nello stesso modo, dato che supp(μφ,ψ ) ⊂ supp(P (T ) ), possiamo equivalentemente scrivere per il dominio di f(T ):
(T ) 2 D(f(T )) = ψ ∈ H |f(x)| dμψ (x) < +∞ .
σ(T ) Si osservi infine che, se f : R → R `e Borel misurabile, decomponendo f(T ) (che `e autoaggiunto per (b) del teorema 9.4) con il teorema spettrale 9.9 , segue che: (f(T )) (T ) λdP (λ) = f(λ)dP (λ) = λdP (T ) (f −1 (λ)) . (9.46) σ(f(T ))
σ(T )
σ(f(T ))
L’ultima identit` a segue da (h) del teorema 9.4. Per l’unicit` a della PVM associata a f(T ) segue che, nelle ipotesi dette su f: P f(T ) (E) = P (T )(f −1 (E))
per ogni E ∈ B(σ(f(T ))).
(9.47)
(5) Da (d) del teorema 9.4 risulta che, per ogni operatore autoaggiunto T , il dominio naturale di un polinomio p(T ) ed il dominio dello stesso operatore pensato come funzione di T coincidono. Dalla definizione di dominio naturale si ha anche che, per ogni operatore autoaggiunto T : D(T m ) ⊂ D(T n )
per 0 ≤ n ≤ m, con n, m ∈ N.
(9.48)
Le funzioni di un operatore godono delle propriet` a che seguono immediatamente dai teoremi 9.3 e 9.4. La seguente proposizione specifica ulteriori propriet` a in relazione allo lo spettro dell’operatore autoaggiunto T . Ricordiamo (vedi anche (1) in esempi 2.118) che f : X → Y, con X, Y spazi normati, `e detta essere localmente lipschitziana se, per ogni x ∈ X, esistono un intorno aperto Ix e una costante LIx ≥ 0 (che diremo di Lipschitz) tali che: ||f(z) − f(z )||Y ≤ LIx ||z − z ||X per ogni z, z ∈ X . Le funzioni derivabili sono banalmente localmente lipschitziane, per cui (a)’ sotto, in particolare, si applica al caso di f `e derivabile. Proposizione 9.12. Sia T operatore autoaggiunto nello spazio di Hilbert H e sia f : R → C Borel misurabile. L’operatore f(T ) gode delle seguenti propriet` a. (a) σ(f(T )) ⊂ f(σ(T )) dove la barra indica la chiusura topologica. (a)’σ(f(T )) = f(σ(T )) se f `e localmente lipschitziana. (a)”σ(f(T )) = f(σ(T )) se f `e continua e f(R) ⊂ R. (b) f(σp (T )) ⊂ σp (f(T )). Dimostrazione. (a), (a)’ e (a)”. Sia x0 ∈ f(σ(T )). Allora la funzione σ(T ) 1 x → f(x)−x `e limitata. Dato che supp(P (T )) = σ(T ) per il teorema 9.9, 0
9.1 Teorema spettrale per operatori autoaggiunti non limitati
397
applicando (c) del teorema 9.3, dobbiamo allora concludere che l’operatore 1 (T ) dP (x) sia limitato e con dominio dato da tutto H. Vale inoltre, R f(x)−x0 applicando (c) del teorema 9.4 e tenendo conto dei domini degli operatori: 1 (T ) dP (x) (f(x) − x0 )dP (T )(x) = ID(f(T )−x0 I) , f(x) − x 0 R R e anche che:
R
(f(x) − x0 )dP (T )(x)
R
1 dP (T )(x) = I . f(x) − x0
Dalla seconda si evince che ) − x0 I) = H. Da (a) in teorema 8.4 Ran(f(T 1 (T ) abbiamo che l’operatore R f(x)−x dP (x) `e il risolvente di f(T ) associato 0 a x0 ; di conseguenza x0 ∈ ρ(f(T )), cio`e x0 ∈ σ(f(T )). Abbiamo provato che, se x0 ∈ σ(f(T )), allora x0 ∈ f(σ(T )). In altre parole: σ(f(T )) ⊂ f(σ(T )). Mostriamo ora che, se f `e localmente lipschitziana oppure se `e continua con immagine in R: f(σ(T )) ⊂ σ(f(T )). Questo concluder`a la dimostrazione di (a)’ e (a)”, in quanto essendo lo spettro chiuso, f(σ(T )) ⊂ σ(f(T )). Nelle ipotesi di (a)’, supponiamo dunque che x0 = f(λ0 ), dove λ0 ∈ σ(T ) pu` o non essere unico, e proviamo che x0 ∈ σ(f(T )). Nelle ipotesi su x0 , se qualche λ0 ∈ σp(T ), la dimostrazione si conclude per l’asserto (b) di questa proposizione (la cui dimostrazione non dipende da quella che stiamo facendo), valendo x0 = f(λ0 ) ∈ σp (f(T )) ⊂ σ(f(T )). Se per ogni λ0 che individua il fissato x0 tramite f vale λ0 ∈ σp (T ), allora per ciascuno di tali λ0 deve essere P (T ) ({λ0 }) = 0 per (ii) in (b) del teorema 9.9. Assumiamo di essere in questo caso e, per assurdo, che x0 ∈ σ(f(T )). Di conseguenza x0 ∈ ρ(f(T )) e questo significa che l’operatore chiuso f(T ) − x0 I `e una biezione da D(f(T )) a tutto H, per (a) del teorema 8.4. In virt` u di (c) del teorema 9.4: 1 dP (T )(λ)(f(T ) − x0 I) f(λ) − x 0 R f(λ) − x0 (T ) dP (λ)D(f(T )) = ID(f(T )) . = R f(λ) − x0 Si osservi che la definizione della funzione 1/(f(λ) − x0 ) in (ogni) λ0 `e del (T ) tutto irrilevante dato che P a operatoriale trovata dice 0 }) = 0. L’identit` ({λ 1 (T ) anche che il dominio di R f(λ)−x dP (λ) deve essere tutto H, dato che 0 Ran(f(T ) − x0 I) = H nelle nostre ipotesi:
1 D dP (T )(λ) = H . (9.49) R f(λ) − x0 Dimostriamo che (9.49) `e falsa se f `e localmente lipschitziana, arrivando ad 1 (T ) un assurdo. Se λ0 ∈ σ(T ), l’operatore D( R λ−λ dP (λ)) = H (altrimenti, 0 ragionando come sopra, T − λ0 I sarebbe una biezione da D(T ) a tutto H
398
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
ed avremmo un assurdo). Dato che, per ogni intervallo aperto limitato I che include λ0 , la funzione 1/(λ − λ0 ) `e limitata su R \ I,deve accadere che, (T ) 1 (T ) dP (λ) . per ogni detto I, esista ψI ∈ PI (H) tale che ψI ∈ D R λ−λ 0 (Altrimenti potremmo decomporre ortogonalmente ogni ψ ∈ H come:
1 (T ) (T ) (T ) dP (T )(λ) ψ = PI ψ + PR\I ψ con PI ψ ∈ D R λ − λ0 ed avremmo, spezzando l’integrale nei due contributi su I e su R \ I, che (T ) (scriviamo μψ in luogo di μψ nel seguito): 1 dμψ (λ) 2 R |λ − λ0 | 1 1 = dμ dμP (T ) ψ (λ) < +∞ (T ) (λ) + 2 P ψ 2 I R\I I |λ − λ0 | R\I |λ − λ0 | 1 e quindi ψ ∈ D R λ−λ dP (T )(λ) che pertanto coinciderebbe con tutto H, 0 contro le ipotesi.) Se f `e localmente lipschitziana, sia L > 0 una costante di Lipschitz nell’intervallo I λ0 . Allora, in I: |f(λ) − f(λ0 )|2 ≤ L2 |λ − λ0 |2 . Pertanto, dato che ψI ∈ D( X dP (λ)/(λ − λ0 )): dμψI (λ) dμψI (λ) dμψI (λ) 1 ≥ ≥ 2 = +∞ . 2 2 |f(λ) − f(λ )| |f(λ) − f(λ )| L |λ − λ0 |2 0 0 R I I Dove, nell’ultimo passaggio abbiamo usato il fatto che ψI ∈ 1 1 D R λ−λ dP (T )(λ) . Abbiamo provato che ψI ∈ D R f(λ)−x dP (T )(λ) , 0 0 in contraddizione con (9.49), concludendo la dimostrazione di (a)’. Consideriamo ora f : R → R continua e proviamo che f(σ(T )) ⊂ σ(f(T )), provando (a)”. Usando (h) del teorema 9.4, passando alla misura spettrale P (T ) (E) = P (T ) (f −1 (E)), se E ∈ B(R), trasformiamo la funzione integrale di partenza, che definisce un operatore autoaggiunto T = f(T ), essendo f reale, nello sviluppo spettrale di T : f(λ)dP (T ) (λ) = xdP (T ) (x) . R
R
Sia ora x = f(λ) con λ ∈ σ(T ). Se I x `e un intervallo aperto, vale P (T ) (I) = P (T )(f −1 (I)) = 0, dato che f −1 (I) `e un aperto che include λ ∈ σ(T ) = supp(P (T )). Ma allora x ∈ supp(P (T ) ) = σ(T ) = σ(f(T )). Quindi f(σ(T )) ⊂ σ(f(T )). (T ) (b) Se λ0 ∈ σp (T ), allora
= 0 per (i) di (b) del teorema 9.9. P ({λ0 }) (T ) Valendo P ({λ0 }) = R χ{λ0 } (x)dP (T )(x), applicando (c) del teorema 9.4, prestando attenzione ai domini di validit` a delle identit` a, si trova che: f(T )P (T ) ({x0 }) = f(x)dP (T ) (x) χ{x0 } (x)dP (T )(x) R
R
9.1 Teorema spettrale per operatori autoaggiunti non limitati
=
399
f(x0 )χ{x0 } (x)dP (T )(x) f · χ{x0 } (x)dP (T )(x) = R R (T ) = f(λ0 ) χ{x0 } (x)dP (x) = f(x0 )P (T ) ({x0 }) R
che `e la tesi. 9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico
Nello spazio di Hilbert complesso L2 (R, dx) (dove dx indica la misura di Lebesgue su R), consideriamo l’operatore: H0 := −
2 mω2 2 1 P S(R) + XS(R) , 2m 2
dove X e P sono l’operatore posizione ed impulso per la particella sulla retta reale introdotti nel capitolo 5. In altre parole: H0 := −
2 d2 mω2 2 x , + 2 2m dx 2
dove il termine x2 si deve intendere come l’operatore moltiplicativo per la funzione R x → x2 e , ω, m sono costanti strettamente positive; infine D(H0 ) := S(R), dove S(R) `e lo spazio di Schwartz su R delle funzioni complesse infinitamente differenziabili che si annullano all’infinito, con tutte le derivate, pi` u velocemente di ogni potenza negativa di x (vedi capitolo 3). Le costanti , ω, m non hanno alcun interesse matematico e possono essere poste tutte uguali ad 1 nel seguito, tuttavia hanno un significato fisico importante. L’operatore H0 si dice hamiltoniano dell’oscillatore armonico unidimensionale e frequenza caratteristica ω/(2π), per una particella di di massa m; h := 2π `e la costante di Planck. Dal punto di vista fisico, H0 rappresenta l’osservabile energia per il sistema considerato, tuttavia, in questa sezione, non ci occuperemo delle motivazioni fisiche per introdurre tale operatore che studieremo esclusivamente da un punto di vista matematico, rimandando ogni commento di carattere fisico ai capitoli 11 e 12. H0 `e evidentemente simmetrico dato che `e hermitiano e S(R) `e denso in L2 (R, dx). H0 ammette estensioni autoaggiunte per il criterio di von Neumann (teorema 5.42), dato che commuta con l’operatore antinunitario dato dalla coniugazione complessa delle funzioni di L2 (R, dx). Mostreremo che H0 `e essenzialmente autoaggiunto, daremo la sua espressione esplicita in termini dello sviluppo spettrale della sua unica estensione autoaggiunta H0 e, contestualmente, preciseremo la forma del suo spettro. Introduciamo tre operatori, detti rispettivamente operatore di creazione, operatore di distruzione e operatore numero di occupazione: 3 3
d d mω mω A := x+ , A := x− , N := A A . 2 mω dx 2 mω dx
400
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Anche in questo caso assumiamo che gli operatori siano densamente definiti con dominio D(A) = D(A ) = D(N ) := S(R). Deve essere chiaro che A ⊂ A∗ , e questo giustifica la notazione, inoltre N `e simmetrico. Si osservi anche che S(R) `e uno spazio denso e invariante per H0 , A e A . Usando A e A costruiremo un insieme di autovettori per N e H0 che formano una base hilbertiana di L2 (R, dx). Dato che gli autovettori sono ovviamente vettori analitici, questo fatto prova, in base al criterio di Nelson (teorema 5.46), che H0 e N sono essenzialmente autoaggiunti sul loro dominio S(R). Cominciamo con il notare che, in base alle definizioni date per A e A , valgono le relazioni di commutazione: [A, A] = I ,
(9.50)
dove i due membri sono valutati sugli elementi dello spazio denso invariante S(R). La verifica delle relazioni di sopra `e immediata dalle definizioni date. Ulteriormente, dalla definizione di A e A , con qualche calcolo risulta che:
1 1 (9.51) H0 = ω A A + I = N + I . 2 2 Consideriamo l’equazione in S(R): Aψ0 = 0 .
(9.52)
Una soluzione si ottiene facilmente essere: 1
3
2
x − (2s) 2
ψ0 (x) = 1/4 √ e π s
,
s :=
, mω
dove abbiamo scelto il fattore davanti alla funzione in modo tale che ||ψ0 || = 1. Notiamo che questa funzione altro non `e che la prima funzione di Hermite introdotta in (4) di esempi 3.33, quando si passa alla variabile x = x/s e √ si tiene conto del fattore 1/ s per non alterare la normalizzazione. Se ora definiamo i nuovi vettori, per n = 1, 2, . . .: (A )n ψn := √ ψ0 , n!
(9.53)
si prova facilmente per induzione, usando solamente (9.52), (9.50) che, per n, m ∈ N: √ √ Aψn = nψn−1 , A ψn = n + 1ψn+1 , (ψn |ψm ) = δnm . (9.54) Infatti, la seconda identit` a segue immediatamente dalla definizione dei vettori ψn , la prima si prova come segue: 1 1 1 Aψn = √ A(A )n ψ0 = √ [A, (A )n ]ψ0 + √ (A )n Aψ0 n! n! n!
9.1 Teorema spettrale per operatori autoaggiunti non limitati
401
1 = √ [A, (A )n ]ψ0 + 0 ; n! d’altra parte, da (9.50) segue subito che: [A, (A )n ] = n(A )n−1 , che inserita sopra produce la prima identit` a in (9.54). La terza identit`a si dimostra come segue, assumendo n ≥ m (l’altro caso `e analogo): 1 1 (ψm−1 |A(A )n ψ0 ) = √ (ψm−1 |[A, (A)n ]ψ0 ) n!m n!m 3 n n n−1 = √ ψ0 ) = (ψm−1 |(A ) (ψm−1 |ψn−1 ) = · · · m n!m ! n! (ψ0 |ψn−m) . = m!(n − m)!
(ψm |ψn ) = √
Se n = m il risultato `e 1, altrimenti il risultato `e 0, dato che: (ψ0 |ψn−m ) = (n − m)−1/2 (ψ0 |Aψn−m−1 ) = (n − m)−1/2 (Aψ0 |ψn−m−1 ) = 0 . La seconda identit`a in (9.54) (passando alla variabile x = x/s che √ non altera la normalizzazione delle funzioni a causa dell’ulteriore fattore 1/ s) altro non `e che la relazione di ricorrenza tra le funzioni di Hermite citata in (4) di esempi 3.33. Concludiamo che le funzioni ψn sono (a parte un fattore ed un cambio di variabile) le funzioni di Hermite e quindi formano una base hilbertiana di L2 (R, dx). Dall’ultima relazione in (9.54) risulta che {ψn }n∈N `e, come deve essere, un insieme di vettori ortonormali di L2 (R, dx), mentre usando le prime due si ottiene subito che: N ψn = nψn , (9.55) e quindi, da (9.51), abbiamo che i vettori ψn formano una base hilbertiana di autovettori di H0 , dato che vale:
1 ψn . H0 ψn = ω n + (9.56) 2 Per inciso questo mostra che H0 (ma anche N ) `e un operatore illimitato, dato che l’insieme {||H0ψ|||ψ ∈ D(H0 ), ||ψ|| = 1} include tutti i numeri ω(n+1/2) con n ∈ N. Concludiamo anche che, per il criterio di Nelson (teorema 5.46), gli operatori simmetrici N e H0 sono entrambi essenzialmente autoaggiunti, dato che nel loro dominio c’`e un insieme di vettori analitici, {ψn }n∈N , le cui combinazioni lineari finite sono dense in L2 (R, dx). Per ottenere la decomposizione spettrale di H0 consideriamo spazio topologico dato dalla base hilbertiana N = {ψn }n∈N dotata dalla topologia dell’insieme delle parti, e costruiamo la misura spettrale: P : B(N ) E → PE = ψn (ψn | ) ψn ∈E
402
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
come in (1) in esempi 9.8. Costruiamo un’analoga misura spettrale su R che abbia supporto sull’insieme degli autovalori associati agli autovettori ψn di H0 : ψn (ψn | ) per F ∈ B(R). PF := sω(n+1/2)∈F
Quindi consideriamo la funzione misurabile φ : N ψn → ω n + 12 . Applicando (c) del teorema 9.4, abbiamo che, per ogni funzione f : R → C misurabile:
1 ψn (ψn | ) f(x)dP (x) = f(φ(z))dP (z) = sf ω n + 2 R N n∈N
dove l’ultima identit`a non `e altro che la (9.32). Specializzando la funzione f a R x → x, abbiamo l’espressione esplicita dell’operatore autoaggiunto:
1 ψn (ψn | ) . H0 := xdP (x) = sω n + (9.57) 2 R n∈N
Mostriamo ora che H0 = H0 . Sia < N > lo spazio denso delle combinazioni lineari finite dei vettori ψn . H0
`e ancora essenzialmente autoaggiunto per il criterio di Nelson. Questo significa che H0 = H0 , cio`e H0 e H0 hanno la stessa (unica) estensione autoaggiunta (pari alla loro chiusura). D’altra parte H0 `e sicuramente un’estensione autoaggiunta di H0 , dato che, come si prova immediatamente da (9.57),
1 H0 ψn = ω n + ψn = H0 ψn 2 per ogni n, e quindi H0 = H0 . Concludiamo che l’operatore autoaggiunto H0 deve essere l’unica estensione autoaggiunta di H0 e quindi anche di H0 . Concludiamo anche che la misura spettrale, associata a H0 dal teorema 9.9 di decomposizione spettrale `e: PF := sψn (ψn | ) per F ∈ B(R); ω(n+1/2)∈F
ma anche che la decomposizione spettrale di H0 `e:
1 ψn (ψn | ) . H0 = sω n + 2 n∈N
Infine, usando (b) nel teorema 9.9, dalla misura spettrale trovata per H0 si evince facilmente che:
1
σ(H0 ) = σp (H0 ) = ω n + n ∈ N . 2
9.1 Teorema spettrale per operatori autoaggiunti non limitati
403
Si deve notare che lo spettro di H0 `e completamente puntuale e gli autospazi sono tutti finito-dimensionali, anche se l’operatore in questione non `e compatto, dato che `e illimitato. Tuttavia le prime due potenze intere inverse di H0 sono compatte, essendo rispettivamente un operatore di Hilbert-Schmidt e uno di classe traccia (lo si provi per esercizio). I numeri in σp (H0 ) sono, dal punto di vista fisico, gli unici valori dell’energia meccanica totale che un oscillatore quantistico, con dati valori di ω ed m, pu` o assumere, al contrario del caso classico in cui i valori dell’energia sono continui. 9.1.4 Un esempio a spettro continuo: gli operatori posizione e impulso Torniamo sugli operatori posizione Xi (5.12)-(5.13) ed impulso Pi (5.18)(5.19), per i = 1, 2, 3, sullo spazio di Hilbert H = L2 (R3 , dx), dove dx `e la misura di Lebesgue su R3 . Nel seguito x = (x1 , x2 , x3 ). Abbiamo visto che gli operatori suddetti sono autoaggiunti. Ora ne determineremo lo sviluppo spettrale e lo spettro. Cominciamo con l’operatore posizione X1 . Quanto diremo per esso vale anche per X2 e X3 , dato che la loro definizione `e completamente simmetrica scambiando i nomi degli operatori. Una PVM su R a valori in B(H) = B(L2 (R3 , dx)) si ottiene definendo: (P (E)ψ)(x1 , x2 , x3 ) = χE (x1 )ψ(x1 , x2 , x3 ) per ogni E ∈ B(R) e ogni ψ ∈ L2 (R3 , dx).
(9.58)
In questo modo si vede facilmente che, se ψ ∈ L2 (R3 , dx), la misura μψ su B(R) `e definita come: μψ (E) = |ψ(x1 , x2 , x3 )|2 dx per ogni E ∈ B(R), E×R2
conseguentemente, se g : R → C `e misurabile: g(y)dμψ (y) = f(x1 )ψ(x1 , x2, x3 )dx . R
(9.59)
E×R2
Procedendo similmente a quanto fatto in (2) in esempi 9.8, si verifica facilmen te che, se f : R → C `e misurabile e ψ ∈ Δf (cio`e R |f(x1 )ψ(x1 , x2 , x3 )|2 dx < +∞), allora
f(y)dP (y)ψ (x1 , x2 , x3) = f(x1 )ψ(x1 , x2 , x3 ) R
q.o. per (x1 , x2 , x3 ) ∈ R3 .
(9.60)
404
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Possiamo allora definire l’operatore autoaggiunto X1 come l’operatore associato, nello sviluppo (9.60), alla funzione f := f1 con f1 : R y → y. Tale operatore `e autoaggiunto per (b) del teorema 9.4, dato che questa funzione `e reale. Inoltre, per confronto con la (5.13) abbiamo immediatamente che Δf1 = D(X1 ) e, da (9.60) troviamo subito che: X1 ψ = X1 ψ
per ogni ψ ∈ D(X1 ).
Concludiamo, dall’unicit` a della misura spettrale sancita nel teorema di decomposizione spettrale 9.9, che (9.58) `e la misura spettrale associata all’operatore posizione X1 . Lo sviluppo spettrale di Xi , per i = 1, 2, 3, deve dunque essere:
(Xi ) ydP (y)ψ (x1 , x2 , x3 ) = (Xi ψ)(x1 , x2, x3 ) R
q.o. per (x1 , x2 , x3 ) ∈ R3 ,
(9.61)
dove: (P (Xi ) (E)ψ)(x1 , x2 , x3) = χE (xi )ψ(x1 , x2 , x3) ∀E ∈ B(R) e ∀ψ ∈ L2 (R3 , dx).
(9.62)
Questa misura spettrale consente di individuare lo spettro di Xi , per i = 1, 2, 3. Applicando (ii) in (b) del teorema 9.9, si trova immediatamente che: σ(Xi ) = σc(Xi ) = R .
(9.63)
Passiamo agli operatori impulso. La discussione `e abbastanza diretta in virt` u della proposizione 5.30, tenendo conto del fatto che la trasformata di FourierPlancherel `e una trasformazione unitaria. Prima di tutto, dato che le trasformazioni unitarie, conservano gli spettri degli operatori (vedi in esercizio 8.9), abbiamo immediatamente che (indicando gli operatori posizione con Ki come nella proposizione 5.30): σ(Pi ) = σ(Fˆ −1 Ki Fˆ ) = R = R , cio`e: σ(Pi ) = σc(Pi ) = R .
(9.64)
La misura spettrale di Pi deve dunque avere supporto su tutto R. Il lettore pu` o facilmente dimostrare che, in base alla proposizione 5.30, e tenendo conto degli esercizi 9.1-9.5, la PVM associata all’operatore impulso Pi `e semplicemente definita come P (Pi ) (E) = Fˆ −1 P (Ki ) Fˆ
per ogni E ∈ B(R)
(9.65)
dove P (Ki ) `e la misura spettrale dell’operatore posizione, ora indicato con Ki .
9.1 Teorema spettrale per operatori autoaggiunti non limitati
405
9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati e misure congiunte Per concludere presentiamo due teoremi connessi alla teoria delle misure spettrali per operatori autoaggiunti. Il seguente teorema di rappresentazione spettrale generalizza il teorema 8.38 al caso di un operatore autoaggiunto non limitato. I dettagli della dimostrazione sono lasciati per esercizio, dato che si tratta essenzialmente della stessa prova gi`a discussa per il teorema 8.38. Teorema 9.13. (Di rappresentazione spettrale per operatori autoaggiunti non limitati.) Siano H spazio di Hilbert e T : D(T ) → H operatore autoaggiunto in H e P (T ) la PVM di T secondo il teorema 9.9. ` possibile decomporre H come una somma diretta hilbertiana (definizio(a) E ne 8.36) H = ⊕α∈A Hα (con A al pi` u numerabile se H `e separabile), dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le propriet` a seguenti: (i) per ogni α ∈ A, vale T (Hα ) ⊂ Hα , (ii) per ogni α ∈ A esiste una misura di Borel positiva finita μα , su σ(T ) ⊂ R2 ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), μα ), tali che, se la funzione f : σ(T ) → C `e misurabile: Uα in particolare vale:
f(x)dP (T )(x)
σ(T )
Hα Uα−1 = f· ,
Uα T Hα Uα−1 = x· ,
dove f· `e l’operatore moltiplicativo per f su L2 (σ(T ), μα ): (f · g)(x) = f(x)g(x) q.o. su σ(T ) se g ∈ L2 (σ(T ), μα ) . (b) Vale: σ(T ) = supp{μα }α∈A , dove supp{μα }α∈A `e il complemento dell’insieme dei numeri λ ∈ R per cui esiste un aperto Aλ ⊂ R tale che Aλ λ e μα (Aλ ) = 0 per ogni α ∈ A. (c) Se H `e separabile, esistono uno spazio con misura (MT , ΣT , μT ), dove vale μT (MT ) < +∞, una funzione FT : MT → R, un operatore UT : H → L2 (MT , μT ) unitario, tali che: UT T UT−1 f (m) = FT (m)f(m) , per ogni f ∈ H. (9.66) Dimostrazione. La dimostrazione si ottiene seguendo la prova del teorema 8.38, per T autoaggiunto, ed in riferimento ad ogni spazio Hψ . A parte semplici riadattamenti, `e sufficiente rimpiazzare sistematicamente lo spazio Mb (σ(T )), delle funzioni misurabili limitate su σ(T ), con lo spazio L2 (σ(T ), μψ ).
406
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
L’ultimo teorema concerne la nozione di misura spettrale congiunta, detta anche joint spectral measure, di un insieme di operatori autoaggiunti con misure spettrali commutanti. Teorema 9.14. Sia A := {A1 , A2 , . . . , An } un insieme di operatori autoaggiunti (in generale non limitati) nello spazio di Hilbert H separabile e si supponga che le misure spettrali, P (Ak ) , rispettivamente associate agli operatori suddetti, commutino a due a due: P (Ak ) (E)P (Ah ) (E ) = P (Ah) (E )P (Ak ) (E) se E, E ∈ B(R) e h, k ∈ {1, 2, . . . , n}. Allora esiste un’unica PVM P (A) : B(Rn ) → B(H) tale che: P (A)(E (1) × · · · × E (n)) = P (A1) (E (1) ) · · · P (An) (E (n) ) se E (k) ∈ B(R) e k = 1, . . . , n.
(9.67)
(A)
`e detta misura spettrale congiunta di A1 , A2 , . . . , An e supp(P (A) ) P si dice spettro congiunto della classe di operatori A. Per ogni f : R → C Borel misurabile, vale l’identit` a: f(xk (x))dP (A) (x) = f(xk )dP (Ak ) (xk ) = f(Ak ) Rn
R
se k = 1, 2, . . ., n,
(9.68)
dove xk (x) `e la k-esima componente di x = (x1 , x2, . . . , xk . . . , xn ) ∈ R . n
Dimostrazione. Premettiamo due lemmi tecnici. Lemma 9.15. Sia H uno spazio di Hilbert separabile e {Pα }α∈A ⊂ P(H) una famiglia infinita di proiettori ortogonali tali che, se α, α ∈ A, vale Pα Pα = Pα Pα = Pβ per qualche β ∈ A dipendente da α, α . Se Ma := Pα (H), M := ∩α∈AMα e PM denota il proiettore ortogonale su M, valgono i fatti seguenti. (a) Esiste una sottofamiglia numerabile {Mαm }m∈N tale che: ∩m∈N Mαm = M. (b) (ψ|PM ψ) = inf α∈A (ψ|Pα ψ) per ogni ψ ∈ H. Dimostrazione. Proviamo (a). Vale H \ M = ∪α∈A(H \ Mα ), dove gli H \ Mα sono insiemi aperti che formano un ricoprimento di H \ M. Dato che H `e separabile, come spazio topologico `e uno spazio a base numerabile (vedi (2) in osservazioni 2.92, notando che la topologia di H `e la topologia indotta dalla distanza associata alla norma). Per il teorema 8.20, possiamo allora estrarre un sottoricoprimento numerabile: H \ M = ∪m∈N (H \ Mαm ). Prendendo i complementi rispetto a H ad ambo membri otteniamo (a). Passiamo a (b). Essendo M ⊂ Mα , per (a) in proposizione 7.18, vale PM ≤ PMα e, di conseguenza, (ψ|PM ψ) ≤ inf α∈A {(ψ|Pα ψ)} per ogni ψ ∈ H. D’altra parte, in base ad (a) tenendo conto della seconda equazione in (b) del teorema 7.20, abbiamo
9.1 Teorema spettrale per operatori autoaggiunti non limitati
407
che (ψ|PMψ) = limN→+∞ (ψ|Pα1 · · · PaN ψ) = limN→+∞ (ψ|PβN ψ), dove, per costruzione, vale che: 0 ≥ PβN ≥ PβN+1 , per per (a) in proposizione 7.18. Di conseguenza (ψ|PMψ) = inf N∈N (ψ|PβN ψ) ≥ inf α∈A {(ψ|Pα ψ)}. Dato che vale anche la disuguaglianza opposta, concludiamo che vale (b). Lemma 9.16. Se A `e un’algebra (vedi Appendice) di insiemi o una σ-algebra di insiemi, sottoinsiemi di X e M : A → P(H), con H spazio di Hilbert `e, un’applicazione a valori di proiezione che soddisfa le richieste (a), (c) e (d) (quest’ultima se ∪n Bn ∈ A , nel caso A sia un’algebra) della definizione 8.21, allora soddisfa anche (b) nella stessa definizione. Dimostrazione. Dalla propriet` a (d), se S1 , S2 ∈ A e S1 ∩ S2 = ∅ si ha subito che M (S1 ∪ S2 ) = M (S1 ) + M (S2 ). Moltiplicando membro a membro per M (S1 ∪ S2 ) = M (S1 ) + M (S2 ), e tenendo conto che stiamo lavorando con proiettori e che dunque sono idempotenti, si trova: M (S1 )M (S2 ) + M (S2 )M (S1 ) = 0 e quindi M (S1 )M (S2 ) = −M (S2 )M (S1 ); applicando M (S1 ) ad ambo membri e tenendo conto ancora di M (S1 )M (S2 ) = −M (S2 )M (S1 ), si ha M (S1 )M (S2 ) = M (S2 )M (S1 ). Concludiamo che, di conseguenza, M (S1 )M (S2 ) + M (S2 )M (S1 ) = 0 implica che M (S1 )M (S2 ) = 0 se S1 ∩ S2 = ∅. Se ora poniamo B = R ∩ S, T1 = R \ B, T2 = S \ B e teniamo conto del fatto che: T1 ∩ T2 = T1 ∩ B = T2 ∩ B = ∅, troviamo, per R, S ∈ A : M (R)M (S) = (M (T1 ) + M (B))(M (T2 ) + M (B)) = M (B)M (B) = M (B) = M (R ∩ S)
che `e la propriet` a (b) della definizione 8.21.
Prova della tesi del teorema. Si prova facilmente che la famiglia di unioni finite di prodotti E (1) × · · · × E (n) , con E (k) ∈ B(R) `e un’algebra di insiemi (vedi appendice), che indicheremo con B0 (Rn ), e che si ottiene la stessa algebra considerando unioni disgiunte e finite di prodotti suddetti (basta decomporre ulteriormente gli insiemi in caso di intersezioni non vuote). Si osservi ancora che la σ-algebra generata da B0 (Rn ) include le unioni numerabili di prodotti di palle aperte di R, dato che Rn `e a base numerabile, questo significa che tale σ-algebra include tutti gli aperti di Rn e quindi include la σ-algebra di Borel B(Rn ) e pertanto deve coincidere con essa. (1) (n) (1) (n) (1) Se S = ∪N ∈ B0 (Rn ) con (Ej × · · · × Ei ) ∩ (Ei × · · · × j=1 Ej × · · · × Ej (n)
Ej ) = ∅ per i = j, definiamo: Q(S) :=
N
(1)
(n)
P (A1 ) (Ej ) · · · P (An ) (Ej ) .
j=1 (k)
Tenendo conto che i P (Ak ) (Ej ) sono proiettori ortogonali e commutano a due a due, segue immediatamente che ogni Q(S) `e un proiettore orto` facile provare gonale e commuta con ogni altro Q(S ) dello stesso tipo. E
408
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
n n che B0 (R ) S → Q(S) soddisfa: Q(∅) = 0, Q(R ) = I ed esiste sn∈S Q(Sn ) ∈ P(H) quando Sk ∩ Sh = ∅ se h = k, e il risultato coincide con Q(∪k∈NSk ) se ∪k∈N Sk ∈ B0 (Rn ). Applicando il lemma 9.16 abbiamo che vale anche Q(S1 )Q(S2 ) = Q(S1 ∩ S2 ) se S1 , S2 ∈ B0 (Rn ). Se R ∈ B(Rn ) definiamo infine P (A) (R) come il proiettoreortogonale sull’intersezione degli spazi su cui proiettano tutti i proiettori k Q(Sk ), al variare di tutte le famiglie {Sk }k∈N ⊂ B0 (Rn ) tali che Sk ∩ Sh = ∅ se h = k e ∪n∈N Sk ⊃ R. Per costruzione P (A)(Rn ) = I: se ∪k∈NSk = Rn , per σn additivit` a, dato che R ∈ B0 (R ): k Q(Sk ) = Q(Rn ) = I che dunque proietta su H , conseguentemente P (Rn ) = I. Inoltre, applicando il lemma 9.15, se ψ ∈ H, allora:
(A) (ψ|P (R)ψ) = inf ψ Q(Sk )ψ Sk ⊃ R , {Sk }k∈N ⊂ B0 (Rn ) ,
k∈N
k∈N
Sk ∩ Sh = ∅ se k = h
.
Come conseguenza del teorema C.1, se ψ ∈ H, B(Rn ) E → (ψ|P (A)(R)ψ) definisce una misura positiva σ-additiva finita su B(Rn ) che `e l’unica estensione di B0 (Rn ) S → (ψ|Q(S)ψ). In altre parole `e l’unica misura σ-additiva (1) (n) (1) positiva νψ su B(Rn ) che soddisfa: νψ (Ej × · · · × Ej ) = (φ|P (A1) (Ej ) · · · (n)
a di polaP (An) (Ej )ψ) per ogni scelta degli E (k) ∈ B(R). Usando l’identit` rizzazione, abbiamo anche che, se ψ, φ ∈ H, allora B(Rn ) E → (ψ|P (R)φ) `e una misura complessa su B(Rn ). Conseguentemente, abbiamo anche che B(Rn ) E → P (R) soddisfa le richieste (a),(b),(c) e (d) della definizione di PVM (definizione 8.21). (a) vale perch´e P (A) (R) `e proiettore ortogonale, (c) vale per costruzione e (d) segue dalla σ-additivit` a di B(Rn ) E → (A) (ψ|P (R)φ). La propriet` a (b) segue infine dal lemma 9.16. Dall’identit` a P (A)(E (1) × · · · × E (n) ) = P (A1 ) (E (1)) · · · P (An ) (E (n)) segue immediatamente che, se Πk : Rn → R `e la proiezione canonica di Rn = R × · · · × R sul k-esimo fattore R, vale P (A) (Πk−1 (E (k))) = P (Ak ) (E (k) ) per ogni E (k) ∈ B(R). Allora, applicando (h) del teorema 9.4 usando φ := Πk e tenendo conto del teorema spettrale 9.9 per Ak , segue immediatamente che: f(Πk (x))dP (A) (x) = f(xk )dP (Ak ) (xk ) = f(Ak ) per k = 1, 2, . . . , n. Rn
R
Per concludere, osserviamo infine che ogni PVM P : B(R) → P(H) che soddisfa P (E (1) × · · · × E (n) ) = P (A1 ) (E (1)) · · · P (An ) (E (n)) per ogni scelta degli E (k) ∈ B(R) deve soddisfare (ψ|P (E (1) × · · · × E (n))ψ) = (ψ|P (A1 ) (E (1) ) · · · P (An) (E (n) )ψ), ma per quanto detto sopra sull’unicit` a delle misure positive che soddisfano questa identit` a, deve risultare (ψ|P (R)ψ) = (ψ|P (A)(R)ψ) per ogni R ∈ B(Rn ) e ogni ψ ∈ H. Quindi deve essere P (A) = P , dato che la precedente identit` a, dall’identit` a di polarizzazione, implica (ψ|P (R)φ) = (A) (ψ|P (R)φ) se ψ, φ ∈ H.
9.2 Esponenziale di operatori non limitati: vettori analitici
409
Una discussione piuttosto esaustiva delle varie propriet`a delle joint spectral measures e delle propriet`a degli integrali rispetto ad esse si trova in [Pru81].
9.2 Esponenziale di operatori non limitati: vettori analitici In questa breve sezione tecnica torniamo sulla nozione di vettore analitico, introdotta alla fine del capitolo 5, per precisarne ulteriori propriet` a alla luce dei risultati ottenuti. I risultati che otterremo saranno a loro volta adoperati in vari punti nel resto del libro. Una questione generale interessante `e la seguente. Se A `e un operatore autoaggiunto nello spazio di Hilbert H, l’esponenziale ezA pu` o essere definito come funzione dell’operatore A nel senso della definizione 9.10. Tuttavia ci si aspetta che, in qualche caso, definendo il primo membro con la definizione 9.10, si possa usare lo sviluppo di Taylor: ezA =
+∞ n=0
zn n A . n!
Se A ∈ B(H), l’identit` a scritta sopra vale effettivamente, interpretando lo sviluppo di Taylor nella topologia operatoriale uniforme, come si dimostra facilmente (esercizio 8.16). Se A non `e limitato, la questione `e pi` u sottile e l’identit` a scritta sopra non ha senso, interpretando la serie nella topologia uniforme. Come ha chiarito Nelson, ha comunque significato, nella topologia operatoriale forte, lavorando su un sottospazio denso dello spazio di Hilbert, che `e anche un core per A: lo spazio dei vettori analitici di A, come vedremo nella proposizione 9.18, unitamente ad altri risultati. Ricordiamo che (definizione 5.43), se A `e un operatore sullo spazio di Hilbert H con dominio D(A), un vettore ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), `e detto vettore C ∞ per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). ψ ∈ C ∞ (A) `e detto vettore analitico per A, se vale: +∞ n=0
||An ψ|| n t < +∞ , n!
per qualche t > 0.
(9.69)
Ricordiamo infine il teorema 5.46 di Nelson, che prova che un operatore simmetrico in uno spazio di Hilbert `e essenzialmente autoaggiunto se il suo dominio contiene un insieme di vettori analitici, le cui combinazioni lineari finite sono dense nello spazio di Hilbert. Notazione 9.17. Se A `e un operatore sullo spazio di Hilbert H con dominio D(A), nel seguito A (A) indicher` a il sottoinsieme di C ∞ (A) degli elementi che soddisfano (9.69).
410
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
La seguente proposizione riguarda alcune utili propriet`a elementari dei vettori analitici ed, in particolare, l’esponenziale di operatori (autoaggiunti) non limitati. Proposizione 9.18. Sia A operatore nello spazio di Hilbert H. Vale quanto segue. (a) A (A) `e uno spazio vettoriale. (b) Se A `e chiudibile allora: A (A) ⊂ A (A) . (c) (i) Per ogni c ∈ C, definendo A + cI sul suo dominio naturale, vale: A (A + cI) = A (A) . (ii) Per ogni c ∈ C \ {0}, definendo cA sul suo dominio naturale, vale: A (cA) = A (A) . (iii) Se A `e hermitiano, definendo A2 sul suo dominio naturale, vale: A (A2 ) ⊂ A (A) . (d) Se A `e autoaggiunto e ψ ∈ A (A) ∩ D(ezA ), interpretando ezA nel senso della definizione 9.10, vale: ezA ψ =
+∞ n z n A ψ n! n=0
per ogni z ∈ C con |z| ≤ t che verifica (9.69) per ψ .
(9.70) se Rez = 0, la (9.70) vale per ogni ψ ∈ A (A), se |z| ≤ t verifica (9.69) per ψ. (e) Se A `e autoaggiunto allora, interpretando ezA nel senso della definizione 9.10: eisA (A (A)) ⊂ A (A) per ogni s ∈ R. (f ) Se A `e autoaggiunto, allora D(A) contiene un sottoinsieme denso i cui elementi sono in A (p(A)) per ogni valore t > 0 in (9.69) e per ogni polinomio complesso (finito) p(A) dell’operatore A. Dimostrazione. (a). La tesi segue dalla maggiorazione, se ψ, φ ∈ A (A): ||An (aψ + bφ)|| ≤ |a| ||An ψ|| + |b| ||Anφ|| , scegliendo t > 0 abbastanza piccolo da accontentare sia ψ che φ in (9.69). (b). La tesi segue immediatamente dalle definizioni, tenendo conto che A `e n un’estensione di A e pertanto A `e un’estensione di An . (c). Per provare la prima propriet` a notiamo che, se t > 0 soddisfa (9.69) per ψ:
+∞ +∞ +∞ k
k
t A ψ |tc|p
tk Ak ψ
|tc| +∞ > M ≥ e = . k! p! k! p=0 k=0
k=0
9.2 Esponenziale di operatori non limitati: vettori analitici
411
Usando il teorema di Fubini-Tonelli per la misura prodotto delle due misure che contano i punti di N, possiamo calcolare il prodotto delle due serie che appare in fondo (interpretato come un integrale nella misura prodotto), come l’integrale doppio iterato, che appare sotto dopo M :
n
n +∞ +∞ |tc|n−k
tk Ak ψ
tn
n!cn−k Ak ψ
M ≥ ≥
(n − k)! k! n!
k!(n − k)!
n=0 k=0
n=0
=
k=0
+∞ n n=0
t ||(A + cI)n ψ|| . n!
Quanto ottenuto dimostra che A (A+cI) ⊃ A (A). Definiamo ora A := A+cI, per cui A = A + c I con c = −c. In base a quanto provato: A (A + c I) ⊃ A (A ): Ma questo equivale a A (A) ⊃ A (A+cI) e quindi A (A) = A (A+cI). La propriet` a (ii) `e ovvia per definizione. Passiamo a (iii). Si osservi prima di tutto che, √ per costruzione C ∞ (A) = C ∞ (A2 ). Inoltre, essendo A hermitiano e valendo x ≤ 1 + x per x ≥ 0, deve essere, su C ∞ (A): ||An ψ|| = (ψ|A2n ψ) ≤ ||ψ|| ||A2n ψ|| ≤ ||ψ||(1 + ||(A2 )n ψ||) . La tesi `e allora vera dato che, per t > 0, +∞ n n=0
+∞ +∞ tn tn t ||An ψ|| ≤ ||ψ|| ||(A2 )n ψ|| + ||ψ|| n! n! n! n=0 n=0
=
+∞ tn 2 n t . ||ψ|| ||(A ) ψ|| + e n! n=0
(d) Per un φ ∈ H, μφ,ψ `e la misura complessa μφ,ψ (E) := φ|P (A)(E)ψ e, per ogni χ ∈ H, μχ (E) := χ|P (A)(E)χ `e la solita misura spettrale positiva finita. Usando la decomposizione (vedi esempi 2.58) dμφ,ψ = hd|μφ,ψ | con |h| = 1 ovunque, si ha subito che, se ψ ∈ D(f(A)), allora:
f d|μφ,ψ | = fh dμφ,ψ = φ fh dP (A)ψ
R
R
R
!
|f|2 dμψ . ≤ ||φ||
fh dP (A)ψ
= ||φ|| R
R
Se z ∈ C e |z| ≤ t allora, usando il lemma 9.2 ed (e) del teorema 9.4:
n +∞ +∞ n
z n
z
x d|μφ,ψ (x)| =
|xn |d|μφ,ψ(x)|
n!
n! σ(A) σ(A) n=0 n=0 1/2 +∞ +∞ n t tn 2n ||φ|| x dμψ (x) = ||φ|| ||An ψ|| < +∞ , ≤ n! n! σ(A) n=0 n=0
412
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
dove abbiamo usato la (9.69) nell’ultimo passaggio. Conseguentemente, Il teorema di Fubini-Tonelli implica che, se |z| ≤ t, possiamo scambiare il simbolo di serie con quello di integrale in:
+∞ n z n x dμφ,ψ (x) . σ(A) n=0 n!
Allora, se |z| ≤ t e se ψ appartiene al dominio di ezA (cfr definizione 9.10) e valendo (e) nel teorema 9.4, si ha subito: (φ|ezA ψ) =
ezx dμφ,ψ =
σ(A)
=
+∞ n z n x dμφ,ψ σ(A) n=0 n!
+∞ n +∞ n z z (φ|An ψ) . xn dμφ,ψ = n! n! σ(A) n=0 n=0
Dato che in virt` u di (9.69) la serie: +∞ n z n A ψ n! n=0
converge in H ed il prodotto scalare `e continuo, l’identit` a ottenuta sopra pu` o essere trascritta come: +∞
z n
zA n (φ|e ψ) = φ A ψ .
n! n=0 Per l’arbitrariet` a di φ questa equivale a (9.70). Nel caso in cui Rez = 0, cio`e z = is e s ∈ R, la funzione R x → eisx `e banalmente limitata e pertanto eisA ∈ B(H) (quindi con dominio dato da tutto H) per il corollario 9.5. (e). Se A `e autoaggiunto, da (c) di teorema 9.4 segue subito che, se s ∈ R, eisA(eisA )∗ = (eisA)∗ eisA = I, per cui eisA `e unitario. Usando (c) del teorema 9.4, segue immediatamente che se ψ ∈ C ∞ (A) ⊂ C ∞ (A) e An eisA ψ = eisAAn ψ, ma, dato che eisA `e unitario ||eisAAn ψ|| = ||An ψ|| da cui segue immediatamente la tesi. (f). Consideriamo la decomposizione spettrale A = R xdP (A)(x), quindi decomponiamo la retta reale R = ∪n∈Z (n, n + 1] ed infine consideriamo i sottospazi chiusi, a due a due ortogonali, Hn = Pn (H), dove abbiamo definito i proiettori ortogonali: Pn := (n,n+1] 1dP (A)(x). Scegliendo una base hilber(n)
tiana {ψk }k∈Kn ⊂ Hn per ogni n, l’unione di tali base forma ovviamente una base hilbertiana di H. Si osservi che supp(μψ(n) ) ⊂ (n, n + 1] come sek gue subito dalla definizione di μφ (teorema 8.30). Da (e) del teorema 9.4, (n) segue che ogni vettore ψk appartiene a D(A) essendo R |x|2dμψ(n) (x) = k |x|2 dμψ(n) (x) ≤ |n + 1|2 ed `e banalmente soddisfa (9.69) per ogni (n,n+1] k
9.3 Gruppi unitari a un parametro fortemente continui
(n)
413
(n)
t > 0, dato che ||Am ψk ||2 = (n,n+1] |x|2mdμψ(n) (x) ≤ |n + 1|2m||ψk ||2 . Le k combinazioni lineari finite di tali vettori sono, per costruzione, un sottospazio vettoriale denso in H, e sono anche vettori analitici per A (per ogni t > 0) in virt` u di (a). Consideriamo ora Nun polinomio di grado N a coefficienti generalmente complessi, pN (x) = k=0 xn , e definiamo pN (A) sul dominio D(pN (A)) = D(AN ) (n) ((d) di teorema 9.4). Vogliamo verificare che ciascuno dei vettori ψk determinati sopra `e un vettore analitico per l’operatore chiuso (autoaggiunto se pN `e reale) pN (A) per il teorema 9.4. Scegliamo uno dei vettori suddetti, di norma unitaria, che indicheremo con ψ, e supponiamo che la sua misura spettrale μψ abbia supporto in qualche intervallo finito (−L, L]. Abbiamo allora che ||Ak ψ|| ≤ Lk ||ψ|| = Lk come detto sopra. Conseguentemente:
N N N
k
ak A ψ ≤ |ak |||Ak ψ|| = |ak |Lk . ||pN (A)ψ|| =
k=0
k=0
k=0
Con la stessa procedura troviamo:
N
||pN (A)n ψ|| =
ak1 · · · akn Ak1 +···+kn ψ
k1 ,...,kn =0
≤
N
k1+···+kn
|ak1 | · · · |akn |||A
ψ|| ≤
k1 ,...,kn =0
N
|ak1 | · · · |akn |Lk1+···+kn .
k1 ,...,kn =0
Concludiamo che, se ML :=
N
k k=0 |ak |L ,
||pN (A)n ψ|| ≤ MLn
e
allora deve essere:
+∞ n t ||pN (A)n ψ|| ≤ etML n! n=0
e pertanto ψ (ma anche, per (a), ogni combinazione lineare di tali vettori) `e un vettore analitico per pN (A) per ogni valore di t > 0.
9.3 Gruppi unitari a un parametro fortemente continui Il fine di questa sezione `e la dimostrazione del teorema di Stone, che `e uno dei teoremi pi` u importanti per le applicazioni in meccanica quantistica (e non solo). Per enunciarlo discuteremo qualche risultato preliminare sui gruppi ad un parametro di operatori unitari ed, in particolare, un importante teorema di von Neumann. Discuteremo anche qualche utile propriet` a dei gruppi unitari ad un parametro in relazione alla continuit` a.
414
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
9.3.1 Gruppi unitari a un parametro fortemente continui, teorema di von Neumann Definizione 9.19. Sia H `e spazio di Hilbert. Una classe {Ut }t∈R ⊂ B(H) `e detta gruppo ad un parametro (di operatori) in H se vale U0 = I
e
Ut Us = Ut+s per ogni coppia t, s ∈ R .
(9.71)
Un gruppo ad un parametro {Ut }t∈R ⊂ B(H) `e detto: (a) gruppo unitario ad un parametro se Ut `e unitario per ogni t ∈ R, (b) debolmente continuo in t0 ∈ R oppure fortemente continuo in t0 ∈ R se l’applicazione t → Ut `e continua in t0 nella topologia operatoriale debole o, rispettivamente, in quella operatoriale forte, dotando R della topologia standard; (c) debolmente continuo oppure fortemente continuo se `e rispettivamente tale in ogni punto di R. Dalla condizione (9.71), se gli operatori Ut sono unitari, si ha: (Ut )∗ = Ut−1 = U−t ,
per ogni t ∈ R .
(9.72)
Proposizione 9.20. Sia {Ut }t∈R un gruppo unitario ad un parametro nello spazio di Hilbert (H, (·|·)). I seguenti fatti sono equivalenti. (a) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. (b) {Ut }t∈R `e debolmente continuo in t = 0. (c) {Ut }t∈R `e debolmente continuo. (d) {Ut }t∈R `e fortemente continuo in t = 0. (e) {Ut }t∈R `e fortemente continuo. Dimostrazione. Prima di tutto rietichettiamo come segue le proposizioni precedenti. (1) {Ut }t∈R `e debolmente continuo in t = 0. (2) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. (3) {Ut }t∈R `e fortemente continuo in t = 0. (4) {Ut }t∈R `e fortemente continuo. (5) {Ut }t∈R `e debolmente continuo. Infine mostriamo che (1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (5) ⇒ (1). (1) ⇒ (2) e (2) ⇒ (3). La continuit` a per t = 0 nella topologia debole implica in particolare che, se t → 0, allora (ψ|Ut ψ) → (ψ|U0 ψ) = (ψ|ψ) ed anche, prendendo il complesso coniugato, (Ut ψ|ψ) → (U0 ψ|ψ) = (ψ|ψ). Viceversa, la continuit`a forte in t = 0 equivale a dire che, per ogni ψ ∈ H, se t → 0: ||Ut ψ − U0 ψ|| → 0 . Ricordando che U0 = I, prendendo il quadrato ed esprimendo la norma in termine del prodotto scalare, tale identit`a equivale a: (Ut ψ|Ut ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ|ψ) → 0 .
9.3 Gruppi unitari a un parametro fortemente continui
415
La condizione di unitariet` a per Ut implica che (Ut ψ|Ut ψ) = (ψ, ψ), da cui, l’identit` a di sopra si pu` o ancora riscrivere come: (ψ|ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ, ψ) → 0 ,
se t → 0 .
Come precisato all’inizio della dimostrazione, questa identit`a `e banalmente verificata nelle nostre ipotesi. (3) ⇒ (4). Se ψ ∈ H, vale: Ut ψ − Ut0 ψ = Ut (ψ − Ut−1 Ut0 ψ) = Ut (ψ − Ut0 −t ψ) , dove abbiamo sfruttato l’identit` a (9.72). In definitiva, usando il fatto che Ut `e unitario, per ogni ψ ∈ H troviamo: ||Us ψ − Ut0 ψ|| = ||Us (ψ − Ut0 −s ψ)|| = ||ψ − Ut0 −s ψ|| . Nelle ipotesi di forte continuit`a in t = 0, tenendo conto che t0 − s → 0 per s → t0 si ha che ||Us ψ − Ut0 ψ|| → 0. Quindi la continuit` a forte per t = 0 implica la continuit`a forte per ogni t0 ∈ R. ` ovvia dal fatto che la convergenza nella topologia forte implica (4) ⇒ (5). E quella nella topologia debole. ` banalmente vera per definizione. (5) ⇒ (1). E Un’altra utile propriet` a dei gruppi unitari ad un parametro `e la seguente. Proposizione 9.21. Sia {Ut }t∈R un gruppo unitario ad un parametro nello spazio di Hilbert (H, (·|·)). Sia H ⊂ H un sottoinsieme tale che: (a) lo spazio < H > finitamente generato da H `e denso in H, (b) {Ut }t∈R soddisfa (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H, allora {Ut }t∈R `e un gruppo unitario ad un parametro fortemente continuo. Dimostrazione. Usando la stessa dimostrazione fatta per la proposizione 9.20, si ha subito che (φ0 |Ut φ0 ) → (φ0 |φ0 ) per t → 0 con φ0 ∈ H, implica che ||Ut φ0 −φ0 || → 0 per t → 0. Se pi` u in generale φ ∈< H > allora φ = i∈I ci φ0i dove I `e finito e φ0i ∈ H. Di conseguenza, se t → 0,
ci φ0i − ci φ0i
=
ci (Ut φ0i − φ0i )
||Ut φ − φ|| =
Ut
i
≤
i
i
|ci |||Ut φ0i − φ0i || → 0 .
i
Per la proposizione 9.20, per dimostrare la tesi `e allora sufficiente estendere il risultato a tutto H. Dobbiamo cio`e provare che ||Ut φ − φ|| → 0 per t → 0 per ogni φ ∈< H > implica ||Ut ψ − ψ|| → 0 se t → 0 per ogni ψ ∈ H. Dato che < H > `e denso, per ogni ψ ∈ H fissato, esister`a una successione {ψn }n∈N ⊂ H con ψn → φ se n → +∞. Se {tm }m∈N `e una successione di
416
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
reali che tende a 0, vale allora, dalla disuguaglianza triangolare e per n ∈ N fissato: ||Utm ψ − ψ|| ≤ ||Utm ψ − Utm φn || + ||Utm φn − φn || + ||φn − ψ|| . Ossia, tenendo conto che gli Utm sono unitari e che la norma `e non negativa: 0 ≤ ||Utm ψ − ψ|| ≤ ||Utm φn − φn || + 2||φn − ψ|| .
(9.73)
Per n fisso, am := ||Utm φn − φn || → 0 se m → +∞ per ipotesi, per cui: lim sup ||Utm φn − φn || = lim inf ||Utm φn − φn || = m
m
lim ||Utm φn − φn || = 0 .
m→+∞
Di conseguenza, dalla disuguaglianza (9.73) abbiamo che, per ogni n ∈ N: 0 ≤ lim sup ||Utm ψ − ψ|| ≤ 2||φn − ψ|| , 0 ≤ lim inf ||Utm ψ − ψ|| ≤ 2||φn − ψ|| . m
m
D’altra parte, prendendo n sufficientemente grande, possiamo rendere piccolo a piacere ||φn − ψ||. Concludiamo che: lim sup ||Utm ψ − ψ|| = lim inf ||Utm ψ − ψ|| = 0 , m
m
per cui esiste: lim ||Utm ψ − ψ|| = 0 .
m→+∞
Dato che ψ ∈ H e la successione {tm }m∈N con tm → 0 erano arbitrari, concludiamo che, per ogni ψ ∈ H: lim ||Ut ψ − ψ|| = 0 .
t→0
La dimostrazione `e terminata.
La teoria fino ad ora dimostrata consente di provate un importante risultato, dovuto a von Neumann, che mostra come la continuit` a forte dei gruppi unitari ad un parametro sia effettivamente molto debole negli spazi di Hilbert separabili. Teorema 9.22. (Di von Neumann.) Sia {Ut }t∈R un gruppo unitario ad un parametro nello spazio di Hilbert (H, (·|·)). Se H `e separabile, {Ut }t∈R `e fortemente continuo se e solo se la funzione R t → (Ut ψ|φ) `e Borel misurabile per ogni scelta di ψ, φ ∈ H. Dimostrazione. Ovviamente se il gruppo `e fortemente continuo allora ogni funzione R t → (Ut ψ|φ) `e Borel misurabile essendo continua. Mostriamo che vale il viceversa. Assumiamo che ognuna delle funzioni suddette sia Borel misurabile. Di conseguenza sar` a Lebesgue misurabile. Dalla disuguaglianza di
9.3 Gruppi unitari a un parametro fortemente continui
417
Schwarz e da ||Ut || = 1 concludiamo che tali funzioni sono anche limitate. Pertanto, se a ∈ R e e ψ ∈ H sono fissati: a H φ → (Ut ψ|φ)dt 0
`e un funzionale lineare limitato con norma non superiore a |a| ||ψ|| per la disuguaglianza di Schwarz e ||Ut || = 1. Per il teorema 3.17 di Riesz esiste ψa ∈ H tale che: a (Ut ψ|φ)dt , per ogni φ ∈ H. (ψa |φ) = 0
Possiamo allora scrivere che:
(Ub ψa |φ) = (ψa |U−b φ) =
a
= 0
(Ut+b ψ|φ)dt =
0
a
(Ut ψ|U−b φ)dt
a+b
(Ut ψ|φ)dt . b
Quindi, spezzando l’integrale in modo ovvio:
a
a+b
(Ut ψ|φ)dt − (Ut ψ|φ)dt |(Ub ψa |φ) − (ψa |φ)| =
b
0
0
=
(Ut ψ|φ)dt
+
b
a
a+b
(Ut ψ|φ)dt ≤ 2b||φ|| ||ψ||.
Di conseguenza: (Ub ψa |φ) → (ψa |φ) se b → 0 e pertanto, prendendo il complesso coniugato di ambo membri: lim (φ | Ub ψa ) → (φ | ψa ) .
t→0
Se riusciamo a provare che l’insieme dei vettori {ψa | ψ ∈ H, a ∈ R} genera finitamente un sottospazio denso in H, in base alla proposizione precedente e scegliendo φ = ψa , possiamo concludere che il gruppo unitario `e fortemente continuo. Sia φ ∈ {ψa | ψ ∈ H, a ∈ R}⊥ e sia {ψ(n) }n∈N una base hilbertiana numerabile per H, che esiste in quanto H `e separabile. Allora, per ogni n ∈ N, vale: a 0 = (ψa(n) |φ) = (Ut ψ(n) |φ)dt per ogni a ∈ R , 0
che (vedi (b) nel teorema C.6) implica che R t → (Ut ψ(n) |φ) sia nulla quasi ovunque.4Sia Sn ⊂ R l’insieme su cui la funzione non 4 si annulla e si fissi t0 ∈ R \ n∈N Sn . Si osservi che t0 esiste dato che n∈N Sn non pu` o coincidere con R avendo misura nulla essendo unione numerabile di insiemi di misura nulla (in questo punto si usa la richiesta che la base hilbertiana sia
418
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
numerabile e cio`e H sia separabile). Deve allora essere (Ut0 ψ(n) |φ) = 0 per ogni n che implica che φ = 0, dato che Ut0 `e unitario e quindi {Ut0 ψ(n) }n∈N `e ancora base hilbertiana. Essendo {ψa | ψ ∈ H, a ∈ R}⊥ = {0}, lo spazio generato da {ψa | ψ ∈ H, a ∈ R} `e denso come richiesto e ci`o conclude la dimostrazione. Osservazione 9.23. Nel teorema si pu`o sostituire la richiesta di Borel misurabilit` a con la misurabilit` a rispetto alla σ-algebra di Lebesgue. Infatti, se vale la Lebesgue misurabilit` a, la dimostrazione non cambia e mostra che il gruppo `e fortemente continuo. Se il gruppo `e fortemente continuo allora vale la Borel misurabilit` a, e quindi anche la Lebesgue-misurabilit`a, delle funzioni nell’enunciato del teorema. 9.3.2 Gruppi unitari a un parametro generati da operatori autoaggiunti e teorema di Stone In questa sezione enunceremo e proveremo il celebre teorema di Stone, che caratterizza i gruppi unitari ad un parametro fortemente continui, provando che si possono sempre ottenere esponenziando operatori autoaggiunti. Useremo successivamente tali tipi di gruppi per dare una condizione necessaria e sufficiente per la commutativit`a delle misure spettrali di operatori autoaggiunti. Abbiamo bisogno di un risultato tecnico preliminare che enunciamo separatamente visto che si tratta di una costruzione utile in vari contesti. Nell’enunciato, come al solito, dx `e la misura di Lebesgue su Rn e χ[a,b] `e la funzione caratteristica di [a, b]. Proposizione 9.24. Sia H spazio di Hilbert complesso e {Vt }t∈Rn ⊂ B(H) una classe di operatori che soddisfi le due seguenti condizioni: (i) valga s-limt→t0 Vt = Vt0 , per ogni t0 ∈ Rn , (ii) esista C ≥ 0 tale che ||Vt || ≤ C per ogni t ∈ Rn . 1 n Allora, per ogni f ∈ L (R , dx) esiste un unico operatore in B(H), indicato con Rn f(t)Vt dt, tale che:
φ
Rn
f(t)Vt dt ψ
= Rn
f(t) (φ|Vt ψ) dt
per ogni φ, ψ ∈ H.
(9.74)
compatto, la validit` a della sola Se f ∈ L1 (Rn , dx) ha supporto (essenziale) condizione (i) assicura l’esistenza di Rn f(t)Vt dt suddetto. Tale operatore soddisfa in ogni caso le propriet` a seguenti. (a) per ogni ψ ∈ H:
Rn
f(t)Vt dtψ
≤
Rn
|f(t)| ||Vt ψ|| dt .
(9.75)
9.3 Gruppi unitari a un parametro fortemente continui
(b) Se A ∈ B(H): A f(t)Vt dt = Rn
f(t)AVt dt
Rn
e Rn
419
f(t)Vt dtA =
Rn
f(t)Vt Adt .
(9.76) (c) Se, per n = 1, definiamo s f(τ )Vτ dτ := R g(τ )f(τ )Vτ dτ dove g = χ[s,t] se s ≥ t e g = −χ[t,s] se t ≤ s allora:
t
(i) R2 (s, t) →
t
f(τ )Vτ dτ s
(ii) se f `e continua, allora
`e continua nella topologia uniforme, d t f(τ )Vτ dτ = f(t)Vt ∀s, t ∈ R . sdt s (9.77)
Dimostrazione. Siano ψ, φ ∈ H e f : Rn → C una funzione in L1 (Rn , dx). Consideriamo l’integrale: I(φ, ψ) := f(t) (φ|Vt ψ) dt . Rn
Tale integrale `e ben definito, dato che Rn t → (φ|Vt ψ) `e continua essendo {Vt }t∈Rn debolmente continuo ed `e limitata per (ii) dalla disuguaglianza di Schwarz. Da ci` o segue banalmente che: |I(φ, ψ)| ≤ ||f||1C||ψ||||φ|| . Dato che H ψ → I(φ, ψ) `e lineare e vale la disuguaglianza scritta sopra, l’applicazione diretta del teorema di Riesz prova che, per ogni φ ∈ H esiste un unico vettore Φφ ∈ H che soddisfa: I(φ, ψ) = (Φφ |ψ) ,
per ogni ψ ∈ H.
Si verifica subito che l’applicazione H φ → T φ := Φφ `e lineare, inoltre, per costruzione vale: |(ψ|T φ)| = |(T φ|ψ)| = |(Φφ|ψ)| = |I(φ, ψ)| ≤ ||f||1 C||ψ||||φ|| ,
se φ, ψ ∈ H.
Scegliendo ψ = T φ si ha subito che T `e limitato e quindi lo `e il suo aggiunto che indichiamo con Rn f(t)Vt dt. Per costruzione vale allora (9.74) e la procedura assicura l’unicit`a dell’operatore costruito. Dall (9.74) si ha anche:
φ
f(t)V dt ψ ≤ |f(t)| |(φ|V ψ)| dt ≤ |f(t)| ||Vt ψ|| dt ||φ|| t t
Rn
Rn
Rn
a (9.76) e quindi, scegliendo φ = Rn f(t)Vt dtψ si arriva alla (9.75). L’identit` segue facilmente dalla (9.74). Nel caso in cui il supporto essenziale di f sia incluso in un compatto K si pu` o, equivalentemente, definire I(ψ, φ) integrando
420
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
su tale insieme e procedere con il resto della dimostrazione come fatto sopra. In tal caso, l’esistenza della costante C in (ii) (con t ∈ K) `e automaticamente garantita. Infatti, per continuit` a, comunque scegliamo ψ ∈ H, esiste Cψ ≥ 0 tale che ||Vt ψ|| ≤ Cψ se t ∈ K. Per il teorema di Banach-Steinhaus questo implica che esiste C ≥ 0 tale che ||Vt|| ≤ C se t ∈ K. Passiamo a provare (c). Sia [a, b] grande a sufficienza in modo che [a, b] × [a, b] includa un intorno aperto di (t, s) e (t , s ) appartenga a tale intorno. Da (a) segue facilmente che:
s
s
f(τ )V (τ )dτ ψ − f(τ )V (τ )dτ ψ
t
t ≤ (|t − t | + |s − s |) sup |f(τ )| sup ||Vτ ψ|| . τ∈[a,b]
τ∈[a,b]
Prendendo l’estremo superiore su ||ψ|| ≤ 1, tenendo conto che ||Vτ || ≤ C < s s t s s +∞ se τ ∈ [a, b] come osservato sopra, ed essendo t − t = t + t − t = t s + s , vale: t
s
s
f(τ )V (τ )dτ − f(τ )V (τ )dτ
≤ (|t − t | + |s − s |) sup |f(τ )|C ,
t τ∈[a,b] t da cui la continuit` a nella topologia uniforme. Riguardo alla seconda propriet` a, notiamo che, dalla continuit` a in senso forte della funzione t → f(t)Vt , nel caso in cui h → 0 vale:
" #
1 τ+h
1
τ+h
f(t)Vt dt ψ − f(τ )Vτ ψ
=
(f(t)Vt − f(τ )Vτ )dt ψ
h τ
h τ
≤
τ+h dt
τ |h| =
sup |t −τ|≤h
sup |t −τ|≤h
||f(t )Vt ψ − f(τ )Vτ ψ||
||f(t )Vt ψ − f(τ )Vτ ψ|| → 0 .
Ecco il teorema di Stone. In realt`a il risultato dovuto a Stone nel teorema seguente `e la parte (b), che `e la meno banale dell’enunciato. Teorema 9.25. (Di Stone.) Sia H uno spazio di Hilbert. Vale quanto segue. (a) Se A : D(A) → H, con D(A) denso in H, `e un operatore autoaggiunto e P (A) `e la sua misura spettrale, gli operatori: eiλt dP (A)(λ) con t ∈ R , Ut = eitA := σ(A)
costituiscono un gruppo unitario ad un parametro fortemente continuo. Inoltre:
9.3 Gruppi unitari a un parametro fortemente continui
421
(i ) esiste in H il limite: s-
Ut ψ − ψ dUt
ψ := lim t→0 dt t=0 t
(9.78)
se e solo se ψ ∈ D(A), (ii ) se ψ ∈ D(A) vale:
dUt
ψ = iAψ . sdt t=0
(9.79)
(b) Se {Ut }t∈R `e un gruppo unitario ad un parametro fortemente continuo in H esiste, ed `e unico, un operatore autoaggiunto A : D(A) → H (con D(A) denso in H) tale che: eitA = Ut ,
per ogni t ∈ R.
(9.80)
Dimostrazione. (a). Se t ∈ R, R λ → eitλ `e banalmente limitata e quindi vale eitA ∈ B(H) per il corollario 9.5. Da (c) di teorema 9.4 segue subito che (con t ∈ R): eitA (eitA )∗ = (eitA )∗ eitA = I, per cui eitA `e unitario. Per provare che il gruppo `e fortemente continuo `e sufficiente verificare che (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H, in virt` u della proposizione 9.20. Questo fatto `e vero dato che, per (f) del teorema 9.4, tenendo conto che il dominio di eitA `e tutto H: (ψ|Ut ψ) = eitλ dμψ (λ) → 1dμψ (λ) = (ψ|ψ) per t → 0 . σ(A)
σ(A)
Sopra abbiamo tenuto conto del fatto che eitλ → 1 e quindi possiamo applicare il teorema della convergenza dominata di Lebesgue, dato che |eitλ | = 1 per ogni t e la funzione che vale costantemente 1 `e integrabile perch´e μψ `e finita. Passiamo ora a provare le propriet`a (i) e (ii). Se ψ ∈ D(A), allora usando (c) del teorema 9.4, si calcola facilmente:
iλt
2
2
Ut − I
e − 1
=
dμψ (λ) . ψ − iAψ − iλ
t
t σ(A)
(9.81)
D’altra parte: |eiλt − 1| = 2| sin(λt/2)| ≤ |λt| e quindi:
iλt
2
e − 1
− iλ
≤ 4|λ|2 .
t La funzione R λ → |λ|2 `e integrabile rispetto a μψ per definizione di D(A) ψ. Infine:
iλt
2
e − 1
→ 0 se t → 0 per ogni λ ∈ R. − iλ
t
422
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Possiamo allora applicare il teorema della convergenza dominata al secondo membro di (9.81) ottenendo che:
Ut − I
→ 0 se t → 0 per ogni ψ ∈ D(A). ψ − iAψ
t
Per concludere la prova di (i) e (ii), mostriamo che se Ut ψ−ψ → φψ ∈ H, per t t → 0, allora ψ ∈ D(A). Si verifica subito che l’insieme dei vettori ψ ∈ H per cui esiste il limite suddetto formano un sottospazio D(B) di H che contiene, ovviamente, D(A) ed `e quindi denso. L’applicazione ψ → iBψ := φψ definisce un operatore con dominio D(B) denso. Se ψ, ψ ∈ D(B) vale, usando il fatto che Ut∗ = U−t :
Ut ψ − ψ
Ut ψ − ψ = −i lim ψ
(ψ|Bψ ) = ψ
−i lim t→0 t→0 t t
U−t ψ − ψ
U−t ψ − ψ
= −i lim lim
ψ = −i t→0
ψ = (Bψ|ψ ) . t→0 t −t Concludiamo che B `e un’estensione simmetrica di A. Tuttavia, dato che A `e autoaggiunto deve essere B = A per (d) di proposizione 5.16 e quindi ogni vettore ψ per cui esiste il limite di Ut ψ−ψ per t → 0 deve appartenere a D(A). t Questo conclude la dimostrazione di (a). (b). Cominciamo a notare che la prova dell’unicit` a di A `e immediata. Se ci sono due operatori autoaggiunti A e A con eitA = Ut = eitA per ogni t ∈ R, in base a (i) e (ii) di (a), deve risultare A = A . Costruiamo ora un operatore autoaggiunto A che soddisfi Ut = eitA per un fissato gruppo unitario ad un parametro fortemente continuo. Specializziamo la situazione discussa nella proposizione 9.24 al caso Vt = Ut gruppo unitario ad un parametro fortemente continuo. Indichiamo con arding, lo spazio vettoriale D, detto spazio di G˚ dei vettori della forma R f(t)Ut dtφ con φ ∈ H con un’arbitraria f ∈ D(R) (spazio delle funzioni su R complesse, infinitamente differenziabili, a supporto compatto). Dalla (9.74) segue facilmente la propriet` a di invarianza Us D ⊂ D per ogni s ∈ R, pi` u precisamente vale: Us f(t)Ut dtψ = f(t)Ut+s dtψ = f(t − s)Ut dtψ per ogni ψ ∈ H. R
R
R
(9.82) Ut ψ−ψ Mostriamo che, se ψ ∈ D allora → ψ ∈ H se t → 0. Supponiamo che 0 t ψ = f(t)U dtφ. Con qualche passaggio, usando (9.82) e la definizione di t R f(t)U dtφ, si vede che: t R
2
Ut ψ − ψ
− f (s)Us dsφ
t R
f(s − t) − f(s) f(r − t) − f(r) = − f (s) Us dsφ
− f (r) Ur drφ t t R R
9.3 Gruppi unitari a un parametro fortemente continui
423
=
ds R
R
drht (s)ht (r) (φ|Ur−s φ) ,
dove
f(s − t) − f(s) − f (s) . t Si osservi che, per ogni t ∈ R, la funzione s → ht (s) ha supporto in un compatto ed `e C ∞ (ed `e quindi limitata). Dato che (r, s) → (φ|Ur−s φ) `e anch’essa una funzione limitata, concludiamo che possiamo interpretare l’integrale di sopra nella misura di Lebesgue prodotto:
2
Ut ψ − ψ
− f (t)Ut dtφ
= dsdrht (s)ht (r) (φ|Ur−s φ) . (9.83)
t R R×R ht (s) :=
Dato che l’integrando tende a 0 puntualmente se t → 0 e che le funzioni (s, r) → ht (s)ht (r) (φ|Ur−s φ) hanno supporto contenuto in un unico compatto abbastanza grande quando t varia in un intervallo limitato attorno a 0 e che ivi sono uniformemente limitate da qualche costante indipendente da t (questo segue dal fatto che la funzione (t, s, r) → ht (s)ht (r) (φ|Ur−s φ) `e continua congiuntamente in tutte le variabili), possiamo applicare il teorema della convergenza dominata, ottenendo che entrambi i membri di (9.83) svaniscono per t → 0. Abbiamo ottenuto che, se ψ ∈ D, allora vale Ut ψ−ψ → ψ0 ∈ H per t → 0. L’applicazione ψ → iSψ := ψ0 t `e lineare come si dimostra facilmente. Procedendo come nella dimostrazione di (a), si verifica facilmente che S `e hermitiano. In realt`a S `e simmetrico dato che D `edenso, come ora verifichiamo. Se φ ∈ H si consideri la successione di vettori R fn (t)Ut dtφ, dove le funzioni fn ∈ D(R) soddisfano: fn ≥ 0, supp fn ⊂ [−1/n, 1/n] e R fn (s)ds = 1. Abbiamo che
fn Ut dtψ − ψ
=
fn Ut dtψ −
fn dtψ
=
fn (Ut − I)dtψ
R
R
R
≤
R
|fn (t)| ||(Ut − I)ψ|| dt
R
dove abbiamo usato (9.75) per la classe di operatori Vt = Ut − I. Dato che: 1/n |fn (t)| ||(Ut − I)ψ|| dt ≤ |fn (t)| dt sup ||(Ut − I)ψ|| R
−1/n
=
sup
t∈[−1/n,1/n]
||(Ut − I)ψ||
t∈[−1/n,1/n]
e supt∈[−1/n,1/n] ||(Ut − I)ψ|| → 0 per n → ∞, essendo la classe degli Ut fortemente continua, concludiamo che: D fn (t)Ut dtφ → φ ∈ H , per n → ∞ R
424
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
e quindi D `e denso in H. Di conseguenza S `e simmetrico. Mostriamo ora che S `e essenzialmente autoaggiunto su D. Se ψ± ∈ Ran(S ± iI)⊥ , allora, per ogni χ ∈ D vale:
Uh Ut χ − Ut χ d (ψ± |Ut χ) = lim ψ±
= (ψ± |iSUt χ) h→0 dt h = i (ψ± |(S ± iI)Ut χ) ± (ψ± |Ut χ) = ± (ψ± |Ut χ) e quindi la funzione F± (t) := (ψ± |Ut χ) ha la forma F±(0)e±t . Dovendo essere limitata (dato che ||Ut || = 1 per ogni t ∈ R), questo `e possibile solo se F±(0) = 0 e quindi ψ± = 0, che implica a sua volta che Ran(S ± iI) = H. Per il teorema 5.18, questo significa che S : D → H `e essenzialmente autoaggiunto. Sia dunque S l’unica estensione autoaggiunta di S. Per concludere la dimostrazione si osservi che se Vt := eitS allora, per ogni coppia ψ, φ ∈ D vale: d d (ψ |(Vt )∗ Ut φ) = (Vt ψ|Ut φ) = (iSVt ψ|Ut φ) + (Vt ψ|iSUt φ) dt dt = − (Vt ψ|iSUt φ) + (Vt ψ|iSUt φ) = 0 . Pertanto (ψ|(Vt )∗ Ut φ) = (ψ|Iφ) e quindi, essendo D denso: (Vt )∗ Ut = I cio`e vale Ut = eitS per ogni t ∈ R. Un collegato elementare, ma utile, risultato tecnico `e il seguente. Proposizione 9.26. Se A `e operatore autoaggiunto nello spazio di Hilbert H, e si definisce Ut := eitA con t ∈ R, allora, per ogni f : σ(A) → C Borel misurabile vale: ∀t ∈ R ∀ψ ∈ D(f(A)). (9.84) Dimostrazione. ψ ∈ D(f(A)) se e solo se σ(A) |f(λ)|2 dμψ (λ) < +∞. D’altra parte, la misura μψ e la misura μUt ψ coincidono, in quanto: Ut f(A)ψ = f(A)Ut ψ ,
(Ut ψ|P (A)(E)Ut ψ) = (ψ|Ut∗ P (A)(E)Ut ψ) , ma Ut∗ P (A)(E)Ut = P (A) (E) come segue immediatamente da (9.13) e (9.14) in (c) del teorema 9.4, tenendo conto che nel caso in esame tutti gli integrali sono riferiti a funzioni limitate e pertanto gli operatori coinvolti hanno tutti dominio dato da tutto lo spazio di Hilbert. Concludiamo che ψ ∈ D(f(A)) se e solo se Ut ψ ∈ D(f(A)). Viceversa vale banalmente f(A)ψ ∈ D(Ut ) = H essendo Ut unitario. In queste ipotesi, usando ancora (9.13) e (9.14) in (c) del teorema 9.4, si ha che Ut f(A)ψ = f(A)Ut ψ per ogni ψ ∈ D(f(A)) e cio`e vale (9.84). Un ulteriore consequente risultato tecnico utile nelle applicazione `e dato nell’esercizio 9.15. Passiamo a dare una definizione che risulter`a fondamentale nelle applicazioni in fisica come vedremo nei capitoli 11 e 12.
9.3 Gruppi unitari a un parametro fortemente continui
425
Definizione 9.27. Sia H uno spazio di Hilbert e {Ut }t∈R ⊂ B(H) un gruppo unitario ad un parametro fortemente continuo. L’unico operatore autoaggiunto su A tale da soddisfare (9.80) `e detto generatore (autoaggiunto) di {Ut }t∈R ⊂ B(H). Il teorema di Stone ha un diversi utili corollari. Uno `e il seguente. Corollario 9.28. Se A : D(A) → H, con D(A) denso in H, `e un operatore autoaggiunto (in generale non limitato) sullo spazio di Hilbert H e se U : H → H1 `e un isomorfismo di spazi di Hilbert (operatore isometrico suriettivo), allora: −1 U eisA U −1 = eisU AU , per ogni s ∈ R . In particolare la tesi `e vera se H = H1 e U `e unitario. Dimostrazione. L’operatore U AU −1 `e evidentemente autoaggiunto su U D(A) come `e facile provare, applicando la definizione. Pertanto il gruppo uni−1 tario ad un parametro fortemente continuo {eisU AU }s∈R `e ben definito. Essendo U un isomorfismo di spazi di Hilbert, si verifica immediatamente che {U eisAU −1 }s∈R `e un secondo gruppo unitario ad un parametro fortemente continuo definito sullo stesso spazio di Hilbert H1 . Ulteriormente, se ψ = U −1 φ ∈ U −1 D(A) allora: U eisA U −1 ψ − ψ U eisA φ − U φ = lim s→0 s→0 s s lim
eisAφ − φ = iU Aφ = U AU −1 ψ . s→0 s
= U lim
In base al teorema di Stone il generatore del gruppo {U eisAU −1 }s∈R `e quindi un’estensione autoaggiunta di U AU −1 che, essendo autoaggiunto, non ha estensioni autoaggiunte proprie. Di conseguenza il generatore del gruppo {U eisAU −1 }s∈R coincide con U AU −1 stesso e quindi: U eisAU −1 = eisU AU
−1
,
per ogni s ∈ R .
Osservazione 9.29. Per certi aspetti, il teorema di Stone pu` o vedersi come sottocaso di un teorema pi` u generale, che deriva dal Teorema di Hille-Yoshida [Rud91], che ha avuto importanti conseguenze in fisica matematica nelle applicazioni della teoria dei semigruppi. Ricordiamo che sullo spazio di Banach (X, ||||), un semigruppo fortemente continuo di operatori, {Qt }t∈[0,+∞) , `e una classe di operatori Qt ∈ B(X) tali che (a) Q(0) = I, (b) Qt+s = Qt Qs se s, t ∈ [0, +∞) e (c) ||Qtψ − ψ|| → 0 se t → 0, per ogni ψ ∈ X. Si dimostra [Rud91] che ogni semigruppo fortemente continuo ammette un unico generatore, cio`e un operatore A in X, completamente individuato dalla richiesta
426
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
che (la derivata `e calcolata rispetto alla norma di X): d Qt ψ = −AQt ψ = −Qt Aψ dt
per ogni ψ ∈ D(A).
Risulta che D(A) ⊂ X `e un sottospazio denso. Specializzandoci al caso di un semigruppo fortemente continuo {Qt }t∈[0,+∞) , su X = H spazio di Hilbert e con operatori Qt normali (limitati), risulta [Rud91] che (1) esiste sempre un generatore A del semigruppo, (2) tale generatore `e un operatore normale (non limitato in generale), (3) vale: Qt = e−tA , dove il secondo membro viene definito come integrale della funzione: σ(A) λ → e−tλ rispetto alla PVM della decomposizione spettrale di A (estendendo il teorema spettrale 9.9 al caso di operatori normali non limitati [Rud91]). Infine, (4) lo spettro di A `e limitato inferiormente nei reali, cio`e: esiste γ ∈ R tale che γ < Re(λ) per ogni λ ∈ σ(A). 9.3.3 Commutativit` a di operatori e misure spettrali Come ultimo risultato possiamo enunciare e provare un teorema riguardante la commutativit` a delle misure spettrali di due operatori autoaggiunti, usando i gruppi ad un parametro da essi generati. Nel caso di operatori autoaggiunti limitati le misure spettrali commutano se e solo se gli stessi operatori commutano come segue facilmente dal teorema spettrale (vedi anche l’osservazione 9.31). Nel caso di operatori non limitati vi sono in generale problemi di dominio e la condizione basata sulla commutativit`a degli operatori non `e utilizzabile. L’uso dei gruppi unitari `e un modo semplice per ovviare il problema dei domini. Il seguente teorema ha larghe applicazioni in Meccanica Quantistica. Teorema 9.30. Siano A e B due operatori (in generale non limitati) sullo spazio di Hilbert H e sia A autoaggiunto. Valgono i fatti seguenti. (i) Assumendo B autoaggiunto e denotando con P (A) e P (B) le misure spettrali di A e B rispettivamente, le seguenti quattro richieste sono equivalenti. (a) Per ogni coppia di boreliani E, E ⊂ R: P (A) (E)P (B) (E ) = P (B) (E )P (A) (E) . (b) Per ogni boreliano E ⊂ R e ogni s ∈ R: P (A)(E)e−isB = e−isB P (A) (E) . (c) Per ogni coppia di numeri reali t, s ∈ R: e−itA e−isB = e−isB e−itA .
9.3 Gruppi unitari a un parametro fortemente continui
427
(d) Per ogni numero reale t ∈ R: e−itABψ = Be−itA ψ ,
e−itAD(B) ⊂ D(B) e
se ψ ∈ D(B).
(ii) Se, nelle ipotesi di (i), vale una delle quattro condizioni precedenti allora vale anche: se ψ ∈ D(AB) ∩ D(BA)
ABψ = BAψ
(Aϕ| Bψ) − (Bϕ|Aψ) = 0 se ψ, ϕ ∈ D(A) ∩ D(B). (iii) Se B ∈ B(H) (non necessariamente autoaggiunto), le due seguenti condizioni sono equivalenti. (e) BAϕ = ABϕ per ogni ϕ ∈ D(A). (f ) Bf(A)ψ = f(A)Bψ per ogni ψ ∈ D(f(A)) e ogni f : σ(A) → R Borel misurabile. Dimostrazione. (i) Facendo uso della definizione 9.10, l’identit` a in (b) pu` o essere trascritta equivalentemente: (A) (A) −itλ −isμ (B) −isμ (B) e dPλ e dPμ = e dPμ e−itλ dPλ R
R
R
R
per ogni t, s ∈ R,
(9.85)
dove abbiamo usato la definizione standard di integrale di funzioni misurabili limitate rispetto ad una misura spettrale facendo uso di (a) del teorema 9.4. Il fatto che (a) implichi (c) `e immediato dalla definizione stessa di integrale di una funzione limitata rispetto ad una misura spettrale introdotta nel capitolo 8, lavorando con la topologia operatoriale forte. Proviamo che (c) implica (b) e che (b) implica (a). Per dimostrare che (c) implica (b), che da (9.85), notiamo
−itλ (A) −isB se Us := e , ψ, φ ∈ H, s ∈ R sono fissati, si ha: ψ R e dPλ Us φ =
(A) Us∗ ψ R e−itλ dPλ φ per ogni t ∈ R, ossia:
−itλ
e R
(A) dμψ,Usφ (λ)
= R
(A)
e−itλ dμU ∗ ψ,φ (λ) ,
(9.86)
s
dove abbiamo introdotto le misure complesse come in (c) del teorema 8.30. Possiamo trasformare gli integrali suddetti in integrali rispetto a misure positive finite usando il teorema Radon-Nykodim (vedere (1) in esempi 2.58). Successivamente, facendo uso del teorema di Fubini-Tonelli in (9.86), concludiamo che, se f `e la trasformata di Fourier di una qualsiasi funzione dello spazio di Schwarz S(R) (vedi capitolo 3), deve risultare: R
R
f(t) e−itλ dt
(A)
dμψ,Usφ (λ) =
R
R
f(t) e−itλ dt
(A)
dμUs∗ψ,φ (λ) .
428
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Dato che la trasformata di Fourier trasforma lo spazio S(R) nello stesso spazio S(R) biettivamente, concludiamo che l’identit`a di sopra pu` o essere riscritta come: (A) (A) g(λ) dμψ,Usφ (λ) = g(λ) dμU ∗ ψ,φ (λ) per ogni g ∈ S(R). (9.87) R
R
s
Se h ∈ Cc (R) (spazio delle funzioni continue a supporto compatto) la successione di funzioni: 3 2 n gn (x) := e−n(x−y) /4 h(y)dy 4π R soddisfa gn ∈ D(R) e converge uniformemente ad h per n → +∞. Dato che gn ∈ D(R) ⊂ S(R) e gn → h ∈ Cc (R) nella norma dell’estremo superiore e le misure sono finite, (9.87) implica che: (A) (A) h(λ) dμψ,Usφ (λ) = h(λ) dμU ∗ ψ,φ (λ) per ogni h ∈ Cc (R). (9.88) R
R
s
Il teorema 2.62 di Riesz per misure complesse implica che le due misure che definiscono i due integrali nei due membri dell’identit`a di sopra sono in realt` a la stessa misura. In altre parole, tenendo conto dell’espressione esplicita di tali misure complesse come in (c) del teorema 8.30:
ψ P (A)(E)Ut φ = Us∗ ψ P (A) (E)φ (9.89) per ogni boreliano E ⊂ R e ogni s ∈ R. tCon ovvi passaggi, data l’arbitrariet` a di ψ e φ, si ricava che vale (b): P (A)(E)e−isB = e−isB P (A)(E)
per ogni boreliano E ⊂ R e ogni s ∈ R. (9.90) Per concludere proviamo che (b) implica (a). Iterando un’altra volta il procedimento per dimostrare che (c) implica (b), dove ora l’operatore e−isB rimpiazza il precedente e−itA e l’operatore unitario Us `e sostituito dal proiettore ortogonale P (A)(E), si ottiene alla fine che (9.90) implica che vale (a): (A) (B) (B) (A) PE PE = PE PE per ogni coppia di boreliani E, E ⊂ R. Per concludere notiamo che, se vale (c), dal teorema di Stone e dalla continuit`a di e−itA segue subito (d). D’altra parte (d) implica (c) per il seguente motivo. Prima di tutto (d) equivale a e−itABeitA = B da cui, esponenziando gli operatori −itA BeitA ) autoaggiunti ad ambo membri, troviamo: e−is(e = e−isB . Dato che, per ogni fissato numero s ∈ R, i gruppi unitari ad un parametro fortemente −itA BeitA ) continui t → e−is(e e t → e−itA e−isB eitA ammettono lo stesso generatore, essi devono coincidere per il teorema di Stone. Conseguentemente dobbiamo avere e−itA e−isB eitA = e−isB , cio`e (c). Proviamo (ii). Per provare la prima affermazione, assumendo ψ ∈ D(AB) ∩ D(BA), partiamo da (c) per cui: e−itA e−isB ψ = e−isB e−itA ψ. Derivando nell’origine in t, dal teorema di Stone: Ae−isB ψ = e−isB Aψ. A questo punto
9.3 Gruppi unitari a un parametro fortemente continui
429
possiamo ancora derivare in s nell’origine. Il secondo membro fornisce immediatamente −iBAψ per il teorema di Stone. Nel primo membro possiamo passare la derivata oltre A, usando il fatto che A = A∗ `e chiuso e tenendo conto del fatto che sappiamo che il limite esiste. In questo modo troviamo, come richiesto −iABψ = −iBAψ. Dimostriamo infine la seconda affermazione assumendo vera la propriet` a (c). Da essa si trova subito, se ψ ∈ D(A) e ϕ ∈ D(B) allora (eitA ψ|e−isB ϕ) = (eisB ψ|e−itA ϕ). Calcolando le derivate in t e s per t = s = 0, dal teorema di Stone abbiamo la tesi. L’affermazione (iii) si prova come segue. Prima di tutto `e ovvio che (f) implica (e). Proviamo che (e) implica (f). Mostriamo per prima cosa che (e) implica che B commuti con e−itA per ogni t ∈ R. A tal fine usiamo (d) ed (f) in proposizione 9.18. Sia ψ `e un vettore analitico per A e per tutte le sue potenze nell’insieme denso che `e provato esistere in (f) in proposizione 9.18, allora, dato che B `e limitato ed usando (d) di proposizione 9.18: Be−itA ψ =
+∞ +∞ (−it)n (−it)n n BAn ψ = A Bψ = e−itA Bψ . n! n! n=0 n=0
Nei due ultimi passaggi abbiamo usato l’ipotesi che BAψ = ABψ ricorsivamente ed il fatto che ||An Bψ|| = ||BAn ψ|| ≤ ||B||||Anψ|| per cui Bψ `e ancora analitico per A. Dato che ψ varia in un insieme denso e gli operatori B e e−itA sono continui, abbiamo ottenuto che Be−itA = e−itAB. Ora usiamo il fatto che, se B `e limitato e commuta con ogni e−itA , allora B commuta con la misura spettrale di A. La prova `e analoga a quella fatta sopra per dimostrare che (c) implica (b): in questo caso bisogna sostituire Us con B e seguire la stessa dimostrazione. Quindi, usando la definizione di g(A), segue facilmente che se g `e limitata (e quindi lo `e g(A)) allora Bg(A) = g(A)B. A questo punto si osserva che (A)
μBψ (E) = (Bψ|P (A) (E)Bψ) = (P (A) Bψ|P (A) (E)Bψ) (A)
= (BP (A) ψ|BP (A) (E)ψ) ≤ ||B||2μψ (E) e pertanto ψ ∈ D(f(A)) implica Bψ ∈ D(f(A)). Applicando infine la definizione di f(A), prendendo una successione di funzioni misurabili limitate fn che convergono a f nel senso di L2 (σ(A), μψ ) si ha immediatamente la tesi prendendo il limite per n → +∞ dell’uguaglianza (vera perch´e tutte le fn sono limitate) Bfn (A)ψ = fn (A)Bψ, per ogni n ∈ N, dato che B `e continuo. Osservazione 9.31. Il teorema provato ha come immediata conseguenza che due operatori autoaggiunti limitati A, B ∈ B(H) commutano se e solo se commutano le loro misure spettrali. Infatti, un’implicazione `e ovvia, mentre da (iii) segue subito che, se (A) (A) (A) AB = BA allora BPE = PE B dato che PE = χE (A), essendo χE la
430
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni (A)
funzione caratteristica del boreliano E. Dato che PE ∈ B(H), possiamo ap(B) (A) (A) (B) plicare nuovamente (iii) ed ottenere PE PE = PE PE per ogni boreliano E ⊂ R.
9.4 Prodotto tensoriale hilbertiano Come vedremo nel capitolo 12, i sistemi quantistici composti vengono descritti in spazi di Hilbert ottenuti prendendo il prodotto tensoriale Hilbertiano degli spazi di Hilbert dei sottosistemi componenti. Chiariamo nel seguito cosa intendiamo qui per prodotto tensoriale Hilbertiano, assumendo, per le motivazioni generali e le notazioni, che il lettore conosca la definizione di prodotto tensoriale nel caso di spazi vettoriali a dimensione finita. 9.4.1 Prodotto tensoriale di spazi di Hilbert Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · · , n e scegliamo un vettore vi per ogni spazio Hi . In analogia al caso finito dimensionale, potremmo definire il prodotto tensoriale dei vettori vi , indicato con v1 ⊗ · · · ⊗ vn , come il funzionale multilineare: v1 ⊗ · · · ⊗ vn : H1 × · · · × Hn (f1 , · · · , fn ) → f1 (v1 ) · · · fn (vn ) ∈ C , dove Hi `e il duale topologico dello spazio Hi e il puntino ·, a secondo membro, indica il prodotto di numeri complessi. Del tutto equivalentemente, tenendo conto del teorema di Riesz, possiamo definire l’azione di v1 ⊗ · · · ⊗ vn sulle n-ple di vettori di H1 × · · ·× Hn invece che su quelle di H1 × · · ·× Hn . In questo modo teniamo conto dell’identificazione del duale di uno spazio di Hilbert con lo spazio di Hilbert stesso, ottenuta tramite un anti isomorfismo costruito con il prodotto scalare. Con questo approccio v1 ⊗ · · · ⊗ vn agisce su n-ple di vettori (u1 , · · · , un ) ∈ H1 × · · · × Hn per mezzo dei prodotti scalari e definisce un funzionale anti multi-lineare. Sceglieremo questa seconda via per motivi di praticit` a. Definizione 9.32. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · · , n e scegliamo un vettore vi per ogni spazio Hi . Il prodotto tensoriale di tali vettori, v1 ⊗ · · · ⊗ vn `e l’applicazione: v1 ⊗· · ·⊗vn : H1 ×· · ·×Hn (u1 , · · · , un ) → (u1 |v1 )1 · · · (un |vn )n ∈ C. (9.91) n Hi indichiamo l’insieme di applicazioni {v1 ⊗ · · · ⊗ vn | vi ∈ Hi , i = Con Ti=1 5n 1, 2, · · ·, n} mentre H denota lo spazio vettoriale su C delle applicazioni i=1
i
multi anti-lineari date da combinazioni lineari finite di elementi v1 ⊗· · ·⊗vn ∈ n Ti=1 Hi .
9.4 Prodotto tensoriale hilbertiano
431
Osservazione 9.33. Con la definizione di prodotti tensoriale che abbiamo dato, `e evidente che l’applicazione v1 ⊗ · · · ⊗ vn : H1 × · · · × Hn → C risulta essere multi antilineare, cio`e, anti lineare separatamente in ogni argomento ui ∈ Hi , come si legge direttamente nella (9.91), tenendo conto che il prodotto scalare `e anti lineare a sinistra. Tuttavia, la funzione (v1 , . . . vn ) → v1 ⊗· · ·⊗vn risulta essere, come si prova subito, multi-lineare. 5n Possiamo definire un prodotto scalare (·|·) su i=1 Hi come segue. Considen n riamo l’applicazione da S : Ti=1 Hi × Ti=1 Hi → C con S(v1 ⊗ · · · ⊗ vn , v1 ⊗ · · · ⊗ vn ) := (v1 |v1 ) · · · (vn |vn ) .
(9.92)
Vale il seguente risultato. n n Proposizione 9.34. L’applicazione S : Ti=1 Hi × Ti=1 Hi → C si estende in maniera univoca, per antilinearit` a nell’argomento di sinistra e per linearit` a in quello di destra, ad un prodotto scalare hermitiano sullo spazio vettoriale 5n complesso H definito da: i=1
i
(Ψ |Φ) :=
i
αi βj S(v1i ⊗ · · · ⊗ vni , u1j ⊗ · · · ⊗ unj )
j
se Ψ = i αi v1i ⊗ · · · ⊗ vni e Φ = j βj u1j ⊗ · · · ⊗ unj (essendo entrambe le somme finite). Dimostrazione. Per semplicit`a di scrittura eseguiamo la prova nel caso n = 2. Per n > 2 la dimostrazione `e concettualmente identica, ma molto pi` u laboriosa 6 2 e valgono da scrivere. Dobbiamo prima di tutto mostrare che se Ψ, Φ ∈ H1 ⊗H decomposizioni differenti per gli stessi vettori: Ψ= αj vj ⊗ vj = βh uh ⊗ uh , Φ = γk wk ⊗ wk = δs zs ⊗ zs , j
h
k
s
allora risulta comunque: αj γk S(vj ⊗ vj , wk ⊗ wk ) = αj δs S(vj ⊗ vj , zs ⊗ zs ) j
e anche: h
j
k
βh γk S(uh ⊗ uh , wk ⊗ wk ) =
k
h
(9.93)
s
βh δs S(uh ⊗ uh , zs ⊗ zs ) . (9.94)
s
6 2 `e ben definita, non Questo prova che l’estensione (anti-) lineare di S a H1 ⊗H dipendendo dalla decomposizione usata per rappresentare gli argomenti di S. Dimostriamo l’indipendenza per l’argomento di sinistra (9.93), per l’argomento di destra (9.94) si procede analogamente. Il primo membro di (9.93) si pu`o riscrivere: αj γk S(vj ⊗ vj , wk ⊗ wk ) j
k
432
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
=
j
γk wk ⊗
wk
(αj vj , vj ) =
Φ(αj vj , vj )
j
k
e, con la stessa procedura, lavorando sul secondo membro di (9.93), si ha ugualmente: αj δs S(vj ⊗ vj , zs ⊗ zs ) j
=
j
s
s
δs zs ⊗
zs
(αj vj , vj ) =
Φ(αj vj , vj ) ,
j
dove abbiamo usato l’ipotesi Φ = k γk wk ⊗ = s δs zs ⊗ zs . Quindi S si estende univocamente ad una applicazione lineare a destra ed antilineare a 6 2 → C. Direttamente dalla definizione di S si ha che vale: sinistra (·|·) : H1 ⊗H wk
(Ψ |Φ) = (Φ|Ψ ) . Per mostrare che in effetti (·|·) definisce un prodotto scalare hermitiano `e ora n sufficiente provare che (·|·) `e positivo. La prova `e semplice. Se Ψ = j=1 αj vj ⊗ vj , dove, per ipotesi n < +∞, possiamo considerare una base Hilbertiana (finita!) u1 , · · · , um (m ≤ n) per il sottospazio generato da v1 , · · · , vn ed una base analoga u1 , · · · , ul , (l ≤ n) per il sottospazio generato da v1 , · · · , vn . Sfruttando la bi-linearit` a di ⊗, possiamo alla fine scrivere m l b u ⊗ u , dove i coefficienti bjk sono opportuni. UsanΨ = k j=1 k=1 jk j do direttamente la definizione di S ed il fatto che le basi considerate sono ortonormali: ⎛ ⎞
l l l m m n
(Ψ |Ψ ) = ⎝ bjk uj ⊗ uk bis ui ⊗ us ⎠ = |bjk |2 .
j=1 k=1
i=1 s=1
j=1 k=1
La positivit` a di (·|·) `e ora evidente.
Definizione 9.35. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·) 5ni) con i = 1, 2, · · · , n. Il prodotto tensoriale hilbertiano degli spazi Hi , i=1 Hi , indicato equivalentemente con H1 ⊗ · · · ⊗ Hn , `e lo spazio di Hilbert ottenu5n to prendendo il completamento hilbertiano dello spazio Hi rispetto al i=1
prodotto scalare (·|·) della proposizione 9.34. ` immediato verificare che la definizione si riduce a quella elementare nel caso E in cui gli spazi Hi siano finito dimensionali. Inoltre sussistono i seguenti utili risultati. Proposizione 9.36. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · ·, n e corrispondenti basi hilbertiane Ni ⊂ Hi con i = 1, 2, · · · , n. L’insieme N := {z1 ⊗ · · · ⊗ zn | zi ∈ Ni , i = 1, 2, · · ·, n}
9.4 Prodotto tensoriale hilbertiano
433
`e una base hilbertiana per H1 ⊗ · · · ⊗ Hn . Quindi, in particolare, H1 ⊗ · · · ⊗ Hn `e separabile se lo sono tutti gli Hi . Dimostrazione. Per costruzione N `e un sistema ortonormale (la verifica `e immediata usando la definizione del prodotto scalare sullo spazio prodotto tensoriale). Bisogna solo provare che < N > `e denso in H1 ⊗ · · · ⊗ Hn . Dato che le combinazioni lineari di elementi del tipo v1 ⊗ · · · ⊗ vn sono dense in H1 ⊗ · · · ⊗ Hn `e sufficiente provare che ogni elemento v1 ⊗ · · · ⊗ vn pu` o essere approssimato a piacimento da combinazioni lineari di elementi z1 ⊗ · · · ⊗ zn di N . Nuovamente, per semplicit`a notazionale lavoriamo nel caso n = 2, dato che il caso n > 2 si dimostra nello stesso modo. Nelle nostre ipotesi, per una opportuna scelta di coefficienti γ e β , valgono gli sviluppi: v = z z 1 z∈N1 γz z e v2 = z ∈N2 βz z , che equivale a dire che valgono (teorema 3.27 e definizione 3.20):
2 2 ||v1 || = sup (9.95) |γz | F1 sottoinsieme finito di N1
z∈F1
e ||v2 ||2 = sup
z ∈F2
|βz |2 F2 sottoinsieme finito di N2 .
(9.96)
Il calcolo diretto, basato sull’ortonormalit` a dei vettori z ⊗z e sulla definizione di prodotto scalare in H1 ⊗ H2 , prova immediatamente che, se F ⊂ N1 × N2 `e finito
2
2 2
v1 ⊗ v2 − z ⊗ z γ β = ||v || ||v || − |γz |2 |βz |2 . z z 1 2
(z,z )∈F (z,z )∈F Valendo (9.95) e (9.96), possiamo rendere piccolo a piacere il secondo membro dell’identit` a scegliendo F sempre pi` u grande. Questo conclude la prova. Proposizione 9.37. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · · , n e corrispondenti sottospazi densi Di ⊂ Hi con i = 1, 2, · · ·, n. Il sottospazio D1 ⊗ · · · ⊗ Dn ⊂ H1 ⊗ · · · ⊗ Hn , formato dalle combinazioni lineari di prodotti tensoriali v1 ⊗ · · · ⊗ vn con vi ∈ Di , i = 1, . . . , n, `e denso in H1 ⊗ · · · ⊗ Hn . Dimostrazione. Al solito svolgiamo la dimostrazione nel caso n = 2, essendo il caso generale solo pi` u complicato da scrivere. Dato che le combinazioni lineari finite di prodotti tensoriali u ⊗ v sono dense in H1 ⊗ H2 , `e sufficiente provare che se ψ := u ⊗ v ∈ H1 ⊗ H2 , esiste una successione di elementi di D1 ⊗ D2 che converge a ψ. Per costruzione esistono due successioni {u1n }n∈N ⊂ D1 e {v1n }n∈N ⊂ D2 che convergono a u e v rispettivamente. Allora: ||un ⊗ vn − u ⊗ v|| ≤ ||un ⊗ vn − un ⊗ v|| + ||un ⊗ v − u ⊗ v|| .
434
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Ma ||un ⊗vn −un ⊗v||2 = ||un ⊗(vn −v)||2 = ||un||21 ||vn −v||22 → 0 se n → +∞, dato che {||un||1 }n∈N `e limitata, essendo convergente la successione degli un . Similmente ||un ⊗ v − u ⊗ v||2 = ||(un − u) ⊗ v||2 = ||un − u||21 ||v||22 → 0 se n → +∞. Esempi 9.38. (1) Esemplificheremo la nozione di spazio prodotto tensoriale, mostrando che lavorando con spazi L2 separabili (spazi delle funzioni d’onda in meccanica quantistica), il prodotto tensoriale pu` o essere visto in un altro modo equivalente, passando alle misure prodotto. Consideriamo una coppia di spazi di Hilbert separabili, L2 (Xi , μi ) con i = 1, 2, e supponiamo che le misure siano entrambe σ-finite in modo tale che sia ben definita la misura prodotto μ1 ⊗ μ2 su X1 × X2 . Abbiamo il seguente utile risultato. Proposizione 9.39. Si consideri una coppia di spazi di Hilbert separabili, L2 (Xi , μi ) con i = 1, 2, con misure σ-finite. In tal caso: L2 (X1 × X2 , μ1 ⊗ μ2 )
e
L2 (X1 , μ1 ) ⊗ L2 (X1 , μ1 )
sono isomorfi in modo naturale come spazi di Hilbert. La trasformazione unitaria che identifica tali spazi `e l’unica estensione lineare limitata dell’applicazione: U0 : L2 (X1 , μ1 ) ⊗ L2 (X1 , μ1 ) ψ ⊗ φ → ψ · φ ∈ L2 (X1 × X2 , μ1 ⊗ μ2 ) dove (ψ · φ)(x, y) := ψ(x)φ(y) per x ∈ X1 e y ∈ X2 . Dimostrazione. Prima di tutto notiamo che, se N1 := {ψn }n∈N e N2 := {φn }n∈N sono basi hilbertiane in L2 (X1 , μ1 ) e L2 (X1 , μ1 ) rispettivamente, allora l’insieme N := {ψn ·φm }(n,m)∈N×N `e base hilbertiana in L2 (X1 ×X2 , μ1 ⊗μ2 ). Infatti N `e banalmente un insieme ortonormale per propriet`a elementari della misura prodotto, inoltre, se f ∈ L2 (X1 × X2 , μ1 ⊗ μ2 ) `e tale che, per ogni ψn · φn , f(x, y)ψn (x)φm (y)dμ1 (x) ⊗ dμ2 (y) = 0 , X×X2
dal teorema di Fubini-Tonelli segue che:
f(x, y)ψn (x)dμ1 (x) φm (y)dμ2 (y) = 0 . X2
X1
Dato che le φm sono una base hilbertiana, questo implica che: f(x, y)ψn (x)dμ1 (x) = 0 , X1
eccetto che per un insieme Sm ⊂ X2 di misura nulla rispetto a μ2 . Allora, per y ∈ S := Um∈N Sm (che `e di misura nulla essendo unione numerabile di insiemi
9.4 Prodotto tensoriale hilbertiano
435
di misura nulla) vale: X1
f(x, y)ψn (x)dμ1 (x) = 0
per ogni ψn ∈ N1 , che implica che f(x, y) = 0, eccetto che per x ∈ B, essendo B di misura nulla rispetto a μ1 . In definitiva vale f(x, y) = 0, escludendo i punti dell’insieme S × B che, per le propriet` a elementari di misura prodotto, `e un insieme di misura nulla rispetto a μ1 ⊗ μ2 . Possiamo concludere che, se f `e pensato come elemento di L2 (X1 ×X2 , μ1 ⊗μ2 ), allora f = 0 e, di conseguenza, N `e una base hilbertiana, essendo insieme ortonormale con ortogonale dato dal solo vettore nullo. Consideriamo infine l’unica applicazione lineare limitata U che associa l’elemento ψn ⊗ φm della base hilbertiana dello spazio di L2 (X1 , μ1 ) ⊗ L2 (X1 , μ1 ) con l’elemento ψn ·φm della base hilbertiana dello spazio di L2 (X1 ×X2 , μ1 ⊗μ2 ). ` inoltre immediato verificare che U associa Per costruzione U `e unitaria. E 2 ogni elemento ψ ⊗ φ ∈ L (X1 , μ1 ) ⊗ L2 (X1 , μ1 ) con il corrispondente elemento ψ · φ ∈ L2 (X1 × X2 , μ1 ⊗ μ2 ) (basta notare che ψ ⊗ φ e ψ · φ hanno le stesse componenti nelle rispettive basi) per cui U `e un’estensione lineare unitaria di U0 . Ogni altra estensione lineare limitata U di U0 , dovendo estendere U0 , deve ridursi a U quando valutata sulle basi ψn ⊗ φm ψn · φm e pertanto deve coincidere con U stessa per linearit`a e per continuit`a. Ovviamente il risultato si generalizza a pi` u prodotti di spazi L2 con misure separabili e σ-finite. (2) Se (Hk , (·|·)k ), con k = 1, 2, . . ., n ≤ +∞, sono spazi di Hilbert, 7n in generale distinti, la somma diretta Hilbertiana di tali spazi, e k=1 Hk , ` definita come lo spazio di Hilbert che si ottiene come segue. Si parte dallo spazio vettoriale i cui elementi sono le n-ple (cio`e le successioni, se n = +∞) (ψ1 , ψ2 , . . .) ∈ ×nk=1 Hk , tali che ψk = 0 per k ≥ k0 , con k0 arbitrariamente grande, ma finito e dipendente dalla n-pla (evidentemente se n < +∞ questa richiesta non ha alcun effetto, dato che siamo liberi di scegliere k0 > n). Le operazioni di spazio vettoriale sono quelle standard di n-ple ed il prodotto scalare `e (si osservi che la somma `e finita anche se n = +∞): ((ψ1 , ψ2 . . .)|(φ1 , φ2 . . .)) :=
n
(ψk |φk )k .
k=1
7n
e, per definizione, lo spazio di Hilbert che si ottiene prendendo il k=1 Hk ` completamento dello spazio con prodotto scalare descritto sopra. Questa definizione `e in accordo 7ncon la definizione 8.36 quando gli spazi Hk sono visti come sottospazi di k=1 Hk , come `e facile provare. Un altro risultato importante sul prodotto tensoriale hilbertiano `e il seguente e riguarda il caso in cui tutti gli Hk di una somma hilbertiana, con n < +∞, coincidono.
436
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Proposizione 9.40. Se H `e uno spazio di Hilbert e7 0 < n ∈ N `e fissato, lo n spazio di Hilbert H ⊗ Cn `e naturalmente isomorfo a k=1 H. La trasformazione unitaria che identifica i due spazi ` e l’unica estensione lineare limitata dell’applicazione: V0 : H ⊗ Cn ψ ⊗ (v1 , . . . , vn ) → (v1 ψ, . . . , vn ψ) ∈
n -
H.
k=1
Dimostrazione. La dimostrazione si esegue come nell’analogo enunciato nell’esempio (1). Si fissa una base hilbertiana N ⊂ H. Per costruzione, i vettori: (ψ, 0, . . . , 0), (0, ψ, 0, . . . , 0), · · · , (0, . . . , 0, ψ) 7n definiscono una base Hilbertiana di k=1 H se ψ variano in N . Si considera l’unica trasformazione lineare limitata che associa ψ ⊗ ei a (0, . . . , ψ, . . . , 0) dove: ψ ∈ N , ei `e l’i-esimo vettore di base della base canonica di Cn e, nella ` n-pla, l’unico posto non nullo, occupato da ψ, `e proprio l’i-esimo posto. E immediato verificare che tale applicazione `e unitaria e si riduce a V0 lavorando su elementi ψ ⊗ (v1 , . . . , vn ). L’unicit` a dell’estensione lineare limitata si prova come nell’esempio (1). (3) Lo spazio di Fock, F (H), generato dallo spazio di Hilbert H, `e lo spazio di Hilbert dato dalla somma diretta hilbertiana infinita, nel senso dell’esempio (2): +∞ F (H) := Hn⊗ n=0 0⊗
dove H
:= C, H
n⊗
:= H ⊗ · · · ⊗ H. Si noti che F (H) `e separabile se lo `e H. 9: ; 8 n volte
9.4.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro propriet` a spettrali Come ultimo argomento matematico introduciamo il prodotto tensoriale di operatori. Se A e B sono operatori con dominio, rispettivamente D(A) e D(B) nei rispettivi spazi di Hilbert H1 e H2 , indicheremo con D(A)⊗D(B) ⊂ H1 ⊗H2 il sottospazio delle combinazioni lineari finite di elementi ψ ⊗ φ con ψ ∈ D(A) e φ ∈ D(B). Possiamo provare a definire un operatore: A⊗B : D(A) ⊗ D(B) → H1 ⊗ H2 come estensione lineare di ψ⊗φ → (Aψ)⊗(Bφ). Il punto da verificare `e se una tale estensione lineare sia effettivamente ben definita. Supponiamo pertanto che, per Ψ ∈ D(A) ⊗ D(B), valgano le due decomposizioni (finite!): Ψ= ck ψk ⊗ φk = ck ψj ⊗ φj , k
j
9.4 Prodotto tensoriale hilbertiano
437
Dobbiamo verificare che: ck (Aψk ) ⊗ (Bφk ) = cj (Aψj ) ⊗ (Bφj ) . j
k
Per verificare ci`o consideriamo una base hilbertiana (finita!) di vettori fr per lo spazio generato da tutti i vettori ψk unitamente ai vettori ψj , ed una analoga base di vettori gs per lo spazio generato da tutti i vettori φk unitamente ai vettori φj . In particolare avremo che: ψi ⊗ φi =
α(i) rs fr ⊗ gs ,
ψj ⊗ φj =
r,s
(j) βrs fr ⊗ gs .
r,s
Inoltre, dato che siamo partiti dallo stesso vettore Ψ decomposto in due modi diversi, deve valere anche: (j) ci α(i) cj βrs . rs = i
j
Usando queste tre identit`a, si trova immediatamente che: A⊗B ci ψi ⊗ φi = ( ci α(i) rs )((Afr ) ⊗ (Bgs )) i
rs
i
(j) ( cj βrs )((Afr ) ⊗ (Bgs )) = (A ⊗ B) cj ψj ⊗ φj . = rs
j
j
Quindi A ⊗ B `e in effetti ben definito. La procedura si estende in modo ovvio al caso di N operatori Ak : D(Ak ) → Hk , con dominio D(Ak ) ⊂ Hk (Hk spazio di Hilbert), Definizione 9.41. Se Ak : D(Ak ) → Hk , per k = 1, 2, . . . , N , sono operatori con dominio D(Ak ) ⊂ Hk (Hk spazio di Hilbert), si definisce l’operatore prodotto tensoriale degli Ak : A1 ⊗ · · · ⊗ AN : D(Ak ) ⊗ · · · ⊗ D(AN ) → H1 ⊗ · · · ⊗ HN , come l’unico operatore lineare che estende le richieste: A1 ⊗ · · · ⊗ AN (v1 ⊗ · · · ⊗ vN ) = (A1 v1 ) ⊗ · · · ⊗ (AN vN ) se vk ∈ D(Ak ), per k = 1, . . . , N . Per le applicazioni `e utile il seguente primo elementare risultato. Proposizione 9.42. Se k = 1, . . . , N , siano Ak : D(Ak ) → Hk operatori sugli spazi di Hilbert Hk . Vale quanto segue.
438
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
(a) Se D(Ak ) = Hk e Ak `e chiudibile per k = 1, . . . , N , allora gli operatori definiti sul dominio D(Ak ) ⊗ · · · ⊗ D(AN ): I,
A1 ⊗I ⊗· · · ⊗I ,
. . . , I ⊗· · ·⊗Ak ⊗· · ·⊗Ah ⊗· · ·⊗I ,
. . . , A1 ⊗· · ·⊗An
e, sullo stesso dominio, le combinazioni lineari finite di tali operatori, sono tutti operatori chiudibili. (b) Se D(Ak ) = Hk e Ak ∈ B(Hk ) per k = 1, . . . , N allora valgono: (i) A1 ⊗ · · · ⊗ AN ∈ B(H1 ⊗ · · · ⊗ HN ) e (ii) ||A1 ⊗ · · · ⊗ AN || = ||A1 || · · · ||AN ||. Dimostrazione. (a). Limitiamoci al caso n = 2, il caso generale `e del tutto analogo. Si osservi che D(A1 ) ⊗ D(A2 ) `e denso per costruzione (usando la proposizione 9.37), per cui gli operatori menzionati in (a) ammettono aggiunto. Si consideri il vettore generico Ψ ∈ D(A∗1 ) ⊗ D(A∗2 ). Per definizione: (Ψ |A1 ⊗ A2 Φ) = (A∗1 ⊗ A∗2 Ψ |Φ) per ogni Φ ∈ D(A1 ) ⊗ D(A2 ). Ma allora, dalla definizione di aggiunto: D(A∗1 ) ⊗ D(A∗2 ) ⊂ D((A1 ⊗ A2 )∗ ) . Per (b) di teorema 5.4, essendo A1 e A2 con domini densi e chiudibili, il dominio dei rispettivi aggiunti dovr` a essere denso e di conseguenza D((A1 ⊗ A2 )∗ ) `e anch’esso densamente definito per cui A1 ⊗ A2 `e chiudibile. La prova per combinazioni lineari `e la stessa. La prova di (b) `e data nella soluzione degli esercizi in fondo al capitolo. Vogliamo ora studiarne alcune propriet` a di polinomi di operatori A1 ⊗ · · · ⊗ AN , quando gli Ak siano autoaggiunti. Nell’enunciato del teorema che segue, gli argomenti Ak del polinomio Q andrebbero pi` u propriamente intesi come I ⊗ · · · ⊗ I ⊗ Ak ⊗ I ⊗ · · · ⊗ I, ma noi scriveremo semplicemente Ak per non sovraccaricare la notazione. Teorema 9.43. Siano Ak : D(Ak ) → Hk , con D(Ak ) ⊂ Hk , per k = 1, 2, . . ., N operatori autoaggiunti e sia Q(a1 , . . . , an ) un polinomio a coefficienti reali di grado nk nella k-esima variabile. Sia Dk ⊂ D(Ak ) un dominio di essenziale autoaggiunzione per Ank k . Vale quanto segue. 5N nk (a) Q (A1 , . . . , A1 ) `e essenzialmente autoaggiunto su k=1 D(Ak ) e su 5N k=1 Dk ; (b) Se ogni Hk `e separabile, lo spettro di Q (A1 , . . . , A1 ) `e la chiusura dell’immagine di Q sul prodotto degli spettri di Ak : σ Q (A1 , . . . A1 ) = Q (σ(A1 ), . . . , σ(AN )) . Dimostrazione. (a). Per prima cosa notiamo che l’operatore Q(A1 , . . . , An ) `e nk ben definito su D := ⊗N k=1 D(Ak ) (in particolare per (d) del teorema 9.4) ed `e simmetrico su tale dominio, come si prova per computo diretto, applicando la definizione di prodotto tensoriale di operatori, tenendo conto che
9.4 Prodotto tensoriale hilbertiano
439
i coefficienti di Q sono reali e che ogni Am e simmetrico su k con m ≤ nk ` D(Ank k ). Possiamo dire di pi` u: Q(A1 , . . . , An ) `e essenzialmente autoaggiunto su D, la prova segue facilmente dal teorema 5.46 di Nelson, esibendo un insieme di vettori analitici per Q(A1 , . . . , An ) il cui spazio generato sia denso nello spazio di Hilbert globale. Tenendo conto di (1) in esempi 9.38, una tale classe di vettori analitici si definisce come quella dei prodotti tensoria(L,1) (L,N) (L,k) li ψαL ⊗ · · · ⊗ ψαL , con L = 1, 2, . . ., dove {ψαL }αL∈GL ⊂ D(Ak ) `e una base hilbertiana del sottospazio chiuso P (Ak ) ([−L, L) ∩ σ(Ak )), essendo P (Ak ) la misura spettrale di Ak ed avendo cura, ad ogni incremento di L: passando da [−L, L] a [−L − 1, L) ∪ [−L, L) ∪ [L, L + 1), di conservare gli stessi elementi di base relativi al sottospazio associato all’intervallo [−L, L). Il fatto che questi vettori siano analitici per Q(A1 , . . . , An ) si prova facilmente seguendo la stessa strada usata per dimostrare (f) nella proposizione 9.18. Per provare che Q(A1 , . . . , An ) `e anche essenzialmente autoaggiunto su D(e) := ⊗N e ora sufficiente provare che vale l’inclusione k=1 Dk ` operatoriale Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D (infatti, per costruzione Q(A1 , . . . , An ) D(e) ⊂ Q(A1 , . . . , An ) D e quindi Q(A1 , . . . , An )D(e) ⊂ Q(A1 , . . . , An )D ; se ancora Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D , allora deve essere Q(A1 , . . . , An )D(e) = Q(A1 , . . . , An )D ed il secondo membro `e autoaggiunto, per cui Q(A1 , . . . , An )D(e) `e essenzialmente autoaggiunto essendo simmetrico con chiusura autoaggiunta.) Per provare che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D si supponga che nk ⊗N k=1 φk ∈ D, allora φk ∈ D(Ak ), ed essendo Dk dominio di essenziale aunk toaggiunzione di Ak , deve esistere una successione {φlk }l∈N con φlk → φk e Ank k φl → Ank k φk se l → +∞. Una facile stima, usando la decomposizione l m spettrale di Ak , implica allora che Am k φ → Ak φk se l → +∞ quando 1 ≤ N l N l m ≤ nk . Concludiamo che ⊗k=1 φk → ⊗k=1 φk e Q(A1 , . . . , AN )(⊗N k=1 φk ) → N Q(A1 , . . . , AN )(⊗k=1 φk ) quando l → +∞. Il risultato si estende alle combinazioni lineari finite di vettori della forma ⊗N k=1 φk . Questo implica che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An )D . Passiamo a provare (b). Per prima cosa, sfruttando (c) del teorema 9.13 e tenendo conto della separabilt` a di ciascuno spazio H, rappresentiamo ogni operatore autoaggiunto Ak in termini di un operatore moltiplicativo per la funzione Fk nello spazio di Hilbert L2 (Mk , μk ) che `e identificato con Hk . Ricordiamo che 2 N ⊗N e isomorfo a L2 (×N k L (Mk , μk ) ` k=1 Mk , μ) con μ = ⊗k=1 μk , come discusso in (1) di esempi 9.38. Sotto tale isomorfismo, l’operatore Q(A1 , . . . , AN ) su D corrisponde alla moltiplicazione per la funzione Q(F1 , . . . , FN ) e D corrisponde allo spazio generato in L2 (×N k=1 Mk , μ) da prodotti finiti φ1 (m1 ) · · · φN (mN ) tali che Fknk · φk ∈ L2 (Mk , μk ). Supponiamo che λ ∈ Q(σ(A1 ), . . . , σ(AN )). Se I λ `e un intervallo aperto, allora Q−1 (I) ⊃ ×N k=1 Ik per qualche intervallo aperto Ik ⊂ R, in modo tale che Ik ∩ σ(Ak ) = ∅ per ogni k = 1, 2, . . . , N . Si osservi ora che σ(Ak ) = ess ran(Fk ), dove si `e tenuto conto dell’esercizio 9.5. Conseguentemente μk (Fk−1 (Ik )) = 0 e quindi μ[Q(F1 , . . . , FN )−1 (I)] = 0. Questo significa
440
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
che λ ∈ ess ranQ(F1 , . . . , FN ) = σ(Q(A1 , . . . , PN )) per l’esercizio 9.5. Viceversa, se λ ∈ Q(σ(A1 ), . . . , σ(AN )) allora (λ − Q(F1 , . . . , FN )) : ×N k=1 Mk → R `e limitata e dunque λ ∈ ρ(Q(A1 , . . . , AN )), cio`e λ ∈ σ(Q(A1 , . . . , AN )). 9.4.3 Un esempio: il momento angolare orbitale In meccanica quantistica, le osservabili che corrispondono alle 3 componenti cartesiane del momento angolare orbitale di una particella, sono le uniche estensioni autoaggiunte dei tre operatori, sullo spazio di Hilbert L2 (R3 , dx) (dove dx `e la misura di Lebesgue su R3 ): L1 := X2 S(R3 ) P3 S(R3 ) −X3 S(R3 ) P2S(R3 ) , L2 := X3 S(R3 ) P1S(R3 ) −X1 S(R3 ) P3S(R3 ) L3 := X1 S(R3 ) P2 S(R3 ) −X2 S(R3 ) P1S(R3 ) ,
(9.97)
dove Xi e Pi sono gli operatori posizione ed impulso introdotti nella sezione 5.3, e S(R3 ) `e lo spazio di Schwartz delle funzioni a valori complessi, infinitamente differenziabili, che siannullano all’infinito pi` u rapidamente di ogni potenza negativa di r := x21 + x22 + x23 insieme a tutte le derivate di ogni ordine (vedi la sezione 3.6). Nel seguito sceglieremo dominio come D(L1 ) = D(L2 ) = D(L3 ) = S(R3 ), dato che S(R3 ) `e un sottospazio invariante per gli operatori Xi e Pi (e quindi anche per ogni Li ). Mostreremo nel seguito che gli operatori momento angolare orbitale Li , sul dominio detto, sono essenzialmente autoaggiunti e ne espliciteremo uno sviluppo spettrale e lo spettro. In questa sede ci occuperemo solo delle propriet`a matematiche degli operatori in questione, lasciando ogni commento di carattere fisico ai capitoli 10 e 11. Nel seguito ci concentreremo unicamente sull’operatore L3 , dato che, cambiando i nomi delle coordinate, quanto diremo per esso si pu` o estendere agli altri due analoghi operatori. Esplicitamente si pu` o scrivere:
∂ ∂ L3 = −i x1 , − x2 ∂x2 ∂x1 dove x1 e x2 si devono intendere come operatori moltiplicativi per le corrispondenti funzioni. Un quarto operatore che useremo nel seguito `e l’operatore momento angolare totale (elevato al quadrato): L2 := L21 + L22 + L23 , definito su S(R3 ). Anche tale operatore `e essenzialmente autoaggiunto su S(R3 ). Calcoleremo lo spettro e daremo la forma esplicita dello sviluppo spettrale di L2 := L2 . Per determinare gli sviluppi spettrali e gli spettri detti, conviene esplicitare gli operatori considerati in coordinate polari sferiche r, θ, φ dove x1 =
9.4 Prodotto tensoriale hilbertiano
441
r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ e quindi r ∈ (0 + ∞), θ ∈ (−π/2, π/2), φ ∈ (−π, π). In questo modo si trova, con qualche banale calcolo, che:
+ * ∂ 1 ∂2 ∂ 1 ∂ 2 2 L3 = −i sin θ , (9.98) + , L = − ∂φ sin θ ∂θ ∂θ sin2 θ ∂φ2 dove gli operatori agiscono sulle funzioni dello spazio di Schwartz S(R3 ) il cui argomento `e sottoposto al cambio di coordinate indicato sopra. Dalla (9.98) risulta evidente che i due operatori non dipendono dalla coordinata radiale r. Questo fatto si riveler`a di cruciale importanza. Tenendo conto di ci` o, notiamo che R3 = S2 × [0, +∞), dove (a meno di insiemi di misura nulla) la superficie sferica di raggio unitario S2 `e lo spazio su cui variano le coordinate θ, φ, mentre [0, +∞) `e lo spazio su cui varia la coordinata radiale r; ulteriormente la misura di Lebesgue di R3 pu` o essere vista come il prodotto delle misure: dx = dω(θ, φ) ⊗ r 2 dr , dove: dω(θ, φ) = sin θdθdφ 2
`e la misura standard su S identificata con il rettangolo (−π/2, π/2) × (−π, π) in coordinate (θ, φ) (l’insieme S2 \ ((−π/2, π/2) × (−π, π)) ha dω-misura nulla e pertanto non crea problemi). In questo modo abbiamo anche la decomposizione: L2 (R3 , dx) = L2 (S2 × [0, +∞), dω(θ, φ) ⊗ r 2 dr) . In base a (1) in esempi 9.38, abbiamo infine che: L2 (R, dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r 2dr) .
(9.99)
A questo punto definiamo gli operatori nello spazio di Hilbert L2 (S2 , dω):
+ * ∂ 1 ∂2 ∂ 1 ∂ 2 2 2 2 , sin θ , (9.100) L = −i L = − + 3 S S ∂φ sin θ ∂θ ∂θ sin2 θ ∂φ2 con dominio C ∞ (S2 ) delle funzioni infinitamente differenziabili su S2 vista come variet`a differenziabile1 C ∞ , che si pu` o provare essere denso in L2 (S2 , dω) (lo si provi per esercizio). Tali operatori risultano essere hermitiani e quindi simmetrici come `e facile verificare per computo diretto. Prima della formulazione della meccanica quantistica, dallo studio dell’equazione di Laplace (e 1 Vedere l’appendice in fondo al libro. In ogni caso l’idea `e semplicemente quella di ricoprire completamente S2 con pi` u carte locali, ottenute dall’iniziale sistema di coordinate θ,φ, ruotando gli assi cartesiani. Bastano 3 sistemi di coordinate locali costruiti in questo modo per ricoprire S2 . Le funzioni di C ∞ (S2 ), per definizione, sono quelle definite su S2 a valori in C che risultano essere C ∞ quando ristrette a ciascuno dei sistemi di coordinate locali suddetti.
442
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
dall’elettrodinamica classica) era gi`a noto che esiste una base hilbertiana di L2 (S2 , dω) costituito dalle cosiddette armoniche sferiche [NiOu82]: ! l (2l + 1) (l + m)! imφ 1 dl−m (−1) e Ylm (θ, φ) := l (1 − cos2 θ)l , 2 l! 4π (l − m)! sinm φ d(cos θ)l−m (9.101) dove: l = 0, 1, 2, . . . m ∈ N , |m| ≤ 2l + 1 . (9.102) Le funzioni Yml ∈ C ∞ (S2 ) sono note autofunzioni degli operatori differenziali S2 L3 e S2 Lz dati in (9.98), valendo: l S2 L3 Ym
= mYml ,
S2 L
2
Yml = 2 l(l + 1)Yml .
(9.103)
Si osservi che la prima identit` a `e ovvia per definizione delle funzioni Yml . In l particolare i vettori Ym sono un insieme di vettori analitici degli operatori simmetrici S2 L2 e S2 L3 , definiti su C ∞ (S2 ). Dato che le Yml formano una base hilbertiana dello spazio L2 (S2 , dω), esse garantiscono, per il criterio di Nelson (teorema 5.46), che gli operatori S2 L2 e S2 L3 definiti su C ∞(S2 ) siano essenzialmente autoaggiunti. Seguendo la stessa procedura usata nella sezione 9.1.3 per l’operatore hamiltoniano dell’oscillatore armonico unidimensionale, concludiamo che le decomposizioni spettrali di L2 := L2 e L3 := Lz sono: 2 2 l(l + 1)Yml (Yml | ) e S2 L3 = s mYml (Yml | ) (9.104) S2 L = sl∈N, m∈Z ,|m|≤2l+1
l∈N, m∈Z ,|m|≤2l+1
e, contestualmente, gli spettri sono:
1 2 σ(S2 L2 ) = σp(S2 L2 ) = 2 l(l + 1) l = 0, 1, 2 . . . ,
(9.105)
e σ(S2 L3 ) = σp (S2 L3 ) = { m | |m| ≤ 2l + 1 , m ∈ Z, l = 0, 1, 2 . . . } . (9.106) Torniamo ora allo spazio L2 (R3 , dx). Dato che lo spazio D(0, +∞) delle funzioni C ∞ a supporto compatto in (0, +∞) `e denso nello spazio di Hilbert separabile L2 ((0 + ∞), r 2dr), per (b) in proposizione 3.32, esister` a una base hilbertiana {ψn }n∈N costituita da funzioni in D(0, +∞). Si verifica per computo diretto, passando in coordinate cartesiane, che le funzioni: fl,m,n (x) = Yml (θ, φ)ψn (r) ,
(9.107)
a apparirebbero per x = 0, sono funzioni di classe C ∞ (R3 ) (le uniche singolarit` ma in un intorno di tale punto le funzioni dette si annullano per costruzione). Per costruzione, le funzioni fl,m,n hanno anche supporto compatto e pertanto appartengono a S(R3 ). Notando che, con le definizioni date e tenendo conto dei domini degli operatori considerati: S2 L3
⊗ ID(0,+∞) ⊂ L3
e
S2 L
2
⊗ ID(0,+∞) ⊂ L2 ,
9.5 Teorema di decomposizione polare per operatori non limitati
443
concludiamo che {Yml ⊗ ψn | n, l ∈ N, |m| ≤ 2l + 1 , m ∈ Z} ⊂ S(R3 ), `e una base hilbertiana di L2 (R3 , dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r 2 dr) per quanto visto in (2) in esempi 9.38. Dato che, evidentemente, pensando L3 e L2 come operatori su S(R3 ), L3 Yml ⊗ ψn = mYml ⊗ ψn ,
L2 Yml ⊗ ψn = 2 l(l + 1)Yml ⊗ ψn ,
(9.108)
possiamo concludere nuovamente che L2 e L3 sono essenzialmente autoaggiunti su tale dominio e valgono sviluppi spettrali per le loro uniche estensioni autoaggiunte L2 := L2 e Lz := Lz del tipo: L2 = s2 l(l + 1)Yml ⊗ ψn (Yml ⊗ ψn | ) l,n∈N, m∈Z ,|m|≤2l+1
e
Lz = s-
mYml ⊗ ψn (Yml ⊗ ψn | ) .
(9.109)
l,n∈N, m∈Z ,|m|≤2l+1
Mentre gli spettri di L2 := e L3 sono ancora dati da (9.105) e (9.106). Si noti che le misure spettrali di L2 e di L3 commutano. Si pu` o arrivare agli stessi risultati applicando in modo opportuno il teorema 9.43.
9.5 Teorema di decomposizione polare per operatori non limitati Consideriamo un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H. Usando il fatto che, come vedremo, A∗ A `e autoaggiunto positivo e sfruttando il teorema spettrale per operatori √ non limitati, `e possibile definire l’operatore positivo autoaggiunto |A| := A∗ A. Se definiamo, almeno su Ran(|A|), l’operatore U = A|A|−1 , estendendolo all’operatore nullo sull’ortogonale di Ran(|A|), abbiamo immediatamente che vale la decomposizione: A = U |A| . Formalmente, e senza prestare troppa attenzione ai domini, si verifica che U Ran(|A|) `e un’isometria. In questo modo si ottiene, a livello euristico, una generalizzazione del teorema 3.61 di decomposizione polare, che abbiamo provato per operatori limitati definiti su tutto lo spazio di Hilbert. Questo approccio diretto ha tuttavia il difetto che non `e evidente su quale dominio valga la decomposizione di sopra (a priori i domini di A e di |A| possono essere differenti) ed il tentativo di rendere rigoroso il ragionamento si rivela piuttosto pesante. Pertanto noi seguiremo un approccio pi` u indiretto, basato su un teorema pi` u generale. L’estensione del teorema di decomposizione polare che proveremo alla fine, gioca un ruolo fondamentale nella teoria quantistica dei campi rigorosa, in riferimento alla teoria modulare di Tomita-Takesaki ed alla definizione degli stati termici KMS [BrRo02].
444
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
9.5.1 Propriet` a degli operatori A∗ A, radici quadrate di operatori autoaggiunti positivi non limitati Procediamo in alcuni passi, dimostrando prima che, nelle ipotesi di A chiuso e densamente definito, A∗ A `e autoaggiunto e che D(A∗ A) `e un core per A, e quindi un teorema che, in un certo senso, generalizza in teorema di decomposizione polare, avendo cura di specificare in modo chiaro i domini degli operatori. Infine proveremo una proposizione riguardate l’esistenza e l’unicit`a delle radici quadrate autoaggiunte positive di operatori autoaggiunti non limitati. Teorema 9.44. Si consideri un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H. Valgono i seguenti fatti: (a) A∗ A, definito sul dominio naturale D(A∗ A) (definizione 5.1), `e autoaggiunto; (b) il sottospazio denso D(A∗ A) `e un core per A: AD(A∗ A) = A .
(9.110)
Dimostrazione. Per dimostrare (a), indicato con I : H → H l’operatore identit` a, introduciamo l’operatore I + A∗ A, definito sul suo dominio naturale (che coincide ancora con D(A∗ A), come si dimostra immediatamente dalla definizione 5.1). Proveremo sotto che esiste un operatore positivo P ∈ B(H) tale che Ran(P ) = D(I + A∗ A), e che soddisfa: (I + A∗ A)P = I ,
P (I + A∗ A) = ID(I+A∗ A) .
(9.111)
Per (f) in proposizione 3.49, l’operatore P ∈ B(H) deve essere autoaggiunto in quanto positivo. Per l’unicit` a della funzione inversa, l’operatore I + A∗ A deve allora coincidere con l’inverso di P , ottenuto tramite la sua decomposizione spettrale: P −1 =
λ−1 dP (P ) (λ) .
σ(P )
Tale operatore `e autoaggiunto in virt` u del teorema 9.4. Dunque, l’operatore A∗ A = (I+A∗ A)−I `e allora autoaggiunto sul dominio D(I+A∗ A) = D(A∗ A), che dovr` a essere denso di conseguenza. Per concludere la dimostrazione proviamo che esiste P ∈ B(H) positivo, con Ran(P ) = D(I + A∗ A) e che vale (9.111). Se f ∈ D(I + A∗ A) = D(A∗ A) allora Af ∈ D(A∗ ) per definizione di D(A∗ A). Di conseguenza: (f|f) + (Af|Af) = (f|f) + (f|A∗ Af) = (f|(I + A∗ A)f) . Abbiamo in tal modo ottenuto che (I + A∗ A) ≥ 0, ma anche, dalla disuguaglianza di Cauchy-Schwarz, che deve essere ||f||2 ≤ ||f|| ||(I + A∗ A)f|| e dunque I + A∗ A : D(A∗ A) → H `e iniettivo. Consideriamo ora l’operatore A che `e chiuso e densamente definito. L’identit`a provata in (d) del teorema 5.9,
9.5 Teorema di decomposizione polare per operatori non limitati
445
implica che che, per ogni h ∈ H esiste un unico P h ∈ D(A), ed un unico Qh ∈ D(A∗ ) tali che in H ⊕ H: (0, h) = (−AP h, P h) + (Qh, A∗ Qh) .
(9.112)
Per costruzione P, Q sono definiti su tutto H ed inoltre i due vettori a secondo membro, pensati come vettori di H ⊕ H, sono ortogonali. Per definizione della norma usata su H ⊕ H, l’dentit` a ottenuta ci dice anche che, per ogni h ∈ H: ||h||2 ≥ ||P h||2 + ||Qh||2 e quindi P, Q ∈ B(H) valendo ||P ||, ||Q|| ≤ 1. Considerando le singole componenti in (9.112), si ha anche che: Q = AP
e
h = P h + A∗ Qh = P h + A∗ AP h = (I + A∗ A)P h ,
per ogni h ∈ H. Quindi (I + A∗ A)P = I e pertanto P : H → D(I + A∗ A) deve essere iniettiva, ma anche suriettiva dato che (I + A∗ A) `e iniettiva, come provato sopra. Per l’unicit` a dell’inversa di funzioni biettive, deve anche essere: P (I + A∗ A) = ID(I+A∗ A) . Fino ad ora abbiamo provato che P ∈ B(H) ha immagine che ricopre D(I + A∗ A) e che vale (9.111). Il fatto che P ≥ 0 si prova come segue. Se h ∈ H, allora h = (I + A∗ A)f per qualche f ∈ D(A∗ A) e quindi: (P h|h) = (P (I + A∗ A)f|(I + A∗ A)f) = (f|(I + A∗ A)f) ≥ 0 . Per concludere, dimostriamo (b). Dato che A `e chiuso, il suo grafico `e un sottospazio chiuso di H ⊕ H ed `e di conseguenza uno spazio di Hilbert. Supponiamo allora che (f, Af) ∈ G(A) sia ortogonale a G(AD(A∗ A) ), allora, per ogni x ∈ D(A∗ A) deve essere: 0 = ((f, Af)|(x, Ax)) = (f|x) + (Af|Ax) = (f|x) + (f|A∗ Ax) = (f|(I + A∗ A)x)) . Dato che Ran(I + A∗ A) = H, deve essere f = 0 e quindi l’ortogonale di G(A D(A∗ A) ) rispetto allo spazio di Hilbert G(A) `e banale e dunque: G(AD(A∗ A) ) = G(A), che `e la tesi. Passiamo ora ad enunciare e provare un notevole teorema che, unitamente ad un teorema di unicit` a delle radici quadrate positive di operatori autoaggiunti positivi (non limitati) implica, come sottocaso, il teorema di decomposizione polare per operatori chiusi e densamente definiti. Ricordiamo che, per una coppia di operatori con lo stesso dominio D, P ≤ Q significa (f|P f) ≤ (f|Qf) per ogni f ∈ D.
446
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Teorema 9.45. Si consideri una coppia di operatori chiusi e con dominio denso, A : D(A) → H, B : D(B) → H nello spazio di Hilbert H. (a) Se vale: D(A∗ A) ⊃ D(B ∗ B)
unitamente a
A∗ AD(B∗ B) ≤ B ∗ B ,
(9.113)
allora D(A) ⊃ D(B) ed esiste un operatore limitato C : H → H unicamente individuato dalle richieste: AD(B) = CB ,
Ker(C) ⊃ Ker(B ∗ ) .
(9.114)
Ulteriormente risulta ||C|| ≤ 1 e C(Ran(B))⊥ = 0. (b) Se vale: D(A∗ A) ⊃ D(B ∗ B)
unitamente a
A∗ AD(B∗ B) = B ∗ B ,
(9.115)
allora CRan(B) `e un’isometria e Ker(C) = Ker(B ∗ ). (c) Se vale: D(A∗ A) = D(B ∗ B)
unitamente a
A∗ A = B ∗ B ,
(9.116)
allora D(A) = D(B). Dimostrazione. (a) Per prima cosa proviamo l’unicit` a di C. Se C e C so no limitati e soddisfano A = CB e A = C B, allora C − C `e l’operatore nullo su Ran(B). Per continuit` a, abbiamo anche che C Ran(B) = C Ran(B) . Dato che vale la decomposizione ortogonale H = Ran(B) ⊕ (Ran(B))⊥ e (Ran(B))⊥ = Ker(B ∗ ), il fatto che KerC ⊃ Ker(B ∗ ), KerC ⊃ Ker(B ∗ ) implica che C(Ran(B))⊥ = C (Ran(B))⊥ . Di conseguenza C = C . Passiamo a provare che esiste un operatore C ∈ B(H) che soddisfa A = CB su D(B) (e quindi questo implica che D(B) ⊂ D(A)), Ker(C) ⊃ Ker(B ∗ ) e che sono vere le propriet` a ||C|| ≤ 1 e C(Ran(B))⊥ = 0. Siano A e B le restrizioni di A e B a, rispettivamente, D(A∗ A) e D(B ∗ B). Dato che (per il teorema precedente) questi spazi sono core per A e B rispettivamente, abbiamo che: Ran(A ) = Ran(A) e Ran(B ) = Ran(B). Notiamo infine che: Ker(A) = Ker(A ) e Ker(B) = Ker(B ), dato che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B). Cominciamo con il produrre un operatore che soddisfi: A = CB . Questa richiesta individua completamente un operatore lineare C su Ran(B ), definito come: A f = CB f , per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A) . Perch´e questa sia una definizione ben posta, bisogna che B f = B g implichi A f = A g cio`e, detto in termini equivalenti: B h = 0 implichi A h = 0 per h ∈ D(B ∗ B) ⊂ D(A∗ A). Questo fatto `e vero. Infatti: B h = 0 implica che (B h|B h) = 0 e quindi, essendo h ∈ D(B ∗ B) ⊂ D(A∗ A), deve valere 0 = (B h|B h) = (h|B ∗ Bh) ≥ (h|A∗ Ah) = (A h|A h) = ||A h||2 ≥ 0, che
9.5 Teorema di decomposizione polare per operatori non limitati
447
implica A h = 0. L’operatore C risulta essere limitato su Ran(B ) con ||C|| ≤ 1. Infatti, essendo: A∗ A ≤ B ∗ B ed usando il fatto che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B), si ha subito che, se f ∈ D(B ∗ B) ⊂ D(A∗ A), allora: ||C(B f)||2 = (CB f|CB f) = (A f|A f) = (f|A∗ Af) ≤ (f|B ∗ Bf) = (B f|B f) = ||B f||2 .
(9.117)
Pertanto C si estende in modo unico su tutto Ran(B ) = Ran(B), conservando la richiesta ||C|| ≤ 1. Per completare la definizione di C : H → H, `e sufficiente definire C sull’ortogonale (Ran(B))⊥ = Ker(B ∗ ). Definiamo C come l’operatore nullo su questo spazio. In questo modo C : H → H risulta ancora essere limitato con ||C|| ≤ 1 e la condizione Ker(C) ⊃ Ker(B ∗ ) risulta essere soddisfatta. Per costruzione, per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A), vale: Af = CBf . Dato che D(B ∗ B) `e un core per B, se g ∈ D(B) esister`a una successione {fn }n∈N ⊂ D(B ∗ B) ⊂ D(A∗ A), tale che fn → g e Bfn → Bg. Avremo allora che, dalla continuit` a di C, lim Afn = lim CBfn = C lim Bfn = Bg .
n→+∞
n→+∞
n→+∞
Dato che A `e chiuso, questo risultato implica che g ∈ D(A) e che limn→+∞ Afn = Ag. Pertanto A = CB si estende, in realt` a, a A = CB valida su D(B) ⊂ D(A). (b) Nell’ipotesi A∗ A = B ∗ B su D(B ∗ B) ⊂ D(A∗ A), la (9.117) risulta essere rimpiazzata da, se f ∈ D(B ∗ B) ⊂ D(A∗ A): ||C(B f)||2 = (CB f|CB f) = (A f|A f) = (f|A∗ Af) = (f|B ∗ Bf) = (B f|B f) = ||B f||2 . Da tale identit` a si ricava che C `e un isometria su Ran(B) e, per continuit` a, su Ran(B). Rimane da dimostrare che Ker(C) ⊂ Ker(B ∗ ), dato che l’altra inclusione `e valida nel caso generale (a). Se s ∈ Ker(C), dato che si ha la decomposizione ortogonale H = Ran(B) ⊕ Ker(B ∗ ), deve essere s = r + n con r ∈ Ran(B) e n ∈ Ker(B ∗ ). Pertanto, dal momento che Ker(B ∗ ) ⊂ Ker(C), 0 = Cs = C(r + n) = Cr + Cn = Cr + 0 = Cr. D’altra parte, dato che C `e un isometria su Ran(B), 0 = ||Cr|| = ||r|| e quindi Cr = 0. In definitiva, se s ∈ Ker(C), allora s = n ∈ Ker(B ∗ ) e questo conclude la dimostrazione di Ker(C) ⊂ Ker(B ∗ ). (c) Dobbiamo provare che D(A) = D(B) se D(A∗ A) = D(B ∗ B) e A∗ A = B ∗ B. Dalla dimostrazione del caso pi` u generale (a), sappiamo che D(B) ⊂ D(A). Nelle ipotesi in (c), possiamo scambiare il ruolo di A e B, trovando che D(A) ⊂ D(B) e pertanto D(A) = D(B). Ecco l’ultimo ingrediente che generalizza parte del teorema 3.57
448
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Teorema 9.46. Sia A : D(A) → H un operatore autoaggiunto nello spazio di Hilbert H. Valgono i fatti seguenti. (a) A ≥ 0 se e solo se σ(A) ⊂ [0 + ∞). (b) Se A ≥ 0, esiste ed `e unico un operatore autoaggiunto B ≥ 0 tale che B 2 = A, dove il primo membro `e definito sul suo dominio naturale D(B 2 ) che coincide con √ D(A). Vale B = A definito usando l’integrale rispetto alla misura spettrale di A. Dimostrazione. (a) Se σ(A) ⊂ [0 + ∞), (g) nel teorema 9.4, riferito alla PVM P (A) di A, implica immediatamente che A ≥ 0. Viceversa, supponiamo che A ≥ 0 e, per assurdo, che esista λ tale che 0 > λ ∈ σ(A). Se λ ∈ σp (A) allora esisterebbe un autovettore ψ ∈ H \ {0} con autovalore λ e si avrebbe un assurdo: 0 ≤ (ψ|Aψ) = ||ψ||2 λ < 0. Se invece λ ∈ σc(A), dal teorema 9.9 (A) sappiamo che, per ogni intervallo aperto (a, b) λ, vale P(a,b) = 0. Potremmo (A)
allora scegliere (a, b) = (2λ, λ/2) ottenendo, se 0 = ψ ∈ P(a,b)(H), usando le propriet` a delle misure spettrali del teorema 9.4 ed il fatto che μψ si annulla fuori da (a, b): 0 ≤ (ψ|Aψ) = xdμψ (x) = xdμψ (x) ≤
R
(2λ,λ/2)
(2λ,λ/2)
λ λ dμψ (x) = ||ψ||2 < 0 , 2 2
che `e ancora un assurdo. (b) Una radice quadrata autoaggiunta positiva di A `e semplicemente: √ √ B = A := xdP (A)(x) . σ(A)
Tale operatore `e ben definito, dato che σ(A) ⊂ [0, +∞), `e autoaggiunto per (b) nel teorema 9.4 e vale B 2 = A, dove il primo membro `e definito sul suo dominio naturale D(B 2 ) che coincide con D(A) in virt` u di (c) e (d) nel teorema 9.4. Infine B ≥ 0 per (g) nel teorema 9.4. Passiamo alla dimostrazione a. Supponiamo che B ≥ 0 sia autoaggiunto e B ≥ 0 per cui: B = di unicit` (B) xdP (x). Se vale anche B 2 = A con A ≥ 0, tenendo conto di (9.46) [0,+∞) abbiamo: (A) 2 (B) xdP (x) = x dP (x) = xdP (B)(f −1 (x)) [0,+∞)
[0,+∞)
[0,+∞)
dove f(x) = x2 con x ≥ 0, per cui f −1 : [0, +∞) → [0 + ∞) `e ben definita come funzione. Per l’unicit` a della misura spettrale di A, deve essere, in particolare, P (B) (f −1 (E )) = P (A)(E ) per ogni boreliano E ⊂ [0, +∞). Se E ⊂ [0, +∞) `e un boreliano, f(E) ⊂ [0, +∞). Pertanto, ponendo E = f(E), abbiamo che P (B) (E) = P (A) (f(E)) per ogni boreliano E ⊂ [0, +∞) (e ovviamente P (B) (E) = 0 se E ⊂ (−∞, 0)). Quindi A determina completamente B determinandone la sua unica PVM.
9.5 Teorema di decomposizione polare per operatori non limitati
449
9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti Possiamo finalmente enunciare e dimostrare il teorema di decomposizione polare per operatori chiusi densamente definiti. L’idea euristica della dimostrazione `e quella di partire, non da A, ma da A∗ A. Se il teorema di decomposi√ zione polare vale, allora ci si aspetta che A∗ A = |A| |A|, dove |A| := A∗ A `e definito per via spettrale, ricordando che A∗ A `e autoaggiunto come provato precedentemente. A questo punto, il teorema 9.45, nel caso (c), produce la decomposizione polare di A voluta. La potenza dell’approccio si vede nel fatto che le propriet` a dei domini degli operatori coinvolti, difficili da studiare con un approccio pi` u diretto, risultano essere automaticamente fissate dal teorema 9.45. Teorema 9.47. Sia A : D(A) → H un operatore chiuso con dominio denso nello spazio di Hilbert H. Valgono i fatti seguenti. (a) Esiste una sola coppia di operatori P, U in H tali che valgano insieme le condizioni elencate di seguito: (1) vale la decomposizione: A = UP ,
(9.118)
(2) P `e positivo, autoaggiunto e D(P ) = D(A), (3) U ∈ B(H) `e isometrico su Ran(P ), (4) Ker(U ) ⊃ Ker(P ). √ (b) Risulta essere P = |A| := A∗ A e Ker(U ) = Ker(P ) = Ker(A) = (Ran(P ))⊥. (c) Se A `e biettivo, U coincide con l’operatore unitario A|A|−1 . Dimostrazione. (a) e (b). Dimostriamo inizialmente l’unicit`a di P determinandolo esplicitamente, assumendo valida (9.118) insieme a (2), (3) e (4). Cominciamo con il provare che D(A∗ A) = D(P P ). Dalla definizione di operatore aggiunto, tenendo conto che U ∈ B(H), (9.118) implica A∗ = P ∗U ∗ = P U ∗ . Di conseguenza f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ). Si osservi ora che, decomponendo H come Ran(P ) ⊕ Ker(P ∗ ) = Ran(P ) ⊕ Ker(P ), tenendo conto del fatto che U `e isometrico su Ran(P ) e si annulla su Ker(P ), segue facilmente che (U ∗ U )Ran(P ) = I Ran(P ) . Pertanto l’asserzione f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ) risulta essere equivalente a f ∈ D(A∗ A) se e solo se f ∈ D(P P ). Abbiamo ottenuto che D(A∗ A) = D(P P ). Usiamo ora tale fatto per ottenere l’unicit`a di P determinandolo esplicitamente. Se g ∈ D(A∗ A) ⊂ D(A) (che equivale a g ∈ D(P P ) ⊂ D(P )) e tenendo ancora conto del fatto U `e isometrico su Ran(P ), si ha subito: (f|A∗ Ag) = (Af|Ag) = (U P f|U P g) = (P f|P g) = (f|P P g) se f ∈ D(A) = D(P ).
450
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Essendo D(A) = D(P ) un insieme denso, si conclude che A∗ A = P P . Quindi P `e una radice quadrata positiva autoaggiunta di A∗ A, ed `e dunque l’unica per √ il teorema 9.46. Vale pertanto P = A∗ A =: |A|. A questo punto possiamo applicare il caso (c) del teorema 9.45 con B = P (che `e chiuso e densamente definito essendo autoaggiunto), trovando che l’operatore U che verifica tutte le richieste coincide con l’operatore C. Il fatto che Ker(U ) = Ker(P ) = (Ran(P ))⊥ segue da (b) del teorema citato, tenendo conto che B = P = P ∗ = B ∗ nel caso in esame e del fatto che (Ran(P ∗))⊥ = Ker(P ). L’asserto Ker(A) = Ker(P ) si prova come segue: 0 = ||Af||2 = (Af|Af) = (f|A∗ Af) = (f|P P f) = (P f|P f) = ||P f||2 , dove abbiamo tenuto conto che se Af = 0 allora f ∈ D(A∗ A) per definizione di tale dominio naturale. (c) Se A `e iniettivo, usando (b), si trova che Ker(A) = Ker(U ) `e banale e quindi U `e iniettivo. D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A) e pertanto, se A `e suriettivo, deve esserlo U . Concludiamo che, se A `e biettivo, U deve essere tale. In tal caso, per (b), U `e un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H ed `e quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| `e biettivo e quindi possiamo scrivere: U = A|A|−1 .
9.6 I teoremi di Kato-Rellich e di Kato Gli ultimi teoremi che enunceremo e dimostreremo ora sono quello di KatoRellich e quello di Kato. Tali teoremi risultano essere utilissimi nello studio delle propriet` a di autoaggiunzione e limitatezza inferiore degli operatori della Meccanica Quantistica (specialmente i cosiddetti operatori hamiltoniani), nell’ambito della teoria delle perturbazioni. In effetti, il primo dei due teoremi fissa delle condizioni generali sufficienti affinch`e un operatore T + V , perturbazione di T , sia autoaggiunto e con spettro limitato dal basso quando lo `e T . Il secondo considera casi specifici in cui T `e l’operatore di Laplace in R3 o Rn . 9.6.1 Il teorema di Kato-Rellich Abbiamo bisogno di una definizione preliminare. Definizione 9.48. Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti nello spazio di Hilbert H con D(T ) ⊂ D(V ). Se esistono a, b ∈ [0, +∞) tali che: ||V ϕ|| ≤ a||T ϕ|| + b||ϕ|| per ogni ϕ ∈ D(T ) ,
(9.119)
9.6 I teoremi di Kato-Rellich e di Kato
451
si dice che V `e T -limitato. L’estremo inferiore dei valori a che verificano (9.119) per qualche b `e detto il limite relativo di V rispetto a T e, se esso risulta essere nullo, si dice che V `e infinitesimo rispetto a T . Osservazioni 9.49. (1) Se T `e chiudibile, come segue immediatamente dalla definizione di core (definizione 5.19), per provare che vale (9.119) `e sufficiente mostrare che tale condizione `e soddisfatta su un core di T . (2) La condizione (9.119) `e equivalente alla condizione: ||V ϕ||2 ≤ a21 ||T ϕ||2 + b21 ||ϕ||2
per ogni ϕ ∈ D(T ) .
(9.120)
Infatti, se vale la (9.120) allora vale la (9.119) con a = a1 e b = b1 . Viceversa, se vale la (9.119) allora vale la (9.120) con a21 = (1 + δ)a2 , b21 = (1 − δ −1 )b2 per ogni δ > 0. Possiamo passare ad enunciare e provare il Teorema di Kato-Rellich. Ricordiamo che, per un operatore autoaggiunto A : D(A) → H, vale σ(A) ⊂ [M, +∞) se e solo se (ψ|Aψ) ≥ M (ψ|ψ) per ogni ψ ∈ D(A) per (a) in teorema 9.46. Conseguentemente, l’enunciato (c) del teorema pu`o essere, equivalentemente, scritto in termini di limiti inferiori di forme quadratiche. Teorema 9.50. (Kato-Relich.) Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti sullo spazio di Hilbert H che verificano: (i) T `e autoaggiunto, (ii) V `e simmetrico, (iii) V `e T -limitato con limite relativo a < 1. Sotto tali ipotesi vale quanto segue. (a) T + V `e autoaggiunto su D(T ). (b) T + V `e essenzialmente autoaggiunto su ogni core di T . (c) Se σ(T ) ⊂ [M, +∞) allora σ(T + V ) ⊂ [M , +∞) con: b M = M − max , a|M | + b , con a e b che soddisfano (9.119). (1 − a) Dimostrazione. Per provare (a) cerchiamo di applicare il teorema 5.17, mostrando che, scegliendo D(T ) come dominio per l’operatore simmetrico T +V , risulta Ran(T + V ± iI) = H. In realt` a proveremo che esiste ν > 0 per cui Ran(T + V ± iνI) = H , che implica immediatamente l’affermazione precedente per linearit`a. Se ϕ ∈ D(T ), nelle nostre ipotesi di T autoaggiunto deve valere Ran(T + iμI) = H e anche: ||(T + iμI)ϕ||2 = ||T ϕ||2 + μ2 ||ϕ||2 . Ponendo ϕ = (T + iμI)−1 ψ, si conclude che: ||T (T + iμI)−1 || ≤ 1 e
||(T + iμI)−1 || ≤ μ−1 .
452
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Applicando (9.119) con ϕ = (T + iμI)−1 ψ concludiamo che: −1
||V (T + iμI)
−1
ψ|| ≤ a||T (T + iμI)
−1
ψ|| + b||(T + iμI)
ψ|| ≤
b a+ μ
||ψ|| .
Prendendo μ = ν abbastanza grande, l’operatore limitato definito su tutto H, U := V (T + iνI)−1 , deve soddisfare ||U || < 1, dato che a < 1. Questo risultato implica che −1 ∈ σ(U ) per (iii) in (c) nel teorema 8.4. Tenendo conto di (a) teorema 8.4 (notando che U `e chiuso essendo limitato) avremo di conseguenza che Ran(I + U ) = H. D’altra parte, dato che T `e autoaggiunto, deve anche essere Ran(T + iνI) = H per il teorema 5.17. Conseguentemente, l’equazione (I + U )(T + iνI)ϕ = (T + V + iνI)ϕ con ϕ ∈ D(T ) implica che, come volevamo, Ran(T + V + iνI) = H. La prova per l’altra l’identit` a, Ran(T + V − iνI) = H, si esegue del tutto similmente. La prova di (a) `e conclusa. Passiamo a provare (b). Da (9.119) segue che, se D ⊂ D(T ) `e un core per T , allora: D(T ) = D T D ⊂ D (T + V )D . D’altra parte, per costruzione e tenendo conto che T + V `e autoaggiunto su D(T ) per cui `e chiuso: D (T + V )D ⊂ D (T + V ) = D (T + V ) = D(T ) . Mettendo insieme le catene di inclusioni, si conclude che deve essere vero che: D (T + V )D = D (T + V ) e quindi (T + V )D = T + V , dato che T + V `e chiuso. (T + V )D `e allora essenzialmente autoaggiunto per la proposizione 5.18. Per concludere, passiamo alla prova di (c). Per ipotesi, dal teorema spettrale, con ovvia notazione, σ(T ) ≥ M . Si scelga s > −M (con s ∈ R). Di conseguenza vale σ(T + sI) > 0 e quindi 0 ∈ σ(T + sI). Dato che T + sI `e autoaggiunto, `e anche chiuso e allora, per (a) in teorema 8.4: Ran(T + sI) = H e le stesse stime usate precedentemente mostrano che ||V (T + sI)−1 || < 1 se: b −s < M := M − max , a|M | + b . (1 − a) Di conseguenza, per tali valori di s: Ran(T + V + sI) = H
e
(T + V + sI)−1 = (T + sI)−1 (I + U )−1 ,
che implica −s ∈ ρ(T + V ), e quindi −s ∈ σ(T + V ). Dato che T + V `e autoaggiunto ed ha quindi spettro reale, questo significa che σ(T + V ) ≥ M .
9.6 I teoremi di Kato-Rellich e di Kato
453
9.6.2 Un esempio: l’operatore −Δ + V e il teorema di Kato La condizione (9.119) nasce naturalmente in certi contesti e risulta essere di grande utilit` a nelle applicazioni, in fisica, nello studio dell’equazione di Schr¨ odinger in cui appare l’operatore di Laplace Δ perturbato tramite un potenziale V . Per discutere tale esempio di applicazione del teorema di KatoRelich, premettiamo la seguente proposizione ed un successivo lemma. Proposizione 9.51. Sia Δ :=
n ∂2 ∂x2i i=1
(9.121)
l’operatore di Laplace su Rn pensato come operatore su L2 (Rn , dx), valgono i fatti seguenti. (a) Se F : L2 (Rn , dx) → L2 (Rn , dk) indica l’operatore unitario di FourierPlancherel (vedi sezione 3.6), Δ `e essenzialmente autoaggiunto su S(Rn ), su D(Rn ) e su F(D(Rn )) ed ammette la stessa (unica) estensione autoaggiunta Δ. (b) Vale: FΔF−1 f (k) := −k 2 f(k) , (9.122) dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da:
D(FΔF−1 ) = f ∈ L2 (Rn , dk)
k 4 |f(k)|2 dk < +∞ . Rn
(c) Vale il limite dal basso per −Δ = −Δ: σ(−Δ) ⊂ [0, +∞)
che equivale a (ψ|−Δψ) ≥ (ψ|ψ) per ogni ψ ∈ D(−Δ). (9.123)
Dimostrazione. (a) e (b) sono stati provati negli esercizi 5.11 e 5.12, eccetto il fatto che Δ sia essenzialmente autoaggiunto su F(D(Rn )) e determini la stessa estensione autoaggiunta ottenuta partendo da D(Rn ) e S(Rn ). A tal fine si noti prima di tutto che F(D(Rn )), D(Rn ) ⊂ S(Rn ) e quindi le tre estensioni autoaggiunte devono coincidere per l’unicit` a dell’estensione autoaggiunta di operatori essenzialmente autoaggiunti. Il fatto che che Δ sia essenzialmente autoaggiunto su F(D(Rn )), vista l’unitariet` a di F e la (9.122), `e equivalente all’essenziale autoaggiunzione dell’operatore simmetrico moltiplicativo per −k 2 su D(Rn ). La validit` a di tale propriet` a segue subito dall’osservazione che tutti gli elementi ϕ = ϕ(k) di D(Rn ) sono vettori analitici dell’operatore moltiplicativo per −k 2 , come si verifica direttamente, valendo || − (k 2 )n ϕ|| ≤ ||ϕ||(supk∈suppϕ |k|2)n . Quindi, tenendo conto del teorema 5.46 di Nelson, (c) segue immediatamente da (b) e da (a) in teorema 9.46. Passiamo al seguente fondamentale classico lemma.
454
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Lemma 9.52. Se n = 1, 2, 3 `e fissato, si consideri f ∈ L2 (Rn , dx) ∩ D(Δ). In tal caso f coincide, a meno di insiemi di misura nulla, con una funzione continua e limitata e, per ogni a > 0, esiste b > 0 indipendente da f tale che: ||f||∞ ≤ a||Δf|| + b||f|| .
(9.124)
Dimostrazione. Eseguiamo la dimostrazione di (9.125) nel caso n = 3, gli altri due casi sono analoghi. Nel seguito fˆ := Ff. Da (a) in proposizione 3.69 e dal teorema di Plancherel (teorema 3.72), la tesi `e provata se si riesce a dimostrare che fˆ ∈ L1 (R3 , dk) e che, per ogni fissato a > 0, esiste b ∈ R con: ˆ 2. ˆ 1 ≤ a||k 2 fˆ||2 + b||f|| ||f||
(9.125)
Se f ∈ D(Δ) allora, in base alla proposizione 9.51, fˆ ∈ D(FΔF−1 ) e quindi anche (1 + k 2 )fˆ ∈ L2 (R3 , dk). Dato che (k1 , k2, k3 ) → 1/(1 + k 2 ) appartiene allo stesso spazio di Hilbert, segue che fˆ ∈ L1 (R3 , dk) per la disuguaglianza di Cauchy-Schwarz e ancora:
ˆ 1 ≤ c||(1 + k 2 )fˆ||2 ≤ c(||k 2fˆ||2 + ||f|| ˆ 2) ||f||
(9.126)
dove: c := (1 + k 2 )−1 dk. Se r > 0, definiamo fˆr (k) := r 3 fˆ(rk). Con tale deˆ 1 , ||fˆr ||2 = r 3/2 ||f|| ˆ 2 e ||k 2 fˆr ||2 = r −1/2 ||k 2fˆ||2 . finizione risulta: ||fˆr ||1 = ||f|| ˆ Usando (9.126) per fr e tenendo conto delle tre identit`a trovate, si ottiene: ˆ 2 ˆ 1 ≤ cr −1/2 ||k 2fˆ||2 + cr 3/2 ||f|| ||f||
per ogni r > 0.
Scegliendo r opportunamente si trova cr −1/2 = a e quindi (9.125) risulta essere verificata. Osservazione 9.53. Il lemma precedente si pu` o generalizzare (vedi il vol. II di [ReSi80]) con la seguente proposizione basata sulla disuguaglianza di Young. Sia f ∈ L2 (Rn , dx) con f ∈ D(Δ). Se n ≥ 4 e 2 ≤ q < 2n/(n − 4), allora f ∈ Lq (Rn , dk) e, per ogni a > 0, esiste b ∈ R indipendente da f (ma dipendente da q, n e a) tale che ||f||q ≤ a||Δf|| + b||f||. Possiamo ora applicare il teorema di Kato-Rellich ad un caso particolare di grande interesse in Meccanica Quantistica, provando un primo teorema dovuto a Kato. Successivamente vedremo un teorema pi` u generale, sempre dovuto a Kato, che include il seguente teorema come caso particolare. Teorema 9.54. (Essenziale autoaggiunzione di −Δ + V .) Sia n = 1, 2, 3 fissato. Si supponga che V = V2 +V∞ con V0 ∈ L2 (Rn , dx) e V∞ ∈ L∞ (Rn , dx) funzioni a valori reali. Vale quanto segue. (a) −Δ + V `e essenzialmente autoaggiunto su D(Rn ) e su S(Rn ). (b) L’unica estensione autoaggiunta −Δ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −Δ + V definito su D(Δ). (c) σ(−Δ + V ) `e limitato dal basso.
9.6 I teoremi di Kato-Rellich e di Kato
455
Dimostrazione. Dato che V `e reale, esso individua un operatore moltiplicativo autoaggiunto sul dominio: D(V ) := {ϕ ∈ L2 (Rn , dx) | V ϕ ∈ L2 (Rn , dx)} . Per costruzione si ha anche, se ϕ ∈ D(Rn ) oppure ϕ ∈ S(Rn ): ||V ϕ||2 ≤ ||V2 ||2 ||ϕ||∞ + ||V∞||∞||ϕ||2 < +∞
(9.127)
quindi D(Rn ) ⊂ S(Rn ) ⊂ D(V ). Ulteriormente, dato che S(Rn ) ⊂ D(Δ) (per la proposizione 9.51), usando (9.124) nel lemma 9.52 (essendo n ≤ 3), troviamo allora che, per ogni a > 0, esiste un corrispondente b > 0 tale che: ||V ϕ||2 ≤ a||V2 ||2 || − Δϕ||2 + (b + ||V∞||∞)||ϕ||2
per ogni ϕ ∈ S(Rn ) .
In altre parole, se a > 0, esiste un corrispondente b > 0 tale che: ||V ϕ||2 ≤ a || − Δϕ||2 + b ||ϕ||2 per ogni ϕ ∈ S(Rn )
(9.128)
e quindi, in particolare, anche per ogni ϕ ∈ D(Rn ). Di conseguenza vale anche: ||V ϕ − V ϕ ||2 ≤ a ||(−Δϕ) − (−Δϕ )||2 + b ||ϕ − ϕ ||2 per ϕ e ϕ in S(Rn ). Usando il fatto che V `e chiuso, perch´e autoaggiunto, e che S(Rn ) `e un core per l’operatore autoaggiunto (e quindi chiuso) −Δ (per la proposizione 9.51), la disuguaglianza appena scritta mostra che D(V ) ⊃ D(−Δ). Usando ancora la chiusura degli operatori, si conclude infine che la (9.128) vale su tutto il dominio di −Δ: ||V ϕ||2 ≤ a ||−Δϕ||2 + b ||ϕ||2
per ogni ϕ ∈ D(−Δ).
Se scegliamo a < 1, abbiamo che tutte le ipotesi del teorema 9.50 di KatoRellich sono soddisfatte per T := −Δ, con V come nelle ipotesi di questo teorema. La tesi segue immediatamente dalla tesi del teorema di KatoRellich usando anche il fatto che S(Rn ) e D(Rn ) sono core per −Δ, per la proposizione 9.51. Osservazione 9.55. Tenendo conto dell’osservazione precedente, il teorema si generalizza al casi n > 3, con un’analoga dimostrazione, modificando la richiesta su V in V = Vp + V∞ con Vp ∈ Lp (Rn , dx) e V∞ ∈ L∞ (Rn , dx) dove p > 2 se n = 4 e p = n/2 se n ≥ 5. Passiamo al classico Teorema di Kato. Nel seguito f ∈ Lp (Rn , dx)+Lq (Rn , dx) si deve interpretare nel senso che la funzione f `e la somma di un elemento in Lp (Rn , dx) e un elemento in Lq (Rn , dx). Teorema 9.56. (Di Kato.) Sia n = 1, 2, 3 fissato. Si indichino con (y1 , . . . , yN ) gli elementi di RnN , dove yk ∈ Rn per ogni k = 1, . . . , N . Se
456
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Δ denota il laplaciano (9.121) su RnN , si consideri l’operatore differenziale −Δ + V , dove V `e l’operatore moltiplicativo individuato dalla funzione: V (y1 , . . . , yN ) :=
N
Vk (yk ) +
k=1
in cui:
N
Vij (yi − yj ) ,
(9.129)
i,j=1 i<j
{Vk }k=1,...,N ⊂ L2 (Rn , dx) + L∞ (Rn , dx) ,
{Vij }i<j i,j=1,...,N ⊂ L2 (Rn , dx) + L∞ (Rn , dx) sono due classi di funzioni a valori reali. Vale quanto segue. (a) −Δ + V `e essenzialmente autoaggiunto su D(RnN ) e su S(RnN ). (b) L’unica estensione autoaggiunta −Δ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −Δ + V definito su D(−Δ). (c) σ(−Δ + V ) `e limitato dal basso. Dimostrazione. Eseguiamo la prova per n = 3, negli altri casi la dimostrazione `e identica. Consideriamo il potenziale V12 (y1 − y2 ) e indichiamo con Δ1 il laplaciano corrispondente alle sole tre coordinate di y1 . Sia ϕ ∈ S(R3N ). Fissiamo y2 , . . . yN ∈ R3(N−1) e definiamo la funzione: R3 y1 → ϕ (y1 ) := ϕ(y1 , y2 , . . . , yN ). ϕ `e in D(R3N ) oppure in S(R3N ) a seconda che, rispettivamente, ϕ ∈ D(R3N ) oppure ϕ ∈ S(R3N ). Definiamo analogamente: R3 y1 → V12 (y1 ) := V12 (y1 − y2 ). Procedendo esattamente come nella prova del teorema precedente, decomponendo V12 = (V12 )2 + (V12 )∞ , si arriva a scrivere, per ogni scelta di a > 0, la stima valida per ogni y2 , . . . , yN : ||V12 ϕ ||L2(R3 ) ≤ a||(V12 )2 ||L2(R3 ) ||−Δ1 ϕ ||L2(R3 ) +(b+||(V12 )∞ ||L∞(R3 ) )||ϕ ||2
dove b > 0 dipende da a, ma non dipende dai valori y2 , . . . yN ∈ R3(N−1) . Le norme sono riferite agli spazi sul primo fattore R3 di R3N ed `e fondamentale notare che, a causa dell’invarianza per traslazioni di (y1 , y2 ) → V12 (y1 − y2 ), le norme ||(V12 )k ||Lk (R3 ) non dipendono dalla variabile y2 . Per quanto notato nelle osservazioni 9.49, questa disuguaglianza equivale a: 2 ||V12 ϕ ||L2(R3 ) ≤ a || − Δ1 ϕ ||2L2(R3 ) + b ||ϕ ||2L2(R3 )
per opportuni numeri, a , b > 0 con a che pu` o essere reso arbitrariamente piccolo dato che ci`o `e possibile per a||V12||2 . Se integriamo la disuguaglianza trovata nelle variabili y2 , . . . yN ∈ R3(N−1) otteniamo che, per ogni a > 0 esiste un corrispondente b > 0 tale che: ||V12 ϕ||2L2(R3N ) ≤ a || − Δ1 ϕ||2L2(R3N ) + b ||ϕ||2L2(R3N ) .
(9.130)
in trasformata di Fourier-Plancherel su R3N
2 3
2 kr |(Fϕ)(k1 , . . . , k3N )|2 dk1 · · · dkL2(R3 N)
R3N
Si osservi ora che, passando || − Δ1 ϕ||2L2 (R3N ) =
r=1
≤
3N 2
2 2 kr2 |(Fϕ)(k
1 , . . . , k3N )| dk1 · · · dk3N = || − Δϕ||L2(R3N ) .
R3N r=1
9.6 I teoremi di Kato-Rellich e di Kato
457
Sostituendo in (9.130), concludiamo che, se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni a > 0, esiste un corrispondente b12 > 0 tale che: ||V12ϕ||2L2 (R3N ) ≤ a || − Δϕ||2L2(R3N ) + b12 ||ϕ||2L2(R3N ) . La stesso risultato si ottiene per gli altri termini Vij e per i potenziali Vk , per i quali la dimostrazione si esegue nello stesso modo, ma risulta essere ancora pi` u semplice. Se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni scelta di a > 0, esiste un corrispondente scelta di numeri bi > 0, bij > 0 con i, j = 1, . . . , N ej > i tale che: ||Vi ϕ||2L2 (R3N ) ≤ a || − Δϕ||2L2(R3N ) + bi ||ϕ||2L2(R3N ) , ||Vij ϕ||2L2(R3N )
≤a
|| − Δϕ||2L2(R3N )
+
bij ||ϕ||2L2(R3N )
(9.131) .
(9.132)
In ogni spazio vettoriale con prodotto scalare hermitiano, la disuguaglianza
2
2
M M di Cauchy-Schwartz implica:
r=1 ψr
≤ r=1 ||ψr || . Tenendo conto che i potenziali Vk e Vij sono in tutto N + N (N − 1)/2 = N (N + 1)/2, la disuguaglianza menzionata e le (9.131)-(9.132) implicano che:
⎛ ⎞
2
N
N
⎝
⎠ V + V ϕ k ij
k=1
2 i,j=1 i<j
L (R3N )
≤
N (N + 1) 2
2 a ||
− Δϕ||2L2(R3N )
+
N (N + 1) 2
2
b||ϕ||2L2(R3N )
dove b `e il massimo nell’insieme di tutti i bk e bij . Per quanto notato nelle osservazioni 9.49, il risultato trovato pu` o essere equivalentemente enunciato come segue. Per ogni a > 0 esiste un b > 0 tale che: ||V ϕ|| ≤ a || − Δϕ|| + b ||ϕ|| per ogni ϕ ∈ S(R3N ). Da questo punto in poi, la dimostrazione procede esattamente come quella del teorema 9.54, a partire dall’equazione (9.128), rimpiazzando ovunque Rn con R3N . Per concludere citiamo senza dimostrazione completa un ulteriore importante teorema, dovuto a Kato, che richiede ipotesi differenti (e pi` u deboli nel caso n = 3 rispetto a quelle nel teorema 9.54) sulle funzioni V , affinch`e −Δ + V risulti essere essenzialmente autoaggiunto su D(Rn ). Ricordiamo che f : Rn → C `e detta essere localmente a quadrato integrabile se f · g `e in L2 (Rn , dx) per ogni g ∈ D(Rn ). Teorema 9.57. L’operatore −Δ + VΔ + VC in L2 (Rn , dx) `e essenzialmente autoaggiunto sul dominio D(Rn ) e la sua unica estensione autoaggiunta −Δ + VΔ + VC `e limitata dal basso, se valgono le seguenti ipotesi.
458
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
(i) VΔ : Rn → R `e una funzione misurabile che individua un operatore moltiplicativo (−Δ)-limitato con limite relativo a < 1 (nel senso del definizione 9.48). (ii) VC : Rn → R `e una funzione localmente a quadrato integrabile con VC ≥ C quasi ovunque per qualche C ∈ R. Le ipotesi (i) sulla funzione misurabile VΔ sono soddisfatte se: VΔ ∈ Lp (Rn , dx) + L∞ (Rn , dx) , con p = 2 se n ≤ 3, p > 2 se n = 4 e p = n/2 se n ≥ 5. Traccia di dimostrazione. L’ultima affermazione della tesi `e dimostrata nella prova del teorema 9.54 nel caso n ≤ 3. La dimostrazione `e analoga per n > 4 in virt` u dell’osservazione sotto il lemma 9.52. Se vale (i), −Δ + VΔ `e essenzialmente autoaggiunto su D(Rn ) e −Δ + VΔ `e limitato dal basso per il teorema di Kato-Rellich. Se vale anche (ii), −Δ + VΔ + (VC − C) `e essenzialmente autoaggiunto su D(Rn ) per il teorema X.29 in vol.II di [ReSi80], essendo Vc − C ≥ 0. Conseguentemente anche −Δ + VΔ + VC = (−Δ + VΔ + (VC − C)) + CI `e essenzialmente autoaggiunto su D(Rn ). Dato che −Δ+VΔ e VC sono entrambi limitati dal basso su tale dominio, lo `e −Δ + VΔ + VC e lo `e anche la sua unica estensione autoaggiunta −Δ + VΔ + VC . Esempi 9.58. (1) Un caso fisicamente interessante su R3 `e quello in cui la perturbazione `e il potenziale coulombiano attrattivo: V (x) =
eQ , |x|
dove e < 0 e Q > 0 sono costanti e e |x| := x21 + x22 + x23 . In questo caso, le ipotesi del teorema 9.56 (o 9.54) di Kato sono verificate, come si prova subito, (m, > 0 sono costanti che non creano alcun problema nell’applicare il teorema precedente, dato che si pu`o moltiplicare l’operatore per 2m/2 , prima di applicare il teorema senza perdere generalit` a). Dunque l’operatore: H0 := −
2 Δ + V (x) , 2m
risulta essere essenzialmente autoaggiunto se, indifferentemente, `e definito su D(R3 ) oppure S(R3 ). L’unica estensione autoaggiunta H0 , se Q = −e, corrisponde all’operatore hamiltoniano di un elettrone nel campo elettrico di un protone (trascurando gli effetti dovuti allo spin e considerando il protone come un oggetto classico). Abbiamo, in questo modo, la pi` u semplice descrizione quantistica dell’operatore hamiltoniano dell’atomo di idrogeno. In questo caso −e `e il valore assoluto comune della carica dell’elettrone e del protone. m `e la massa dell’elettrone. Infine > 0 `e la costante di Planck divisa per 2π.
9.6 I teoremi di Kato-Rellich e di Kato
459
Lo spettro dell’unica estensione autoaggiunta di tale operatore individua, dal punto di vista fisico, i valori dell’energia totale ammessi per tale sistema. Un risultato importante `e che, malgrado V non sia limitato dal basso, lo spettro dell’operatore considerato lo `e in ogni caso e, conseguentemente, lo sono i valori dell’energia fisicamente permessi. Nei capitoli 10, 11 e 12 esamineremo meglio il significato fisico degli operatori qui rapidamente descritti. (2) Un secondo caso fisicamente interessante, sempre in R3 , `e quello individuato dal potenziale di Yukawa: V (x) =
−e−μ|x| , |x|
dove μ > 0 `e ancora una costante positiva. Anche in questo caso l’operatore 2 H0 = − 2m Δ + V (x) risulta essere essenzialmente autoaggiunto se, indifferentemente, definito su D(R3 ) oppure S(R3 ), come segue dal teorema 9.56 (o 9.54) di Kato. Il potenziale di Yukawa descrive, in prima approssimazione, processi d’interazione tra un pione ed una sorgente di forza forte pensata, in questa approssimazione, come dovuta ad una sorgente macroscopica. (3) Il terzo caso fisicamente importante `e dato dall’hamiltoniano di un sistema di N particelle di vettori posizione xi ∈ R3 , masse mi > 0 e cariche ei ∈ R\{0} (i = 1, . . . , N ), che interagiscono con un potenziale coulombiano esterno e con potenziali coulombiani di coppia (non necessariamente attrattivi). In questo caso l’operatore completo `e: H0 :=
N i=1
−
N N Qi ei ei ej 2 + , Δi + 2mi |xi | |xi − xj | i=1 i<j
dove Δi `e l’operatore di Laplace riferito alle sole 3 coordinate di xi . Per appli2 davanti agli care il teorema di Kato `e necessario eliminare tutti i fattori 2m i operatori Δi . Si ottiene questo risultato semplicemente cambiando coordinate √ i x . In tal modo la prima delle tre ed usando le nuove coordinate yi := 2m i somme di sopra produce il laplaciano su R3N riferito alle 3N componenti di tutti gli N vettori yi . Si vede facilmente che la perturbazione V (y1 , . . . , yN ) soddisfa le ipotesi del teorema 9.56 di Kato e quindi l’operatore H0 sopra definito `e essenzialmente autoaggiunto su D(R3N ) e la sua unica estensione autoaggiunta `e limitata dal basso. (4) Il teorema 9.57 permette di affermare che, aggiungendo una qualsiasi funzione V , reale localmente integrabile e limitata dal basso, agli operatori hamiltoniani H0 visti negli esempi precedenti, si ottiene ancora un operatore essenzialmente autoaggiunto sul corrispondente D(Rn ). Un esempio importante `e il potenziale armonico (generalmente non isotropo) V (x) = kx21 +k2 x2 +k3 x23 con k1 , k2 , k3 ≥ 0.
460
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Esercizi 9.1. Si consideri una PVM P : B(X) E → P (E) ∈ B(H) e un operatore unitario (cio`e isometrico suriettivo) V : H → H , dove H `e un secondo spazio di Hilbert complesso. Si dimostri che: P : B(X) E → P (E) := V P (E)V −1 ∈ B(H ) `e ancora una PVM. 9.2. In riferimento all’esercizio 9.1, si provino i seguenti fatti. (i) Se f : X → C `e misurabile allora ψ ∈ Δf se e solo se V ψ ∈ Δf , dove Δf `e il dominio dell’integrale di f secondo P . (ii) V X f(x)dP (x)V −1 = X f(x)dP (x). 9.3. Provare che se H `e uno spazio di Hilbert, allora T ∈ B(H) `e di classe traccia (cio`e T ∈ B1 (H)) se e solo se u∈N |(u|T u)| < +∞ per ogni base hilbertiana N ⊂ H. Soluzione. Supponiamo che u∈N |(u|T u)| < +∞ per ogni base hilber∗ tiana N . Cominciamo a supporre che T =(TT) . Dal teorema spettrale(T )T = (T ) λdP (λ). Definiamo T := λdP (λ) e T := λdP (λ). − + R (−∞,0) [0,+∞) Ovviamente T± ∈ B(H) (perch´e |λχ(−∞,0)| ≤ |λ| e |λχ[0,+∞) | ≤ |λ|, vale il corollario 9.5 e la funzione λ `e limitata sul supporto di P (T ) per il teorema spettrale per operatori autoaggiunti limitati), inoltre ±T± ≥ 0 in base al teorema 9.46. Ulteriormente H = H− ⊕H+ dove i due sottospazi chiusi sono ortogonali e sono definiti come H− := P (T ) ((−∞, 0))H, H+ := P (T )([0, +∞))H. Siano N− ⊂ H− e N+ ⊂ H+ due basi Hilbertiane. N := N− ∪ N+ `e una base hilbertiana di H. Dato che −T− , T+ ≥ 0 e che T± u = 0 se u ∈ H∓ , vale: +∞ > |(u|T u)| = |(u|T− u)| + |(u|T+ u)| u∈N
=
u∈N−
−(u|T− u) +
u∈N−
(u|T+ u) =
u∈N−
=
u∈N
(u||T−|u) +
u∈N+
(u||T−|u) +
u∈N−
(u||T+ |u)
u∈N−
(u||T+ |u) .
u∈N
Concludiamo che T± ∈ B1 (H) per la definizione 4.28 e dunque T = T+ +T− ∈ B1 (H) per (b) del teorema 4.30. Nel caso in cui T non sia autoaggiunto, possiamo sempre decomporlo come T = A + iB, con A := 12 (T + T ∗ ) 1 e B := 2i (T − T ∗ ), dove A e B sono autoaggiunti. Per ogni fissata base hilbertiana N ⊂ H si ha, se u ∈ N : |(u|T u)| = |(u|Au) + i(u|Bu)| = |(u|Au)|2 + |(u|Bu)|2 ≥ |(u|Au)| , |(u|Bu)|. Pertanto, applicando il risultato provato sopra per gli operatori autoaggiunti, segue che A, B ∈ B1 (H) e quindi T ∈ B1 (H). Se invece T ∈ B1 (H), allora, su ogni base hilbertiana |(u|T u)| < +∞ per la proposizione 4.32. u∈N
Esercizi
461
9.4. Dimostrare che (iv) in (b) del teorema 9.9 pu` o essere rinforzata in: Sia T : D(T ) → H operatore autoaggiunto nello spazio di Hilbert H. λ ∈ σc (T ) se e solo se, per ogni > 0, esiste φ ∈ D(T ) con ||φ|| = 1 e 0 < ||T φ − λφ || ≤ . Suggerimento. Se vale quanto detto, λ non pu` o appartenere a σp(T ), quindi esiste sicuramente (T − λI)−1 : Ran(T − λI) → D(T ) e quindi λ ∈ σ(T ) = σp (T ) ∪ σc(T ). Pu` o essere limitato (T − λI)−1 ? 9.5. Si consideri uno spazio L2 (X, μ) con μ positiva e finita sulla σ-algebra di Borel di X, spazio topologico. Se f : X → R `e una qualunque funzione reale misurabile localmente L2 (cio`e f · g ∈ L2 (X, μ) per ogni g ∈ Cc(X)), si consideri l’operatore su L2 (X, μ): Tf : h → f · h dove D(Tf ) := {h ∈ L2 (X, μ) | f · h ∈ L2 (X, μ)}. Dopo aver provato che Tf `e autoaggiunto, si dimostri che: σ(Tf ) = ess ran(f) . Se f : X → R, ess ran(f) `e il rango essenziale della funzione misurabile f definito come: C v ∈ ran ess(f) se e solo se μ f −1 (v − , v + ) > 0 per ogni > 0. Suggerimento. Il dominio di Tf `e denso perch´e f `e localmente L2 , il fatto che Tf sia autoaggiunto si prova calcolando direttamente Tf∗ e notando che coincide con Tf . La seconda parte si dimostra osservando che λ ∈ ρ(Tf ) se solo se esiste il risolvente Rλ (Tf ) su tutto L2 (X, μ) ed `e limitato, cio`e, esiste M > 0 tale che: ||Rλ(Tf )h|| ≤ M per ogni h ∈ L2 (X, μ) con ||h|| = 1. In altre parole λ ∈ ρ(Tf ) se e solo se: |h(x)|2 dμ(x) < M per ogni h ∈ L2 (X, μ) con ||h|| = 1 . 2 X |f(x) − λ| Se λ ∈ ess ran(f), si vede immediatamente dalla definizione di rango essenziale e usando μ(X) < +∞, che la condizione scritta sopra `e soddisfatta, per cui: λ ∈ ess ran(f) implica λ ∈ σ(Tf ). Se λ ∈ ess ran(f), applicando ancora la definizione di rango essenziale, si costruisce una successione di hn , con |h(x)|2 ||hn|| = 1 tale che: X |f(x)−λ|2 dμ(x) > 1/n2 per ogni n = 1, 2, . . .. Quindi λ ∈ ess ran(f) implica λ ∈ σ(Tf ). 9.6. Provare la (9.72) per ogni gruppo unitario ad un parametro R t → Ut . Soluzione. da Ut−1 Ut = I, applicando U−t al lato destro dei due membri ed usando la seconda di (9.71), si ha Ut−1 Ut−t = U−t ossia, dalla prima identit`a in (9.71), Ut−1 = U−t . Infine Ut−1 = (Ut )∗ dato che Ut `e unitario.
462
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
9.7. Si supponga che V : R3 → R sia tale che l’operatore simmetrico H1 , individuato dall’operatore differenziale −Δx + V (x), sia essenzialmente au3 ∂2 toaggiunto su S(R3 ), dove Δx := k=1 ∂x e l’operatore di Laplace. Si provi 2 ` i
che l’operatore simmetrico H su L2 (R3 × R3 , dx ⊗ dy) dato dall’operatore differenziale −Δx +V (x)−Δy +V (y) `e essenzialmente autoaggiunto sullo spazio generato dai prodotti finiti di funzioni in S(R3 ), una nella variabile x e l’altra nella variabile y. Si provi infine che: σ(H) = σ(H1 ) + σ(H1 ) . 9.8. Provare che se Ak ∈ B(Hk ) per k = 1, . . . , N , allora A1 ⊗ · · · ⊗ Ak ∈ B(H1 ⊗ · · · ⊗ HN ) . Soluzione. Consideriamo il caso N = 2, il caso generale `e analogo. Se , si consideri la somψ = {fi }i∈I e {g j }j∈J sono basi hilbertiane di H1 e H2 ma finita ψ := ij cij fi ⊗ gj . Allora ||(A1 ⊗ I)ψ||2 = j || i cij A1 fi ||2 ≤ 2 2 2 2 a si conclude che ||A1 ⊗ I|| ≤ A. j ||A1 || i |cij | = ||A1 || ||ψ|| . Per densit` Quindi vale: ||A1 ⊗ A2 || ≤ ||A1 ⊗ I|| ||I ⊗ A2 || ≤ ||A1 || ||A2 ||. 9.9. Mostrare che, nelle ipotesi in (2), vale anche: ||A1 ⊗ · · · ⊗ Ak || = ||A1 || · · · ||AN || . Soluzione. Consideriamo ancora il caso n = 2, il caso generale essendo analogo. Se A1 = 0 o A2 = 0 la tesi `e ovvia, per cui assumiamo ||A1 ||, ||A2|| > 0. Nella soluzione di (2) abbiamo trovato che ||A1 ⊗A2 || ≤ ||A1 || ||A2||, per cui `e sufficiente mostrare la disuguaglianza opposta. Dalla definizione di ||A1 || e () () () () ||A2||, segue che per ogni > 0 esistono ψ1 ∈ H1 e ψ2 ∈ H2 , ||ψ1 ||, ||ψ2 || = () () 1, tali che | ||Ai ψi || − ||Ai || | < e quindi, in particolare, ||ψi || ≥ ||Ai || − . Con queste scelte: ()
()
()
()
||(A1 ⊗ A2 )(ψ1 ⊗ ψ2 )|| = ||A1 ψ1 || ||A2 ψ2 || ≥ ||A1 || ||A2|| − (||A1 || + ||A2 ||) + 2 ()
()
e quindi, notando che ||ψ1 ⊗ ψ2 || = 1, ed essendo ()
()
||A1 ⊗ A2 || = sup ||A1 ⊗ A2 ψ|| ≥ ||(A1 ⊗ A2 )(ψ1 ⊗ ψ2 )|| , ||ψ||=1
abbiamo, che per ogni > 0: ||A1 ⊗ A2 || ≥ ||A1 || ||A2 || − (||A1 || + ||A2 ||) + 2 , dove −(||A1 ||+||A2 ||)+2 < 0, e tale valore tende a 0 se → 0+ . Concludiamo che deve essere ||A1 ⊗ A2 || ≥ ||A1|| ||A2 || come richiesto. 9.10. Considerare gli operatori A e A definiti in (2) di esempi 9.8. Provare che si tratta di operatori chiudibili e dimostrare che: ∗
A A = A∗ A = A A .
Esercizi
463
9.11. Per l’operatore A definito in (2) di esempi 9.8, studiare la decomposizione polare A = U P e dimostrare che l’operatore U soddisfa: U ψn = ψn−1 se n ≥ 1 e {ψn }n∈N `e la base hilbertiana di L2 (R, dx) definita in (2) di esempi 9.8. 9.12. Considerare gli operatori A e A definiti in (2) di esempi 9.8 e sia {ψn }n∈N la base hilbertiana di L2 (R, dx) definita in quell’esempio. Calcolare eαA+αA ψn con α ∈ C fissato. 9.13. Provare che se Ak ∈ B(Hk ) per k = 1, . . . , N allora: (A1 ⊗ · · · ⊗ Ak )∗ = A∗1 ⊗ · · · ⊗ A∗N . Suggerimento. Verificare che A∗1 ⊗ · · · ⊗ A∗N soddisfa le propriet` a dell’operatore aggiunto per operatori limitati definiti su tutto lo spazio di Hilbert (proposizione 3.36). 9.14. Mostrare che se Pk ∈ B(Hk ) per k = 1, . . . , N sono proiettori ortogonali allora P1 ⊗ · · · ⊗ Pk `e un proiettore ortogonale. 9.15. Provare che se D ⊂ D(A), con A autoaggiunto nello spazio di Hilbert H, `e un sottospazio denso tale che eitAD ⊂ D per ogni t ∈ R, allora AD `e essenzialmente autoaggiunto e AD = A. In altre parole D `e un core per A. Suggerimento. Se ψ ∈ D ⊂ D(A), Ut ψ = eitA ψ `e derivabile ed il risultato `e iAUt ψ. Tenendo conto di ci` o, ripercorrendo la parte finale della dimostrazione del teorema di Stone, rimpiazzando lo spazio di G˚ arding D con il presente sottospazio D, si ha la tesi.
10 La formulazione matematica della Meccanica Quantistica non relativistica Ogni scienza sarebbe superflua se l’essenza delle cose e la loro forma fenomenica direttamente coincidessero. Karl Marx
In questo capitolo daremo gli assiomi della Meccanica Quantistica per il sistema elementare costituito da un particella non relativistica, senza spin, e discuteremo alcuni importanti risultati connessi alle relazione di commutazione canonica. Dopo avere riassunto e commentato, presentando qualche nuovo risultato tecnico, i primi 4 assiomi formulati nel capitolo 7, nella prima sezione aggiungeremo un assioma relativo alla formalizzazione della teoria quantistica della particella senza spin. In particolare introdurremo le relazioni di commutazione canonica (CCR) e proveremo che non sono implementabili per mezzo di operatori limitati. Mostreremo infine come il principio di Indeterminazione di Heisenberg risulti essere una teorema nella formulazione presentata. La sezione successiva `e dedicata al celebre teorema di Stone-von Neumann, completato da Mackey, e relativo alla caratterizzazione delle rappresentazioni unitarie continue delle CCR. Per enunciare e provare il teorema introdurremo la nozione di ∗-algebra di Weyl, discutendone le pi` u importanti propriet` a. Dopo avere provato i teoremi di Stone-von Neumann e Mackey, useremo il formalismo costruito per estendere la validit`a delle relazioni di Heisenberg con ipotesi molto deboli sugli stati usati ed estendendo il risultato al caso degli stati misti. Riformuleremo infine i teoremi di Stone-von Neumann e Mackey detti in termini di gruppo di Heisenberg. Nell’ultima sezione discuteremo, molto brevemente il principio di corrispondenza di Dirac.
10.1 Riepilogo e commenti sugli assiomi A1, A2, A3, A4 della MQ Nel capitolo 7 abbiamo dato gli assiomi generali della Meccanica Quantistica. Riepiloghiamo parte del contenuto di quel capitolo alla luce della teoria spettrale sviluppata successivamente.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
466
10 Formulazione matematica della MQ
A1. Le proposizioni riguardanti un sistema quantistico S sono in corrispondenza biunivoca con (un sottoinsieme de) il reticolo P(HS ) dei proiettori ortogonali di uno spazio di Hilbert (complesso) e separabile, HS , detto spazio di Hilbert associato ad S. Inoltre (indicando con la stessa lettera proposizioni e proiettori corrispondenti): (1) La compatibilit` a tra proposizioni corrisponde alla commutativi` a dei rispettivamente associati proiettori ortogonali; (2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione P ≤ Q per i proiettori associati; (3) I (operatore identit` a) e 0 (operatore nullo) corrispondono, rispettivamente, alla proposizione sempre vera ed a quella sempre falsa; (4) la negazione di una proposizione P , P , corrisponde al proiettore ortogonale ¬P = I − P ; (5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q; (6) se {Qn }n∈N `e un insieme numerabile di proposizioni a due a due compatibili, hanno senso fisico le proposizioni corrispondenti a ∨n∈NQn e ∧n∈NQn . A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , `e un operatore positivo di classe traccia con traccia unitaria su HS . La probabilit` a che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ). Abbiamo visto che gli stati ρ sono combinazioni lineari convesse (anche infinite, considerando la decomposizione spettrale degli stati) di stati estremali dell’insieme convesso S(HS ) di tutti gli stati. Gli stati estremali sono stati denominati stati puri e sono tutti del tipo ρ = ψ(ψ| ) con ψ ∈ HS tale che ||ψ|| = 1. Lo spazio degli stati puri `e in corrispondenza biunivoca con lo spazio dei raggi di HS , cio`e l’insieme HS /∼ da cui si elimina la classe [0], dove la relazione di equivalenza ∼ `e definita da φ ∼ φ s.se φ = aφ per qualche a ∈ C \ {0}. Gli stati non puri sono anche chiamati stati misti o miscele e gli operatori di classe traccia ad essi associati sono spesso chiamati, in letteratura, operatori statistici o anche matrici densit` a. A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato del sistema immediatamente dopo la misura `e: P ρP ρP := . tr(ρP ) In particolare se ρ `e puro ed `e individuato dal vettore ψ ∈ HS con ||ψ|| = 1, lo stato del sistema immediatamente dopo la misura `e ancora puro ed `e
10.1 Riepilogo e commenti sugli assiomi A1, A2, A3, A4 della MQ
individuato dal vettore: ψP =
467
Pψ . ||P ψ||
Una nozione fisicamente importante, anche dal punto di vista storico, `e quella di ampiezza di transizione o di probabilit` a, (ψ|φ), dello stato puro individuato dal vettore unitario φ sullo stato puro individuato dal vettore unitario ψ. Il modulo quadrato di essa rappresenta la probabilit` a che, essendo il sistema nello stato φ, passi allo stato ψ in seguito a processo di misura. Si osservi che possiamo scambiare il ruolo dei due stati, per le propriet`a del prodotto scalare hermitiano, senza variare la probabilit` a di transizione. Rimandiamo alla sezione 7.4.4 per una discussione sulle regole di superselezione e sulla decomposizione di H in settori coerenti. A4. Ogni osservabile A sul sistema quantistico S `e descritta da una misura a valori di proiezione su R, P (A), nello spazio di Hilbert del sistema HS , in modo tale che, se E `e un boreliano di R, il proiettore P (A)(E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”. Il teorema spettrale per operatori autoaggiunti generalmente non limitati, enunciato e provato nella versione pi` u generale nel capitolo 9 (teorema 9.9), consente associare univocamente ad ogni osservabile un operatore autoaggiunto definito sullo spazio di Hilbert del sistema fisico. In questo senso, se HS `e lo spazio di Hilbert di un sistema fisico, lo spettro σ(A) ⊂ R di un’osservabile A, cio`e un operatore autoaggiunto A : D(A) → HS , contiene tutti i valori possibili che si possono ottenere misurando l’osservabile A. Dal punto di vista matematico, σ(A) coincide con il supporto della misura a valori di proiezione P (A) associata all’osservabile. Una nozione fisicamente importante `e quella di osservabili compatibili: Definizione 10.1. Sia S un sistema quantistico descritto sullo spazio di Hilbert HS . Due osservabili A e B per S si dicono compatibili se le misure spettrali P (A) e P (B) degli operatori autoaggiunti rispettivamente associati a A e B commutano, ossia P (A) (E)P (B) (E) = P (B) (E)P (A)(E) ,
per ogni boreliano E ⊂ R.
Due osservabili non compatibili sono dette incompatibili. Si osservi che, dal punto di vista fisico, la compatibilit` a tra osservabili equivale al fatto che esse possono essere misurate contemporaneamente (in armonia con l’assioma A1 e con il significato delle misure spettrali associate ad osservabili). Nel caso di una classe finita di osservabili compatibili, A = {A1 , A2 , . . . , An }, `e possibile definire una misura spettrale congiunta, costruita con le misure spettrali di degli operatori autoaggiunti rappresentati le osservabili, in virt` u del teorema 9.14. Usando le stesse notazioni del teorema, se f : Rn → C `e
468
10 Formulazione matematica della MQ
Borel misurabile, l’operatore autoaggiunto: f(A1 , . . . , An ) := f(x1 , . . . , xn )dP (A)(x1 , . . . , xn )
(10.1)
Rn
– con dominio dato dai vettori ψ ∈ H per cui f risulti in L2 (Rn ; μψ ) dove, al solito, μψ (E) = (ψ|P (A) (E)ψ) per ogni E ∈ B(Rn ) – ha il significato naturale di osservabile funzione delle osservabili A1 , . . . , An . Osservazione 10.2. Condizione necessaria affinch´e due osservabili siano compatibili, `e che gli operatori associati commutino, prestando attenzione ai domini, come precisato nell’enunciato (ii) di (d) del teorema 9.30. Tale condizione, per operatori autoaggiunti non limitati, non `e sufficiente, malgrado ci`o si trovi scritto in qualche testo di fisica: Nelson [Nel59] ha dimostrato che esistono coppie di operatori che commutano su un sottospazio denso ed invariante per entrambi su cui sono entrambi essenzialmente autoaggiunti, ma le misure spettrali delle uniche estensioni autoaggiunte non commutano. Un’utile condizione necessaria e sufficiente affinch´e due osservabili A e B siano compatibili `e data da (c) del teorema 9.30: eitA eisB = eisB eitA
per ogni coppia s, t ∈ R .
Un’altra condizione necessaria e sufficiente `e stabilita in (d) dello stesso teorema. La proposizione 7.41 permette di associare ad ogni coppia “osservabile - sta(A) to”, A, ρ, una misura di probabilit` a su R, μρ : E → tr(ρP (A) (E)) (che (A) coincide con μψ = (ψ|P (A) (E)ψ), definita in (c) del teorema 8.30, se ρ `e puro, individuato dal vettore ψ ∈ H con ||ψ|| = 1) dove E ∈ B(R). Per co(A) (A) struzione supp(μρ ) ⊂ σ(A). Dato che per definizione μρ (E) coincide con la probabilit` a che, nello stato ρ, il valore della misura di A cada in E, ha senso definire il valore medio e lo scarto quadratico medio di A nello stato ρ. Definizione 10.3. Sia A un’osservabile per il sistema fisico S descritto nello (A) spazio di Hilbert HS , sia ρ ∈ S(HS ) uno stato del sistema S e sia μρ la misura di probabilit` a associata a ρ e A come precisato sopra. Il valore medio di An , n = 1, 2, . . ., `e: (A) n A ρ := λn dμρ(A)(λ) , se R λ → λn `e in L1 (R, μρ ). (10.2) R
Lo scarto quadratico medio nello stato ρ di A `e: ! ΔAρ :=
2
R
(A)
(λ − A ρ ) dμρ (λ) ,
(A)
se R λ → λ2 `e in L1 (R, μρ ) .
(10.3) Se la richiesta in (10.2) (oppure in (10.3)) non vale, il valor medio di An (rispettivamente lo scarto quadratico medio) non esistono per ρ.
10.1 Riepilogo e commenti sugli assiomi A1, A2, A3, A4 della MQ
469
(A)
Osservazione 10.4. Se la funzione λn `e in L1 (R, μρ ) lo `e anche λk per (A) k = 1, 2, . . . , n − 1, essendo μρ finita. Quindi, se esiste An ρ , allora esiste k A ρ (e ΔAρ se n ≥ 2) per k = 1, 2, . . . , n − 1. Le propriet` a discusse negli esempi 7.42 sono generalizzate come segue. Proposizione 10.5. Sia A un’osservabile per un sistema fisico descritto nello spazio di Hilbert HS , ρψ ∈ Sp (HS ) associato a ψ ∈ HS con ||ψ|| = 1 e ρ ∈ S(HS ). Valgono i fatti seguenti. (a) (i) A ρψ esiste se e solo se ψ ∈ D(|A|1/2 ) e ΔAρψ esiste se e solo se ψ ∈ D(A). (ii) Se ψ ∈ D(A) allora A ρψ esiste e: A
ρψ
= (ψ|Aψ) ,
(10.4)
(iii) Se ψ ∈ D(A2 ) allora A ρψ e ΔAρψ esistono, vale (10.4) e: ΔA2ρψ = ψ (A − A ψ I)2 ψ = (ψ|A2 ψ) − (ψ|Aψ)2 .
(10.5)
(b) (i) A ρ esiste se e solo se Ran(ρ1/2 ) ⊂ D(|A|1/2 ) e |A|1/2ρ1/2 ∈ B2 (H), (ii) ΔAρ esiste (equivalentemente, A2 ρ esiste) se e solo se Ran(ρ1/2 ) ⊂ D(A) e Aρ1/2 ∈ B2 (H), (iii) Se esiste A2 ρ , allora Aρ ∈ B1 (HS ) e: A
ρ
= tr(Aρ) ,
(10.6)
(iv) Se esiste A4 ρ , allora Aρ ∈ B1 (HS ), vale (10.6), (A − A ρ I)2 ρ ∈ B1 (HS ) e: (10.7) ΔA2ρ = tr (A − A ρ I)2 ρ = tr(A2 ρ) − tr(Aρ)2 . (A)
Dimostrazione. (a). Vale tr(ρψ P (A)(E)) = (ψ|P (A)(E)ψ) = μψ (E). Allora, (A)
le richieste che R λ → λ e R λ → λ2 siano in L1 (R, μρ ), sono rispettivamente equivalenti a ψ ∈ D(|A|1/2 ) e ψ ∈ D(A), per la definizione 9.10 e per (f) nel teorema 9.4. Per definizione e usando (f) e (e) nel teorema 9.4 per quanto riguarda lo scarto quadratico, abbiamo: (A) A ρψ = λdμψ (λ), (10.8) R
(A) (A) ΔA2ρψ = Aψ − λdμψ (λ) ψ
Aψ − λdμψ (λ) ψ , (10.9) R
R
da cui seguono (10.6) e (10.7) nelle ipotesi ψ ∈ D(A)(⊂ D(|A|1/2 )) e ψ ∈ D(A2 )(⊂ D(A)), rispettivamente, usando (g) del teorema 9.4 in particolare. (A) (b). Sia {ψn }n∈N una base hilbertiana di HS (separabile). μρ (E) = +∞ (A) 1/2 (A) 1/2 1/2 1/2 tr(ρP (E)) = tr(ρ P (E)ρ ) = ψn |P (E)ρ ψn ) = n=0 (ρ
470
+∞ n=0
10 Formulazione matematica della MQ (A)
μρ1/2 ψ (E), per ogni boreliano E ∈ B(R), dove abbiamo usato il fat-
to che ρ1/2 ∈ B2 (HS ) (dato che B1 (H) ρ ≥ 0) e (c) in proposizione 4.34. Da ci`o segue che, se f : R → C `e Borel misurabile: R
|f(λ)|dμρ(A) (λ)
=
+∞ n=0
(A)
R
|f(λ)|dμρ1/2 ψn (λ) ≤ +∞ .
(10.10)
Inoltre, se il secondo membro in (10.10) (e quindi anche il primo) `e finito, allora: +∞ (A) f(λ)dμρ(A) (λ) = f(λ)dμρ1/2 ψ (λ) ∈ C . (10.11) R
n=0
R
n
+∞ (A) (A) Infatti, da μρ (E) = n=0 μρ1/2 ψ (E), la (10.10) `e banalmente vera se |f| = s `e funzione semplice non negativa. Per ogni funzione Borel misurabile g ≥ 0, esiste una successione di funzioni semplici 0 ≤ s0 ≤ s1 ≤ · · · ≤ sn → g (proposizione 7.39). Applicando il teorema della convergenza monotona, sia ai singoli integrali che alla misura che conta i punti di N, segue che vale la (10.10) con |f| rimpiazzata da qualsiasi g ≥ 0. Nell’ipotesi che f sia a valori in R, se in (10.10) vale < +∞ , spezzando f in parte positiva e parte negativa f = f+ − f− , essendo 0 ≤ f+ , f− ≤ |f|, segue subito la (10.11) per linearit` a. Il caso di f a valori complessi si ottiene lavorando con parte reale ed immaginaria separatamente. f(A) ρ esiste se e solo se il primo membro di (10.10) `e finito. A sua volta, ci` o equivale a dire che che tutti i termini della somma a secondo membro sono finiti e la somma di essi `e finita. Ogni termine `e finito se e solo se ρ1/2 ψn ∈ D(|f(A)|1/2 ) per definizione di D(g(A)) (definizione 9.10). Dato che ψn `e un qualsiasi vettore (con norma unitaria) di H, deve essere che Ran(ρ1/2 ) ⊂ D(|f(A)|1/2 ). Ogni integrale a secondo membro in (10.10) si pu` o riscrivere equivalentemente come (vedi (f) del teorema 9.4) |||f(A)|1/2 ρ1/2 ψn ||2 , dove |f(A)|1/2 ρ1/2 ∈ B(HS ) per la proposizione 5.5. Dalla definizione 4.22, concludiamo che il primo membro di (10.10) `e finito se e solo se |f(A)|1/2 ρ1/2 ∈ B2 (HS ). Scegliendo f(λ) = λ segue immediatamente (i) di (b), scegliendo f(λ) = λ2 si ha la prova di (ii) in (b), tenendo conto (A) che se λ2 `e integrabile rispetto a μρ , allora lo `e anche λ ed osservando che D(A) = D(|A|). Per provare (iii), assumiamo ora che esista A2 ρ (e conseguentemente anche A ρ ) e notiamo che vale Ran(ρ) ⊂ D(A) in conseguenza di Ran(ρ1/2 ) ⊂ D(A), dato che ρ = ρ1/2 ρ1/2 implica Ran(ρ1/2 ) ⊃ ran(ρ). Applicando (10.11) a f(λ) = λ e tenendo conto di (g) del teorema 9.4), troviamo: A ρ = (ρ1/2 ψn |Aρ1/2 ψn ) = (ψn |ρ1/2 Aρ1/2 ψn ) = tr(ρ1/2 Aρ1/2 ) , n∈N
n∈N
dove abbiamo usato il fatto che ρ1/2 e Aρ1/2 ∈ B2 (H2 ) e dunque il loro prodotto (in qualunque ordine) `e di classe traccia. Per la propriet` a ciclica della traccia ((c) in proposizione 4.34), troviamo immediatamente A ρ =
10.2 Assioma A5: sistemi elementari non relativistici
471
tr(Aρ1/2 ρ1/2 ) = tr(Aρ), concludendo la prova di (iii). La prova di (iv) `e del tutto analoga rimpiazzando A con A2 e osservando che, se esiste A4 ρ , allora esiste anche A2 ρ per cui vale (iii). La seconda identit` a in (10.7) segue con ovvie manipolazioni algebriche dalla prima. Osservazione 10.6. I secondi membri di (10.6) e (10.7) non sono le definizioni di media e scarto quadratico medio, che invece sono date, in tutta generalit` a dalle (10.2) e (10.3), indipendentemente dalla proposizione 10.5. Per proseguire ulteriormente nella formulazione matematica della Meccanica Quantistica, dobbiamo fornire ulteriori assiomi che riguardano sistemi elementari particolari. Tali sistemi corrispondono alle particelle della teoria non relativistica. In altre parole, il gruppo di trasformazioni sotto il quale la teoria `e invariante `e il gruppo di Galilei e non quello di Poincar´e. Torneremo pi` u avanti su questo punto. Dal punto di vista fisico, questa descrizione `e adeguata fino a quando le velocit` a in gioco non sono dell’ordine della velocit` a della ` importante sottolineare che, comunque, alcune luce (circa 300.000 km/sec). E nozioni matematiche come l’algebra di Weyl, introdotte in questa descrizione non relativistica, hanno validit` a molto pi` u generale: si usano anche in regime relativistico, nella formulazione della teoria quantistica dei campi, della quale non ci occuperemo in questo libro. Con i sistemi elementari si costituiscono quelli complessi tramite una composizione basata sulla nozione di prodotto tensoriale di spazi di Hilbert, come vedremo pi` u avanti studiando i sistemi composti.
10.2 Assioma A5: sistemi elementari non relativistici Il pi` u semplice sistema elementare in Meccanica Quantistica non relativistica `e una particella quantistica di massa m > 0 con spin 0. Per essa vale il seguente assioma. A5. Considerando un sistema di riferimento inerziale I dotato di un sistema di coordinate cartesiane ortonormali x1 , x2 , x3 , una particella non relativistica con spin 0 e massa m > 0 `e descritta come segue. (a) Lo spazio di Hilbert del sistema `e H = L2 (R3 , dx), dove R3 `e identificato con lo spazio di quiete di I tramite le coordinate x1 , x2, x3 e dx `e l’ordinaria misura di Lebesgue su R3 . (b) Le osservabili associate alle coordinate x1 , x2 , x3 della particella sono, rispettivamente, date dagli operatori autoaggiunti, detti operatori posizione: (Xi ψ)(x1 , x2, x3 ) = xi ψ(x1 , x2 , x3 ) , (10.12) per i = 1, 2, 3, con domini: D(Xi ) := ψ ∈ L2 (R3 , dx)
R3
2
|xi ψ(x1 , x2 , x3 )| dx < +∞
.
472
10 Formulazione matematica della MQ
(c) Le osservabili associate alle 3 componenti dell’impulso della particella rispetto a I, p1 , p2 , p3 , sono rispettivamente date dagli operatori autoaggiunti, detti operatori impulso: Pk = −i
∂ , ∂xk
(10.13)
per k = 1, 2, 3, dove l’operatore a secondo membro `e la chiusura dell’operatore differenziale essenzialmente autoaggiunto: −i
∂ : S(R3 ) → L2 (R3 , dx) ∂xk
e S(R3 ) `e lo spazio di Schwartz su R3 (vedi la sezione 3.6). Ricordiamo che in letteratura fisica i vettori (normalizzati a 1) di L2 (R3 , dx) associati ad una particella sono detti funzioni d’onda della particella. Le funzioni d’onda determinano (non in modo biunivoco a causa dell’arbitrariet` a nello scegliere un fattore numerico) gli stati puri della particella. Osservazioni 10.7. (1) La discussione fatta nella sezione 5.3 prova che si arriva alle stesse definizioni di sopra definendo gli operatori Xi sostituendo la condizione ψ ∈ L2 (R3 , dx) con la richiesta ψ ∈ D(R3 ). Lo stesso risultato si ottiene con la condizione ψ ∈ S(R3 ) nella definizione del dominio di tali operatori. In entrambi i casi si deve prendere l’unica estensione autoaggiunta dell’operatore definito su D(R3 ) oppure S(R3 ). (2) La definizione di Pi pu` o essere equivalentemente data come (vedi definizione 5.26, la proposizione 5.28 e la discussione successiva): ∂ (Pi f)(x) = −iwf(x) , (10.14) ∂x i
( )
∂ f ∈ L2 (R3 , dx) . D(Pi ) := f ∈ L2 (R3 , dx) esiste w- ∂x i ∂ indica la derivata in senso debole. La discussione fatta nella seDove w- ∂x i zione 5.3 prova anche che la definizione di Pi (vedi proposizione 5.28) pu` o essere data, equivalentemente, sostituendo lo spazio di Schwartz con D(R3 ) e prendendo l’unica estensione autoaggiunta dell’operatore cos`ı definito, che risulta ancora essere essenzialmente autoaggiunto. (3) Ricordiamo infine che, per la proposizione 5.30, se Ki denota l’operatore posizione rispetto alla coordinata i-esima nello spazio di arrivo della trasformata di Fourier-Plancherel discussa nella sezione 3.6. F : L2 (R3 , dx) → L2 (R3 , dk), vale: Pi = F−1 Ki Fˆ ,
che pu` o essere usata come una definizione equivalente dell’operatore impulso. (4) Dalla discussione nella sezione 9.1.4, sappiamo che: σ(Xi ) = σc(Xi ) = R ,
σ(Pi ) = σc(Pi ) = R per i = 1, 2, 3.
(10.15)
10.2 Assioma A5: sistemi elementari non relativistici
473
10.2.1 Le Relazioni di Commutazione Canonica (CCR) La definizione degli operatori posizione ed impulso `e tale che, malgrado i domini delle 6 osservabili siano differenti, esistono comunque sottospazi H0 ⊂ L2 (R3 , dx) invarianti per tutte queste osservabili, cio`e Xi (H0 ) ⊂ H0 e Pi (H0 ) ⊂ H0 per ogni i = 1, 2, 3. Per esempio si pu` o prendere lo spazio di Schwartz H0 = S(R3 ). La verifica di ci` o `e immediata dalla stessa definizione di spazio di Schwartz. Su S(R3 ), per computo diretto usando (10.12) e (10.13), si verifica subito che valgono le relazioni di commutazione di Heisenberg o CCR (canonical commutation relations): [Xi , Pj ] = iδij I , dove δij = 0 se i = j mentre δij = 1 se i = j . Pi` u precisamente: Lemma 10.8. Gli operatori posizione ed impulso Xi e Pj con i, j = 1, 2, 3, definiti in A5, soddisfano le relazioni relazioni di commutazione di Heisenberg: [Xi , Pj ]ψ = iδij ψ
per ogni ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ), i, j = 1, 2, 3. (10.16)
La (10.16) continua ad essere verificata quando si sostituiscono a primo membro Xi con Xi := Xi + ai I e Pj con Pj := Pj + bj I, dove ai , bj ∈ R sono costanti arbitrarie. Dimostrazione. Si osservi prima di tutto che, come si verifica immediatamente: D(Xi Pj ) ∩ D(Pj Xi ) = D(Xi Pj ) ∩ D(Pj Xi ). Sulle funzioni ϕ ∈ D(R3 ), per costruzione l’operatore Pj si riduce all’azione di −i∂/∂xj + bj I e pertanto, tenendo conto che Xi coincide con la semplice moltiplicazione per la coordinata traslata xi + ai , abbiamo l’identit` a: Pj Xi ϕ = −iδij ϕ + Xi Pj ϕ. Da essa segue immediatamente che:
Pj Xi ϕ − Xi Pj ϕ + iδij ϕ ψ = 0 , se ϕ ∈ D(R3 ) e ψ ∈ L2 (R3 , dx). A sua volta, se ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ) = D(Xi Pj ) ∩ D(Pj Xi ) e tenendo conto del fatto che Pj e Xi sono autoaggiunti, l’identit` a trovata si riscrive: ϕ Xi Pj ψ − Pj Xi ψ − iδij ψ = 0 . Dato che D(R3 ) `e denso in L2 (R3 , dx), concludiamo che vale (10.16) per Xi e Pj in luogo di Xi e Pj . Coppie di osservabili che soddisfano le relazioni di Heisenberg (10.16), su un qualche dominio invariante come S(R3 ), sono spesso dette in letteratura osservabili coniugate. Le relazioni di Heisenberg sono il caso elementare di pi` u generali CCR valide anche in teoria dei campi quantistici, per campi bosonici, con una definizione appropriata per gli operatori corrispondenti all’operatore posizione ed all’operatore impulso. Dal punto di vista fisico si `e constatato
474
10 Formulazione matematica della MQ
pi` u volte, nella storia della Meccanica Quantistica e sue evoluzioni, che queste relazioni sono pi` u importanti delle definizioni di Xi e Pi stessi. Come `e evidente dalle definizioni date, gli operatori posizione ed impulso non sono limitati e non sono definiti su tutto lo spazio di Hilbert. Questo fatto `e piuttosto fastidioso dal punto di vista tecnico, perch´e costringe ad usare la teoria spettrale per operatori non limitati, che `e pi` u complessa di quella per operatori limitati. Ci si pu`o chiedere se non sia possibile definire in modo alternativo Xi e Pi in modo tale che le relazioni di Heisenberg siano mantenute, ma che tali operatori siano limitati. La risposta `e negativa e questa situazione `e nella natura delle cose, dato che discende direttamente dalle relazioni di commutazione di Heisenberg. Proposizione 10.9. Non esistono due operatori autoaggiunti X e P che soddisfino [X, P ] = iI su un sottospazio comune invariante e che siano limitati su tale sottospazio. Dimostrazione. Supponiamo che X e P soddisfino [X, P ] = iI su un sottospazio comune invariante D e siano limitati su di esso. Restringiamoci allora a lavorare su tale spazio (o sulla chiusura di esso se non `e chiuso, estendendo gli operatori in modo unico ad operatori autoaggiunti definiti su tale chiusura), considerandolo come tutto lo spazio di Hilbert. Le restrizioni di tali operatori saranno ancora operatori autoaggiunti oltre che limitati. Da [X, P ] = iI si ricava subito che: P X n − X n P = −inX n−1 , da cui, se n `e dispari, usando ricorrentemente (a) di proposizione 3.38 (tenendo conto che X p = (X p )∗ per ogni intero positivo p) e le propriet`a elementari della norma: n||X||n−1 = n||X n−1 || ≤ 2||P ||||X n|| ≤ 2||P ||||X||||X n−1|| = 2||P ||||X||||X||n−1 . Dato che ||X|| = 0 (altrimenti (10.16) sarebbe falsa), otteniamo l’asserto impossibile: n ≤ 2||P ||||X|| < +∞ per ogni n = 1, 3, 5, . . . 10.2.2 Il Principio di Indeterminazione di Heisenberg come teorema Una conseguenza positiva immediata delle relazioni di Heisenberg e di tutto il formalismo introdotto `e che il Principio di Indeterminazione di Heisenberg, per le variabili posizione ed impulso (cfr sezione 6.4), diventa un teorema. Dimostreremo ora il teorema nella forma classica per gli stati puri, ma pi` u avanti generalizzeremo il risultato agli stati misti. Teorema 10.10. (“Principio di indeterminazione di Heisenberg”.) Per ogni stato puro di un particella classica con spin 0, descritto da un vettore ψ tale che: ψ ∈ D(Xi Pi ) ∩ D(Pi Xi ) ∩ D(Xi2 ) ∩ D(Pi2 )
10.3 Teorema di Stone-von Neumann
475
(in particolare ψ ∈ S(R3 )) con ||ψ|| = 1, valgono le relazioni (dove scriviamo a): ψ invece di ρψ per semplicit` (ΔXi )ψ (ΔPi )ψ ≥
2
i=1,2,3 .
(10.17)
Dimostrazione. Prima di tutto notiamo che, nelle ipotesi fatte si ha in particolare che ψ ∈ D(Xi2 ) ∩ D(Pi2 ) per cui gli scarti quadratici hanno senso. Dalla definizione (10.3) si vede immediatamente che (ΔXi )ψ = (ΔXi )ψ e (ΔPi )ψ = (ΔPi )ψ se Xi := Xi +ai I e Pi := Pi +bi I dove ai , bi sono costanti in R, per cui la validit` a di (10.17) con Xi e Pi rimpiazzati con Xi e Pi rispettivamente `e equivalente alla validit` a di (10.17). Scegliamo pertanto ai = −Xi ψ e bi = −Pi ψ e dimostriamo (10.17) per i nuovi operatori Xi e Pi . Dalla (10.5) risulta immediatamente che, con le scelte fatte, (ΔXi )ψ = ||Xi ψ|| e (ΔPi)ψ = ||Piψ||. Quindi dobbiamo provare che: ||Xi ψ||||Piψ|| ≥ /2 .
(10.18)
Xi e Pi soddisfano ancora (10.16), per cui, dalla disuguaglianza di Schwarz ed usando il fatto che gli operatori sono autoaggiunti e le propriet`a elementari del prodotto scalare, si ha: ||Xi ψ||||Piψ|| ≥ |(Xi ψ|Pi ψ)| ≥ |Im(Xi ψ|Pi ψ)|
1 1
(ψ|Xi Pi ψ) − (ψ|Xi Pi ψ) = |(ψ|(Xi Pi − Pi Xi )ψ)| = (ψ|ψ) = . 2 2 2 2 Nel penultimo passaggio abbiamo usato il lemma 10.8. Abbiamo quindi provato (10.18) che era quanto si doveva fare. =
Osservazione 10.11. La dimostrazione prova, pi` u in generale, che vale ΔAψ ΔBψ ≥ 12 |(ψ|[A, B]ψ)| per ogni vettore ψ ∈ D(AB) ∩ D(BA) ∩ D(A2 ) ∩ D(B 2 ) e per ogni coppia di operatori hermitiani A, B in H.
10.3 Le relazioni di Weyl, il teorema di Stone-von Neumann e il teorema di Mackey Esiste un risultato piuttosto notevole sulle CCR: `e in qualche modo sovrabbondante, enunciando l’assioma A5, precisare che lo spazio di Hilbert sia L2 (R3 , dx) e che gli operatori posizione ed impulso siano della forma data. In qualche modo queste informazioni sono tutte contenute nelle relazioni di commutazione di Heisenberg purch´e, detto un poco impropriamente, la rappresentazione degli operatori posizione ed impulso sia irriducibile. Questo `e il contenuto essenziale del famoso teorema di Stone-von Neumann che dimostreremo in questa sezione. Se cade la condizione di irriducibilit`a, Mackey ha
476
10 Formulazione matematica della MQ
provato (come conseguenza di teoremi molto pi` u generali legati alla teoria dell’imprimitivit` a) che lo spazio di Hilbert `e comunque una somma diretta ortogonale di rappresentazioni irriducibili (il numero di tali rappresentazioni `e numerabile se lo spazio di Hilbert `e separabile). Dimostreremo anche il teorema di Mackey.
10.3.1 Famiglie irriducibili di operatori e lemma di Schur Prima di procedere sono necessarie alcune nozioni generali riguardanti il concetto di famiglia irriducibile di operatori. Strettamente legato a tale nozione `e il cosiddetto Lemma di Schur, che ha grande utilit` a nella teoria generale delle rappresentazioni unitarie di gruppi, che avremo occasione di incontrare nel prossimo capitolo. Definizione 10.12. Se H `e uno spazio di Hilbert e A := {Ai }i∈J `e una famiglia di operatori Ai : H → H, diremo che H `e irriducibile rispetto a A ovvero, equivalentemente, che A `e irriducibile rispetto a H, se non esiste alcun sottospazio chiuso di H, diverso da {0} e da H stesso, che sia invariante per tutti gli elementi di A contemporaneamente. In altre parole, non deve esistere alcun sottospazio chiuso H0 ⊂ H, diverso da {0} e da H stesso, per cui Ai (H0 ) ⊂ H0 per ogni i ∈ J. Proviamo ora un utile risultato generale sull’irriducibilit` a di classi di operatori, noto come Lemma di Schur. Proposizione 10.13. (Lemma di Schur.) Sia A := {Ai }i∈J ⊂ B(H) una famiglia di operatori sullo spazio di Hilbert, chiusa rispetto alla coniugazione hermitiana (cio`e A∗i ∈ A se Ai ∈ A). Valgono i seguenti fatti. (a) La famiglia A `e irriducibile se e solo se ogni operatore V ∈ B(H) che soddisfa: V Ai = Ai V per ogni i ∈ J, `e della forma V = χI per qualche numero complesso χ ∈ C. (b) Sia A := {Ai }i∈J ⊂ B(H ) un’altra famiglia di operatori sullo spazio di Hilbert H , etichettata sullo stesso insieme di indici J, che sia chiusa rispetto alla coniugazione hermitiana. Si supponga infine che: ∗
se A∗i = Aji allora A i = Aji per ogni i ∈ J ed un corrispondente ji ∈ J. (10.19) Se A e A sono irriducibili, allora ogni operatore lineare limitato S : H → H che verifica: SAi = Ai S per ogni i ∈ J, deve essere della forma S = rU dove U : H → H `e una trasformazione unitaria e r ∈ R (in particolare S `e l’operatore nullo quando r = 0).
10.3 Teorema di Stone-von Neumann
477
Dimostrazione. Partiamo dalla dimostrazione di (b) che `e pi` u complessa e che viene in parte utilizzata per provare (a). ∗ (b) Prendendo l’aggiunto di SAi = Ai S abbiamo A∗i S ∗ = S ∗ A i per ogni ∗ ∗ i ∈ J. In altre parole Aji S = S Aji per ogni i ∈ J. Si osservi che ji varia in tutto J quando i varia in J, essendo A∗ji ∈ A e (A∗ji )∗ = Aji , pertanto possiamo riscrivere l’identit`a trovata come Ai S ∗ = S ∗ Ai per ogni i ∈ J. Per confronto con SAi = Ai S, abbiamo che Ai S ∗ S = S ∗ SAi e Ai SS ∗ = SS ∗ Ai . Dalla prima identit` a trovata abbiamo che l’operatore autoaggiunto limitato V := S ∗ S commuta con ogni Ai e pertanto, per (c) del teorema 8.34, la misura spettrale P (V ) di V su R commuta con ogni Ai . Ma allora (V ) ogni sottospazio chiuso PE (H) `e invariante per ogni Ai . Essendo la famiglia (V ) (V ) degli Ai irriducibile, questo significa che PE = I, oppure PE (H) = {0}, (V ) cio`e PE = 0, per ogni boreliano E ⊂ R. Supponiamo che lo spettro di V contenga almeno due punti α = α ed usiamo i risultati in (b) del teorema 9.9. Consideriamo due intervalli aperti di R, J α e J α con J ∩ J = ∅. Deve (V ) (V ) essere PJ = 0 e PJ = 0 perch´e i due intervalli contengono punti dello (V ) (V ) spettro, e quindi deve valere il caso PJ = PJ = I. D’altra parte si deve (V ) (V ) anche avere PJ PJ = 0 perch´e J ∩ J = ∅. Abbiamo raggiunto un assurdo e pertanto lo spettro di V (che non pu` o mai essere vuoto) deve contiene un unico punto che, essendo isolato, `e parte dello spettro puntuale. Concludiamo che S ∗ S = V = λI per qualche λ ∈ [0, +∞). Con la stessa procedura si trova che vale anche SS ∗ = λ I per qualche λ ∈ [0, +∞). Ma allora deve essere: λS ∗ = S ∗ SS ∗ = λ S ∗ . Ne consegue che λ = λ oppure S ∗ = 0 e quindi S = (S ∗ )∗ = 0. Nel secondo caso la dimostrazione `e conclusa. Nel primo caso, definendo U := λ−1/2 S, si trova subito U U ∗ = I e U ∗ U = I dove I e I sono gli operatori identit` a su H e H rispettivamente. Ne consegue (vedi definizione 3.46) che U `e un operatore unitario. La tesi `e provata con r = λ1/2 . Passiamo a provare (a). Supponiamo che A sia irriducibile. Se V Ai = Ai V , allora A∗i V ∗ = V ∗ A∗i che, nell’ipotesi di A chiuso rispetto alla coniugazione hermitiana, significa Ai V ∗ = V ∗ Ai per ogni i ∈ J. Allora gli operatori limitati 1 autoaggiunti V+ := 12 (V +V ∗ ) e V− := 2i (V −V ∗ ) commutano con gli elementi di A e questo implica che le loro misure spettrali commutano con gli elementi di A. Ragionando come nella dimostrazione di (b), si conclude subito che V± = λ± I per qualche coppia di reali λ± . Di conseguenza V = V+ + iV− = (λ+ +iλ− )I = χI con χ ∈ C. Supponiamo, viceversa che gli unici operatori che commutano con A siano del tipo χI. Se H0 `e un sottospazio invariante per A e P `e il proiettore ortogonale su H0 , allora deve essere P Ai P = Ai P per ogni i ∈ J. Prendendo l’aggiunto si ha subito che: P A∗i P = P A∗i per ogni i ∈ J. Dato che la classe A `e chiusa rispetto alla coniugazione hermitiana ed i ∈ J `e generico, l’identit` a trovata si pu` o riscrivere P Ai P = P Ai . Per confronto con l’identit` a iniziale, troviamo: P Ai = Ai P per ogni i ∈ J. Nelle ipotesi fatte, deve allora essere P = χI per qualche χ ∈ C. P ∗ = P implica che χ ∈ R, e
478
10 Formulazione matematica della MQ
P P = P implica che χ2 = χ. Ci sono pertanto solo due possibilit` a: P = 0 e quindi H0 = {0} oppure P = I e quindi H0 = H. Abbiamo verificato che A `e irriducibile. Osservazione 10.14. Il lemma di Schur `e particolarmente utile quando le due famiglie A e A sono rappresentazioni unitarie di uno stesso gruppo G. In tal caso, le ipotesi di chiusura rispetto alla coniugazione hermitiana e la (10.19) sono automaticamente soddisfatte usando G come insieme degli indici I. 10.3.2 Le relazioni di Weyl dalle CCR Per illustrare il teorema di Stone-von Neumann procediamo a piccoli passi. Un punto tecnicamente rilevante `e che le relazioni di commutazione di Heisenberg sono troppo difficili da usare rigorosamente, perch´e coinvolgono sottigliezze sui domini. Per liberaci dei problemi di dominio possiamo passare dagli operatori Xi e Pi ai gruppi unitari ad un o fare di meglio nparametro da essi generati. Si pu` e considerare gli operatori i=1 tk Xk + uk Pk , con tk , uk ∈ R, che risultano essere essenzialmente autoaggiunti su S(R3 ) e considerare gli esponenziali delle n loro uniche estensioni autoaggiunte i=1 tk Xk + uk Pk . Un calcolo diretto e “brutale”, basato sulle sole relazioni di Heisenberg (10.16) e sullo sviluppo formale dell’esponenziale con la sua formula di Taylor (tale sviluppo non `e giustificato fino ad ora), produce la seguente relazione1 : n n tk Xk + uk Pk exp i tk Xk + uk Pk exp i k=1
i = exp − 2
n k=1
k=1
tk uk
−
tk uk
n exp i (tk + tk )Xk + (uk + uk )Pk
.
k=1
Queste relazioni dette relazioni di Weyl, sono conseguenze formali dirette delle relazioni di commutazione di Heisenberg. Possiamo allora enunciare la proposizione annunciata, che dimostra tra le altre cose ed indipendentemente da quanto gi`a fatto con altre tecniche, che gli operatori Xi e Pi sono essenzialmente autoaggiunti se ristretti a S(R3 ), anche lavorando in dimensione maggiore di 3. Nel seguito assumeremo, per comodit`a notazionale = 1.
1
Se gli operatori negli esponenti fossero matrici n × n di C, il risultato seguirebbe immediatamente dalla famosa formula di Campbell-Hausdorff-Baker: eA eB = e[A,B]/2 eA+B , valida quando la matrice [A, B] commuta sia con la matrice a A che con la matrice B.
10.3 Teorema di Stone-von Neumann
479
Proposizione 10.15. Si consideri lo spazio L2 (Rn , dx) con n = 1, 2, · · · fissato e dove dx indica l’ordinaria misura di Lebesgue su Rn . Per k = 1, 2, · · · , n si definiscano gli operatori simmetrici: Xk : S(Rn ) → L2 (Rn , dx)
Pk : S(Rn ) → L2 (Rn , dx)
e
(Xk ψ) (x) = xk ψ(x) , ∂ψ (x) . (Pk ψ) (x) = −i ∂xk
(10.20) (10.21)
Valgono i seguenti fatti. n (a) Gli operatori simmetrici, definiti su S(Rn ), k=1 tk Xk +uk Pk ammettono n S(R ) come spazio invariante e sono essenzialmente autoaggiunti per ogni (t, u) ∈ R2n . (b) Lo spazio L2 (Rn , dx) `e irriducibile rispetto all’insieme di tutti gli operatori limitati: n W ((t, u)) := exp i tk Xk + uk Pk , con (t, u) ∈ R2n . (10.22) k=1
(c) Gli operatori suddetti soddisfano le relazioni, dette relazioni di Weyl: i
W ((t, u))W ((t , u)) = e− 2 (t·u −t ·u) W ((t + t , u + u )) , W ((t, u))∗ = W (−(t, u)) . (d) Per (t, u) ∈ R
2n
(10.23)
fissato, ogni applicazione R s → W (s(t, u)) soddisfa: s- lim W (s(t, u)) = W (0) . s→0
(10.24)
Dimostrazione. Lavoriamo per iniziare nel caso n = 1, la generalizzazione al caso n > 1 finito sar` a ovvia. Useremo alcuni strumenti gi`a introdotti nella sezione 9.1.3. In questo caso abbiamo solo l’operatore X e l’operatore P. Entrambi gli operatori sono ben definiti quando ristretti allo spazio di Schwartz S(R) ed ammettono un’unica estensione autoaggiunta partendo da tale spazio, come precedentemente discusso, che coincide con X e P rispettivamente. Vogliamo costruire un sottospazio denso di vettori analitici per tutti gli operatori simmetrici aX + bP : S(R) → L2 (R, dx), per ogni scelta di a, b ∈ R. Definiamo sul dominio denso S(R) gli operatori detti, rispettivamente, operatore di distruzione, operatore di creazione e operatore numero di occupazione:
1 d d 1 A := √ , A := √ , N := A A . X+ X− (10.25) dx dx 2 2 Per costruzione A∗ ⊃ A , (A )∗ ⊃ A e N `e simmetrico. Si verifica per computo diretto che le CCR (ovvero la stessa definizione data sopra) implicano che valgano le relazioni di commutazione su S(R): [A, A] = I .
(10.26)
480
10 Formulazione matematica della MQ
` un fatto noto della teoria dei polinomi ortogonali che il sistema ortonormale E completo su L2 (Rn , dx) delle funzioni di Hermite {ψn }n=0,1,... ⊂ S(R) (cfr (4) 2 in esempi 3.33) soddisfa ψ0 = π −1/4 e−x /2 e la relazione di ricorrenza: ψn+1 = (2(n + 1))−1/2 (x −
d )ψn . dx
Questo `e equivalente a dire che, come si prova facilmente dalla definizione di A , assegnato ψ0 le altre funzioni di Hermite si ottengono come: 3 1 n (A ) ψ0 . (10.27) ψn = n! D’altra parte, per computo diretto si verifica immediatamente che: Aψ0 = 0 .
(10.28)
Usando (10.27), (10.28) e (10.26) si ha facilmente per induzione la seconda delle due equazioni seguenti: √ √ A ψn = n + 1ψn+1 , Aψn = nψn−1 , N ψn = nψn , (10.29) dove, nella seconda formula il secondo membro `e assunto nullo per definizione se n = 0 e, come si riconosce facilmente, la prima identit`a non `e altro che d la relazione di ricorrenza ψn+1 = (2(n + 1))−1/2 (x − dx )ψn precedentemente introdotta; la terza `e invece immediata conseguenza delle due precedenti. Tenendo conto che gli ψn sono normalizzati a 1, le prime 2 in (10.29) producono la seguente stima: √ √ √ ||A1A2 · · · Ak ψn || ≤ n + 1 n + 2 · · · n + k ≤ (n + k)! , (10.30) dove gli operatori Ai sono, indifferentemente ed indipendentemente, A oppure A . Consideriamo ora un operatore simmetrico su S(R) dato da una qualsiasi combinazione lineare reale T := aX + bP con a, b ∈ R. Si ha immediatamente da (10.25) che, se z := a + ib allora: T =
zA + zA √ . 2
(10.31)
Da questa identit` a e da (10.30) segue subito che, per ogni funzione di Hermite ψn : ||T k ψn || = 2−k/2 ||(zA + zA )k ψn || ≤ 2−k/2 2k |z|k (n + k)! < = |z|k 2k (n + k)! . Pertanto, se t ≥ 0: √ +∞ k +∞ +∞ √ ( 2|z|t)k (n + k)! ( 2|z|t)k (n + k)n t √ < +∞ . ||T k ψn || ≤ ≤ k! k! k! k=0
k=0
k=0
10.3 Teorema di Stone-von Neumann
481
Il fatto che l’ultima serie converga si ha calcolando direttamente il raggio di convergenza r con la formula (usando alla fine lo sviluppo asintotico di Stirling): 3 1/k n ln(k+n) (n + k)n ln k! ln k! 1/r = lim = lim e 2k − 2k = lim e− 2k = 0 . k→+∞ k→+∞ k→+∞ k! Concludiamo che combinazioni lineari finite delle funzioni di Hermite sono un insieme di vettori analitici per tutti gli operatori T := aX + bP definiti su S(R). Dato che tali operatori sono simmetrici, concludiamo che devono anche essere essenzialmente autoaggiunti su S(R) per il teorema di Nelson (teorema 5.46). Questo conclude la prova di (a) per n = 1, per n > 1 la dimostrazione `e la stessa, con semplici riadattamenti, tenendo conto che le funzioni di Hermite in n variabili: ψm1 ,...,mn (x1 , . . . , xn ) := ψm1 (x1 ) · · · ψmn (xm ) definiscono un sistema ortonormale completo per L2 (Rn , dx) (vedi (1) in esempi 9.8). Quanto appena visto prova evidentemente (a) ma anche (d) e la seconda identit` a in (c). Infatti, per costruzione: n n W (s(t, u)) = exp is , tk Xk + uk Pk = exp is tk X k + u k P k k=1
k=1
dove abbiamo usato il risultato di verifica immediata, applicando la definizione di chiusura di un operatore chiudibile a, sA = sA per ogni s ∈ C. n A questo punto, dato che t Xk + uk Pk `e autoaggiunto, il punto (a) k i=1 del teorema 9.30, prova la continuit`a nella topologia forte del gruppo unitario ad un ( parametro R s → )W (s(t, u)), tenendo conto del fatto che n W (0) = exp i0 i=1 tk Xk + uk Pk = I. La seconda identit`a in (c) `e ovvia dato che R s → W (s(t, u)) `e un gruppo unitario ad un parametro come appena precisato. Per dimostrare (b) faremo uso del lemma 10.16 enunciato e provato dopo questa dimostrazione, che si basa unicamente sulla dimostrazione del punto (a) appena data. Supponiamo che esista un sottospazio chiuso H0 ⊆ L2 (Rn ) invariante per la classe degli operatori W ((t, u)) e che sia non banale, cio`e contenga almeno un vettore ψ = 0. Sia φ ∈ H⊥ 0 , mostreremo che deve necessariamente essere φ = 0 e pertanto H0 = L2 (Rn ). Per ipotesi deve essere, dato che sia H0 che il suo ortogonale sono invarianti sotto l’azione degli operatori suddetti: (φ|W ((t, 0)W ((0, u))ψ) = 0 , In altre parole:
φ ei k tk Xk ei k uk Pk ψ = 0 ,
per ogni (t, u) ∈ R2n .
per ogni (t, u) ∈ R2n .
482
10 Formulazione matematica della MQ
Il primo membro pu` o essere calcolato esplicitamente usando (10.38) e (10.39) del lemma 10.16, trovando: eit·xφ(x)ψ(x + u) dx = 0 , per ogni t, u ∈ Rn . Rn
Dato che la funzione x → hu(x) := φ(x)ψ(x + u) `e in L1 (Rn , dx) essendo le due funzioni a prodotto in L2 (Rn , dx), e data l’arbitrariet` a di t ∈ Rn , l’identit` a di sopra dice semplicemente che la trasformata di Fourier di hu ∈ L1 (Rn , dx) `e nulla. In base a (f) in proposizione 3.69, la funzione hu deve essere nulla quasi ovunque. In altre parole: φ(x)ψ(x + u) = 0 quasi ovunque per ogni u ∈ Rn .
(10.32)
Sia E ⊂ Rn l’insieme su cui ψ non si annulla e F l’insieme su cui non si annulla mai φ. (Notare che entrambi gli insiemi sono misurabili perch´e controimmagini dell’aperto C \ {0} secondo funzioni misurabili.) Indicando con m la misura di Lebesgue di Rn , vale m(E) > 0 per ipotesi. Affinch`e sia valida la richiesta (10.32) deve accadere che:
cio`e
m(F ∩ (E − u)) = 0 per ogni u ∈ Rn , χF (x)χE (x + u)dx = 0 per ogni u ∈ Rn . R
Integrando in u abbiamo che deve anche valere: dy χF (x)χE (x + u)dx = 0 . R
R
Dato che le funzioni integrande sono non negative e che l’integrale iterato `e finito, possiamo usare il teorema di Fubini-Tonelli per scambiare le integrazioni, sfruttare ancora l’invarianza per traslazioni della misura di Lebesgue ottenendo: 0= dxχF (x) χE (x + u)du = dxχF (x) 1du R
R
= R
R
dxχF (x)
R
E−x
χE (u)dy = m(F )m(E) .
Dato che m(E) > 0 deve essere m(F ) = 0. Dunque φ `e nulla quasi ovunque: `e il vettore nullo di L2 (Rn , dx). Quindi H0 = L2 (Rn , dx) e questo prova l’irriducibilit` a enunciata in (b). Non resta che dimostrare le identit`a:
i
W ((t, u))W ((t, u )) = e− 2 (t·u −t ·u) W ((t + t , u + u )) .
(10.33)
Per provare tali identit` a suddette procediamo come segue in due passaggi, introducendo gli operatori: i
U ((t, u)) := e− 2 (t·u) W ((t, 0))W ((0, u)) .
10.3 Teorema di Stone-von Neumann
483
Per prima cosa dimostreremo che tali operatori soddisfano le identit` a:
i
U ((t, u))U ((t, u )) = e− 2 (t·u −t ·u)U ((t + t , u + u )) .
(10.34)
Come secondo punto dimostreremo che U ((t, u)) = W ((t, u)) ,
(10.35)
e ci`o concluder` a la dimostrazione. Esattamente come nella dimostrazione di (b), usando il lemma 10.16 segue immediatamente che: i
(U ((t, u))ψ) (x) = e 2 t·ueit·x ψ(x + u) .
(10.36)
Da questa identit` a reiterata segue, con qualche banale calcolo che, per ogni fissata ψ ∈ L2 (Rn , dx): i
U ((t, u))U ((t, u ))ψ = e− 2 (t·u −t ·u) U ((t + t , u + u ))ψ . Per l’arbitrariet` a di ψ questo `e equivalente alla (10.34) che risulta in tal modo provata. Passiamo a dimostrare (10.35). Consideriamo, per t, u fissati, la classe di operatori unitari Us := U (s(t, u)) per s ∈ R. Direttamente da (10.36) si verifica per computo diretto che Us+s = Us Us e U0 = I. Dato che gli operatori sono tutti unitari abbiamo ottenuto che {Us }s∈R `e un gruppo ad un parametro di operatori unitari. La nostra strategia sar` a ora quella di dimostrare che tale gruppo `e fortemente continuo, calcolarne il generatore e dimostrare che esso coincide con quello di {W (s(t, u))}s∈R; provate queste cose, il teorema di Stone (teorema 9.25) dimostra che i due gruppi ad un parametro devono coincidere provando in tal modo (10.35). Per quanto concerne la continuit`a in senso forte, si osservi che, per ogni fissata coppia ψ, φ ∈ L2 (R2 , dx): is2
(φ|Us ψ) = e 2 t·u φ eis k tk Xk eis k uk Pk ψ =e
is2 2
t·u
eis k tk Xk φ eis k uk Pk ψ → (φ|ψ)
per s → 0 ,
in virt` u della continuit` a del prodotto scalare e della continuit` a in senso forte dei gruppi unitari ad un parametro generati dagli operatori autoaggiun ti k uk Pk e k tk Xk . La proposizione 9.20 assicura allora che {Us }s∈R `e fortemente continuo. Consideriamo ora ψ ∈ S(Rn ) e verifichiamo che:
2
U ψ − ψ
s
−i tk X k + u k P k ψ = 0 . (10.37) lim
s→0
s k
Con qualche passaggio, si trova esplicitamente:
2
U ψ − ψ
s tk X k + u k P k ψ −i
s k
484
10 Formulazione matematica della MQ
2
2
eis t·u/2 eistxψ(x + su) − ψ(x)
= − it · xψ(x) − u · ∇xψ dx .
s n R
Pertanto:
2
U ψ − ψ
s tk X k + u k P k ψ −i
s k
2
is2 t·u/2 istx ψ(x + su) − ψ(x)
e
− u · ∇ ≤ e ψ x dx
s Rn
is2 t·u/2 istx
is2 t·u/2 istx ψ(x + su) − ψ(x)
e e −1
e − u · ∇xψ
e +2
s st · x n R
2
is2 t·u/2 ist·x
e −1
e
−i| |t · xψ(x)|dx + − i |t · xψ(x)|2 dx .
st · x Rn
Consideriamo i tre integrali a secondo membro. L’integrale intermedio, a causa della disuguaglianza di Schwarz, deve tendere a zero quando tendono a zero i rimanenti due, dato che il suo quadrato `e maggiorato dal prodotto degli altri due integrali. Per il teorema della convergenza dominata, l’ultimo integrale tende a 0 per s → 0 dato che l’integrando tende puntualmente a 0 ed `e uniformemente maggiorato dalla funzione L1 data da C|t · xψ(x)|2 per qualche costante C > 0. L’integrando del primo integrale tende anch’esso puntualmente a 0 quando s → 0. Per applicare il teorema di Lebesgue bisogna trovare una maggiorazione dell’integrando, uniforme in s in un intorno di 0, data da una funzione L1 (quindi indipendente da s). Si osservi che, spezzando l’integrale e ricordando che ψ ∈ S(Rn ), si vede subito che `e sufficiente trovare una maggiorazione uniforme in s ∈ [−, ], da parte di funzioni L1 per:
2
ψ(x + su) − ψ(x)
e ψ(x + su) − ψ(x) ,
s s per avere una maggiorazione di tutto l’integrando. Assumendo ψ reale (e ci si pu`o sempre ricondurre a tale caso decomponendo ψ in parte reale ed immaginaria), possiamo stimare con il teorema di Lagrange:
ψ(x + su) − ψ(x)
= |u · ∇ψ|x+s u | , 0
s dove s0 ∈ [−, ]. Dato che ψ ∈ S(Rn ), per ogni fissato p = 1, 2, . . . esiste Kp ≥ 0 con: Kp |u · ∇ψ|x| ≤ . 1 + ||x||p ` facile vedere che se > 0, u ∈ Rn e p = 2, 3, . . . sono fissati, esiste Cp, > 0 E tale che 1 Cp, ≤ per ogni x ∈ Rn e s0 ∈ [−, ]. 1 + ||x + s0 u||p 1 + ||x||p−1
10.3 Teorema di Stone-von Neumann
485
In definitiva possiamo concludere che, per qualche costante C ≥ 0:
ψ(x + su) − ψ(x) C n
≤
1 + ||x||n+1 per ogni x ∈ R e s ∈ [−, ].
s La funzione a secondo membro ed il suo quadrato sono funzioni L1 (Rn , dx) e ci`o `e quanto volevamo per poter applicare il teorema di Lebesgue. La (10.37) risulta essere provata. Abbiamo ottenuto che il generatore autoaggiunto del gruppo unitario ad un parametro fortemente continuo {U (s(t, u))}s∈R coincide con quello dell’analogo gruppo di operatori {W (s(t, u))}s∈R sullo spazio S(Rn ). Dato che il secondo generatore `e essenzialmente autoaggiunto su tale spazio, e quindi ammette un’unica estensione autoaggiunta, i due generatori devono coincidere ovunque. Come conseguenza abbiamo allora che i due gruppi devono coincidere dato che si possono entrambi scrivere esponenziando lo stesso generatore autoaggiunto. Enunciamo e proviamo un Lemma usato nella precedente dimostrazione per provare (b) e (c) una volta provato (a). Enunciamo tale lemma separatamente in quanto `e utile come risultato tecnico. Lemma 10.16. In riferimento alle ipotesi della proposizione 10.15, se ψ ∈ L2 (Rn , dx) e t, u ∈ Rn , valgono le seguenti identit` a: ei k tk Xk ψ (x) = eit·xψ(x) , (10.38)
e
ei
k
uk Pk
ψ (x) = ψ(x + u) .
(10.39)
Dimostrazione. Per computo diretto si ha che il gruppo unitario ad un parametro {Us }s∈R con: (Us ψ) (x) := eist·xψ(x) ,
∀ψ ∈ L2 (Rn , dx)
`e fortemente continuo e soddisfa su S(Rn ): 1 tk X k ψ . −i lim (Us ψ − ψ) = s→0 s k
Infatti:
2
2
1
eist·x − 1
− it · x
|ψ(x)|2 dx tk X k ψ =
(Us ψ − ψ) − i
s s R3 k
= R
ist·x
2
e
−1
|t · x|2 |ψ(x)|2 dx → 0 per s → 0 , − i
st · x 3
486
10 Formulazione matematica della MQ
dove abbiamo usato il fatto che x → |t · x|2 |ψ(x)|2 `e L1 dato che ψ ∈ S(Rn ), che la funzione:
ist·x
2
e
−1 3
R × R (s, x) → − i
st · x `e limitata e tende puntualmente in x a 0 per s → 0, ed abbiamo infine applicato il teorema della convergenza dominata di Lebesgue. Per il teorema diStone, il generatore del gruppodegli Us `e un’estensione autoaggiunta di k tk Xk . D’altra parte, dato che k tk Xk `e essenzialmente autoaggiunto per (a) del teorema precedente, e pertanto non ammette altre estensioni autoaggiunte eccetto la sua chiusura, concludiamo che {Us }s∈R `e il gruppo ad un parametro generato da k tk Xk . In questo modo abbiamo provato la (10.38). Passiamo alla seconda identit` a. In virt` u di (3.65)-(3.68), del fatto che la trasformata di Fourier-Plancherel Fˆ si riduce a quella di Fourier F su S(Rn ) e che quest’ultimo `e uno spazio invariante sotto F : uk Pk = Fˆ −1 uk Kk Fˆ , (10.40) k
k
dove Kk `e l’operatore Xk al quale abbiamo cambiato nome dato che la variabile della funzione trasformata secondo Fourier `e k e non x. Dato che la trasformata di Fourier `e un isomorfismo di spazi di Hilbert abbiamo anche che: uk Pk = Fˆ −1 uk Kk Fˆ . (10.41) k
k
Infine per il corollario 9.28 deve anche valere: ei
k
uk Pk
= Fˆ −1 ei
k
uk Kk
Fˆ .
(10.42)
Riducendosi al caso di ψ ∈ S(Rn ), dove la trasformata di Fourier-Plancherel Fˆ e la sua inversa si calcolano con l’integrale di Fourier e si riducono alla trasformata di Fourier F e alla corrispondente inversa (cfr definizione 3.67), (10.42) implica che: ei k uk Pk ψ (x) = F −1 ei k uk Kk ψˆ (x) = ψ(x+u), per ogni ψ ∈ S(Rn ). (10.43) Tenendo conto che S(Rn ) `e denso in L2 (Rn , dx), che se S(Rn ) ψn → ψ nel senso di L2 , allora vale anche ψn ( · + u) → ψ( · + u) in L2 dato che la misura diLebesgue `e invariante per traslazione e la continuit` a dell’operatore unitario ei k uk Pk implica (10.39) dalla (10.43). 10.3.3 Il teorema di Stone-von Neumann e il teorema di Mackey Mostriamo ora come le relazioni di Weyl valide per operatori limitati W ((t, u)) con (t, u) ∈ R2n , che formino un insieme irriducibile di operatori su uno spazio
10.3 Teorema di Stone-von Neumann
487
di Hilbert complesso H e tali che s → W (s(t, u)) siano continui, per s = 0, nella topologia operatoriale forte, implichino che H sia collegato a L2 (Rn , dx) tramite un isomorfismo di spazi di Hilbert che identifica ogni W ((t, u)) con ei k tk Xk +uk Pk . Si osservi che, in particolare, lo spazio di Hilbert H risulta essere separabile. Enunceremo il teorema in forma leggermente pi` u generale introducendo alcune nozioni di teoria degli spazi vettoriali simplettici. Ricordiamo alcune nozioni elementari di teoria degli spazi simplettici. Definizione 10.17. Una coppia (X, σ) `e detta spazio simplettico quando X `e spazio vettoriale reale e σ : X × X → R, detta forma simplettica, `e un’applicazione `e bilineare, antisimmetrica e debolmente non degenere: cio`e σ(u, v) = 0 per ogni u ∈ X implica v = 0. Un isomorfismo tra spazi vettoriali reali dotati di forma simplettica `e detto simplettoisomorfismo se preserva le forme simplettiche. Se X `e uno spazio normato (infinitodimensionale), esiste una nozione di non degeneratezza in senso forte che richiede, pi` u fortemente che (a) σ(·, v) ∈ X per ogni v ∈ X, e che (b) X v → σ(·, v) ∈ X sia biettiva. In dimensione finita la non degeneratezza debole equivale a quella forte. Vale il seguente risultato dovuto a Darboux (che `e legato ad un secondo, pi` u importante, teorema di Darboux sulle variet` a simplettiche del quale non ci occuperemo [FaMa94]). Teorema 10.18. (Di Darboux.) Se (X, σ) `e uno spazio simplettico con X di dimensione finita 2n, allora esiste una base (in realt` a un’infinit` a di esse), detta base canonica, {e1 , · · · , en , f1 , · · · , fn } ⊂ X, rispetto alla quale σ `e scritta nella seguente forma, detta forma canonica: n per ogni coppia z, z ∈ X , σ(z, z ) := t i u i − ti u i (10.44) i=1
dove z =
n
i=1 ti ei
+
n i=1
ui fi e z =
n
i=1 ti ei
+
n
i=1 ui fi .
Si prova facilmente che un isomorfismo da uno spazio simplettico nello stesso spazio `e un simplettoisomorfismo se e solo se trasforma basi canoniche in basi canoniche. Possiamo ora enunciare il teorema di Stone-von Neumann, che proveremo pi` u avanti dopo avere introdotto la nozione di ∗-algebra di Weyl. Alcuni commenti, sia di carattere matematico che fisico, sul teorema di Stone-von Neumann sono riportati in una sezione dopo la dimostrazione del teorema. Teorema 10.19. (Di Stone-von Neumann.) Si consideri uno spazio di Hilbert complesso H e uno spazio vettoriale simplettico (X, σ) di dimensione finita 2n. Si supponga H sia dotato di una classe di operatori {W (z)}z∈X ⊂ B(H) che goda delle seguenti tre propriet` a.
488
10 Formulazione matematica della MQ
(a) H sia irriducibile rispetto all’insieme degli operatori {W (z)}z∈X . (b) Valgano le relazioni di Weyl:
i
W (z)W (z ) = e− 2 σ(z,z ) W ((z + z )) ,
W (z)∗ = W (−z)
se z, z ∈ X (10.45) (c) Per z ∈ X fissato, ogni applicazione R s → W (sz) soddisfa: s- lim W (sz) = W (0) .
(10.46)
s→0
Allora, scelta una base canonica di X, rispetto alla quale z ∈ X `e individuato da (t(z) , u(z)) ∈ Rn × Rn , esiste un isomorfismo di spazi di Hilbert S : H → L2 (Rn , dx) tale che:
S W (z) S
−1
n (z) (z) := exp i tk X k + u k P k
,
per ogni z ∈ X.
(10.47)
k=1
dove gli operatori simmetrici sono Xi e Pi definiti come in proposizione 10.15. Si osservi che, come corollario, H deve risultare essere separabile, se soddisfa le ipotesi del teorema 10.19, dato L2 (Rn , dx) `e separabile. A completamento del teorema di Stone-von Neumann enunciamo un ulteriore risultato dovuto a Mackey. La nozione di somma diretta hilbertiana usata sotto `e quella data nella definizione 8.36. Teorema 10.20. (Di Mackey.) A parit` a delle altre ipotesi nel teorema 10.19, si assuma che l’ipotesi (a) sia sostituita da una delle seguenti ipotesi equivalenti. (a1) Ogni generatore W (z) ha nucleo banale per z ∈ X. (a2) Ogni generatore W (z) `e un operatore unitario per z ∈ X. (a3) W (0) `e l’operatore identit` a su H. In tal caso lo spazio di Hilbert H `e la somma diretta hilbertiana di una famiglia (numerabile se H `e separabile) di sottospazi chiusi, ciascuno invariante ed irriducibile rispetto all’insieme dei generatori W (z). In ciascuno di tali spazi `e quindi valido il teorema di Stone-von Neumann per la classe di operatori W (z) ristretti al sottospazio considerato. Osservazione importante. Tenendo conto del teorema di Darboux citato sopra, un modo alternativo di formulare il teorema Teorema di Stone-von Neumann, che si trova pi` u spesso in letteratura, `e il seguente. Vale un’analoga riformulazione del teorema di Mackey che il lettore pu`o facilmente ricavare e che omettiamo. Teorema 10.21. (Di Stone-von Neumann in formulazione alternativa,) Sia H spazio di Hilbert complesso e {U (t)}t∈Rn , {V (u)}u∈Rn ⊂ B(H) tali che valgano le seguenti propriet` a.
10.3 Teorema di Stone-von Neumann
489
(a) H sia irriducibile rispetto a {U (t)}t∈Rn , {V (u)}u∈Rn . (b) Siano soddisfatte le relazioni (anch’esse dette di Weyl): U (t)V (u) = V (u)U (t)eit·u U (t)U (t ) = U (t + t )
per ogni t, u ∈ Rn ,
V (u)V (u) = V (u + u )
per ogni t, u, tu ∈ Rn .
(c) Per ogni coppia t ∈ Rn e u ∈ Rn : s- lim U (st) = U (0) s→0
e
s- lim V (su) = V (0) .
(10.48)
s→0
Allora esiste un isomorfismo di spazi di Hilbert S1 : H → L2 (Rn , dx) che soddisfa: n n −1 −1 S1 U (t) S1 := exp i e S1 V (u) S1 := exp i tk X k u k Pk k=1
k=1
dove gli operatori simmetrici sono Xi e Pi definiti come in proposizione 10.15. Mostriamo che le due formulazioni sono equivalenti. Assumiamo che gli spazi di Hilbert H dei due teoremi siano lo stesso spazio di Hilbert. Proviamo subito che il teorema 10.19 implica il teorema 10.21. Partendo dalle ipotesi del teorema 10.21 ed usando le relazioni di Weyl presentate in tale teorema, si verifica immediatamente che gli operatori W ((t, u)) := eit·u/2 U (t)V (u) soddisfano le ipotesi del teorema 10.19 sullo spazio simplettico (Rn × Rn , σc), dove σc `e la forma simplettica gi`a espressa in forma canonica: n σc ((t, u), (t , u )) = t i u i − ti u i i=1
sulla base naturale di R × R . Scegliendo la base canonica come quella naturale di Rn × Rn , la validit` a della tesi del teorema 10.19 implica la validit`a dalla tesi del teorema 10.21 con S1 = S. Proviamo ora che il teorema 10.21 implica il teorema 10.19. Scegliamo una base canonica in X e identifichiamo gli elementi di X con le coppie (t, u) di Rn × Rn . Partendo dalla classe di operatori W ((t, u)) soddisfacenti le ipotesi del teorema 10.19, si verifica subito che i nuovi operatori V (t) := W ((t, 0)) e U (u) := W ((0, u)) soddisfano le ipotesi del teorema 10.21. Per verifica diretta si ha subito che la validit` a della tesi del teorema 10.21 implica la validit`a dalla tesi del teorema 10.19 con S = S1 . n
n
10.3.4 La ∗-algebra di Weyl L’enunciato del teorema di Stone von Neumann contiene una nozione molto importante, non solo per la dimostrazione del teorema stesso, ma anche per i successivi sviluppi della MQ verso la teoria quantistica dei campi. Si tratta della nozione di ∗-algebra di Weyl. Soffermiamoci un po’ su tale nozione.
490
10 Formulazione matematica della MQ
Definizione 10.22. Sia X uno spazio vettoriale (non banale) di dimensione arbitraria (anche non finita) sul campo reale e σ : X × X → R una forma simplettica su X. Una ∗-algebra (definizione 3.40) W (X, σ) `e detta Algebra di Weyl associata a (X, σ) se esiste in W (X, σ) una classe {W (u)}u∈X di elementi non nulli, detti generatori (di W (X, σ)), tale che: (i) valgano le relazioni (di commutazione) di Weyl: i
W (u)W (v) = e− 2 σ(u,v)W (u + v) ,
W (u)∗ = W (−u) ,
per ogni u, v ∈ V , (10.49) (ii) W (X, σ) sia generata da {W (u)}u∈V , cio`e W (X, σ) coincida con lo spazio lineare delle combinazioni lineari finite di prodotti finiti degli elementi in W (X, σ). Mostriamo ora, tra le altre cose, che uno spazio simplettico (X, σ) determina in modo univoco, cio`e a meno di ∗-isomorfismi, una ∗-algebra di Weyl. Ricordiamo (definizioni 2.36 e 3.37) che un isomorfismo di ∗-algebre α : A → B `e un’applicazione lineare, biettiva, che conserva i prodotti e le involuzioni, passando dalla ∗-algebra A alla ∗-algebra B. Se tali ∗-algebre ammettono unit` a `e ulteriormente richiesto che, per definizione, l’isomorfismo α trasformi l’unit` a di A nell’unit` a di B (di conseguenza, α trasforma l’inverso di un elemento nella prima algebra nell’inverso del corrispondente elemento nella seconda). Nel caso in cui B sia una sotto ∗-algebra della C ∗ -algebra B(H) degli operatori limitati sullo spazio di Hilbert complesso H, α : A → B `e detta rappresentazione di A su H. Teorema 10.23. Sia X uno spazio vettoriale (non banale) di dimensione arbitraria (anche non finita) sul campo reale e σ : X × X → R una forma simplettica su X. (a) Esiste sempre una ∗-algebra di Weyl, W (X, σ), associata a (X, σ). (b) Ogni ∗-algebra di Weyl W (X, σ) ammette unit` a I e vale: W (0) = I ,
W (u)∗ = W (−u) = W (u)−1 , per ogni u ∈ X .
(10.50)
I generatori {W (u)}u∈X sono linearmente indipendenti, in particolare W (u) = W (v) se u = v. (c) Se W (X, σ), generata da {W (u)}u∈X , e W (X, σ), generata da {W (u)}u∈X , sono algebre di Weyl associate a (X, σ), esiste, ed `e unico, uno ∗-isomorfismo α : W (X, σ) → W (X, σ) completamente determinato dalla richiesta: α(W (u)) = W (u) ,
per ogni u ∈ X.
(d) Ogni rappresentazione di W (X, σ) su uno spazio di Hilbert H: π : W (X, σ) → B(H) `e fedele (cio`e iniettiva) oppure `e la rappresentazione nulla.
10.3 Teorema di Stone-von Neumann
491
Dimostrazione. (a). Si consideri lo spazio di Hilbert complesso H := L2 (X, μ) dove μ `e la misura che conta i punti dell’insieme X. Se u ∈ X, si consideri W (u) ∈ B(L2 (X, μ)) definito da (W (u)ψ)(v) := eiσ(u,v)ψ(u + v) per ogni ψ ∈ L2 (X, μ) e v ∈ X. Si verifica immediatamente che tali operatori sono non nulli e soddisfano le relazioni di commutazione di Weyl (10.50) usando come involuzione la coniugazione hermitiana. Le combinazioni lineari finite di prodotti finiti di tali operatori costituiscono un’algebra di Weyl associata a (X, σ). (b). Dalla prima equazione in (10.49) segue che W (u)W (0) = W (0) = W (0)W (u) e anche W (u)W (−u) = W (0) = W (−u)W (u), dato che i W (u) sono non nulli e generano tutta la ∗-algebra, segue che deve essere W (0) = I e W (−u) = W (u)−1 . Quest’ultima, tenendo conto della seconda in (10.49), implica che W (u)∗ = W (u)−1 . Passiamo a provare che i generatori W (u) sono linearmente indipendenti. Consideriamo un sottoinsieme di n generatori {W (uj )}j=1,...,n , con u1 , . . . , un tutti distinti, e dimostriamo che i W (uj ) sono linearmente indipendenti. Dato che il sottoinsieme `e arbitrario (e le combinazioni lineari da usare sono supposte sempre finite) ci`o prova la tesi. Considen riamo la combinazione lineare nulla j=1 aj W (uj ) = 0 e dimostriamo, per induzione, che aj = 0 per j = 1, . . . , n. Per n = 1 la tesi `e vera dato che per definizione ogni W (u) non `e nullo. Assumiamo che la tesi sia vera per n − 1 generatori, non importa come scelti, e mostriamo che `e vera anche per n generatori. Senza perdere generalit`a possiamopensare, per assurdo, che an = 0, n eventualmente rietichettando i generatori. j=1 aj W (uj ) = 0 implica che: W (un ) =
n−1 j=1
−aj W (uj ) . an
Di conseguenza: I = W (un )∗ W (un ) =
n−1 j=1
=
n−1 j=1
−aj W (un )∗ W (uj ) an
n−1 −aj −iσ(−un ,uj )/2 e W (uj − un ) = bj W (uj − un ) , an j=1
−a dove bj := anj e−iσ(−un ,uj )/2 . Per provare l’enunciato `e evidentemente sufficiente dimostrare che ogni bj = 0 per j = 1, 2, . . . , n − 1. Andiamo a dimostra-
re questo fatto. Fissiamo u ∈ X arbitrariamente ed, usando l’identit` a trovata, abbiamo che: I = W (u)IW (−u) =
n−1
bj W (u)W (uj − un )W (−u)
j=1
=
n−1 j=1
bj e−iσ(u,uj −un )/2 W (uj − un ) .
492
10 Formulazione matematica della MQ
Confrontando le due espressioni ottenute per I abbiamo che deve essere: n−1
bj W (uj − un ) =
j=1
n−1
bj e−iσ(u,uj −un )/2 W (uj − un ) .
j=1
Moltiplicando ambo membri per W (un ) ed eseguendo un’ovvia semplificazione, si trova alla fine: n−1 j=1
bj W (uj ) =
n−1
bj e−iσ(u,uj −un )/2 W (uj ) .
j=1
Dato che i generatori W (uj ) con j = 1, 2, . . ., n − 1 sono linearmente indipendenti, deve accadere che: bj (1 − e−iσ(u,uj −un)/2 ) = 0. Se fosse bj = 0 per σ(u,uj −un ) qualche j avremmo che 1 = e−iσ(u,uj −un )/2 e quindi: = k(u) ∈ Z. 2π Dato per` o che il primo membro dell’identit`a scritta `e lineare in u ∈ X, la funzione X u → k(u) deve essere lineare. Dovendo essa assumere solo valori in Z, deve essere la funzione nulla. Di conseguenza: σ(u, uj − un ) = 0 per ogni u ∈ X. La non degeneratezza di σ implica che uj − un = 0 che `e impossibile per ipotesi. (c). Essendo i generatori di un’algebra di Weyl linearmente indipendenti ed essendo i prodotti di due di essi un generatore moltiplicato per un numero complesso (in virt` u della prima identit` a di Weyl), i generatori risultano essere una base vettoriale per l’algebra di Weyl. Si consideri l’unica applicazione lineare α : W (X, σ) → W (X, σ) individuata dalla richiesta α(W (u)) = W (u) per ogni u ∈ X. Dato che {W (u)}u∈X e {W (u)}u∈X sono basi delle relative ∗-algebre, α `e un isomorfismo di spazi vettoriali. Dato che i prodotti di elementi delle due ∗-algebre si scrivono come combinazioni lineari dei generatori a causa del primo set delle relazioni di Weyl, che sono le stesse per le due ∗-algebre, si verifica facilmente che α trasforma prodotti in prodotti. α(W (0)) = W (0) implica che α trasformi l’elemento neutro moltiplicativo della prima algebra nell’elemento neutro moltiplicativo della seconda. Infine la richiesta α(W (−u)) = W (−u) e il secondo set delle relazioni di Weyl implicano che α trasformi l’involuzione nella prima algebra nell’involuzione nella seconda. La procedura seguita mostra anche che α `e univocamente determinato dalla richiesta α(W (u)) = W (u) per ogni u ∈ X. (d). Si consideri una rappresentazione π : W (X, σ) → B(H). Per costruzione gli operatori {π(W (u))}u∈X soddisfano le relazioni di Weyl. Se ognuno dei π(W (u)) `e non nullo, essi definiscono una ∗-algebra di Weyl associata a (X, σ). In base a (c) la rappresentazione π, quando si restringe il codominio a π(W (X, σ)), `e uno ∗-isomorfismo e quindi π `e iniettiva. Se al contrario, per qualche u ∈ X vale π(W (u)) = 0 allora π `e la rappresentazione nulla. Infatti, in base alle relazioni di Weyl, se z ∈ X, posto z − u =: v si trova: i i W (z) = e 2 σ(u,v) W (u)W (v) = e 2 σ(u,v)0W (v) = 0. Quindi π si riduce alla rappresentazione nulla dato che i W (v) sono una base per W (X, σ).
10.3 Teorema di Stone-von Neumann
493
Osservazioni 10.24. (1) Nel senso precisato dal punti (a) e (c) del teorema di sopra, la coppia (X, σ) e le relazioni (10.49) determinano in modo universale (cio`e a meno di isomorfismi) l’algebra di Weyl associata a (X, σ). Ogni concreta ∗-algebra di Weyl associata alla coppia (X, σ) `e detta spesso realizzazione della ∗-algebra di Weyl associata alla coppia (X, σ). (2) Se W (X, σ) `e una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a (X, σ), `e in generale falso che I = I, dove I : H → H `e l’operatore identit` a, mentre I = W (0) `e l’elemento neutro dell’algebra. La questione `e importante anche perch´e, dalle relazioni di Weyl, segue immediatamente che: I = I se e solo se ogni generatore W (u) `e un operatore unitario. Mostriamo un controesempio semplice. Supponiamo che W (X, σ) sia una rappresentazione sullo spazio di Hilbert (H, (·|·)) dell’algebra di Weyl associata a (X, σ) dove W (0) = I = I. Consideriamo lo spazio di Hilbert H := H ⊕ C con prodotto scalare (ψ, z)|(ψ , z ) = (ψ|ψ ) + zz. Una rappresentazione su H dell’algebra di Weyl associata a (X, σ) `e immediatamente costruita come quella generata dagli operatori W (u) : (ψ, z) → (W (u)ψ, 0), dove gli operatori W (u) generano l’algebra di Weyl su H. Nel caso in esame I = W (0) : (ψ, z) → (ψ, 0), per cui W (0) non `e l’operatore identit` a su H , ma solo il proiettore ortogonale su H. Tuttavia vi sono delle rappresentazioni dell’algebra di Weyl in spazi di Hilbert che risultano sempre essere tali che i generatori sono operatori unitari, siffatte rappresentazioni sono, per esempio, le cosiddette rappresentazioni GNS2 che sono fondamentali nella formulazione della teoria dei campi quantistici. (3) Se W (V, σ) `e una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a (V, σ) e l’insieme dei generatori {W (u)}u∈V `e irriducibile rispetto ad H, allora I = I e di conseguenza gli operatori W (u) sono tutti unitari. Nelle ipotesi fatte W (u) = 0, per ogni u ∈ V, altrimenti la rappresentazione sarebbe quella nulla e perci` o riducibile. Se non valesse I = I, l’operatore W (0) = I sarebbe un proiettore, diverso dall’operatore nullo e dall’operatore identit` a su H, che commuta con ogni operatore W (u) valendo ` allora immediato verificare che il sotW (u)W (0) = W (0) = W (0)W (u). E tospazio chiuso su cui proietta W (0) (che per ipotesi non coincide con {0} e nemmeno con H) `e invariante sotto l’azione di ogni W (u) e quindi sotto l’azione di ogni elemento di W (V, σ), contraddicendo le ipotesi. (4) Se W (V, σ) `e una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a (V, σ), vale I = I (cio`e gli operatori W (u) sono tutti unitari) se e solo se ciascuno dei generatori {W (u)}u∈V ha nucleo banale {0}. La dimostrazione `e immediata. Se ciascuno dei generatori W (u) ha nucleo banale, il proiettore ortogonale W (0) = I ha nucleo banale e quindi pu` o solo
2 In tal caso l’unitariet` a degli operatori W (u) segue dall’esistenza del vettore ciclico e da come si costruisce materialmente la rappresentazione.
494
10 Formulazione matematica della MQ
essere il proiettore I. Se viceversa W (0) = I allora i W (u) sono unitari e quindi hanno tutti nucleo banale. (5) L’algebra di Weyl W (V, σ) di uno spazio simplettico (V, σ) si pu` o sempre dotare di una norma (in modo unico per (b) del teorema 8.11, vedi il commento che segue la prova del teorema) in modo tale che il completamento di Banach dell’algebra risulti essere una C ∗ -algebra: la C ∗ -algebra di Weyl associata a (V, σ). Tale C ∗-algebra risulta essere unicamente individuata da (V, σ) a meno di isomorfismi, dato che lo ∗ -isomorfismo in (c) del teorema 10.23 si estende ad uno ∗ -isomorfismo (isometrico) sulle corrispondenti C ∗ -algebre. L’uso delle C ∗-algebre di Weyl `e uno dei possibili punti di partenza per costruire la teoria quantistica dei campi bosonici [BrRo02]. Come esempio di utilizzo delle C ∗algebre in MQ si veda [Str05].
10.3.5 Dimostrazione dei teoremi di Stone-von Neumann e di Mackey In questa sezione dimostriamo per primo il teorema di Stone von Neumann nella formulazione data nel teorema 10.19. Successivamente dimostreremo il teorema di Mackey 10.20. Parte delle dimostrazioni `e una rielaborazione di analoghe prove in [Str05]. Infine faremo alcuni commenti sia di carattere matematico che fisico sull’importanza di tali risultati e sulla loro validit`a in ambito pi` u generale. Dimostrazione del Teorema 10.19 di Stone von Neumann. Prima di tutto notiamo che ogni operatore W (z) ∈ B(H) deve essere non nullo: se fosse W (z0 ) = 0, per ogni z ∈ X e posto z − z0 =: v, avremmo che W (z) = i i e 2 σ(z0 ,v)W (z0 )W (v) = e 2 σ(z0 ,v)0W (v) = 0. In questo caso lo spazio H non potrebbe essere irriducibile per la classe di tutti operatori W (z) ∈ B(H). Concludiamo, applicando la definizione 10.22, che l’insieme dei W (z) ∈ B(H) `e un sistema di generatori per una realizzazione della ∗-algebra di Weyl A associata allo spazio simplettico (X, σ). Tale realizzazione `e data dalle combinazioni lineari finite dei prodotti finiti degli operatori W (z) ed `e l’immagine di una rappresentazione fedele π : A → B(H) di A. Dopo avere scelto una base canonica in X, in modo tale da associare biettivamente ad ogni z ∈ X il vettore delle sue componenti (t(z), u(z)) ∈ Rn × Rn , consideriamo lo spazio L2 (Rn , dx). La )) classe di operatori non nul( di(Hilbert n (z) (z) , per la proposizione li (perch´e unitari) exp i k=1 tk Xk + uk Pk z∈X
10.15 definisce un’altra realizzazione della stessa ∗-algebra A ed una corrispondente rappresentazione fedele π1 : A → B(L2 (Rn , dx)). Indicheremo con az ∈ A i generatori di A,( in modo tale che π(a) z ) = W (z) e, contemporan (z) (z) neamente, π1 (az ) = exp i k=1 tk Xk + uk Pk per ogni z ∈ X. Supponiamo ora che esistano due vettori non nulli Φ0 ∈ H e Ψ0 ∈ L2 (Rn , dx) tali che: D := π(A)Φ0 `e un sottospazio denso in H, D1 := π1 (A)Ψ0 `e denso in
10.3 Teorema di Stone-von Neumann
495
L2 (Rn , dx) e vale: (Φ0 |π(a)Φ0 ) = (Ψ0 |π1 (a)Ψ0 ) ,
per ogni a ∈ A.
(10.51)
Mostriamo che esiste, di conseguenza, un’applicazione lineare S6 : D → D1 definita completamente dalla richiesta: 6 Sπ(a)Φ 0 = π1 (a)Ψ0
per ogni a ∈ A,
(10.52)
che si estende per continuit`a ad un isomorfismo di spazi di Hilbert da H a L2 (Rn , dx) soddisfacendo (10.47) e quindi provando il teorema di Stone-von Neumann. Prima di tutto verifichiamo che l’applicazione sia ben definita: supponiamo che π(a)Φ0 = π(b)Φ0 , perch´e l’applicazione in (10.52) sia ben definita deve accadere che π1 (a)Ψ0 = π1 (b)Ψ0 . Da π(a)Φ0 = π(b)Φ0 abbiamo che, per ogni c ∈ A: (π(c)Φ0 |π(a)Φ0 ) = (π(c)Φ0 |π(b)Φ0 ) . Usando il fatto che π `e una rappresentazione di ∗-algebre e pertanto: π(c∗ ) = π(c)∗ e π(f)π(d) = π(fd), questa identit` a equivale a: (Φ0 |π(c∗ a)Φ0 ) = (Φ0 |π(c∗ b)Φ0 ) e quindi, valendo (10.51): (Ψ0 |π1 (c∗ a)Ψ0 ) = (Ψ0 |π1 (c∗ b)Ψ0 ). Procedendo in senso inverso troviamo infine che deve valere, per ogni c ∈ A: (π1 (c)Ψ0 |π1 (a)Ψ0 ) = (π1 (c)Ψ0 |π1(b)Ψ0 ) . Dato che π1 (c)Ψ0 spazia in tutto lo spazio denso D1 , concludiamo che deve essere, proprio come volevamo provare, π1 (a)Ψ0 = π1 (b)Ψ0 . Pertanto S6 in (10.52) `e ben definita. Si verifica immediatamente, usando il fatto che π e π1 sono rappresentazioni, che S6 `e lineare. Per costruzione S6 preserva il prodotto scalare ed `e quindi isometrica: ∗ 6 6 Sπ(a)Φ 0 |Sπ(b)Φ0 = (π1 (a)Ψ0 |π1 (b)Ψ0 ) = (Ψ0 |π1 (a) π1 (b)Ψ0 ) = (Ψ0 |π1 (a∗ )π1 (b)Ψ0 ) = (Ψ0 |π1 (a∗ b)Ψ0 ) = (Φ0 |π(a∗ b)Φ0 ) = (Φ0 |π(a∗ )π(b)Φ0 ) = (Φ0 |π(a)∗ π(b)Φ0 ) = (π(a)Φ0 |π(b)Φ0 ) . Per la proposizione 2.57, possiamo allora estendere, per linearit`a e continuit`a, la trasformazione S6 dal dominio denso D a tutto lo spazio di Hilbert, ottenendo un’applicazione lineare S : H → L2 (Rn , dx). L’estensione S sar`a ancora un operatore isometrico per la continuit` a del prodotto scalare. In modo analogo possiamo costruire sullo spazio denso D1 prima e poi su tutto lo spazio di Hilbert L2 (Rn , dx), una trasformazione lineare isometrica S : L2 (Rn , dx) → H, che si ottiene estendendo per linearit`a e continuit`a: S6 π1 (a)Ψ0 = π(a)Φ0
per ogni a ∈ A.
(10.53)
496
10 Formulazione matematica della MQ
Dato che sugli spazi densi D1 e D vale rispettivamente S6S6 = ID1 e S6 S6 = ID , queste identit` a continueranno ad essere verificate per le estensioni continue sui domini estesi: SS = IL2 (Rn ,dx) e S S = IH . In definitiva S : H → L2 (Rn , dx) `e un isomorfismo di spazi di Hilbert che soddisfa: Sπ(a)Φ0 = π1 (a)Ψ0
per ogni a ∈ A.
(10.54)
Invertendo questa identit` a troviamo, per b ∈ A: π(b)Φ0 = S −1 π1 (b)Ψ0 . Sostituendo questo risultato in (10.54), dopo avere rimpiazzato π(a) con π(ab) = π(a)π(b) a sinistra e π1 (a) con π1 (ab) = π1 (a)π1 (b) a destra, si trova: Sπ(a)S −1 π1 (b)Ψ0 = π1 (a) π1 (b)Ψ0 . Dato che i vettori π1 (b)Ψ0 definiscono uno spazio denso in L2 (Rn , dx), abbiamo ottenuto: Sπ(a)S −1 = π1 (a) per ogni a ∈ A . Scegliendo a ∈ A uguale ad un generico generatore di Weyl, l’identit` a ottenuta si riduce alla (10.47), che risulta essere provata. Per concludere la dimostrazione `e ora sufficiente esibire i vettori Φ0 e Ψ0 che soddisfano (10.51) e che generino, sotto l’azione delle rispettive rappresentazioni, sottospazi densi. Se Φ0 `e un qualsiasi vettore non nullo, il sottospazio chiuso π(A)Φ0 `e invariante sotto l’azione di ogni π(a) e, in particolare, di ogni π(W (z)) per costruzione. Dato che H `e irriducibile rispetto a tali operatori, deve accadere che π(A)Φ0 = H, cio`e D := π(A)Φ0 `e un sottospazio denso in H. Con lo stesso ragionamento si ha che D1 := π1 (A)Ψ0 `e denso in L2 (Rn , dx) per ogni vettore non nullo Ψ0 ∈ L2 (Rn , dx). Per concludere la dimostrazione, bisogna fissare Φ0 e Ψ0 in modo che valga (10.51). Consideriamo, nello spazio L2 (Rn , dx) il vettore Ψ0 dato da, se ψ0 `e la prima funzione di Hermite: Ψ0 (x) = ψ0 (x1 ) · · · ψ0 (xn ) = π −n/4 e−|x|
2
/2
.
Il calcolo diretto basato sul lemma 10.8 fornisce: n
2
−n/2 tk Xk + uk Pk Ψ0 = π eit·xe−|x+u| /2 dx Ψ0 exp i
Rn k=1
= e−|t|
2
/4−|u|2/4
e quindi
n
2 2
Ψ0 exp i tk Xk + uk Pk Ψ0 = e−(|t| +|u| )/4 ,
k=1
per ogni (t, u) ∈ Rn × Rn .
(10.55)
Se riusciamo a determinare un vettore Φ0 ∈ H che soddisfi: (Φ0 |W (z) Φ0 ) = e−(|t
(z) 2
| +|u(z) |2 )/4
,
per ogni z ∈ X,
(10.56)
10.3 Teorema di Stone-von Neumann
497
allora l’identit` a (10.51) risulta essere soddisfatta per linearit` a, tenendo conto che ogni elemento π1 (a) `e una combinazione lineare di elementi π1 (az ) ed il corrispondente π(a) `e una combinazione lineare (con gli stessi coefficienti) di elementi π(az ). L’esistenza di Φ0 `e garantita dalla seguente proposizione. Proposizione 10.25. Nelle ipotesi del teorema 10.19, se `e stata scelta una base canonica in X, in modo tale da associare biettivamente ad ogni z ∈ X il vettore delle sue componenti (t(z), u(z)) ∈ Rn × Rn , esiste Φ0 ∈ H che soddisfa la (10.56). Dimostrazione. Per prima cosa osserviamo che gli operatori W (z) sono unitari con W (0) = I in conseguenza di (3) nelle osservazioni 10.24 e tenuto conto del fatto che H `e irriducibile rispetto alla classe degli operatori W (z). Vogliamo ora provare che X z → W (z) `e continua nella topologia operatoriale forte (l’ipotesi di regolarit` a s-lims→0 W (sz) = W (0) = I apparentemente `e pi` u debole della forte continuit` a in z = 0, dato che il limite potrebbe non essere uniforme nelle varie direzioni verso l’origine). Nel seguito porremo: W ((t(z), u(z))) := W (z). cominciamo a provare che Rn t → W ((t, 0)) e Rn u → W ((0, t)) sono continue nella topologia operatoriale forte. Dimostriamo ci`o per Rn t → W ((t, 0)) essendo identica la dimostrazione per l’altra funzione. Le relazioni di Weyl implicano che valga la regola di additivit` a: W ((t, 0))W ((t , 0)) = W ((t + t , 0)). Se e1 , . . . , e n indica la parte di base n canonica su cui si decompongono i vettori come t = k=1 tk ek , possiamo allora scrivere: W ((t, 0)) = W ((t1 e1 , 0)) · · · W ((tn en , 0)). Ognuna delle funzioni R tk → W ((tk ek , 0)) `e fortemente continua a causa dell’ipotesi di regolarit`a s-lims→0 W (sz) = W (0) = I nel teorema 10.19. Sia ora ψ ∈ H, mostriamo che ||W ((t, 0))ψ − ψ|| → 0 se t → 0. Vale infatti:
n
/
||W ((t, 0))ψ − ψ|| =
W ((tk ek , 0))ψ − ψ
k=1
n n−1
/
/
≤
W ((tk ek , 0))ψ − W ((tk ek , 0))ψ
k=1
k=1
n−2
n−1
/
/
+
W ((tk ek , 0))ψ − W ((tk ek , 0))ψ
+ · · · + ||W ((t1 e1 , 0))ψ − ψ|| =
k=1
k=1
||W ((tn en , 0))ψ − ψ||+||W ((tn−1 en−1 , 0))ψ − ψ||+· · ·+||W ((t1 e1 , 0))ψ − ψ|| , dove, nell’ultimo passaggio abbiamo tenuto conto del fatto che gli operatori W ((tk ek , 0)) sono unitari e pertanto conservano la norma e quindi, per esempio:
n n−1
/ /
W ((tk ek , 0))ψ − W ((tk ek , 0))ψ
k=1
k=1
498
10 Formulazione matematica della MQ
n−1
/
=
W ((tk ek , 0)) (W ((tn en , 0))ψ − ψ)
= ||W ((tn en , 0))ψ − ψ|| .
k=1
La disuguaglianza: ||W ((t, 0))ψ − ψ|| ≤
n
||W ((tk ek , 0))ψ − ψ||
k=1
e la continuit` a per tk → 0 delle funzioni W ((tk ek , 0))ψ implicano che valga: W ((t, 0))ψ → ψ
per t → 0,
lavorando con intorni di z = 0 costruiti come prodotti di intervalli lungo gli assi cartesiani. In virt` u di quanto appena provato, per ogni scelta di vettori φ , φ , la funzione: X z → (φ1 |W (z) φ2 ) = 1 2
W ((t(z), 0))∗ φ1 W ((0, u(z))) φ2 `e continua per z = 0. Questo implica che X z → W (z) sia fortemente continua ovunque. Infatti, per ogni φ ∈ H, usando le relazioni di Weyl ed il fatto che i W (z) sono unitari, troviamo: ||W (z)φ − W (z0 )φ||2 = ||eiσ(z0,z)/2 W (z − z0 )φ − φ||2 = 2||φ||2 −e−iσ(z0 ,z)/2 (φ|W (z − z0 )φ)−eiσ(z0 ,z)/2 (φ|W (z−z0 )φ) → 0 se z → z0 . Possiamo allora applicare la proposizione 9.24 e definire l’operatore: 2 dze−|z| /4 W (z) . (10.57) P := (2π)−n R2n
Per costruzione P ∈ B(H) inoltre, dalla proposizione 9.24, segue che P ∗ = P : 2 e−|z| /4 (φ2 |W (z) φ1 ) dz (φ1 |P ∗φ2 ) = (φ2 |P φ1) = (2π)−n = (2π)−n
R2n
R2n
e−|z|
2
/4
(φ1 |W (z) φ2 ) dz = (φ1 |P φ2 ) ,
dove si `e tenuto conto del fatto che vale (φ2 |W (z) φ1 ) = (W (z)φ1 | φ2 ) = (φ1 | W (z)∗ φ2 ) = (φ1 | W (−z)φ2 ) , e che la misura dz ed il fattore exp −|z2 /4| sono invarianti per riflessione z → −z. Si osservi che P = 0, perch´e, se fosse P = 0 avremmo: 2 0 = (φ1 |W (z )P W (z )φ2 ) = (2π)−n e−|z| /4 (φ1 |W (z )W (z)W (z ) φ2 ) dz R2n
e cio`e, usando le relazioni di Weyl 2 (z ) (z) (z ) (z) e−|z| /4 eit ·t −iu ·u (φ1 |W (z) φ2 ) dz . 0 = (2π)−n R2n
10.3 Teorema di Stone-von Neumann
499
Questo equivale a dire che la trasformata di Fourier della funzione L1 : z → e−|z|
2
/4
(φ1 |W (z) φ2 )
`e nulla e quindi, per (f) di proposizione 3.69: z → (φ1 |W (z) φ2 ) = 0 quasi ovunque. Dato che la funzione `e continua questo significa che essa `e nulla ovunque e quindi W (z) = 0, ma questo `e falso come detto precedentemente. Mostreremo ora, per concludere la dimostrazione, che vale l’ulteriore identit`a: P W (z)P = e−|z|
2
/4
P.
(10.58)
Dalla (10.58), scegliendo z = 0 si ricava: P P = P e quindi si conclude che P `e un proiettore ortogonale non nullo. Se Φ0 ∈ P (H) \ {0} con ||Φ0 || = 1, dovendo essere P Φ0 = Φ0 , la stessa (10.58) implica che, per ogni z ∈ X: (Φ0 |W (z)Φ0 ) = e−|z|
2
/4
= e−(|t
(z) 2
| +|u(z) |2 )/4
.
Dunque Φ0 , scelto come detto sopra, soddisfa l’identit`a (10.56). Proviamo la (10.58) per concludere. Dalla definizione di P , da (b) della proposizione 9.24 e dalle relazioni di Weyl, vale: 2 n (2π) P W (z)P = dz e−z /4 P W (z)W (z ) =
Rn
dz e−z
2
/4 −iσ(z,z)/2
e
P W (z + z ) .
R2n
Ricordando ancora la definizione (10.57) di P , possiamo esplicitare ancora P nell’integrando. Tenendo conto di (b) della proposizione 9.24, abbiamo che per ogni φ1 , φ2 ∈ H: (φ1 |P W (z)P φ2) = 2 2 1 dz dz e−(z +z )/4e−iσ(z,z )/2 e−iσ(z ,z+z )/2 (φ1 |W (z + z + z )φ2 ) . (2π)2n (10.59) Siamo passati dall’iniziale integrale iterato a quello nella nella misura prodotto, in base al teorema di Fubini-Tonelli, dato che, nelle variabili della misura prodotto, l’integrando tende assolutamente ed esponenzialmente a zero all’infinito, a causa delle funzioni esponenziali e della stima | (φ1 |W (z + z + z )φ2 ) | ≤ ||φ1 || ||φ2 ||. Se poniamo: z = (α, β), z = (γ , δ ) e z = (γ, δ), il secondo membro di (10.59) si esplicita come: dγdδdγ dδ −(|γ|2 −|δ|2 −|γ |2 −|δ |2 )/4 − i (α·δ−β·γ +γ·β+γ·δ −δ·α−δ·γ ) e e 2 (2π)2n R4n × (φ1 |W ((α + γ + γ , β + δ + δ )) φ2 ) . Cambiando variabili e passando alle nuove variabili d’integrazione: κ, ν, μ, λ ∈ Rn , con γ = (κ + μ − α)/2, γ = (κ − μ − α)/2, δ = (ν + λ − β)/2, δ =
500
10 Formulazione matematica della MQ
(ν − λ − β)/2, l’integrale si calcola esplicitamente, dato che gli integrali in μ e λ si disaccoppiano dando luogo ad integrali gaussiani. Il secondo membro di (10.59) `e alla fine: 2
e−(|α| +|β| (2π)n
2
)/4
dκdνe−(|κ|
2
+|ν|2 )/4
R2n
(φ1 |W ((κ, ν)) φ2 ) = e−|z|
2
/4
(φ1 |P φ2)
che implica la (10.58) per l’arbitrariet` a di φ1 , φ2 ∈ H.
La prova della precedente proposizione conclude la dimostrazione del teorema 10.19 (di Stone-von Neumann). Dimostrazione del teorema 10.20 di Mackey. Il fatto che le ipotesi (a1), (a2) e (a3) siano equivalenti `e conseguenza immediata di (4) in osservazioni 10.24. Notiamo che in virt` u di tali ipotesi gli operatori W (z) sono tutti unitari con W (0) = I. Usando tale fatto possiamo seguire nuovamente la dimostrazione del teorema 10.23, che adoperava solo il fatto che gli operatori W (z) fossero tutti unitari con W (0) = I, ma non direttamente l’irriducibilit` a della rappresentazione, e costruire il proiettore ortogonale P = 0: 2 P = (2π)−n dze−|z| /4 W (z) , per ogni z ∈ R2n , R2n
in modo tale che, come visto, ogni vettore Φ0 ∈ P (H) verifichi: (Φ0 |W (z)Φ0 ) = e−|z|
2
/4
= e−(|t
(z) 2
| +|u(z) |2 )/4
.
Mostriamo prima di tutto che il sottospazio chiuso H0 := < {W (z)P (H)}z∈X > coincide con tutto H. H0 `e, per costruzione, invariante sotto la famiglia degli W (z). Ne segue che H⊥ e anch’esso invariante sotto l’azione di tutti gli ope0 ` ⊥ ratori W (z). Se H⊥ 0 = {0}, lavorando in H0 , pensato come spazio di Hilbert ambiente, con le restrizioni W (z) H⊥ (e si noti che W (0) H⊥ = I H⊥
= 0 se 0 0 0 H⊥ =
{0}), possiamo costruire l’unico proiettore ortogonale P =
0 tale che: 0 2 e−|z| /4 (φ1 |W (z) φ2 ) dz , (φ1 |P φ2 ) = (2π)−n R2n
per ogni z ∈ R2n e φ1 , φ2 ∈ H⊥ 0 . Tuttavia l’integrale a secondo membro vale (φ1 |P φ2 ) come gi`a sappiamo, che ⊥ a sua volta `e nullo, visto che φ2 ∈ H⊥ 0 = (P (H)) . In definitiva P = 0. Questo ⊥ `e impossibile dato che P = 0. Concludiamo che H0 = {0} e quindi H0 = H. Sia ora {Φk }k∈I una base hilbertiana di P (H) e consideriamo i sottospazi chiusi, invarianti sotto tutti i W (z), Hk := < {W (z)Φk }z∈X >. Si noto che Φk ∈ Hk , essendo W (0) = I, e dunque Hk = {0} per ogni k ∈ I. Dato che vale la (10.58): (Φj |W (z)Φk ) = (Φj |P W (z)P Φk ) = e−|z|
2
/4
(Φj |P Φk ) = 0 se j = k .
10.3 Teorema di Stone-von Neumann
501
Abbiamo trovato che i sottospazi chiusi Hj = {0} sono mutuamente ortogonali (quindi in particolare, j varia in un insieme j numerabile se H `e separabile). Per costruzione, dato che < {W (z)P (H)}z∈X > = H, e che {Φk }k∈I una base hilbertiana di P (H), lo spazio delle combinazioni lineari finite di vettori negli spazi mutuamente ortogonali Hk `e denso in H: H `e somma diretta hilbertiana, ⊕k∈I Hk , dei sottospazi chiusi Hk con k ∈ I (definizione 8.36). Per concludere, notiamo che, in ogni spazio di Hilbert Hk , possiamo utilizzare nuovamente la dimostrazione gi`a fatta per il teorema di Stone-von Neumann, con le stesse notazioni usate nella dimostrazione del teorema di Stone-von Neumann dove ora H `e rimpiazzato da Hk e la rappresentazione π : A → B(H) `e rimpiazzata da πk : A → B(Hk ), ottenuta restringendo le immagini di ciascun operatore di π(A) al sottospazio chiuso invariante Hk . L’unica differenza con la dimostrazione citata `e che, in questo caso, la richiesta che πk (A)Φk sia denso in Hk `e verificata per ipotesi invece che come conseguenza del fatto che πk (A) sia irriducibile. Si ottiene in questo modo che la restrizione πk (A) di π(A) ad ogni sottospazio invariante Hk `e unitariamente equivalente alla rappresentazione standard dell’algebra di Weyl su L2 (Rn , dx). Dato che tale rappresentazione `e irriducibile, lo deve anche essere ogni πk . Questo completa la dimostrazione. 10.3.6 Estensione del “principio di Heisenberg” agli stati misti Il formalismo sviluppato per enunciare e provare il teorema di Stone-von Neumann consente di generalizzare la validit`a del teorema 10.10, corrispondente al principio di Heisenberg, indebolendo le ipotesi sull’insieme in cui varia ψ (`e sufficiente che esistano (ΔXi )ψ e (ΔPj )ψ ), ma anche estendendo il risultato al caso degli stati misti. Cominciamo con un lemma tecnico3 . Lemma 10.26. Siano Xi e Pj gli operatori posizione ed impulso dell’assioma A5 e si ponga Xi := Xi + ai I e Pj := Pj + bj I, con ai , bj ∈ R. Se ψ, φ ∈ D(Xi )∩ D(Pj ) allora valgono le relazioni di commutazione canonica nel senso delle forme quadratiche: (Xi ψ|Pj ϕ) − (Pj ψ|Xi ϕ) = iδij (ψ|ϕ) .
(10.60)
Dimostrazione. Si osservi che D(Xi ) = D(Xi ) e D(Pj ) = D(Pj ). Per provare la tesi nel caso ai , bj = 0, si considerino le relazioni (10.23), ottenendo in particolare: (W ((−t, 0))ψ |W ((0, u))ϕ) − (W ((0, −u))ψ |W ((t, 0))ϕ ) = (1 − e−i(t·u)/2 ) (W ((−t, 0))ψ |W ((0, u))ϕ) . Usando il teorema di Stone si ottiene immediatamente (Xi ψ|Pj ϕ)−(Pj ψ|Xi ϕ) = iδij (ψ|ϕ). Aggiungendo ai I e bj I agli operatori nei prodotti scalari a primo 3 Tale lemma pu` o essere usato come punto di partenza per interpretare la relazione di indeterminazione tempo-energia come discusso in [BF02].
502
10 Formulazione matematica della MQ
membro, usando il fatto che Xi e Pj sono hermitiani, i termini risultati a secondo membro si elidono a vicenda, provando la (10.60) nel caso generale. Teorema 10.27. Siano Xi e Pj gli operatori posizione ed impulso dell’assioma A5. Se ψ ∈ HS con ||ψ|| = 1 `e tale che (ΔXi )ψ e (ΔPi )ψ esistono, allora vale il principio di Heisenberg: (ΔXi )ψ (ΔPi )ψ ≥ /2 . Dimostrazione. Per (i) in (a) in proposizione 10.5, se (ΔXi )ψ e (ΔPi )ψ esistono allora ψ ∈ D(Xi ) ∩ D(Pi ). In riferimento al lemma 10.26, scegliamo ai = −(ψ|Xi ψ) e bj = −(ψ|Pi ψ). Dalla definizione di scarto quadratico (10.3) (A) e da (f) del teorema 9.4: (ΔXi )2ψ = (λ − ai )2 dμψ (λ) = ||Xi ψ||2 . Similmente ||Piψ||2 = (ΔPi )2ψ . D’altra parte (comunque scegliamo ai e bi ) abbiamo anche, valendo la (10.60): . 2
(10.61)
Essendo (ΔXi )ψ (ΔPi )ψ = ||Xi ψ||||Piψ||, la prova `e conclusa.
||Xi ψ||||Piψ|| ≥ |(Xi ψ|Pi ψ)| ≥ |Im(Xi ψ|Pi ψ)| =
Possiamo ora enunciare un teorema di estensione del “principio di Heisenberg” agli stati misti. Teorema 10.28. Siano Xi e Pj gli operatori posizione ed impulso dell’assioma A5. Se ρ `e uno stato misto per la particella senza spin tale che (ΔXi )ρ e (ΔPi )ρ esistono, allora vale: (ΔXi )ρ (ΔPi )ρ ≥
. 2
Dimostrazione. Osserviamo preventivamente che, se sono definibili (ΔXi )ρ e (ΔPi )ρ , lo sono anche (Xi )k ρ e (Pi )k ρ per k = 0, 1, 2, come segue facilmente dalla definizione 10.3, tenendo conto che le misure coinvolte in essa sono finite. Inoltre Ran(ρ) ⊂ D(Xi ) ∩ D(Pi ) per (ii) in (b) in proposizione 10.5, osservando che Ran(ρ1/2 ) ⊃ Ran(ρ). Ponendo Xi := Xi +ai I e Pi := Pi +bi I, scegliamo ai := −Xi ρ e bi := −Pi ρ . Per computo diretto, applicando la definizione 10.3, si vede che (ΔXi )2ρ = (Xi )2 ρ e (ΔPi )2ρ =(Pi )2 ρ . Decomponiamo ρ sulla sua base di autovettori normalizzati: ρ = n pn ψn (ψn | ). A questo punto, ragionando come nella dimostrazione della proposizione 10.5 per provare la (10.11), se A = Xi , Pi e f(λ) = λ e tenendo conto che (A) μρ (E) = tr(P (A) (E)ρ) = n pn μψn (E), usando il fatto che pn ≥ 0 si prova nello stesso modo che:
|f(λ)|2 dμρ(A) (λ) =
+∞ n=0
pn
(A)
|f(λ)|2 dμψn (λ)
10.3 Teorema di Stone-von Neumann
=
+∞
503
pn (f(A)ψn |f(A)ψn ) ≤ +∞ ,
n=0
dove ψn ∈ D(Xi ) ∩ D(Pi ) = D(Xi ) ∩ D(Pi ) dato che ψn ∈ Ran(ρ) ⊂ D(Xi ) ∩ D(Pi ). Quindi: (ΔXi )2ρ = (Xi )2
ρ
=
pn (Xi ψn |Xi ψn )
n
e
(ΔPi )2ρ = (Pi )2
ρ
=
pm (Pi ψm |Pi ψm ) .
m
La disuguaglianza di Schwarz, tenendo conto di (10.61), implica la tesi, dato che (notare che pn ≥ 0 e n pn = 1): (Xi )2
1/2 2 1/2 ρ (Pi ) ρ
≥
1/2 1/2 p1/2 (Pi ψn |Pi ψn )1/2 n pn (Xi ψn |Xi ψn )
n
≥
n
pn
= . 2 2
10.3.7 Commenti finali sul teorema di Stone-von Neumann: il gruppo di Heisenberg Torniamo al teorema di Stone-von Neumann per fare alcune considerazioni di carattere fisico. Il teorema di Stone-von Neumann si esprime nel gergo della fisica teorica, con l’affermazione: “tutte le rappresentazioni irriducibili dell’algebra di Weyl con un numero finito e fissato di gradi di libert` a sono unitariamente equivalenti,” o anche “tutte le rappresentazioni irriducibili delle CCR con un numero finito e fissato di gradi di libert` a sono unitariamente equivalenti,”. Sopra unitariamente equivalenti si riferisce all’esistenza dell’isomorfismo di spazi di Hilbert S e il numero finito di gradi di libert` a `e riferito alla dimensione finita dello spazio simplettico X sul quale `e costruita l’algebra di Weyl. Cosa accade nel caso infinito dimensionale? Assumendo comunque l’irriducibilit` a e passando, da X finito dimensionale – descrivente per es. le coordinate del punto materiale nello spazio delle fasi – a X infinito dimensionale – descrivente per es. un appropriato spazio di soluzioni di equazioni di campo bosoniche libere–, il teorema di Stone - von Neumann cessa di valere. Nel linguaggio dei fisici teorici si dice che: “Esistono rappresentazioni delle CCR con un numero infinito di gradi di libert` a che non sono unitariamente equivalenti,”.
504
10 Formulazione matematica della MQ
In pratica, in questo caso, si trovano rappresentazioni irriducibili fortemente continue π1 e π2 , su rispettivi spazi di Hilbert (separabili) H1 , H2 , della ∗-algebra di Weyl A := W (V, σ) (in questo contesto pensata come C ∗algebra senza modificare i risultati) associata al sistema fisico in considerazione (tipicamente un campo bosonico quantizzato) per le quali non esiste alcun isomorfismo di spazi di Hilbert S : H1 → H2 tale che: Sπ1 (a) S −1 = π2 (a) ,
per ogni a ∈ A.
Coppie di rappresentazioni siffatte sono dette inequivalenti o anche unitariamente inequivalenti. Il passaggio da X finito dimensionale a X infinito dimensionale corrisponde al passaggio dalla meccanica quantistica alla teoria dei campi quantistica (anche relativistica e su spaziotempo curvo). In tali contesti (ma non solo), l’esistenza di rappresentazioni inequivalenti `e spesso legata a quella che si chiama rottura spontanea della simmetria. L’esistenza di rappresentazioni inequivalenti per uno stesso sistema fisico (individuato dalla coppia (X, σ)), mostra che la formulazione della teoria in un fissato spazio di Hilbert `e inadeguata e bisogna emanciparsi dalla struttura di spazio di Hilbert per fondare le teorie quantistiche con maggiore generalit`a. Questo programma `e stato largamente sviluppato, a partire da lavori pionieristici dello stesso von Neumann, e si chiama oggi formulazione algebrica delle teorie di campo quantistiche. In questo ambito, per esempio, si `e potuta dare una veste rigorosa alla teoria dei campi in spaziotempo curvo anche in relazione ai fenomeni quantistici connessi alla termodinamica dei buchi neri. Un altro punto da sottolineare `e che la particella elementare con spin 0 `e descritta da una rappresentazione irriducibile di un’algebra (quella di Weyl). Si vede che la stessa cosa accade prendendo particelle con spin, carica ecc... allargando opportunamente l’algebra (o il gruppo) di riferimento. I sistemi elementari sono in tal modo descritti da rappresentazioni irriducibili di una certa algebra, in genere associata ad un gruppo di simmetria del sistema. Questo punto di vista si `e rivelato fecondissimo nello sviluppo delle teorie quantistiche relativistiche – in particolare ad opera di Wigner – dove per definire le particelle elementari si usano rappresentazioni irriducibili del gruppo di Poincar´e e la condizione di irriducibilit`a rimane come caratterizzante un sistema elementare. Facciamo ora qualche commento di carattere matematico sul teorema di Stone-von Neumann. Useremo qui alcune nozioni che discuteremo pi` u approfonditamente nel capitolo 11. Il nostro approccio si `e basato sulla struttura di ∗-algebra (di Weyl) Tuttavia esiste un altro punto di vista, dovuto a Weyl e basata sul gruppo di Heisenberg, detto per tale motivo anche gruppo di Weyl-Heisenberg. Il gruppo di Heisenberg su R2n+1 , H (n), `e il gruppo di Lie semplicemente connesso dotato della struttura differenziabile indotta da R2n+1 e con legge di
10.3 Teorema di Stone-von Neumann
505
composizione (al solito t ∈ Rn e u ∈ Rn , mentre η ∈ R) n 1 (η, t, u) ◦ (η , t , u ) = η + η + ui ti − ui ti , t + t , u + u . 2 i=1
Un calcolo diretto dell’algebra di Lie di questo gruppo mostra che esiste una base dell’algebra composta da 2n + 1 generatori: xi , pi , e con i = 1, 2, . . . , n e tali generatori soddisfano le relazioni di commutazione: [xi , pj ] = δij e ,
[xi , e] = [pi , e] = 0 ,
i, j = 1, 2, . . . , n .
Di conseguenza, se definiamo l’algebra di Lie delle combinazioni lineari reali finite degli operatori anti-autoaggiunti −iI, −iXk , −iPk ristretti al dominio comune denso ed invariante S(Rn ) e con commutatore [·, ·], l’applicazione lineare individuata da e → −iI, xk → −iXk e pk → −iPk `e un isomorfismo di algebre di Lie. Questo isomorfismo si estende a tutto il gruppo di Heisenberg. Infatti, se gli operatori W ((t, u)) sono definiti come in proposizione 10.15, la funzione: R2n+1 (η, t, u) → eiη W ((t, u)) =: H((η, t, u)) (10.62) definisce una rappresentazione unitaria irriducibile e fedele (cio`e iniettiva) del gruppo di Heisenberg 2n + 1 dimensionale su L2 (Rn , dx), come si prova facilmente per ispezione diretta. Ulteriormente vale: s- lim H(s(η, t, u)) = I s→0
per ogni fissato (η, t, u) ∈ R2n+1 .
(10.63)
Viceversa, abbiamo che vale la seguente proposizione. Proposizione 10.29. Se: R2n+1 (η, t, u) → H((η, t, u)) `e una rappresentazione unitaria irriducibile del gruppo di Heisenberg H (n) sullo spazio di Hilbert H, che soddisfa la (10.63), allora deve essere necessariamente della forma (10.62): H((η, t, u)) = eiη W ((t, u)) , dove gli operatori W ((t, u)) soddisfano le ipotesi del teorema 10.19 di Stonevon Neumann. Dimostrazione. Il fatto che valga la (10.62) segue dal fatto che il sottogruppo abeliano R del gruppo di Heisenberg deve essere rappresentato da un sottogruppo abeliano unitario. Ora, il fatto che gli elementi di R commutino con tutti gli elementi del gruppo di Weyl implica che ogni elemento H((η, 0, 0)) commuti con tutta la rappresentazione. Dato che la rappresentazione `e irriducibile, questo implica, per il lemma di Schur, che H((η, 0, 0)) = χ(η)I con χ(η) ∈ C e deve valere |χ(η)| = 1 dato che H((η, 0, 0)) `e unitario. Infine, dato che η → H((η, 0, 0)) `e fortemente continuo, il teorema di Stone implica che χ(η) = eicη per ogni η ∈ R e qualche costante c. Le relazioni di commutazione del gruppo richiedono infine che c = 1. Le stesse relazioni di commutazione implicano la validit` a delle relazioni di Weyl per gli operatori W ((t, u)).
506
10 Formulazione matematica della MQ
In questo contesto una formulazione alternativa (la prima volta dimostrata da Weyl) del teorema di Stone – von Neumann si enuncia dicendo quanto segue. Teorema 10.30. Ogni rappresentazione unitaria irriducibile del gruppo di Heisenberg H (n) che soddisfa la (10.63), `e equivalente, tramite una trasformazione unitaria, alla rappresentazione su L2 (Rn , dx): R2n+1 (η, t, u) → eiη W ((t, u)) , dove gli operatori W ((t, u)) sono definiti in proposizione 10.15. Dimostrazione. Con il nostro approccio, la dimostrazione segue immediatamente dalla proposizione 10.29. Esistono infine formulazioni pi` u o meno rigorose del teorema di Stone - von Neumann basate sulle sole relazioni di commutazione di Heisenberg (10.16) senza passare agli esponenziali (vedi [CCP82] per alcune discussioni euristiche non completamente rigorose). In tal caso per`o le ipotesi tecniche sui domini (spazi di vettori analitici) e sull’esistenza di estensioni autoaggiunte, sono non ovvie e non hanno un diretto significato fisico. Un risultato rigoroso importante `e quello di J. Dixmier [Dix56] ed anche il fondamentale lavoro di E. Nelson [Nel59], su cui torneremo nel prossimo capitolo, in cui si prova, generalizzandolo ad un numero finito ma arbitrario di dimensioni, che se P e Q sono simmetrici su un sottospazio denso invariante su cui soddisfano le relazioni di Heisenberg e P 2 + Q2 `e essenzialmente autoaggiunto su tale spazio, allora P e Q generano una rappresentazione fortemente continua dell’algebra di Weyl sullo spazio di Hilbert e quindi, a meno di isomorfismi di spazi di Hilbert hanno la solita forma su L2 (R, dx).
10.4 Il principio di corrispondenza di Dirac Rimane fino ad ora aperto il problema di come sia possibile individuare gli operatori in H corrispondenti alle osservabili di interesse fisico differenti da ` stato scritto moltissimo da parte di numerosi ed imposizione ed impulso. E portanti autori su procedure che permettano di passare da osservabili classiche importanti ad osservabili quantistiche importanti. Bisogna dire comunque che, in un certo senso, si tratta di una “battaglia persa in partenza”: dal punto di vista fisico, la Meccanica Quantistica `e pi` u fondamentale di quella classica e pertanto la Meccanica Classica dovrebbe essere vista come caso limite della Meccanica Quantistica, anche se non `e per nulla facile dimostrare ci`o a parte pochi risultati generali noti tra cui il teorema di Eherenfest la cui formulazione rigorosa `e stata data solo di recente [FK09]. Ci si aspetta di conseguenza che ci siano enti fisici quantistici, in particolare osservabili, che non hanno corrispondente classico. Un esempio `e sicuramente lo spin delle particelle.
10.4 Il principio di corrispondenza di Dirac
507
Fatta questa premessa, possiamo dire che, in linea di principio, per la particella senza spin, alcune osservabili quantistiche rilevanti saranno “funzioni” delle osservabili Xi e Pi . Ci si aspetta che, se F (x, p) `e una grandezza classica, la corrispondente grandezza quantistica sia qualcosa del tipo F (X, P ). Tuttavia questa strada `e molto pi` u ardua da percorrere di quanto si creda per motivi di carattere matematico. Infatti: (1) non `e affatto ovvio come dare significato ad una funzione di X e P quando questi operatori hanno misure spettrali che non commutano (nel caso di operatori con misure spettrali commutanti si possono usare procedure basate sulle joint measures come in (10.1), (2) le ricette ingenue che cercano di percorrere questa via in genere non producono operatori autoaggiunti e nemmeno simmetrici, quando sono coinvolti operatori che non commutano. A titolo di esempio, si consideri la grandezza classica x · p. A quale osservabile – cio`e operatore autoaggiunto – dovrebbe corrispondere? Non conviene passare per le misure spettrali degli operatori perch´e queste non commutano. Allora proviamo ad usare gli stessi operatori ristretti ad uno spazio invariante e denso su cui sono entrambi definiti. La speranza `e di produrre un operatore essenzialmente autoaggiunto o almeno simmetrico e poi selezionarne, con qualche criterio, le estensioni autoaggiunte (se ce ne sono nel secondo caso). In quest’ottica, la risposta: “x · p corrisponde a X · P (= ni=1 Xi Pi )” sarebbe del tutto inadeguata, anche interpretando gli operatori come definiti nello spazio invariante e denso S(R3 ). Questo perch´e X · P non `e un operatore simmetrico su tale spazio, non commutando Xi e Pi (lo si verifichi per esercizio). Pertanto non ha nemmeno senso cercare estensioni autoaggiunte di X · P. Un’altra possibilit` a `e quella di associare a x · p l’operatore simmetrico (X·P +P ·X)/2 definito su S(R3 ) e quindi studiarne le estensioni autoaggiunte. Tuttavia se si prendono in considerazione casi pi` u complessi, come x2k pk , si vede che questa ricetta `e fortemente ambigua, perch´e ci sono pi` u possibilit` a ammissibili a priori: (Xk2 Pk + Pk Xk2 )/2 `e simmetrico sul dominio S(R3 ), ma lo `e anche Xk (Xk Pk + Pk Xk )/4 + (Xk Pk + Pk Xk )Xk /4 e ci sarebbero ancora altre possibilit` a. Un criterio per aiutare nella scelta, ma che non risolve in generale i problemi sollevati, `e dovuto allo stesso Dirac e si chiama solitamente “principio di corrispondenza di Dirac”. Per discuterlo, Ricordiamo che un’algebra di Lie `e una coppia (V, [·, ·]), dove V `e uno spazio vettoriale reale e [·, ·] : V × V → V, detto commutatore dell’algebra di Lie, `e un’applicazione bilineare, antisimmetrica, che soddisfa l’identit` a di Jacobi: [u, [v, w]] + [v, [w, u]] + [w, [u, v]] = 0 ,
per ogni u, v, w ∈ V.
Dirac not`o che, per lo spazio delle fasi della particella classica F (in realt` a ci`o a validit` a del tutto generale), la coppia (G(F ), {·, ·}), dove G(F ) `e lo spazio vettoriale reale delle funzioni sufficientemente regolari a valori reali definite
508
10 Formulazione matematica della MQ
sullo spazio delle fasi, e {·, ·} `e la parentesi di Poisson: {f, g} :
∂f ∂g ∂g ∂f − , ∂xi ∂pi ∂xi ∂pi i
f, g ∈ G(F) ,
`e un’algebra di Lie. Si noti in particolare che valgono le relazioni di commutazione canoniche: {xi , pj } = δij . Queste relazioni sono le relazioni di Heisenberg quando si sostituiscono xi → Xi , pi → Pi e {·, ·} → −i−1 [·, ·]. L’idea di Dirac `e allora la seguente “Principio di Corrispondenza di Dirac”. Se fˆ denota il corrispondente quantistico (operatore almeno simmetrico definito su un dominio denso, invariante, indipendente dalla grandezza particolare considerata) della generica grandezza classica f ∈ G(F ), la corrispondenza deve essere tale che, se vale classicamente: h = {f, g} , allora deve valere quantisticamente: ˆ ˆ gˆ] h = −i−1 [f, per ogni terna di grandezze classiche f, g, h ∈ G(F ) e corrispondenti quantistiche fˆ, gˆ, ˆ h. A titolo di esempio, se si considera la solita particella classica, le componenti del momento angolare classico: li =
3
ijk xj pk ,
j,k=1
corrispondono agli operatori, che risultano essere essenzialmente autoaggiunti su S(R3 ), 3 Li = ijk Xj Pk , j,k=1
e le relazioni di commutazione classiche {li , lj } =
3
ijk lk ,
k=1
corrispondono alle analoghe relazioni quantistiche su S(R3 ): [Li , Lj ] = i
3 k=1
ijk Lk .
Esercizi
509
Una giustificazione possibile del principio di Dirac si pu`o dare per le osservabili che corrispondono ad i generatori di trasformazioni unitarie che rappresentano l’azione di un gruppo di simmetria sul sistema fisico. In tal caso `e naturale richiedere che (a) l’algebra di Lie del gruppo, (b) quella della rappresentazione unitaria che rappresenta le trasformazioni sul sistema quantistico e (c) l’algebra di Lie dei generatori del gruppo delle trasformazioni canoniche classiche che corrispondono alle trasformazioni di simmetria sul sistema classico, siano tutte e tre isomorfe. Non ci addentreremo ulteriormente in questa direzione, diciamo solo che, in un certo senso, le idee di Dirac hanno trovato sviluppo rigoroso in certe procedure di quantizzazione che cadono sotto il nome di Quantizzazione ` a la Weyl (vedi per esempio [ZFC05]), nella quale non ci addentreremo.
Esercizi 10.1. Si consideri una particella sulla retta reale e si supponga che lo stato puro rappresentato dalla funzione ψ ∈ D(X 2 ) ∩ D(P 2 ) ∩ D(XP ) ∩ D(P X), con ||ψ|| = 1 e ψ differenziabile, soddisfi: (ΔX)ψ (ΔP )ψ = /2. Dimostrare che, per qualche γ > 0: ψ(x) = (πγ)−1/4 ei
P ψ x
e−
(x−Xψ )2 2γ
.
Suggerimento. In riferimento alla dimostrazione del teorema 10.10, si osservi che (ΔX)ψ (ΔP )ψ = /2 `e possibile solo se ||X ψ||||P ψ|| = |(X ψ|P ψ)|, insieme a Re(X ψ|P ψ) = 0. La prima richiesta implica, per (i) in proposizione 3.3, che X ψ = cP ψ per qualche c ∈ C. Sviluppando la seconda richiesta, tenendo conto che σp (X) = ∅ e che ψ = 0, si vede che deve essere Re(c) = 0, risolvendo l’equazione differenziale X ψ = iIm(c)P ψ, usando ||ψ|| = 1 si arriva alla forma detta per ψ. 10.2. Considerare lo spazio di Hilbert H := L2 ([a, b], dx) e l’operatore autoaggiunto X in H definito da (Xψ)(x) := xψ(x), per ogni ψ ∈ H tale che Xψ ∈ H. Provare che `e impossibile trovare un’estensione autoaggiunta P dell’operatod re simmetrico −i dx , definito sul sottospazio delle funzioni differenziabili con continuit` a che si annullano al bordo di [a, b], oppure che soddisfano condizioni di periodicit` a al bordo, in modo tale che i gruppi unitari ad un parametro U (u) := eiuX , V (v) := eivP soddisfino le relazioni di commutazione di Weyl: U (u)V (v) = V (v)U (u)eiuv per ogni u, v ∈ R. Suggerimento. Si osservi prima di tutto che la condizione V (sv), U (su) → I in senso forte, se s → 0, `e banalmente soddisfatta, essendo fortemente continui i gruppi unitari ad un parametro generati da operatori autoaggiunti. Si pu` o quindi procedere in vari modi. Per esempio, si pu` o provare che σ(X) = [a, b]. Questo `e impossibile se e siste P come detto perch´e, dal teorema 10.21, dovrebbe esistere un operatore unitario S che trasforma X e P negli operatori
510
10 Formulazione matematica della MQ
su L2 (R, dx) dell’assioma A5 (passando da R3 a R1 in modo ovvio), oppure si deve poter decomporre L2 ([a, b], dx) in una somma diretta hilbertiana di sottospazi chiusi invarianti per X e P , su ciascuno dei quali esiste l’operatore unitario S suddetto. In entrambi i casi si dimostra facilmente che dovrebbe valere σ(X) = σ(SXS −1 ) = R e non σ(X) = [a, b]. 10.3. In riferimento alla dimostrazione della proposizione 10.15, adottandone le definizioni degli operatori A e A , si consideri lo spazio di Hilbert L2 (R, dx) dotato della base hilbertiana delle funzioni di Hermite {ψn }n∈N e lo spazio di Bargmann-Hilbert B1 (vedi (6) in esempi 3.33) dotato della base hilbertiana delle funzioni intere {un }n∈N con: zn un (z) := √ n!
per ogni z ∈ C.
Si definisca l’operatore unitario, detto trasformazione di Segal-Bargmann: U : L2 (R, dx) → B1 , completamente individuato dalle richieste: U ψn := un , per n = 0, 1, 2, . . .. Si provi che valgono le relazioni: U A U ∗ = z
e
U AU ∗ =
d dz
(10.64)
valide negli spazi densi delle combinazioni lineari finite di elementi delle due basi, rispettivamente. 10.4. Nello spazio di Bargmann-Hilbert B1 (vedi (6) in esempi 3.33), si consideri l’operatore: d K0 := z dz con dominio D(H0 ) = {f ∈ B1 | zdf/dz ∈ B1 }. Si dimostri che si tratta di un operatore essenzialmente autoaggiunto e se ne determini lo spettro. Ha qualche significato fisico l’operatore 2K0 + I? Suggerimento. Provare che `e simmetrico e mostrare che la base hilbertiana degli un `e costituita da autovettori di H0 (e quindi da vettori analitici. 2K0 + I, a parte un fattore moltiplicativo, `e l’hamiltoniano dell’oscillatore armonico.
11 Introduzione alle Simmetrie Quantistiche Le scienze matematiche in particolare mostrano ordine, simmetria e limite: e queste sono le pi` u grandi istanze del bello. Aristotele
In questo capitolo continueremo la presentazione della struttura matematica della Meccanica Quantistica, introducendo alcune nozioni fondamentali e strumenti matematici di grande rilievo. La prima sezione `e dedicata alla nozione e caratterizzazione di simmetria quantistica. Dopo avere dato qualche esempio, ed avere discusso quello che accade in presenza di regole di superselezione, daremo la definizione di simmetria nel senso di Kadison e poi di simmetria nel senso di Wigner. Dimostreremo poi i teoremi di Wigner e Kadison che provano che le due nozioni coincidono e sono implementate da operatori unitari oppure antiunitari. Nella seconda sezione, passeremo quindi al problema della rappresentazione di gruppi di simmetria, introducendo le nozioni di rappresentazioni proiettive, unitarie proiettive e di estensione centrale di un gruppo (di simmetria) tramite U (1). La terza sezione sar`a inizialmente dedicata alla nozione di gruppo di simmetria topologico ed allo studio delle rappresentazioni unitarie proiettive fortemente continue. Esamineremo, in particolare il caso notevole del gruppo topologico abeliano R, che ha importanti applicazioni in Meccanica Quantistica. Successivamente, dopo avere richiamato alcune definizioni e risultati generali della teoria dei gruppi ed algebre di Lie, presenteremo alcuni importanti risultati dovuti a Bargmann, G˚ arding e Nelson (ed alcune generalizzazioni di tali risultati), riguardanti le rappresentazioni unitarie proiettive ed unitarie di gruppi di Lie. A titolo di esempio di grande importanza fisica studieremo le rappresentazioni unitarie del gruppo di simmetria SO(3) in relazione allo spin. Per concludere, applicheremo tutta la teoria presentata al gruppo di Galileo fino ad enunciare e provare la regola di Bargmann di superselezione della massa.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
512
11 Introduzione alle Simmetrie Quantistiche
11.1 Nozione e caratterizzazione delle simmetrie quantistiche Una nozione estremamente importante in meccanica quantistica, anche per gli sviluppi successivi nelle teorie quantistiche dei campi, `e la nozione di simmetria di un sistema quantistico. In realt` a esistono due nozioni di simmetria, una dinamica ed una pi` u elementare, che non coinvolge l’evoluzione temporale. In questa sezione ci occuperemo della prima e discuteremo la seconda nel prossimo capitolo. Consideriamo un sistema fisico S, descritto nello spazio di Hilbert HS , con spazio degli stati S(HS ) e sottoinsieme degli stati puri Sp (HS ). Quando agiamo con una trasformazione fisica g sul sistema S, ne alteriamo lo stato quantistico. Alla trasformazione fisica g corrisponder`a quindi un’applicazione γg : S(HS ) → S(HS ) nello spazio degli stati oppure, volendoci restringere agli stati puri: γg : Sp (HS ) → Sp (HS ). Il legame tra g e γg per il momento non ci interessa ed ammetteremo solo che sia noto; in ogni caso dipender`a dalla descrizione matematica di S. Se γg soddisfa certi requisiti che preciseremo in seguito, γg viene detta simmetria del sistema. Con abuso di linguaggio diremo a volte che g stessa `e una simmetria del sistema quando lo `e γg . I requisiti affinch`e γg sia una simmetria sono due: (a) che γg sia biettiva, (b) che conservi qualche struttura matematica, per il momento non ancora specificata, dello spazio degli stati S(HS ) o in quello degli stati puri Sp (HS ), che abbia qualche significato fisico preciso. Da un punto di vista fisico, il requisito (a) pu` o essere in realt`a imposto sulla trasformazione fisica g che agisce sul sistema, e corrisponde alla richiesta che g sia reversibile, cio`e che (i) esista una trasformazione fisica inversa g−1 , associata all’applicazione γg−1 : S(HS ) → S(HS ), che ritrasformi lo stato quantistico in quello iniziale, e (ii) si deve poter raggiungere qualsiasi stato quantistico, attraverso l’azione di γg , scegliendo opportunamente lo stato di partenza. Le differenze tra le varie nozioni note di simmetria dipendono dalla precisazione del requisito (b), cio`e dal tipo di struttura che rimane invariata sotto l’azione di γg . La struttura pi` u semplice che tale applicazione pu`o conservare `e quella convessa dello spazio degli stati, che corrisponde fisicamente al fatto che uno stato si possa costruire miscelando altri stati con certi pesi statistici. Le operazioni di simmetria, in questo caso, alterano gli stati che si combinano, ma non alterano i pesi statistici usati nella miscela. Questo genere di simmetrie quantistiche sono quelle definite da Kadison [Kad51]. Un seconda classe di simmetrie `e quella dovuta a Wigner [Wig59], che si riferisce alle funzioni che agiscono da Sp (HS ) in Sp (HS ) e richiede che le simmetrie preservino la struttura di spazio metrico che possiede lo spazio dei raggi. Tradotto nel linguaggio fisico, le trasformazioni modificano gli stati puri, ma lasciano invariate le probabilit` a di transizione tra coppie di stati puri. (Una terza classe, della quale non ci occuperemo, `e quella individuata da Segal, che concerne la struttura di
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
513
algebra di Jordan delle osservabili.) Nel seguito studieremo i primi due tipi di simmetrie e proveremo che, a livello matematico, sono in realt`a la stessa cosa, ma anche che sono sempre descritte dall’azione di operatori unitari oppure anti unitari (quindi le simmetrie di Wigner si possono estendere a simmetrie di Kadison su tutto lo spazio degli stati). Questo risultato di caratterizzazione delle simmetrie in termini di operatori unitari o antiunitari `e di enorme importanza in fisica ed `e stato formulato in due teoremi che portano il nome di Teorema di Kadison e Teorema di Wigner rispettivamente. Il secondo `e molto pi` u noto del primo tra i fisici, anche se il primo `e almeno altrettanto importante. 11.1.1 Qualche esempio Prima di entrare nei dettagli matematici, facciamo qualche esempio di operazioni fisiche che risultano essere simmetrie di sistemi quantistici (sia di Wigner che di Kadison). Descrivendo un sistema fisico isolato S in un certo sistema di sistema di riferimento inerziale I, una trasformazione che, come ben noto, produce una simmetria di S, `e ogni traslazione rigida di S secondo un fissato vettore, oppure la rotazione di un qualsiasi angolo attorno ad ogni fissato asse asse. In altre parole le isometrie continue dello spazio di quiete dei riferimenti inerziali producono simmetrie quantistiche. Un’altra trasformazione `e il cambiamento di sistema di riferimento inerziale (anche nelle teorie relativistiche) nel senso che segue. Trasformiamo il sistema isolato S nel riferimento inerziale I, in modo tale che il sistema fisico trasformato appaia, in un altro sistema di riferimento inerziale I = I, come appariva all’inizio in I. Infine, un altro tipo di trasformazione, per sistemi fisici isolati descritti in riferimenti inerziali, che produce simmetrie `e la traslazione temporale (da non confondersi con l’evoluzione temporale) che discuteremo pi` u avanti. Si deve notare che questo genere di trasformazioni sono tutte attive, nel senso che cambiano il sistema S o, pi` u precisamente, il suo stato quantistico. Bisogna anche avere ben chiaro che le trasformazioni di cui parliamo non avvengono in seguito ad evoluzione dello stato del sistema: sono trasformazioni ideali, cio`e puramente matematiche. Tra l’altro, alcune di esse non potrebbero mai avvenire nella realt`a in seguito all’evoluzione temporale del sistema secondo la propria legge dinamica, o potrebbero avvenire molto difficilmente. Un tipico esempio `e l’inversione di parit` a. Con questa trasformazione fisica, in termini un po’ imprecisi, il sistema S viene sostituito da un nuovo sistema che corrisponde all’immagine del sistema riflessa in uno specchio. In certi casi l’unico modo di ottenere in pratica l’inversione di parit`a `e quello, idealmente, di distruggere il sistema e ricostruirne uno che corrisponde all’immagine speculare di quello iniziale. In taluni casi anche questa operazione astratta non `e fisicamente sensata a causa della natura delle stesse leggi fisiche. Le particelle che interagiscono tramite l’interazione debole costituiscono, sorprendentemente, sistemi i cui stati non ammettono l’inversione di parit` a come simmetria
514
11 Introduzione alle Simmetrie Quantistiche
in un senso molto drastico: nello spazio degli stati non vi `e alcuna trasformazione γ che rappresenti la trasformazione fisica ideale d’inversione di parit`a. Questo significa, semplicemente, che la presunta simmetria non `e, in realt`a, una simmetria del sistema. Un altro genere di trasformazione che ha alcune particolarit`a in comune con l’inversione di parit` a e che, talvolta, `e associata a simmetrie, `e l’inversione del tempo. Le simmetrie illustrate fino ad ora sono relative da isometrie spaziotemporali. Bench`e siano sempre trasformazioni attive sugli stati, sono legate a trasformazioni passive di cambiamento di sistema di riferimento (o semplicemente di coordinate) per mezzo di isometrie passive dello spaziotempo. In questo caso ci si aspetta (ma come visto non `e sempre vero) che le trasformazioni attive sugli stati siano simmetrie, proprio in conseguenza del fatto che, i diversi sistemi di riferimento o coordinate connessi dalle corrispondenti trasformazioni passive (trasformazioni di Galileo o trasformazioni di Poincar´e) che usiamo per descrivere la realt`a (almeno a livello macroscopica), sono equivalenti. In altre parole, se agisco sul sistema fisico S con una di queste trasformazioni attive, posso comunque annullare l’effetto della trasformazione cambiando riferimento (o semplicemente coordinate) e con la garanzia che il nuovo riferimento sia fisicamente equivalente al precedente. Ci sono trasformazioni associabili a simmetrie che, a differenza di tutte quelle menzionate fino ad ora, non sono associate ad isometrie dello spaziotempo e non sono annullabili cambiando riferimento. Un tipico esempio `e la coniugazione di carica, attraverso la quale si cambia segno a tutte le cariche (del genere considerato) presenti in S e si cambia quindi settore di superselezione della carica. Esistono infine trasformazioni ancora pi` u astratte legate a simmetrie interne e simmetrie di gauge, sulle quali non ci soffermiamo. Per concludere vogliamo sottolineare un fatto molto importante dal punto di vista fisico. La lezione che si impara dal caso delle interazioni deboli `e che la questione se una trasformazione agente, idealmente, su un sistema rappresenti o meno una simmetria quantistica `e, in ultima analisi e dopo che il requisito (b) `e stato specificato, un fatto da decidere a livello sperimentale. Dopo avere enunciato e provato i teoremi di Kadison e Wigner, ci occuperemo della descrizione delle simmetrie, in termini di operatori unitari o antiunitari, nella situazione in cui le trasformazioni fisiche abbiano la struttura di un gruppo algebrico, topologico o di Lie [War75, NaSt84]. Nel prossimo capitolo ci occuperemo delle simmetrie dinamiche, che vengono introdotte nel momento in cui viene definita la nozione di evoluzione temporale dello stato quantistico di un sistema S. In questo contesto, si ritrover` a lo stretto legame tra esistenza di simmetrie dinamiche ed esistenza di associate leggi di conservazione. Come ben noto, a livello classico, tale relazione `e codificata dalle varie formulazioni del celebre teorema di N¨ other.
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
515
11.1.2 Simmetrie in presenza di regole di superselezione Come gi`a osservato nel capitolo 7, se M `e un sottospazio chiuso dello spazio di Hilbert H, possiamo identificare in modo naturale S(M) (Sp (M)) con un sottoinsieme di S(H) (rispettivamente di Sp (H)), pensando S(M) (risp. Sp (M)) come il sottoinsieme che contiene gli stati ρ ∈ S(H) (risp. Sp (H)), tali che Ran(ρ) ⊂ M. Tale identificazione `e equivalente ad estendere ogni ρ ∈ S(M) ad un operatore definito su tutto H, imponendo che sia l’operatore nullo su M⊥ . In tutto il resto del capitolo assumeremo tacitamente tale identificazione. Tale identificazione risulta utile nella situazione che andiamo a considerare ora. Ricordiamo che, in talune situazioni, gli stati possibili per un sistema fisico non sono tutti gli elementi di S(HS ) (o Sp (HS ) nel caso di stati puri), ma sono in numero ridotto perch´e alcune combinazioni convesse di stati sono vietate. Questo accade in presenza di regole di superselezione (vedi capitolo 7). Senza ripetere quanto abbiamo spiegato precedentemente, diciamo solo che nel caso di presenza di regole di superselezione si ha una decomposizione di HS nella somma diretta in sottospazi chiusi ortogonali detti settori coerenti: HS = HSk . k∈K
Possiamo allora definire gli spazi degli stati e degli stati puri di ciascun settore S(HSk ), Sp (HSk ). Si noti che S(HSk )∩S(HSj ) = ∅ e Sp (HSk )∩Sp (HSj ) = ∅ se k = j. Per quanto riguarda gli stati puri fisicamente ammissibili dalla regola di superselezione per il sistema fisico S descritto su H, questi saranno tutti e soli quelli dell’unione disgiunta: , Sp (HSk ) . k∈K
Gli stati misti fisicamente ammissibili dalla regola di superselezione per il sistema fisico S descritto su H saranno invece tutte e sole le possibili le combinazioni lineari convesse (anche infinite in riferimento qualche topologia operatoriale) degli elementi dell’insieme: , S(HSk ) . k∈K
Questa richiesta `e equivalente ad imporre che gli stati fisicamente ammissibili siano gli elementi ρ di S(HS ) (o Sp (HS )) che ammettano ogni sottospazio HSk come spazio invariante. In questa situazione le simmetrie devono rispettare la struttura della decomposizione di H in settori coerenti e quello che si assume `e che si possano avere simmetrie che scambiano settori distinti, cio`e funzioni: γkk : S(HSk ) → S(HSk ), k, k ∈ K, dove pu` o essere k = k. Ogni applicazione γkk : S(HSk ) → S(HSk ) deve essere biettiva e soddisfare il requisito d’invarianza di Wigner o di Kadison.
516
11 Introduzione alle Simmetrie Quantistiche
11.1.3 Simmetrie nel senso di Kadison Consideriamo un sistema fisico quantistico S descritto sullo spazio di Hilbert HS e con spazio degli stati γ(HS ). Una richiesta (fisicamente molto debole) per definire una simmetria `e quella che si riferisce alla procedura di miscela degli stati quantistici. Un’operazione sul sistema definisce una simmetria del sistema se la costruzione di miscele `e invariante rispetto ad essa. In termini precisi: se uno stato si pu` o ottenere come una miscela di altri stati, con certi pesi statistici, allora, trasformando il sistema secondo un’operazione fisica che individua una simmetria del sistema, lo stato trasformato si deve poter ottenere come miscela degli stati trasformati della miscela iniziale, con gli stessi pesi statistici. In altre parole un’applicazione biettiva γ : S(HS ) → S(HS ) rappresenta una simmetria del sistema quando conserva la struttura di insieme convesso di S(HS ): se ρi ∈ S(HS ), 0 ≤ pi ≤ 1 e i∈J pi = 1, allora: γ pi ρi = pi γ(ρi ) . i∈J
i∈J
Nel seguito assumeremo che J sia finito. In tal caso `e ovvio che, senza perdere generalit` a, possiamo ridurci ad imporre il vincolo di sopra con J composto da due soli elementi. Possiamo ora enunciare formalmente la definizione nel caso generale in cui siano presenti settori coerenti di superselezione. Definizione 11.1. (Simmetria di Kadison.) Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk . Una simmetria (di Kadison) di S dal settore HSk al settore HSk , con k, k ∈ K, `e un’applicazione γ : S(HSk ) → S(HSk ) che goda delle due seguenti propriet` a: (a) γ `e biettiva; (b) γ conserva la struttura convessa di S(HSk ) e S(HSk ). In altre parole: γ (p1 ρ1 + p2 ρ2 ) = p1 γ(ρ1 ) + p2 γ(ρ2 ) se ρ1 , ρ2 ∈ S(HS ) , p1 + p2 = 1, p1 , p2 ∈ [0, 1] .
(11.1)
Nel caso in cui lo spazio di Hilbert H non contenga settori coerenti, ogni applicazione γ : S(H) → S(H), che sia biettiva e conservi la struttura di insieme convesso, `e detta automorfismo di Kadison su H. Osservazione 11.2. In realt` a quella data non `e la nozione originale dovuta a Kadison, ma `e equivalente ad essa con una procedura di dualit` a. Un esempio di simmetria nel senso della definizione 11.1 `e quella indotta da un operatore U : HSk → HSk che sia unitario o antiunitario (definizione 5.38), definendo: γ (U ) (ρ) := U ρU −1 per ogni ρ ∈ S(HSk ). (11.2)
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
517
Dimostriamolo. Abbiamo bisogno di un lemma elementare. Lemma 11.3. Sia U : H → H un operatore antiunitario dallo spazio di Hilbert H allo spazio di Hilbert H e N ⊂ H una base hilbertiana. Allora U = V C, dove V : H → H `e un operatore unitario e C : H → H `e l’operatore di coniugazione (definizione5.40) naturale associata a N definita da: Cψ := (z|ψ)z . z∈N
Dimostrazione. Definendo V ψ := z∈N (z|ψ)U z, la dimostrazione segue immediatamente dalla propriet` a di antiisometricit` a e continuit` a di ogni operatore antiunitario e dalle propriet` a elementari delle basi hilbertiane, in particolare si osservi che {U z}z∈N `e una base hilbertiana di H . Proposizione 11.4. Sia U : HSk → HSk un operatore unitario (cio`e isometrico e suriettivo) oppure antiunitario, sullo spazio di Hilbert HS , associato al sistema quantistico S con spazio degli stati S(H) e dove HSk e HSk sono due settori coerenti. γ (U ) : S(HSk ) → B(H) definita in (11.2) `e una simmetria di Kadison per S dal settore HSk al settore HSk . Dimostrazione. La propriet` a (11.1) `e banalmente vera in ciascuna delle due ipotesi per U (si osservi che non lo sarebbe se permettessimo ai coefficienti pi di essere complessi). Dimostriamo che γ (U ) (ρ) ∈ S(HSk ) se ρ ∈ S(HSk ). Assumiamo inizialmente che U sia unitario. Se ρ `e di classe traccia in HS lo deve essere anche U ρU −1 , dato che lo spazio degli operatori di classe traccia `e un ideale bilatero in B(HS ) per (b) in teorema 4.30 interpretando U ρU −1 come una composizione di operatori di B(HS ). Per fare ci`o `e sufficiente, pensare ρ come operatore in S(HS ) che `e nullo sull’ortogonale di HSk e ρ(HSk ) ⊂ HSk , quindi estendere U e U −1 come operatori nulli sull’ortogonale di HSk e HSk rispettivamente, pensandoli, in tal modo, operatori in B(HS ). Se ρ ≥ 0 allora (ψ|U ρU −1 ψ) = (U ∗ ψ|ρU ∗ ψ) ≥ 0 e pertanto γ (U ) (ρ) ≥ 0. Infine, usando una base hilbertiana data dall’unione di in HSk e una in una base hilbertiana (HSk )⊥ si ha subito che tr γ (U ) (ρ) = tr U ρU −1 = tr(U −1 U ρ) = tr(ρ) = 1. Nell’ultimo passaggio, calcolando la traccia sulla base prima menzionata, abbiamo usato l’identit` a U −1 U HSk = I HSk ed abbiamo tenuto conto del fatto che ρ = 0 su (HSk )⊥ . Pertanto γ (U ) (ρ) ∈ S(HSk ) se ρ ∈ S(HSk ). Passiamo al caso di U antiunitario. Decomponiamo U come detto nel lemma 11.3: U = V C, in riferimento alla base hilbertiana N ⊂ HS che preciseremo pi` u avanti. Mostriamo che U ρU −1 `e positivo, di classe traccia e con traccia unitaria. Dato che V `e unitario (nel qual caso la tesi vale per la dimostrazione appena fatta) e che U ρU −1 = V (CρC −1 )V −1 , `e sufficiente dimostrare la tesi per U = C. Specializziamo N , e quindi C, ad una base Hilbertiana N costituita di autovettori ψ dell’operatore ρ (che esiste per il teorema 4.18 di Hilbert) e pertanto, se φ ∈ H: ρφ = pψ (ψ|φ)ψ . ψ∈N
518
11 Introduzione alle Simmetrie Quantistiche
Di conseguenza, usando il fatto che C `e continuo ed antilineare, che vale CC = I e (f|g) = (Cf|Cg) per definizione di coniugazione, che ogni autovettore di ρ, pψ `e reale (e positivo) e, infine, che Cψ = ψ, otteniamo: CρC −1 φ =
pψ (ψ|Cφ)Cψ =
ψ∈N
=
ψ∈N
pψ (Cψ|φ)Cψ =
pψ (CCψ|Cφ)Cψ =
ψ∈N
pψ (ψ|Cφ)ψ = ρφ .
ψ∈N
Abbiamo provato che CρC −1 = ρ e quindi CρC −1 `e di classe traccia, positivo e con traccia pari a 1 se ρ ∈ S(HSk ). Esempio 11.5. Nel caso in cui la regola di superselezione sia quella della carica elettrica di un sistema fisico, ci saranno (in generale infiniti) settori Hq uno per ogni valore fissato della carica q. La coniugazione di carica pu` o essere costruita come una classe di simmetrie tra settori di tipo γ (Uq ) e vale che Uq : Hq → H−q per ogni valore di q. 11.1.4 Simmetrie nel senso di Wigner Passiamo ora alla nozione di simmetria quantistica nel senso proposto da Wigner. Consideriamo il solito sistema quantistico S, descritto sullo spazio di Hilbert HS e con spazio degli stati S(HS ). Concentriamo l’attenzione sull’insieme degli stati puri Sp (HS ) (cio`e sui raggi di HS ). Restringiamoci a trasformazioni: δ : Sp (HS ) → Sp (HS ) . Dal punto di vista sperimentale possiamo controllare le probabilit`a di transizione |(ψ|ψ )|2 = tr(ρρ ) tra due stati puri ρ = ψ(ψ| ) e ρ = ψ (ψ | ). La richiesta di Wigner perch´e una funzione biettiva δ : Sp (HS ) → Sp (HS ) sia una simmetria `e che preservi le probabilit` a di transizione. Se due stati puri hanno una certa probabilit` a di transizione, allora, trasformando il sistema secondo un’operazione fisica che individua una simmetria del sistema, gli stati trasformati devono avere la stessa probabilit` a di transizione di quelli iniziali. Possiamo dare la definizione seguente che tiene anche conto della possibile presenza di settori coerenti. Definizione 11.6. (Simmetria di Wigner.) Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS e con spazio degli stati S(HS ). Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk . Una simmetria (di Wigner) di S dal settore HSk al settore HSk , con k, k ∈ K, `e un’applicazione δ : Sp (HSk ) → Sp (HSk ) che goda delle due seguenti propriet` a:
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
519
(a) δ `e biettiva; (b) δ conserva le probabilit` a di transizione. In altre parole: tr (ρ1 ρ2 ) = tr (δ(ρ1 )δ(ρ2 ))
se ρ1 , ρ2 ∈ Sp (HSk ) .
(11.3)
Nel caso in cui lo spazio di Hilbert H non contenga settori coerenti, ogni a applicazione δ : Sp (H) → Sp (H), che sia biettiva e che conservi le probabilit` di transizione, `e detta automorfismo di Wigner su H. Un esempio di simmetria nel senso della definizione 10.3, come nel caso delle simmetrie di Kadison, `e quella indotta da un operatore U : HSk → HSk che sia unitario o antiunitario (definizione 5.31), definendo: δ (U ) (ρ) := U ρU −1
per ogni ρ ∈ Sp (HSk ).
(11.4)
A differenza del caso delle simmetrie di Kadison, qui la verifica `e veramente immediata. Osservazioni 11.7. (1) Dato che gli stati puri sono tutti del tipo ψ(ψ| ) con ||ψ|| = 1, l’azione di δ (U ) sugli stati puri `e equivalentemente descrivibile, con una certa impropriet`a di linguaggio, dicendo che δ (U ) trasforma lo stato puro ψ nello stato puro U ψ. Questo `e la maniera in cui, molto spesso, si descrivono le simmetrie indotte dagli operatori (anti)unitari nei manuali di Meccanica Quantistica. (2) Ogni simmetria di Kadison mappa stati puri in stati puri e pertanto definisce un’applicazione biettiva sullo spazio degli stati puri. Tuttavia non `e detto, a priori, che definisca una simmetria di Wigner, perch`e non `e affatto evidente che conservi le probabilit`a di transizione. D’altra parte, una simmetria nel senso di Wigner non si estende in modo ovvio dalla classe degli stati puri a quella degli stati misti. Pertanto non `e ovvio che le due nozioni di simmetria siano la stessa. Tuttavia ogni operatore unitario oppure anti unitario individua contemporaneamente una simmetria di Wigner ed una di Kadison tramite la mappa ρ → U ρU −1 . Per concludere, possiamo dare una nozione di simmetria di Wigner in senso generale. Definizione 11.8. (Simmetria di Wigner generale.) Si consideri lo spazio di Hilbert HS del sistema S e si assuma che sia decomposto in settori coerenti, in modo che gli stati puri fisicamente ammissibili siano solo gli elementi dell’insieme: , Sp (HS )ammiss := Sp (HSk ) . k∈K
Una simmetria di Wigner δ (senza specificare i settori) `e un’applicazione da Sp (HS )ammiss in Sp (HS )ammiss biettiva che conserva le probabilit` a di transizione.
520
11 Introduzione alle Simmetrie Quantistiche
In realt` a questa definizione si pu` o ricondurre alla definizione di simmetria di Wigner tra coppie di settori nel modo che segue. Proposizione 11.9. Sia δ una simmetria di Wigner del sistema S e si assuma che lo spazio di Hilbert HS di S sia decomposto in settori coerenti, in modo che gli stati puri fisicamente ammissibili siano solo gli elementi dell’insieme: , Sp (HSk ) . Sp (HS )ammiss = k∈K
Allora esiste una funzione biettiva f : K → K e una classe di simmetrie di Wigner, con settori fissati, δf,f(k) : Sp (HSk ) → Sp (HSf(k) )
con k ∈ K,
tali che δSp (HSk ) = δf,f(k) per ogni k. In questo senso δ non `e altro che una classe di simmetrie di Wigner che scambiano i settori senza sovrapporsi. Dimostrazione. Si definisca su Sp (HS ) la distanza: d(ρ, ρ ) := ||ρ − ρ ||1 := tr(|ρ − ρ |) , dove || ||1 `e la norma naturale nello spazio degli operatori di classe traccia. Con questa definizione risulta che gli insiemi Sp (HSk ) sono le componenti connesse di Sp (HS )ammiss (vedi esercizio 11.4). La funzione δ : Sp (HS )ammiss → Sp (HS )ammiss `e un’isometria biettiva in riferimento alla distanza d, in particolare `e un omeomorfismo. Pertanto trasforma insiemi connessi massimali in insiemi connessi massimali e di conseguenza si deve decomporre in isometrie biettive che operano tra coppie di settori differenti, cio`e simmetrie di Wigner tra coppie di settori differenti. 11.1.5 Teoremi di Wigner e di Kadison Cominciamo ad enunciare e provare il teorema di Wigner. Successivamente, usando tale risultato, proveremo il teorema di Kadison. La dimostrazione del teorema di Wigner che daremo ora `e molto diretta. Ne esistono di pi` u eleganti, ma indirette. Quella che presenteremo ha il merito di mostrare esplicitamente come si costruisce U su una base hilbertiana. Teorema 11.10. (Di Wigner.) Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert (complesso separabile) HS . Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk (dove eventualmente K = {1} ed in tal caso quanto segue vale sostituendo ovunque HSk e HSk con HS ). Se la funzione: δ : Sp (HSk ) → Sp (HSk ) `e una simmetria (di Wigner) di S dal settore HSk al settore HSk , con k, k ∈ K, allora valgono i fatti seguenti.
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
521
(a) Esiste un operatore U : HSk → HSk , unitario oppure antiunitario (e la scelta `e fissata da δ stessa), tale che: δ(ρ) = U ρU −1
per ogni stato puro ρ ∈ Sp (HSk ).
(11.5)
(b) U `e determinato a meno di una fase, cio`e U1 e U2 (entrambi unitari oppure entrambi antiunitari) soddisfano (11.5) (sostituendo separatamente ciascuno di essi a U ) se e solo se U2 = χU1 dove χ ∈ C con |χ| = 1. (c) Se {ψn }n∈N `e una base hilbertiana di HSk e scegliamo i vettori ψn ∈ HSk in modo tale che ψn (ψn | ) = δ (ψn (ψn | )), allora {ψn }n∈N `e base hilbertiana di HSk , inoltre un operatore U che soddisfa (11.5) risulta essere: an ψn → an ψn nel caso unitario, U :ψ= n∈N
n∈N
oppure: U :ψ=
n∈N
an ψn →
an ψn
nel caso antiunitario.
n∈N
Dimostrazione. (b). Prima di tutto mostriamo che U , se esiste, `e unico a meno di una fase. Ovviamente, se U1 soddisfa la tesi rispetto a δ, allora U2 := χU1 la soddisfer`a ancora se χ ∈ C con |χ| = 1. Mostriamo che questo `e l’unico caso possibile. Supponiamo che esistano U1 e U2 (entrambi unitari oppure antiunitari) che soddisfino la tesi in riferimento a δ. Deve accadere che, se ρ = ψ(ψ| ), allora, posto L := U1−1 U2 , vale Lψ(ψ|L−1 φ) = ψ(ψ|φ) per ogni coppia di vettori normalizzati a 1, ψ, φ. Di conseguenza varr` a Lψ(Lψ|φ) = ψ(ψ|φ), dato che L `e unitario. In definitiva, essendo Lψ(Lψ| ) = ψ(ψ| ), Lψ e ψ determinano lo stesso stato puro, per cui deve essere Lψ = χψ ψ e cio`e U1 ψ = χψ U2 ψ, oppure U1 ψ = χψ U2 ψ (se gli operatori sono antiunitari) per ogni ψ ∈ HSk , e per qualche χψ ∈ C con |χψ | = 1. Mostriamo che χψ non dipende da ψ. Scegliendo ψ = ψ e a, b ∈ C \ {0}, la linearit` a di L implica che: χaψ+bψ (aψ + bψ ) = L(aψ + bψ ) = aLψ + bLψ = aχψ ψ + bχψ ψ . Di conseguenza: a(χaψ+bψ − χψ )ψ = b(χψ − χaψ+bψ )ψ . Dato che ψ = ψ , a, b = 0, deve essere (χaψ+bψ −χψ ) = 0 e (χψ −χaψ+bψ ) = 0 e quindi χψ = χψ . Abbiamo ottenuto che, per qualche χ ∈ C con |χ| = 1, vale: U2 ψ = χU1 ψ per ogni ψ ∈ HSk . (a) e (c). Passiamo ora a costruire un operatore U che rappresenti δ. Sia {ψn }n∈N una base hilbertiana di HSk . Ad ognuno dei vettori ψn associamo il corrispondente stato puro ρn := ψn (ψn | ). Quindi facciamo agire δ su tali stati, ottenendo la classe di stati puri δ(ρn ) = ψn (ψn | ) ∈ Sp (HSk ), dove i vettori
522
11 Introduzione alle Simmetrie Quantistiche
unitari ψn ∈ HSk sono individuati a meno di una fase. Supponiamo di fissare una volta per tutte tale fase in modo arbitrario. Per prima cosa notiamo che {ψn }n∈N `e una base hilbertiana di HSk . Infatti, i vettori sono ortonormali va lendo: |(ψn |ψm )|2 = tr(δ(ρn )δ(ρm )) = tr(ρn ρm ) = |(ψn |ψm )|2 = δnm , inoltre ψ ⊥ ψn implica ψ = 0 come ora dimostriamo. Sia ψ ⊥ ψn per ogni n ∈ N. Se ψ = 0, senza perdere generalit`a, possiamo assumere che ||ψ || = 1 e definire ρ := ψ (ψ | ) ∈ Sp (HSk ). Dato che δ `e suriettiva, deve essere ρ = δ(ρ) con ρ = ψ(ψ| ), per qualche ψ ∈ HSk con ||ψ|| = 1. Di conseguenza: |(ψ |ψn )|2 = tr(δ(ρ)δ(ρn )) = tr(ρρn ) = |(ψ|ψn )|2 = 0 e quindi deve essere ψ = 0, dato che {ψn }n∈N `e base hilbertiana, ma questo `e impossibile dato che ||ψ|| = 1. Deve dunque essere ψ = 0, e quindi {ψn }n∈N `e base hilbertiana. Ora, usando le due basi {ψn }n∈N e {ψn }n∈N definiremo l’operatore U in varie tappe. Per prima cosa definiamo i vettori unitari ausiliari: Ψk := 2−1/2 (ψ0 + ψk )
per k ∈ N \ {0}
ed i corrispondenti stati puri: (Ψk | ) Ψk , per k ∈ N \ {0}. Il trasformato δ(Ψk (Ψk | )) = Ψk (Ψk | ) deve soddisfare, in particolare: |(Ψk |ψn )|2 = tr (Ψk (Ψk | )δ(ρn )) = tr (δ(Ψk (Ψk | ))δ(ρn )) = |(Ψk |ψn )|2 δ0n + δkn , 2 e deve anche essere ||Ψk || = 1. Decomponendo Ψk = n an ψn , si vede che l’unica possibilit` a `e: Ψk = χk 2−1/2 (ψ0 + χk ψk ) =
con |χk | = |χk | = 1. Le fasi χk sono individuate da δ mentre le fasi χk si possono fissare arbitrariamente. Le fasi χk portano l’informazione di δ e ne faremo uso tra poco. √ Cominciamo a definire U sui vettori ψn , (ψ0 + ψk )/ 2 stabilendo che, per definizione, dove k ∈ N \ {0}: U ψ0 := ψ0 ,
U ψk := χk ψk ,
U (2−1/2(ψ0 + ψk )) := 2−1/2(ψ0 + χk ψk ) . (11.6) Con questa scelta siamo sicuri che, se φ `e uno dei vettori nell’argomento di U scritti sopra e ρφ `e lo stato puro associato ad esso, allora δ(ρφ ) `e associato a U φ. Ora estenderemo U su ogni vettore: ψ = n∈N an ψn ∈ HSk , in modo che U continui a rappresentare δ. Assumiamo come sopra che ||ψ|| = 1 e che a0 ∈ R \ {0}. Sia poi ψ ∈ HSk con ||ψ || = 1, tale che ψ (ψ | ) = δ(ρψ ). Avremo uno sviluppo: ψ = an ψn , (11.7) n∈N
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
523
i coefficienti ak sono individuati, a meno di una fase globale, dai coefficienti an e da δ. Nelle nostre ipotesi su δ vale comunque: |(ψ |ψn )|2 = tr(δ(ρψ )δ(ρn )) = tr(ρψ ρn ) = |(ψ|ψn )|2 . Il risultato si pu` o riscrivere come |an | = |an |. Usando questo risultato insieme alle prime due identit`a in (11.6) nel secondo membro di (11.7), arriviamo a: ⎛ ⎞ ⎠ , ψ = χ ⎝a0 U ψ0 + χ−1 n an U ψn n∈N\{0}
dove χ, con |χ| = 1, `e arbitrario. Possiamo allora definire: χ−1 U ψ := a0 U ψ0 + n an U ψn .
(11.8)
n∈N\{0}
In questo modo siamo sicuri che, per costruzione, U ψ(U ψ| ) = δ(ρψ ) e si verifica che la definizione appena data di U estende quella gi`a data in (11.6). Tuttavia non abbiamo ancora completamente definito U ψ, perch´e non conosciamo quanto valgono i coefficienti an in funzione delle componenti an di ψ. Siamo ora in grado di determinare tale legame. Per costruzione di U e nelle nostre ipotesi su δ, deve risultare |(Ψk |ψ)| = |(U Ψk |U ψ)|, che significa, facendo uso di (11.8): 2 |a0 + ak |2 = |a0 + χ−1 k ak | .
Questa identit` a, tenendo conto che |ak | = |ak |, implica che: Re(a0 ak ) = Re(a0 χ−1 k ak ) .
Tenendo infine conto del fatto che a0 ∈ R \ {0}, le identit`a di sopra sono possibili solo in uno dei seguenti casi: ak = χk ak oppure ak = χk ak . Di conseguenza, per ogni ψ = n an ψn con a0 ∈ R \ {0} vale: ψ = U ψ = an ψn + an ψn . n∈Aψ
n∈Bψ
Si osservi che, per il fissato vettore ψ, si pu` o sempre sempre scegliere uno dei due insiemi Aψ e Bψ come vuoto1 . Supponiamo infatti che ci` o non sia possibile. Allora per le componenti di ψ e del corrispondente ψ deve succedere 1
Si osservi che c’`e una certa ambiguit` a nel definire gli insiemi Aψ e Bψ dato che gli indici n degli eventuali coefficienti an reali possono essere scelti come membri di An oppure Bn indifferentemente.
524
11 Introduzione alle Simmetrie Quantistiche
che ap = χp ap mentre aq = χq aq , per qualche coppia di indici p = q, dove Imap , Imaq = 0. Se φ = 3−1/2(ψ0 +ψp +ψq ) deve allora essere per costruzione: |(φ |ψ )|2 = |(φ|ψ)|2 , dove φ := U φ = 3−1/2 (ψ0 +ψp +ψq ). L’identit`a tra i moduli quadri si esplicita in: 2 2 |a0 + ap + aq | = |a0 + ap + aq | , cio`e, con qualche calcolo: Re(ap aq ) = Re(ap aq ) che `e impossibile nelle nostre ipotesi, perch´e implica che Imaq = −Imaq . Se ψ = n an ψn ∈ HSk con ||ψ|| = 1 e se a0 ∈ R \ {0}, abbiamo pertanto le due alternative per definire U ψ: Uψ = an ψn oppure U ψ = an ψn . (11.9) n∈N
n∈N
Mostriamo ora che la scelta tra i due casi non dipende da ψ e quindi deve dipendere dalla natura di δ. Consideriamo un generico vettore ψ = n an ψn ∈ HSk con ||ψ|| = 1 e a0 ∈ R \ {0}. Quindi definiamo il vettore ψ(nc) associato a c ∈ C con Imc = 0, per ogni n = 1, 2, . . ., dato da: ψ(nc) :=
1 1 + |c|2
(ψ0 + cψn ) .
Dovendo essere valido il vincolo: |(ψ|ψ(nc))| = |(U ψ|U ψ(nc) )|, si vede immediatamente che questo `e possibile solo se ψ(nc) e ψ sono dello stesso tipo tra le due possibilit` a in (11.9). Di conseguenza tutti i vettori ψ = n an ψn ∈ HSk con ||ψ|| = 1 e a0 ∈ R \ {0} sono dello stesso tipo. Definiamo ora l’operatore U : HSk → HSk dato da: an ψn → an ψn nel caso lineare, U :ψ= n∈N
oppure: U :ψ=
n∈N
an ψn →
n∈N
an ψn
nel caso antilineare.
n∈N
Si noti che, per costruzione, il primo operatore `e isometrico suriettivo cio`e unitario, il secondo `e antisometrico suriettivo, cio`e antiunitario. Deve essere, a questo punto, chiaro che la scelta tra il caso unitario e quello antiunitario deve dipendere dalla natura di δ e non `e possibile rappresentare lo stesso δ sia con un operatore unitario Questo segue dal fatto che con uno antiunitario. ˜ che ` e impossibile che ψ := a ψ → a ψ e ψ = n∈N n n n∈N n n n∈N an ψn → a ψ differiscano per una sola fase per ogni scelta dei coefficienti an , n∈N n n
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
525
cio`e del vettore ψ, come dovrebbe essere se ψ e ψ˜ individuassero lo stesso stato puro δ(ψ(ψ| )). Per costruzione, questo operatore soddisfa U ρU −1 = δ(ρ) purch` e si possa esprimere ρ ∈ Sp (HSk ) come ψ(ψ| ) dove, nello sviluppo ψ = n∈N an ψn , a0 = 0. Infatti, in tal caso `e possibile ridefinire ψ cambiando una sola fase ˜ ψ| ˜ ), in modo tale che, nello totale: ψ˜ = χψ, senza alterare ρ = ψ(ψ| ) = ψ( ˜ a sviluppo di ψ, ˜ 0 ∈ R \ {0}; a questo punto la costruzione che abbiamo fatto per U implica che: ˜ ψ| ˜ )U −1 = U ψ(U ˜ ψ| ˜ ) = δ(ρ) . U ρU −1 = U ψ(ψ| )U −1 = U ψ( Rimane da provare che questo risultato vale anche per gli stati puri associati a vettori ψ = n∈N an ψn con a0 = 0. A tal fine notiamo che tutta la costruzione pu` o essere rifatta rimpiazzando ψ0 con un qualsiasi altro vettore di base ψk . In tal caso si trova banalmente che, se si definisce U esattamente comedetto sopra, vale U ρU −1 = δ(ρ) per gli stati puri associati a vettori ψ = n∈N an ψn con ak = 0. (Non pu` o accadere che, usando come vettore di riferimento ψk invece di ψ0 , il nuovo operatore U sia di tipo diverso (lineare o antilineare) di quello definito prendendo come riferimento ψ0 . Infatti, sui vettori ψ = n∈N an ψn con ak = 0 e a0 = 0 insieme, i due operatori si devono comportare nello stesso modo e questo ne determina il tipo come provato sopra.) L’osservazione fatta conclude la dimostrazione perch´e, se consideriamo ρ ∈ Sp (HSk ) e ρ = ψ(ψ| ), con ψ = n∈N an ψn , e a0 = 0, ci deve essere almeno un coefficiente ak = 0, essendo ||ψ|| = 1. Pertanto possiamo eseguire la dimostrazione di sopra rimpiazzando ψ0 con tale ψk . Passiamo ora alla prova del teorema di Kadison, impiegando una procedura di riduzione al teorema di Wigner dovuta a Roberts e Roepstorff [RR69]. Per prima cosa dimostriamo parte del teorema nel caso bidimensionale. Proposizione 11.11. Sia H uno spazio di Hilbert bidimensionale. Se la funzione γ : S(H) → S(H) `e un automorfismo di Kadison, allora esiste U : H → H unitario oppure anti unitario tale che: γ(ρ) = U ρU −1
per ogni ρ ∈ S(H).
Dimostrazione. Per prima cosa caratterizziamo geometricamente gli stati e gli stati puri su H attraverso la cosiddetta sfera di Poincar´e. Uno stato ρ ∈ S(H) `e, nel caso in esame, una matrice hermitiana positiva con traccia pari a 1. Lo spazio vettoriale reale delle matrici hermitiane possiede una base costituita dall’identit` a I e dalle 3 matrici di Pauli: + + + * * * 01 0 −i 1 0 σ1 = , σ2 = , σ3 = . (11.10) 10 i 0 0 −1 Quindi, dovr` a essere per a, bn ∈ R: ρ = aI +
3 n=1
bn σ n .
526
11 Introduzione alle Simmetrie Quantistiche
La condizione tr(ρ) = 1 fissa a = 1/2, dato che le tre matrici σn hanno traccia nulla. La richiesta di positivit` a, cio`e la richiesta che gli autovalori di ρ siano entrambi positivi, risulta allora essere equivalente a b11 + b22 + b23 ≤ 1/2. La verifica `e immediata per computo diretto. In definitiva gli elementi ρ di S(H) risultano essere in corrispondenza biunivoca con i vettori n ∈ R3 con |n| ≤ 1 attraverso la relazione, con ovvie notazioni: ρ=
1 (I + n · σ) . 2
(11.11)
Infine, la richiesta che ρ sia puro, e cio`e che si abbia un unico autovalore pari a 1, `e equivalente al fatto che |n| = 1, come si prova per verifica diretta. In definitiva, gli elementi di S(H) sono in corrispondenza biunivoca con la palla chiusa B in R3 di raggio 1 e centrata nell’origine, e gli elementi del sottoinsieme degli stati puri, Sp (H), sono in corrispondenza biunivoca con i punti sulla superficie della palla ∂B. B, con tale interpretazione dei suoi punti `e detta sfera di Poincar´ e. La corrispondenza biunivoca appena definita: B n → ρn ∈ S(H) `e in realt` a un vero isomorfismo, dato che conserva le strutture convesse dei rispettivi spazi, risultando da (11.11): ρpn+qm = pρn + qρm
per ogni coppia n, m ∈ B se p, q ≥ 0 e p + q = 1 .
Una propriet` a importante nel seguito dell’isomorfismo trovato `e la seguente formula che segue immediatamente dalle relazioni (che si provano per verifica diretta): tr(σj ) = 0, tr(σi σj ) = 2δij : tr (ρm ρn ) =
1 (1 + m · n) . 2
(11.12)
Possiamo ora caratterizzare gli automorfismi di Kadison. Assegnare un automorfismo di Kadison γ : S(H) → S(H) `e evidentemente equivalente ad assegnare una corrispondente funzione biettiva γ : B → B che soddisfi: γ (pn + qm) = pγ (n) + qγ (m) per ogni coppia n, m ∈ B se p, q ≥ 0 e p + q = 1. Se l’automorfismo di Kadison γ : S(H) → S(H) individua la funzione γ : B → B come detto sopra, la funzione Γ : R3 → R3 definita da:
v , se v ∈ R3 \ {0} Γ (0) := 0 , Γ (v) := |v|γ |v| risulta allora essere un’estensione di γ e risulta anche essere lineare e biettiva. La prova di ci` o `e diretta. Si osservi che gli automorfismi di Kadison, essendo isomorfismi, devono trasformare elementi estremali in elementi estremali e
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
527
pertanto deve anche risultare: Γ (n) = γ (n) = 1 se |n| = 1 e ancora, per linearit` a: |Γ (v)| = |v| per ogni v ∈ R3 . Concludiamo che la funzione lineare Γ : R3 → R3 associata all’automorfismo di Kadison γ deve essere un’isometria di R3 che ammette l’origine come punto fisso. Questo `e possibile se e solo se Γ ∈ O(3), il gruppo delle matrici ortogonali reali di dimensione 3. Γ ∈ O(3) implica che γSp (H) sia un automorfismo di Wigner. Se infatti ρn e ρm sono stati puri, la probabilit` a di transizione ad essi associata `e: tr (ρn ρm ) che si pu`o esprimere tramite la (11.12). Dato che Γ `e una matrice ortogonale vale: tr (γ(ρn )γ(ρm )) =
1 1 (1 + Γ (n) · Γ (m)) = (1 + n · m) = tr (ρn ρm ) . 2 2
Tenendo infine conto del fatto che γ ∂B = Γ ∂B : ∂B → ∂B `e banalmente una biezione (ci`o accade per tutte le matrici ortogonali), abbiamo che γ Sp (H) : Sp (H) → Sp (H) `e una biezione. Concludiamo che γSp (H) : Sp (H) → Sp (H) `e un automorfismo di Wigner. Il teorema di Wigner implica allora che esiste un operatore unitario o anti unitario U : H → H tale che γ(ρ) = U ρU −1 , per ogni ρ ∈ Sp (H). Se ρ ∈ S(H) si potr` a comunque decomporre come combinazione convessa di due stati puri associati agli autovettori di ρ. Se ρ1 , ρ2 ∈ Sp (H) sono questi stati, per qualche p ∈ [0, 1] dovr` a essere ρ = pρ1 + (1 − p)ρ2 e quindi: γ(ρ) = pγ(ρ1 ) + (1 − p)γ(ρ2 ) = pU ρ1 U −1 + (1 − p)U ρ2 U −1 = U (pρ1 + (1 − p)ρ2 ) U −1 = U ρU −1 . Concludiamo che l’operatore unitario o antiunitario U verifica la tesi della proposizione e la dimostrazione si conclude. Enunciamo e proviamo il teorema di Kadison nel caso generale. (Il contenuto del teorema provato da Kadison si riferisce solo ai punti, non banali, (a) e (b)). Teorema 11.12. (Di Kadison.) Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert (complesso separabile) HS . Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk (dove eventualmente K = {1} ed in tal caso quanto segue vale sostituendo ovunque HSk e HSk con HS ). Se la funzione: γ : S(HSk ) → S(HSk ) `e una simmetria (di Kadison) di S dal settore HSk al settore HSk , con k, k ∈ K, allora valgono i fatti seguenti. (a) Esiste un operatore U : HSk → HSk , unitario oppure antiunitario, tale che: γ(ρ) = U ρU −1 per ogni stato puro ρ ∈ S(HSk ). (11.13)
528
11 Introduzione alle Simmetrie Quantistiche
(b) U `e determinato a meno di una fase, cio`e U1 e U2 (entrambi unitari oppure entrambi antiunitari) soddisfano (11.13) (sostituendo separatamente ciascuno di essi a U ) se e solo se U2 = χU1 dove χ ∈ C con |χ| = 1. (c) La restrizione di γ allo spazio degli stati puri `e una simmetria di Wigner (e la scelta del carattere unitario o anti unitario di U in (a) `e fissata da γSp (HSk ) ). (d) Ogni simmetria di Wigner δ : Sp (HSk ) → Sp (HSk ) si estende, in modo unico, ad una simmetria di Kadison γ (δ) : S(HSk ) → S(HSk ). Dimostrazione. (b). Prima di tutto mostriamo che U , se esiste ed `e unitario oppure `e anti unitario, `e unico a meno di una fase nella corrispondente classe di operatori. Ovviamente, se U1 soddisfa la tesi rispetto a γ, allora U2 := χU1 la soddisfer`a ancora se χ ∈ C con |χ| = 1. Mostriamo che questo `e l’unico caso possibile. Supponiamo che esistano U1 e U2 (entrambi unitari oppure anti unitari) che soddisfino la tesi in riferimento a γ. Deve accadere in particolare che, se ρ ∈ S(HSk ), allora U1 ρU1−1 = U2 ρU2−1 e quindi: LρL−1 = ρ dove L := U1−1 U2 `e lineare ed unitario. Scegliendo uno stato puro ρ = ψ(ψ| ), l’identit` a trovata si riscrive: Lψ(Lψ| ) = ψ(ψ| ) e quindi Lψ deve appartenere allo stesso raggio di ψ e pertanto Lψ = χψ ψ per qualche numero χψ ∈ C con |χ| = 1. Esattamente come nella dimostrazione del punto (b) del teorema di Wigner, si trova allora che χψ non dipende da ψ e questo conclude la dimostrazione di (b). Passiamo a dimostrare (a). Dividiamo la dimostrazione in alcuni passi. Per prima cosa notiamo che γ `e biettiva e conserva la struttura convessa. Conseguentemente, trasforma elementi estremali in elementi estremali ed elementi non estremali in elementi non estremali, cio`e stati puri in stati puri e stati misti in stati misti. Di conseguenza, se M ⊂ HSk `e un sottospazio bidimensionale allora esister`a un analogo sottospazio bidimensionale M ⊂ HSk tale che γ (S(M)) = S(M ). Proviamolo. Se ψ1 , ψ2 `e una base di M, il generico elemento di S(M) `e ρ = pψ1 (ψ1 | ) + qψ2 (ψ2 | ) con p + q = 1 e p, q ≥ 0. Quindi: γ(ρ) = pγ(ψ1 (ψ1 | )) + qγ(ψ2 (ψ2 | )) = pψ1 (ψ1 | ) + qψ2 (ψ2 | ) , dove, i vettori unitari ψ1 e ψ2 si ottengono (a meno di fasi) richiedendo che individuino gli stati puri γ(ψ1 (ψ1 | )) e γ(ψ1 (ψ1 | )) rispettivamente. Questi due stati puri devono essere differenti tra di loro, altrimenti la biezione γ −1 : S(HSk ) → S(HSk ) che conserva la struttura conforme, mapperebbe uno stato puro in uno stato misto. Pertanto i vettori ψ1 e ψ2 , che devono essere di norma unitaria, soddisfano necessariamente: ψ1 = aψ2 per ogni a ∈ C e pertanto sono linearmente indipendenti. Lo spazio M `e allora quello generato da ψ1 e ψ2 . Abbiamo ora due lemmi.
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
529
Lemma 11.13. Nelle nostre ipotesi su γ, esiste una simmetria di Wigner denotata con δ : Sp (HSk ) → Sp (HSk ) che soddisfa γ(ρ) = δ(ρ) per ogni ρ ∈ Sp (HSk ). Prova del lemma 11.13. Dato che γ e γ −1 trasformano elementi estremali in elementi estremali ed elementi non estremali in elementi non estremali, γSp (HSk ) : Sp (HSk ) → Sp (HSk ) `e biettiva, dato che la sua inversa destra e sinistra non `e altro che γ −1 Sp (HSk ) : Sp (HSk ) → Sp (HSk ). La dimostrazione si conclude provando che γSp (HSk ) conserva le probabilit` a di transizione. Dato φ, ψ ∈ HSk supposti essere unitari e diversi, sia M lo spazio vettoriale generato da essi e sia M ⊂ HSk lo spazio bidimensionale che soddisfa γ (S(M)) ⊂ S(M ) menzionato sopra. Sia infine U : M → M un qualsiasi operatore unitario. Definiamo: γ (ρ) := U γ(ρ)U −1
per ogni ρ ∈ S(M).
Si verifica immediatamente che γ `e una simmetria di Kadison se ci si restringe a lavorare nello spazio di Hilbert 2-dimensionale H = M. Come provato nella proposizione 11.11, in questo caso il teorema di Kadison `e vero e quindi esiste un operatore unitario o anti unitario V : M → M tale che γ (ρ) = U γ(ρ)U −1 = V ρV −1 . In altre parole: γ(ρ) = U V ρ(U V )−1
per ogni ρ ∈ S(M).
In particolare, scegliendo ρ = ψ(ψ| ) e poi ρ = φ(φ| ) abbiamo che: tr (γ(ψ(ψ| ))γ(φ(φ| ))) = tr U V ψ(ψ| )(U V )−1 U V φ(φ| )(U V )−1 = = tr U V ψ(ψ| )φ(φ| )(U V )−1 = tr (ψ(ψ| )φ(φ| )) . Nel caso ψ(ψ| ) = φ(φ| ) si ottiene banalmente lo stesso risultato come `e immediato verificare. Abbiamo provato che γSp (HSk ) conserva le probabilit` a di transizione ed `e quindi una simmetria di Wigner. Per il lemma precedente ed applicando il teorema 11.10 di Wigner, esiste un operatore unitario oppure anti unitario U : HSk → HSk tale che: γ(ρ) = U ρU −1
per ogni ρ ∈ Sp (HSk ).
(11.14)
La dimostrazione si conclude dimostrando che l’identit` a trovata vale anche nel caso di ρ ∈ S(HSk ) e non solo Sp (HSk ). A tal fine, notiamo che (11.14) `e equivalente a: U −1 γ(ρ)U = ρ per ogni ρ ∈ Sp (HSk ). (11.15) Γ := U −1 γ( · )U : S(HSk ) → S(HSk ) `e quindi una simmetria di Kadison (anzi un automorfismo di Kadison) che si riduce all’identit`a sugli stati puri. La dimostrazione del teorema di Kadison si conclude immediatamente provando il seguente lemma.
530
11 Introduzione alle Simmetrie Quantistiche
Lemma 11.14. Sia H uno spazio di Hilbert. Se Γ : S(H) → S(H) `e un automorfismo di Kadison che si riduce all’identit` a sugli stati puri, allora `e l’identit` a. N Prova del lemma 11.14. Se ρ = k=0 pk ψk (ψk | ) `e una combinazione lineare (convessa) finita di stati puri, allora: Γ (ρ) = Γ
N
pk ψk (ψk | )
=
k=0
N
pk Γ (ψk (ψk | )) =
k=0
N
pk
I =I.
k=0
Di conseguenza, la tesi varr`a per ogni ρ ∈ S(H), se le combinazioni lineari (convesse) finite di stati puri sono dense in S(H) in una topologia rispetto alla quale Γ `e continuo. Mostriamo che ci`o accade rispetto alla topologia degli operatori di classe traccia indotta dalla norma ||T ||1 := tr(|T |) (vedi capitolo 4). Se ρ ∈ S(H), possiamo decomporre l’operatore nel suo sviluppo spettrale: ρ=
pk ψk (ψk | )
k∈N
dove pk > 0 e k∈N pk = 1. La convergenza `e nella topologia operatoriale forte e anche nella topologia operatoriale uniforme come sappiamo dal capitolo 4. Mostriamo che, ulteriormente, possiamo approssimare ρ con elementi ρN ∈ S(H), combinazioni lineari (convesse) finite di stati puri, in modo tale che: ||ρN − ρ||1 → 0 per N → +∞. A tal fine definiamo: ρN :=
N
(N)
qk ψk (ψk | ) ,
(N)
qk
pk := N j=0
k=0
pj
,
N=0,1,2,. . . .
Evidentemente ρN ∈ S(H) per ogni N ∈ N. Teniamo conto del fatto che (N) qk > pk e che i vettori unitari ψk (aggiungendo una base hilbertiana di ker(ρ) ⊃ ker(ρN )) formano una base hilbertiana di H, fatta di autovettori di ρ, ρN e quindi di ρ − ρN . Calcolando la traccia di |ρ − ρN | usando tale base, si ha immediatamente che: ||ρ − ρN ||1 = tr (|ρ − ρN |) =
N k=0
(N)
|pk − qk | +
+∞
|pk |
k=N+1
N N +∞ 1 − j=0 pj = N pk + pk → 0 se N → +∞ . j=0 pj k=0 k=N+1 Il fatto che il limite esista e sia nullo segue subito da pn > 0 e da +∞ n=1 pn = 1. Mostriamo ora che Γ `e continua nella topologia di || ||1 e questo completa la
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
531
dimostrazione. Per prima cosa estendiamo Γ da S(H) alla classe degli operatori di classe traccia positivi su H definendo, se A ∈ B1 (H) con A ≥ 0 (e quindi tr(A) > 0 se A = 0):
1 Γ1 (A) := tr(A)Γ A , Γ1 (0) := 0 . trA Con questa definizione, segue immediatamente che Γ1 (A) ∈ B1 (H) e Γ1 (A) ≥ 0, inoltre: Γ1 (αA) = αΓ1 (A)
se α ≥ 0, e
tr (Γ1 (A)) = tr(A) .
Tenendo conto che Γ conserva la struttura convessa, si prova immediatamente che Γ1 (A + B) = Γ1 (A) + Γ1 (B) . Per concludere estendiamo Γ1 sulla classe degli operatori autoaggiunti di classe traccia, definendo: Γ2 (A) := Γ1 (A+ ) − Γ1 (A− ) , dove A− := − (−∞,0) xdP (A)(x) e A+ := (0,+∞) xdP (A)(x). Si osservi che
A+ − A− = A e |A| = A+ + A− , per definizione, essendo P (A) la PVM di A. Con questa definizione, se A ∈ B1 (H) `e autoaggiunto, allora Γ2 (A) ∈ B1 (H) ed `e autoaggiunto, inoltre: ||Γ2(A)||1 ≤ ||Γ1(A+ )||1 + ||Γ1(A− )||1 = tr (A+ ) + tr (A− ) = ||A||1 . Segue che Γ2 `e continua nella topologia di || ||1 e di conseguenza lo `e Γ : S(H) → S(H) che ne `e una restrizione.
Abbiamo quindi provato l’esistenza di U unitario o anti unitario che soddisfa la richiesta γ(ρ) = U ρU −1 per ogni ρ ∈ S(HSk ). Questo conclude la prova di (a). (c). Si osservi che, valendo: γSp (HSk ) (ρ) = U ρU −1 , si conclude che γSp (HSk ) `e una simmetria di Wigner come si prova immediatamente. In particolare, l’operatore U che verifica (a) (di questo teorema) soddisfa anche la tesi in (a) del teorema di Wigner per γSp (HSk ) . In base al teorema di Wigner il carattere unitario o antiunitario di U che soddisfa (a) `e quindi fissato da γSp (HSk ) . (d) Se δ `e una simmetria di Wigner, per il teorema di Wigner esiste U , unitario o antiunitario per cui δ(ρ) = U ρU −1 per ogni stato puro. U definisce la simmetria di Kadison γ (δ) (ρ) = U ρU −1 che estende δ su tutto lo spazio degli stati. Dimostriamo l’unicit`a. Se due simmetrie di Kadison, γ, γ , associate agli operatori (unitari o antiunitari) U , U rispettivamente, coincidono su Sp (HSk ), allora le simmetrie di Wigner δ (U ) = U · U −1 e δ (U ) = U · U −1 coincidono. Per il teorema di Wigner U e U devono essere entrambi unitari o entrambi antiunitari e U = χU con |χ| = 1. Conseguentemente, per le simmetrie di Kadison iniziali vale: γ(ρ) = U ρU −1 = χU ρU −1 χ−1 = χχ−1 U ρU −1 = U ρU −1 = γ (ρ)
532
11 Introduzione alle Simmetrie Quantistiche
per ogni ρ ∈ S(HSk ) e quindi γ = γ . Questo conclude la dimostrazione del teorema di Kadison. Dall’ultima parte della dimostrazione di (a) estraiamo una proposizione che `e interessante per sua natura. Proposizione 11.15. Sia γ un automorfismo di Wigner, oppure di Kadison, sullo spazio di Hilbert H, e B1 (H)R ⊂ B1 (H) indichi il sottospazio reale degli operatori autoaggiunti di classe traccia sullo spazio di Hilbert complesso H. Esiste, ed `e unico, un operatore lineare γ2 : B1 (H)R → B1 (H)R , continuo nella norma naturale || ||1 di B1 (H), tale che si restringa a γ su Sp (H) oppure, rispettivamente, su S(H). Pi` u precisamente vale: ||γ2 (A)||1 ≤ ||A||1
per ogni A ∈ B1 (H)R .
Dimostrazione. La dimostrazione di esistenza, nel caso di automorfismi di Kadison `e stata data nella dimostrazione del lemma 11.14, dimostrando l’esistenza di Γ2 (ora indicato con γ2 ), quando `e assegnato Γ (ora indicato con γ). L’unicit` a segue direttamente dalla costruzione fatta, nella dimostrazione del lemma 11.14, per ottenere Γ2 da Γ . Per gli automorfismi di Wigner, la dimostrazione segue immediatamente da quella per gli automorfismi di Kadison, applicando (d) del teorema di Kadison. 11.1.6 Azione duale delle simmetrie sulle osservabili I teoremi di Wigner e Kadison consentono di definire in modo molto elementare una nozione di azione (duale) di una simmetria sulle osservabili del sistema fisico. Consideriamo un sistema fisico S descritto sullo spazio di Hilbert (complesso separabile) HS . Per semplicit` a ci occuperemo della situazione in cui si abbia un unico settore, dato che la generalizzazione al caso di presenza di pi` u settori coerenti `e immediata. Sia P(HS ) l’insieme delle osservabili elementari su S, descritte, come sappiamo dai proiettori ortogonali su H. Le osservabili su S sono PVM costruite con tali proiettori, ovvero sono gli operatori autoaggiunti (non limitati in generale) associati a tali PVM. Supponiamo che γ : S(HS ) → S(HS ) sia una simmetria. Definiamo l’azione duale di γ sul reticolo dei proiettori, γ ∗ : P(HS ) → P(HS ) come: γ ∗ (P ) := U −1 P U
per ogni P ∈ P(HS ).
(11.16)
Con questa scelta vale l’identit`a di dualit` a: tr (ργ ∗ (P )) = tr (γ(ρ)P ) ,
(11.17)
come si verifica immediatamente, tenendo conto che γ(ρ) = U ρU −1 per il teorema di Kadison e tenendo conto, nel calcolo della traccia e nel caso in cui
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
533
U sia antinunitario, che gli operatori antiunitari trasformano basi hilbertiane in basi hilbertiane. L’applicazione γ ∗ : P(HS ) → P(HS ) non solo trasforma proiettori ortogonali in proiettori ortogonali, ma preserva la struttura di reticolo limitato, ortocomplementato e σ-completo. Per esempio i proiettori ortogonali P e Q di P(HS ) commutano se e solo se γ ∗ (P ) e γ ∗ (Q) commutano. In tal caso γ ∗ (P ∨ Q) = γ ∗ (P ) ∨ γ ∗ (Q) e via di seguito. Se A : D(A) → H `e un operatore autoaggiunto in H con misura spettrale P (A) ⊂ P(HS ), risulta facilmente (vedi l’esercizio 9.1 per il caso unitario, e −1 −1 l’esercizio 11.6 per il caso antiunitario) che U AU : U D(A) → HS `e ancora ∗ (A) autoaggiunto ed ha misura spettrale γ P . Questa osservazione consente di estendere l’azione di γ ∗ a tutte le osservabili in modo coerente con l’idea della decomposizione spettrale, definendo, se A : D(A) → HS `e un operatore autoaggiunto che rappresenta qualche osservabile di S: γ ∗ (A) := U −1 AU .
(11.18)
Il significato fisico di γ ∗ (A) `e il seguente. Nel momento in cui definiamo una simmetria di Kadison γ, assegniamo una serie di prescrizioni sperimentali con cui trasformare il sistema S. Matematicamente parlando, l’azione sugli stati `e descritta proprio da γ : S(HS ) → S(HS ). L’azione γ ∗ sulle osservabili rappresenta invece una serie di prescrizioni operative sugli strumenti di misura che, in termini intuitivi, corrisponde e generalizza la nozione di trasformazione passiva di coordinate. Pi` u precisamente, tale prescrizione `e tale che se attuiamo γ sul sistema oppure γ ∗ sull’apparato di misura, otteniamo lo stesso risultato (valori di aspettazione, varianze, frequenze di esiti) quando guardiamo gli esiti delle misure. Per esempio, il valore di aspettazione γ ∗ (A) ρ risulta essere lo stesso di A γ(ρ) : γ ∗ (A) ρ = tr (γ ∗ (A)ρ) = tr U −1 AU ρ = tr AU ρU −1 = tr(Aγ(ρ)) = A
γ(ρ)
.
Questo `e, in definitiva, il risultato espresso nell’equazione di dualit` a (11.17). Il risultato `e equivalente a dire che: l’azione di γ sul sistema pu` o essere annullata, ai fini dell’osservazione degli esiti delle misure sul sistema, dall’azione contemporanea di (γ ∗ )−1 sugli strumenti. Osservazione 11.16. Si noti che, dal punto di vista sperimentale, non `e affatto ovvio che una trasformazione agente sul sistema possa essere annullata da un’azione contemporanea sull’apparto di misura. Le simmetrie, nel senso di Kadison e di Wigner, hanno tale propriet` a. Esempi 11.17. (1) Consideriamo una particella quantistica senza spin descritta su R3 , pensato come spazio di quiete di un sistema di riferimento inerziale descritto da
534
11 Introduzione alle Simmetrie Quantistiche
fissate coordinate ortonormali destrorse. Sappiamo, dal capitolo 10, che in tal caso lo spazio di Hilbert della particella `e L2 (R3 , dx). Gli stati puri sono dunque individuati, a meno di fasi arbitrarie, dalle funzioni d’onda, cio`e dai vettori ψ ∈ L2 (R3 , dx) tali che R3 |ψ(x)|2 dx = 1. Le isometrie di R3 individuano simmetrie di Wigner (e quindi di Kadison) nel modo che segue, a causa dell’invarianza della misura di Lebesgue sotto di esse. Alcune nozioni di teoria dei gruppi che useremo di seguito saranno richiamate pi` u avanti (la teoria elementare `e brevemente richiamata in appendice). Indichiamo con IO(3) il gruppo delle isometrie di R3 , che risulta essere il prodotto semidiretto (vedi l’appendice) di O(3) e del gruppo abeliano delle traslazioni R3 . In pratica, ogni elemento del gruppo Γ ∈ IO(3) `e una coppia Γ = (R, t) che agisce sui punti di R3 come segue: Γ (x) := t + Rx. La legge di composizione gruppale di IO(3) si ottiene di conseguenza come: (t , R ) ◦ (t, R) = (t + R t, R R) e quindi (t, R)−1 = (−R−1 t, R−1 ) . Sia Γ : R3 → R3 un elemento di IO(3), quindi in particolare Γ potrebbe essere una traslazione lungo un asse t, Γ : R3 x → x + t oppure una rotazione di O(3) attorno all’origine R3 x → Rx (includendo le rotazioni improprie descritte dagli elementi di O(3) con determinante negativo) oppure una combinazione di questi due tipi di trasformazioni. Possiamo allora definire la trasformazione delle funzioni a quadrato integrabile: (UΓ ψ) (x) := ψ Γ −1x per ogni ψ ∈ L2 (R3 , dx). (11.19) L’operatore U `e evidentemente lineare, suriettivo (dato che ogni isometria Γ di R3 `e biettiva) ed `e un operatore isometrico, dato che la matrice jacobiana J di ogni isometria ha determinante che vale ±1:
−1 2 2
ψ Γ x dx = ||UΓ ψ||2 = |ψ (x )| |detJ|dx R3
= R3
R3
2
2
|ψ (x )| dx = ||ψ|| .
La trasformazione γΓ indotta dall’operatore unitario UΓ sugli stati (puri e non) `e una simmetria (di Wigner o Kadison rispettivamente), che ha come significato naturale l’azione dell’isometria Γ sul sistema S dato dalla particella in esame. Si osservi che l’applicazione IO(3) Γ → UΓ soddisfa, in virt` u di (11.19) e dove id `e l’identit`a di IO(3): Uid = I ,
UΓ UΓ = UΓ ◦Γ
per ogni Γ, Γ ∈ IO(3).
Abbiamo quindi che IO(3) Γ → UΓ conserva la struttura di gruppo (in −1 particolare UΓ −1 = (UΓ ) ) ed `e pertanto una rappresentazione del gruppo
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
535
IO(3) in termini di operatori unitari. Discuteremo tali rappresentazioni nella prossima sezione. Consideriamo ora una PVM su R3 , che indicheremo con P (X) , e che coincide con la misura spettrale congiunta (vedi il teorema 9.14) dei tre operatori posizione ed `e definita da: (X)
(PE ψ)(x) = χE (x)ψ(x)
per ogni ψ ∈ L2 (R3 , dx).
Si dimostra facilmente che i tre operatori posizione si ottengono integrando le corrispondenti funzioni rispetto a tale PVM: Xi = xi dP (X) (x) per i = 1, 2, 3. R3
Direttamente dalla definizione (11.19) si verifica che vale la condizione di imprimitivit` a: (X) (X) = UΓ PE UΓ−1 = PΓ (E) . (11.20) Infatti, per una generica funzione ψ ∈ L2 (R3 , dx): (X) = χΓ (E) (x)ψ(x) UΓ PE UΓ−1 ψ (x) = χE Γ −1 (x) ψ Γ Γ −1 (x) (X) = PΓ (E) ψ (x) . Per l’arbitrariet` a di ψ, segue la (11.20). Si osservi che la condizione di imprimitivit` a si pu` o equivalentemente scrivere, in termini dell’azione duale della simmetria di Kadison: (X) (X) γΓ∗ PE = PΓ −1 (E) . In generale, se abbiamo (i) una misura spettrale P sulla σ-algebra di Borel dello spazio topologico a base numerabile e localmente compatto X, (ii) un gruppo topologico G di trasformazioni di X ed (iii) una rappresentazione unitaria G g → Vg che sia continua nella topologia operatoriale forte, se vale la condizione: Vg PE Vg−1 = Pg(E) , si dice che si ha un sistema di imprimitivit` a su X. Abbiamo verificato (a parte le richieste topologiche, che in ogni caso valgono dotando IO(3) della sua naturale struttura di gruppo di Lie matriciale sottogruppo di GL(4)), che P (X), IO(3), U , formano un sistema di imprimitivit` a su R3 . ∗ L’azione di γΓ sugli operatori posizione si pu` o ottenere per computo diretto, analogamente a come abbiamo ricavato la condizione di imprimitivit`a, oppure tenendo conto di quest’ultima ed integrando la misura spettrale. Se X = (X1 , X2 , X3 ) indica il vettore colonna di operatori X1 , X2 , X3 ristretti al dominio comune invariante dato dalla spazio di Schwartz S(R3 ) su cui sono essenzialmente autoaggiunti: γΓ∗ (X) = UΓ−1 XUΓ = RX + tI ,
(11.21)
536
11 Introduzione alle Simmetrie Quantistiche
in particolare, per traslazioni pure: −1 ∗ γ(t,I) (X) = U(t,I) XU(t,I) = X + tI ,
(11.22)
e per rotazioni pure: −1 ∗ γ(0,R) (X) = U(0,R) XU(0,R) = RX .
(11.23)
L’elemento (0, −I) ∈ IO(3) definisce la riflessione rispetto all’origine. La rappresentazione unitaria P := U(0,−I) , ed anche la simmetria di Wigner o Kadison γP ad essa associata, si dice inversione di parit` a. Un po’ impropriamente, la stessa (0, −I) `e spesso detta inversione di parit` a. Si verifica facilmente che P ∗ = P (e quindi PP = I, dato che vale anche P −1 = P ∗ ). Pertanto l’inversione di parit` a ammette un’osservabile ad essa associata che si chiama parit` a ed ha i due possibili autovalori ±1. Bisogna per` o precisare che, in realt` a, l’operatore unitario che rappresenta (0, −I) `e al solito definita a meno di una fase e quindi l’osservabile P, associata alla simmetria di inversione di parit` a, corrisponde ad una precisa scelta di tale fase. Sono in realt` a possibili due scelte, dato che −P `e ancora un’osservabile e rappresenta l’inversione di parit` a. (2) Consideriamo ora il sistema trattato nell’esempio precedente, ma studiamo il sistema nella rappresentazione impulso. In altre parole, sfruttando la trasformata di Fourier-Plancherel, identifichiamo H con L2 (R3 , dk), in modo tale che le tre osservabili impulso (le tre componenti dell’impulso riferite al sistema di coordinate cartesiane ortonormali solidali con un riferimento inerziale) siano rappresentati dagli operatori moltiplicativi: 6 Pi ψ (k) = ki ψ(k) , come discusso nel capitolo 10. Abbiamo indicato con ψ6 = F(ψ) la trasformata di Fourier-Plancherel di ψ ∈ L2 (R3 , dx). Una simmetria di grande interesse fisico `e l’inversione del tempo, γT , che `e descritta da operatori antiunitari (vedremo pi` u avanti perch´e). Dal punto di vista fisico corrisponde all’operazione che cambia segno al tempo, ma anche alle velocit`a delle particelle e quindi al loro impulso. Una scelta (l’unica a meno di fasi) per l’operatore anti = che descrive l’inversione del tempo `e: unitario T =ψ6 (k) := ψ(−k) 6 T (11.24) per ogni ψ6 ∈ L2 (R3 , dk). Si osservi che, a differenza di P nell’esempio precedente, con ogni scelta per la =, vale sempre T =T = = I a causa dell’antiunitafase arbitraria dell’operatore T =. Tuttavia T = non `e un’osservabile perch`e l’operatore non `e lineare. riet` a di T Si pu` o facilmente dimostrare che, tornando in rappresentazione posizione e con la scelta fatta per la fase, la simmetria γT `e associata ad un operatore
11.1 Nozione e caratterizzazione delle simmetrie quantistiche
537
antiunitario (dove F `e la trasformata di Fourier-Plancherel usata come nel capitolo 10): =F−1 T := F−1 T tale che: (T ψ) (x) := ψ(x)
per ogni ψ ∈ L2 (R3 , dx).
(11.25)
(3) Consideriamo una particella con carica elettrica rappresentata dall’osservabile Q con spettro discreto di autovalori ±1. Fissando un riferimento inerziale I, dotato di un sistema di coordinate solidali cartesiane ortonormali che identificano lo spazio di quiete del riferimento con R3 , lo spazio di Hilbert del sistema `e dato, in questo caso, da: H = C2 ⊗ L2 (R3 , dx) ≡ L2 (R3 , dx) ⊕ L2 (R3 , dx) , dove ⊕ si deve intendere come una somma diretta ortogonale. L’isomorfismo canonico tra i due spazi scritti sopra (vedi anche (2) in esempi 9.38), segue dal fatto che ogni vettore Ψ ∈ C2 ⊗ L2 (R3 , dx) `e scrivibile come: Ψ = |+ ⊗ ψ+ + |− ⊗ ψ− , dove {|+ , |− } `e la base canonica di C2 , costituita da due autovettori della matrice di Pauli σ3 (vedi (11.10)) rispettivamente con autovalore +1 e autovalore −1. L’isomorfismo canonico `e dato dunque da: L2 (R3 , dx) ⊕ (R3 , dx) (ψ+ , ψ− ) → |+ ⊗ ψ+ + |− ⊗ ψ− ∈ C2 ⊗ L2 (R3 , dx) . Si verifica subito che l’isomorfismo conserva la struttura di spazio di Hilbert (cio`e il prodotto scalare), quando si pensa L2 (R3 , dx) ⊕ (R3 , dx) come una somma diretta ortogonale. L’osservabile di carica pu`o pensarsi come la matrice di Pauli σ3 in C2 e quindi, sullo spazio completo: Q = σ3 ⊗ I dove I `e l’operatore identit` a su L2 (R3 , dx). La regola di superselezione della carica, in questo caso elementare, richiede che lo spazio si decomponga in due settori coerenti H = H+ ⊕ H− , dove H± sono, rispettivamente, i due autospazi di Q con autovalore ±1. Per costruzione, la decomposizione in settori coerenti coincide proprio con la decomposizione naturale: H = L2 (R3 , dx) ⊕ (R3 , dx) . In riferimento a tale decomposizione, gli stati puri fisicamente ammissibili sono allora solamente quelli individuati dai vettori (ψ, 0) oppure dai vettori (0, ψ) con ψ ∈ L2 (R3 , dx). Abbiamo allora che la simmetria γC+ detta coniugazione
538
11 Introduzione alle Simmetrie Quantistiche
di carica dal settore H+ al settore H− `e rappresentata dall’operatore unitario C : H+ → H− : C+ : (ψ, 0) → (0, ψ) per ogni ψ ∈ L2 (R3 , dx).
(11.26)
La simmetria γC− detta coniugazione di carica dal settore H− al settore H+ si definisce analogamente: C− : (0, φ) → (φ, 0) per ogni φ ∈ L2 (R3 , dx).
(11.27)
Si noti che C− risulta essere l’inverso di C+ . Possiamo infine definire la simmetria di Wigner di coniugazione di carica, che opera su tutto lo spazio di Hilbert (tenendo conto della presenza dei settori), e che si riduce alle due simmetrie tra settori definite sopra su ogni spazio coerente. C := C+ ⊕ C− . Si osservi che, per costruzione, CC = I e pertanto C = C ∗ , per cui I `e autoaggiunto. Inoltre si ha che: C ∗ QC = −Q .
(11.28)
11.2 Introduzione ai gruppi di simmetria In questa sezione introdurremo alcuni argomenti elementari della teoria delle rappresentazioni proiettive applicata ai gruppi di simmetria quantistica. Vista la vastit` a e l’importanza dell’argomento, rimandiamo all’esaustivo trattato [BaRa86] per approfondimenti. Parte dei risultati presentati in questa sezione sono una rielaborazione di materiale di un corso dottorato in fisica tenuto da M. Toller, a Trento, nel 1994. 11.2.1 Rappresentazioni proiettive, unitarie proiettive Consideriamo la situazione in cui esista un gruppo G (con prodotto gruppale indicato con · ed elemento neutro e) che possa essere interpretato come gruppo di trasformazioni che possano agire su un sistema fisico S, descritto nello spazio di Hilbert HS . Per semplicit`a supponiamo che HS non ammetta settori coerenti (quindi HS stesso `e l’unico settore). Supponiamo infine che, a ciascuna di queste trasformazioni g ∈ G, sia associata una simmetria γg , che quindi possiamo pensare come automorfismo di Kadison (o di Wigner). Abbiamo incontrato questa situazione in (1) in esempi 11.5. In tal caso G era il gruppo delle isometrie dello spazio di quiete tridimensionale di un riferimento inerziale e S era la particella senza carica e senza spin. Gli automorfismi di Kadison da S(HS ) in S(HS ) formano naturalmente un gruppo rispetto alla composizione
11.2 Introduzione ai gruppi di simmetria
539
di applicazioni. Arriviamo naturalmente in questo modo all’idea che esista una rappresentazione di G in termini di automorfismi di Kadison, che descrivono l’azione del gruppo di trasformazioni G sugli stati quantistici del sistema S. In altre parole, possiamo supporre che l’applicazione G g → γg sia un omomorfismo gruppale da G al gruppo delle funzioni biettive su S(HS ): γg·g = γg ◦ γg ,
γe = id ,
γg−1 = γg−1
per ogni g, g ∈ G,
dove abbiamo indicato con id l’automorfismo identit` a. In realt` a non `e necessario imporre la terza condizione, dato che essa segue dalle precedenti due in virt` u dell’unicit` a dell’elemento inverso in un gruppo. Ci si aspetta anche che, come accade nella maggior parte dei casi concreti in fisica, la rappresentazione G g → γg sia fedele, cio`e che l’omomorfismo gruppale G g → γg sia iniettivo. La situazione descritta `e molto frequente in fisica. Definizione 11.18. Si consideri un sistema quantistico S descritto sullo spazio di Hilbert HS . Sia G un gruppo che ammette un omomorfismo gruppale iniettivo (cio`e una rappresentazione fedele) G g → γg , data in termini di automorfismi di Wigner γg : Sp (HS ) → Sp (HS ). In tal caso diremo che G `e un gruppo di simmetria di S e G g → γg `e la sua rappresentazione proiettiva su Sp (HS ). Osservazioni 11.19. (1) Nella definizione ci siamo riferiti solo a simmetrie di Wigner, questo non `e riduttivo dato che, per il teorema di Kadison (nella formulazione che abbiamo dato noi), ogni automorfismo di Wigner γg si estende, in modo unico, ad un automorfismo di Kadison γg : S(HS ) → S(HS ). Si prova immediatamente che G g → γg `e un omomorfismo gruppale iniettivo, cio`e una rappresentazione fedele di G in termini di automorfismi di Kadison. Viceversa, ogni rappresentazione fedele di G in termini di automorfismi di Kadison individua univocamente una rappresentazione fedele di G in termini di automorfismi di Wigner, restringendo ogni automorfismo di Kadison a Sp (HS ). Nel seguito, anche se scriveremo prevalentemente simmetria di Wigner, penseremo indifferentemente la rappresentazione G g → γg come costituita da automorfismi di Wigner o di Kadison a seconda di quello che `e conveniente. (2) Il termine rappresentazione proiettiva, `e appropriato perch´e Sp (Hs ) `e uno spazio proiettivo come menzionato nel capitolo 7 e l’applicazione γg : Sp (HS ) → Sp (HS ) `e ben definita. (3) Dato che l’omomorfismo G g → γg `e esplicitamente supposto essere iniettivo, possiamo equivalentemente considerare come gruppo di simmetria, o pi` u precisamente il gruppo di simmetrie, l’insieme degli automorfismi γg , con g ∈ G, dotato della struttura naturale di gruppo rispetto alla legge di composizione delle funzioni. Tale gruppo `e infatti isomorfo a G per costruzione. Una questione interessante `e la seguente. Supponiamo ancora di avere un gruppo di simmetria, con rappresentazione proiettiva G g → γg . L’applicazione
540
11 Introduzione alle Simmetrie Quantistiche
G → γg `e certamente una rappresentazione, ma non `e una rappresentazione lineare, dato che le funzioni γg : Sp (HS ) → Sp (HS ) non sono funzioni lineari. Notando per` o che ad ogni automorfismo γg corrisponde un operatore unitario (lineare) o antiunitario Ug : HS → HS , che soddisfa γg (ρ) = Ug ρUg−1 per ogni ρ ∈ Sp (HS ), sorge spontanea la questione se possa accadere che l’applicazione G g → Ug sia una rappresentazione (anti)lineare di G cio`e in termini di operatori (anti)lineari (unitari e/o antiunitari) di B(H). In altre parole ci chiediamo se sia possibile che l’applicazione G g → Ug sia un omomorfismo gruppale, cio`e conservi la struttura di gruppo: Ug·g = Ug Ug ,
Ue = I ,
Ug−1 = Ug−1
per ogni g, g ∈ G,
(11.29)
a. La questione `e importante anche dal dove I : HS → HS `e l’operatore identit` punto di vista tecnico, in quanto esistono moltissimi risultati della teoria delle rappresentazioni lineari dei gruppi su spazi vettoriali (di Hilbert), che possono essere usati nello studio dei gruppi di simmetria dei sistemi quantistici. La risposta, in generale `e negativa, dato che la condizione Ug·g = Ug Ug non `e in generale verificata. Infatti, dato che γg ◦ γg = γgg , deve essere: −1 Ug Ug ρ(Ug Ug )−1 = Ug·g ρUg·g
per ogni ρ ∈ S(HS ).
Conseguentemente: (Ug·g )−1 Ug Ug ρ(Ug Ug )−1 Ug·g = ρ
per ogni ρ ∈ Sp (HS ).
Questo significa che, se ρ = ψ(ψ| ), allora (Ug·g )−1 Ug Ug ψ e ψ devono differire al pi` u per una fase. Tale fase non pu`o dipendere da ψ (la dimostrazione `e la stessa che abbiamo fatto nell’enunciato relativo all’unicit` a nel teorema di Wigner), tuttavia tale fase pu` o dipendere da g e g . Deve essere chiaro che `e impossibile ottenere un risultato pi` u preciso, proprio perch`e gli stessi operatori Ug sono definiti a meno di una fase. In definitiva, se gli Ug sono gli operatori (unitari o antiunitari) associati ad una rappresentazione proiettiva di un certo gruppo di simmetria, la condizione Ug·g = Ug Ug , nel caso generale si indebolisce in: Ug Ug = ω(g, g )Ug·g
per ogni g, g ∈ G,
dove ω(g, g ) ∈ C con |ω(g, g )| = 1 sono numeri complessi che dipendono dalla scelta che abbiamo fatto nell’associare gli operatori Ug agli automorfismi γg in rispetto della libert` a permessa dai teoremi di Wigner e Kadison. Quindi se U (1) indica il gruppo dei numeri complessi di modulo unitario, vale ω(g, g ) ∈ U (1). Non `e affatto ovvio che sia possibile riassegnare le fasi degli operatori Ug , in modo tale che risulti ω(g, g ) = 1 per ogni g, g ∈ G. Osservazione 11.20. D’ora in poi ci restringeremo a lavorare con operatori esplicitamente unitari tralasciando il caso antiunitario. Daremo qualche motivazione alla fine di questa sezione.
11.2 Introduzione ai gruppi di simmetria
541
Le funzioni G × G (g, g ) → ω(g, g ) ∈ U (1) non sono completamente arbitrarie, dato che deve valere la propriet` a associativa: (Ug Ug )Ug = Ug (Ug Ug ) . Il calcolo prova immediatamente che la propriet` a associativa `e valida se e solo se `e soddisfatta l’identit` a: ω(g, g )ω(g · g , g ) = ω(g, g · g )ω(g , g ) .
(11.30)
Da questa identit` a seguono facilmente le importanti propriet`a (dove e `e l’elemento neutro di G): ω(g, g−1 ) = ω(g −1 , g),
se g, g1 ∈ G. (11.31) Possiamo dare la seguente definizione che prescinde dal significato fisico degli oggetti matematici coinvolti.
ω(g, e) = ω(e, g),
ω(g, e) = ω(g1 , e),
Definizione 11.21. Se G `e un gruppo e H uno spazio di Hilbert (complesso), una rappresentazione unitaria proiettiva di G su H `e un’applicazione: G g → Ug ∈ B(H) ,
(11.32)
in cui Ug sono operatori unitari e, definiti i moltiplicatori della rappresentazione: −1 ω(g, g ) := Ug·g per ogni g, g ∈ G, (11.33) Ug Ug risulti ω(g, g ) ∈ U (1) (e di conseguenza vale la (11.30)) per ogni g, g ∈ G. La rappresentazione proiettiva su Sp (H) individuata da (con ovvie notazioni): G g → Ug · Ug∗ si dice essere indotta dalla rappresentazione unitaria proiettiva (11.32). La rappresentazione unitaria proiettiva (11.32) `e detta rappresentazione (propriamente) unitaria di G su H se tutti i suoi moltiplicatori valgono 1. La rappresentazione unitaria proiettiva (11.32) `e detta irriducibile, se non esiste alcun sottospazio chiuso H0 ⊂ H diverso da H e da {0} tale che Ug (H0 ) ⊂ H0 per ogni g ∈ G. Due rappresentazioni unitarie proiettive G g → Ug ∈ B(H) e G g → Ug ∈ B(H ) , con H e H spazi di Hilbert (eventualmente coincidenti), si dicono equivalenti se esiste un operatore unitario S : H → H ed una funzione χ : G g → χ(g) ∈ U (1) tali che: χ(g)SUg S −1 = Ug per ogni g ∈ G. (11.34)
542
11 Introduzione alle Simmetrie Quantistiche
Osservazione importante. Il lettore dovrebbe avere ben chiara la differenza tra rappresentazioni proiettive e rappresentazioni unitarie proiettive e rappresentazioni unitarie. Le prime agiscono su Sp (HS ) o S(HS ) rappresentando gruppi di simmetria e non contengono scelte arbitrarie senza significato fisico. Quelle di secondo e terzo tipo agiscono su HS , inducono rappresentazioni proiettive, ma sono affette da scelte arbitrarie nella definizione delle fasi degli operatori unitari che le costituiscono. Osservazioni 11.22. (1) La nozione data di rappresentazioni unitarie proiettive equivalenti `e: transitiva, simmetrica e riflessiva. Pertanto individua una relazione di equivalenza tra le rappresentazioni unitarie proiettive di un fissato gruppo su un fissato spazio di Hilbert. Se G `e un gruppo di simmetria per il sistema fisico S, descritto sullo spazio di Hilbert HS , le rappresentazioni proiettive di G su Sp (HS ) sono evidentemente in corrispondenza biunivoca con le classi di equivalenza di rappresentazioni unitarie proiettive di G. (2) La propriet`a che una data rappresentazione unitaria proiettiva G g → Ug sia equivalente ad una rappresentazione unitaria, `e in realt`a una propriet` a riguardante la classe di equivalenza di tale rappresentazione unitaria proiettiva: corrisponde al fatto che la classe di equivalenza contenga una rappresentazione unitaria. Nel caso in cui ci riferiamo ad un gruppo di simmetrie di un sistema quantistico, `e dunque una propriet` a della rappresentazione proiettiva su S(HS ) alla quale corrisponde tale classe di equivalenza. (3) La propriet` a che una data rappresentazione unitaria proiettiva G g → Ug sia irriducibile `e in realt` a una propriet` a riguardante tutti gli elementi della classe di equivalenza di tale rappresentazione unitaria proiettiva: se un elemento `e irriducibile, allora lo sono tutti gli altri, come si verifica immediatamente dalle definizioni date. L’importanza delle rappresentazioni irriducibili `e dovuta al fatto che, con tali rappresentazioni, si costruiscono tutte le rimanenti rappresentazioni come somma diretta o come integrale diretto di rappresentazioni irriducibili [BaRa86]. La questione se una data rappresentazione proiettiva G g → γg , di un gruppo di simmetria G, ammetta una descrizione, sullo spazio HS , in termini di una rappresentazione unitaria di G, pu` o porsi come segue, in termini concreti. Nella classe di equivalenza di rappresentazioni proiettive unitarie associate a G g → γg , se ne fissa una arbitrariamente (quanto segue non dipende dal particolare elemento della classe di equivalenza per l’osservazione (2) di sopra) e si considerano i suoi moltiplicatori. La questione si riduce ora, semplicemente, a stabilire se esista o non esista una funzione χ : G g → χ(g) ∈ C con |χ(g)| = 1 che verifichi la condizione: ω(g, g ) =
χ(g · g ) χ(g)χ(g )
per ogni g, g ∈ G .
(11.35)
11.2 Introduzione ai gruppi di simmetria
543
Infatti, se la suddetta funzione χ esiste, inserendo essa a primo membro in (11.34), i moltiplicatori di G g → Ug risultano essere banali per le identit` a (11.35). Se, viceversa i moltiplicatori di G g → Ug sono banali, la funzione χ, che appare a primo membro in (11.34), soddisfa la (11.35). Esistono vari approcci per affrontare e risolvere il problema dell’esistenza di χ suddetta [BaRa86], e si vede che ci sono gruppi, in particolare il gruppo di Lorentz e il gruppo di Poincar´e, le cui rappresentazioni proiettive sono descrivibili da rappresentazioni unitarie sullo spazio di Hilbert associato al sistema fisico. Altri, come il gruppo di Galileo, le cui rappresentazioni proiettive (non banali) non ammettono descrizioni in termini di rappresentazioni unitarie, ma solo unitarie proiettive e non si possono mai sopprimere i moltiplicatori con scelte oculate delle fasi. Esiste una vasta letteratura in proposito e le rappresentazioni unitarie proiettive irriducibili dei gruppi di interesse fisico (specialmente gruppi di Lie) sono state studiate e catalogate [BaRa86]. 11.2.2 Unitariet` a o antiunitariet` a delle rappresentazioni unitarie proiettive Torniamo ora ad esaminare la questione dell’unitariet` a o antiunitariet` a degli operatori Ug . Supponiamo di avere un gruppo di simmetria, con rappresentazione proiettiva G g → γg . Ad ogni automorfismo γg corrisponde un operatore unitario oppure antiunitario, Ug : HS → HS , che soddisfa γg (ρ) = Ug ρUg−1 per ogni ρ ∈ Sp (HS ), in base al teorema di Wigner. Ci sono criteri per decidere se gli operatori Ug sono tutti unitari, tutti anti unitari oppure di tipo differente a seconda del particolare g ∈ G? Se Ug e Ug fossero entrambi antiunitari, il vincolo Ug Ug = χ(g, g )Ug·g imporrebbe che Ug·g sia, al contrario, unitario. Di conseguenza rappresentazioni con pi` u di due elementi costituite da soli operatori antiunitari (a parte l’identit` a che `e sempre unitaria) non possono esistere e la situazione in cui appaiono alcuni (pi` u di uno) operatori antiunitari `e comunque non banale, per l’esistenza di vincoli come quello trovato. Sussiste la seguente elementare proposizione a riguardo, che mostra che la natura stessa di G pu` o imporre che gli operatori siano tutti unitari. Proposizione 11.23. Sia H uno spazio di Hilbert complesso e G un gruppo. Si supponga che ogni g ∈ G sia il prodotto di elementi g1 , g2 , . . . , gn ∈ G (dipendenti da g e con n dipendente da g) che ammettono una radice quadrata (cio`e esiste rk ∈ G tale che gk = rk · rk per ogni k = 1, . . . , n). Allora, per ogni rappresentazione proiettiva G g → γg , gli elementi γg possono essere associati solo ad operatori unitari in base al teorema di Wigner (o Kadison). Dimostrazione. La prova `e ovvia, essendo Urk Urk lineare anche quando Urk `e antilineare e valendo Ugk = χ(rk , rk )Urk Urk , segue che Ugk deve essere lineare ed, infine, anche Ug deve essere lineare. Abbiamo il seguente importante caso per le applicazioni, specialmente per n = 1.
544
11 Introduzione alle Simmetrie Quantistiche
Proposizione 11.24. In riferimento alla proposizione 11.23, le rappresentazioni proiettive del gruppo additivo G = Rn possono solo essere associate ad operatori unitari. Dimostrazione. Se t ∈ Rn allora t = t/2 + t/2. La tesi allora segue dalla proposizione 11.23. Come vedremo pi` u avanti, l’ipotesi della proposizione 11.23 `e automaticamente soddisfatta nel momento in cui si assume che G sia un gruppo di Lie connesso, e la presenza di operatori antiunitari si ha solo in presenza di gruppi discreti o discontinuit` a (cambiando componente connessa del gruppo di Lie). Pertanto nel seguito ci riferiremo al caso in cui tutti gli operatori Ug siano sempre unitari. 11.2.3 Estensioni centrali e gruppo quantistico associato a un gruppo di simmetria Esiste un approccio [BaRa86] che permette di studiare tutte le possibili rappresentazioni proiettive unitarie di un gruppo, vedendole come restrizioni di rappresentazioni unitarie di un gruppo pi` u grande, detto estensione centrale del gruppo iniziale. Questa procedura, apparentemente macchinosa, risulta invece tecnicamente utile (anche per determinare l’esistenza di eventuali rappresentazioni unitarie del gruppo iniziale G) perch´e permette di utilizzare tecniche proprie della teoria delle rappresentazioni unitarie (dell’estensione centrale), di cui sono noti molti risultati. Spieghiamo brevemente l’idea fondamentale di questa procedura e pi` u avanti vedremo un esempio fondamentale discutendo il gruppo di Galileo come gruppo di Lie; il lettore pu` o saltare questa sezione e tornare a leggerla quando sar` a necessario. Se G `e un gruppo arbitrario e G g → Ug `e una sua rappresentazione unitaria proiettiva sullo spazio di Hilbert H con moltiplicatori ω, definiamo il ω che ha come elementi le coppie (χ, g) ∈ U (1)×G e definiamo nuovo gruppo G ω come: il prodotto gruppale in G (χ, g) ◦ (χ , g) = (χχ ω(g, g ) , g · g )
per ogni (χ, g), (χ , g ) ∈ U (1) × G.
Lasciamo al lettore la verifica che la definizione data sia ben posta, come sola conseguenza del fatto che la funzione ω soddisfi (11.30), e che individui effettivamente una struttura di gruppo con elemento neutro (ω(e, e)−1 , e), essendo e l’elemento neutro di G (si tenga conto delle (11.31)) ed elemento inverso: (χ, g)−1 = (χ−1 ω(e, e)−1 ω(g, g−1 )−1 , g−1 ). Possiamo dare la seguente definizione che prescinde da come abbiamo ottenuto la funzione ω, purch`e essa soddisfi (11.30). Definizione 11.25. Si consideri un gruppo G ed una funzione ω : G × G → ω costruito sull’insieme U (1) × G con U (1) che soddisfa (11.30). Il gruppo G prodotto gruppale: (χ, g) ◦ (χ , g) = (χχ ω(g, g ) , g · g )
per ogni (χ, g), (χ , g ) ∈ U (1) × G,
11.2 Introduzione ai gruppi di simmetria
545
`e detto estensione centrale del gruppo G tramite U (1) con funzione dei ω e l’omoltiplicatori ω. L’omomorfismo iniettivo U (1) χ → (χ, e) ∈ G momorfismo suriettivo Gω (χ, g) → g ∈ G sono detti, rispettivamente, l’iniezione canonica e la proiezione canonica dell’estensione centrale. A giustificazione della terminologia (vedi l’Appendice in fondo al libro per la terminologia generale della teoria dei gruppi elementare), notiamo che la ω (χ, g) → g ∈ G `e un omomorfismo suriettivo, il cui proiezione canonica G nucleo `e dato dal sottogruppo normale N (immagine dell’iniezione canonica e isomorfo a U (1)) di elementi (χ, e) con χ ∈ U (1). N `e incluso nel centro del dato che i suoi elementi commutano con tutti gli elementi di G ω gruppo G, (visto che ω(e, g) = ω(g, e)). In pratica, il gruppo G `e stato esteso fino ad ot ω , la cui parte che differisce da G (il nucleo dell’applicazione tenere il gruppo G suriettiva Gω (χ, g) → g ∈ G) `e nel centro dell’estensione. Si osservi anche ω /N . che G si identifica naturalmente con il gruppo quoziente G Ci sono ora tre importanti osservazioni che portano ad individuare una procedura per ottenere tutte le rappresentazioni unitarie proiettive di G. (1) Il primo punto importante `e che, in riferimento ad una rappresentazione unitaria proiettiva G g → Ug , con funzione dei moltiplicatori ω, l’applicazione: ω (χ, g) → V(χ,g) := χUg , G ω su H, infatti, gli ope`e sempre una vera rappresentazione unitaria di G ratori appena definiti V(χ,g) : H → H sono tutti unitari, risulta subito che V(ω(e,e)−1 ,e) = I ed infine: V(χ,g) V(χ ,g ) = χUg χ Ug = χχ ω(g, g )Ug·g = V(χ,g)◦(χ ,g ) . (2) Il secondo punto importante `e che la rappresentazione unitaria proietti ω (χ, g) → V(χ,g) va di partenza, si ottiene dalla rappresentazione unitaria G per restrizione: restringendo cio`e il dominio di V all’insieme di elementi (1, g) con g ∈ G. Con un piccolo abuso di linguaggio, restringendo la rappresentazione unitaria V a G. (3) Il terzo punto importante `e che, data una qualsiasi rappresentazione unitaria: ω (χ, g) → V(χ,g) G di un’estensione centrale, la sua restrizione all’insieme di elementi (1, g) con g ∈ G: Ug := V(1,g) `e una rappresentazione unitaria proiettiva se e solo se: V(χ,e) = χω(e, e)I
per ogni χ ∈ U (1).
(11.36)
Infatti, se V(χ,g) = χUg allora: V(χ,e) = χUe = χω(e, e)I (dove abbiamo usato −1 il fatto che ω(e, e) := Uee Ue Ue = Ue , che vale per ogni rappresentazione unitaria proiettiva). Viceversa, essendo (χ, g) = (χω(e, e)−1 , e)(1, g), se vale (11.36), possiamo sempre scrivere: V (χ, g) = V (χω(e, e)−1 , e)V (1, g) = χV (1, g) =: χUg .
546
11 Introduzione alle Simmetrie Quantistiche
Concludiamo che vale la seguente proposizione. Proposizione 11.26. Ogni rappresentazione unitaria proiettiva di un gruppo G si ottiene restringendo a G una opportuna rappresentazione unitaria di una ω la cui funzione dei moltiplicatori soddisfa opportuna estensione centrale G (11.36). Questa procedura in certi casi, in particolare considerando gruppi G che abbiano struttura di gruppi di Lie, `e estremamente potente e, applicando metodi di coomologia gruppale consente di catalogare tutte le rappresentazioni unitarie proiettive continue in un certa topologia (e le eventuali rappresentazioni unitarie) di un gruppo di Lie semplicemente connesso, partendo dalla sola conoscenza dell’algebra di Lie di G [BaRa86]. Torneremo su ci`o pi` u avanti. In realt` a non `e necessario conoscere tutte le estensioni centrali di G ` sufficiente coper conoscerne tutte le rappresentazioni unitarie proiettive. E noscere le estensioni centrali i cui moltiplicatori non sono equivalenti nel senso che segue. Date due funzioni dei moltiplicatori sullo stesso gruppo, G × G (g, g ) → ω(g, g ) ∈ U (1) e G × G (g, g ) → ω (g, g ) ∈ U (1), diremo che esse sono equivalenti, se esiste una funzione χ : G → U (1) tale che: χ(g · g ) ω(g, g ) = ω (g, g ) per ogni g, g ∈ G. χ(g)χ(g ) Se due rappresentazioni unitarie proiettive U e U di G sono equivalenti, allora si possono costruire restringendo a G due rappresentazioni unitarie di estenω e G ω che hanno funzioni dei moltiplicatori ω e ω equivalenti. sioni centrali G Quindi, se conosciamo tutte le estensioni centrali di G i cui moltiplicatori non sono equivalenti e le rappresentazioni unitarie di esse, conosciamo tutte le classi di equivalenza di rappresentazioni unitarie proiettive di G e di conseguenza tutte le rappresentazioni unitarie proiettive di G. Si noti ancora che, se ω(e, e) = 1 per una certa scelta della funzione ω, attraverso una trasformazione di equivalenza con una funzione χ costante, possiamo sempre ridurci ad avere soddisfatta la condizione ω(e, e) = 1. Moltiplicatori tali che ω(e, e) = 1 (e quindi ω(e, g) = ω(g, e) = ω(e, e) = 1) vengono detti normalizzati. In questo caso, l’estensione centrale ha come elemento neutro (1, e) e la condizione (11.36) diventa: V(χ,e) = χI
per ogni χ ∈ U (1) .
(11.37)
Le rappresentazioni unitarie proiettive che si ottengono da queste estensioni centrali soddisfano Ue = I. ω , nel Per concludere, facciamo qualche considerazione fisica sul significato di G caso in cui non esistano rappresentazioni unitarie di G, ma solo rappresentazioni unitarie proiettive. Supponiamo quindi di avere un gruppo di simmetria G g → γg per il sistema fisico S, e quindi una sua rappresentazione proiettiva su S(HS ), che non sia descrivibile tramite una rappresentazione unitaria.
11.2 Introduzione ai gruppi di simmetria
547
Possiamo comunque fare una scelta delle fasi arbitrarie ed estendere il gruppo ω usando i moltiplicatori trovati e pensare G ω come il vero gruppo da G a G di simmetria di S. Tale gruppo esteso ammette dunque due rappresentazioni: una data dal gruppo G stesso: ω (χ, g) → g ∈ G , G che rappresenta l’azione classica del gruppo. L’altra quantistica ed unitaria: ω (χ, g) → χUg , G che rappresenta l’azione del gruppo sugli stati del sistema (in realt`a sui vettori dello spazio di Hilbert del sistema e, di conseguenza, sugli stati). ω `e a volte detto il gruppo quantistico associato In quest’ottica, il gruppo G a quello classico G. Si osservi che tuttavia la scelta di una precisa estensione ω non pu` centrale G o essere fatta con la costruzione che abbiamo presentato fino ad ora, in cui solo le rappresentazioni proiettive in termini di automorfismi di Wigner o di Kadison hanno un significato fisico. Per poter scegliere tra le varie estensioni centrali `e necessario dare un significato fisico alle singole rappresentazioni unitarie proiettive di G, oppure alle singole rappresentazioni ω . Questo pu` unitarie delle possibili estensioni centrali G o essere fatto arricchendo la struttura di G fino a farlo diventare un gruppo di Lie, come vedremo pi` u avanti. Nel caso delle rappresentazioni unitarie proiettive del gruppo di Galileo, i moltiplicatori hanno un diretto significato fisico perch´e sono legati alla massa del sistema fisico come chiariremo meglio pi` u avanti, dopo avere introdotto i gruppi di Lie come gruppi di simmetria. 11.2.4 Gruppi di simmetria topologici Ci occupiamo ora di introdurre la nozione di gruppo di simmetria topologico, dando alcuni semplici risultati generali per lo pi` u dovuti a Wigner. Studieremo in particolare il caso del gruppo topologico additivo R, che riveste un particolare significato fisico oltre ad essere tecnicamente importante. La maggior parte dei gruppi di simmetria quantistici, escluse in particolare le simmetrie discrete (inversione di parit`a ed inversione del tempo) sono date da gruppi di Lie, di cui diremo nel prossimo paragrafo. I gruppi di Lie sono un sottocaso dei gruppi topologici. Definizione 11.27. Un gruppo topologico `e un gruppo G che `e anche spazio topologico e le cui operazioni di composizione, G × G (f, g) → f · g ∈ G, e di calcolo dell’inverso G g → g −1 , sono funzioni continue rispetto alla topologia prodotto di G × G ed alla topologia di G, rispettivamente. La teoria dei gruppi topologici e delle loro rappresentazioni `e un capitolo molto vasto della matematica [NaSt84], noi ci limiteremo a presentare alcuni risultati elementarissimi e strettamente legati ai nostri modelli fisici.
548
11 Introduzione alle Simmetrie Quantistiche
Esempi 11.28. (1) Il gruppo lineare n-dimensionale reale, GL(n, R), e complesso, GL(n, C), delle matrici n × n non singolari reali, rispettivamente, complesse, sono (evidentemente) gruppi topologici, quando li si pensa dotati della topologia in2 2 dotta da Rn e, rispettivamente, Cn . (2) Usando le stesse topologie, sono quindi gruppi topologici tutti i sottogruppi di GL(n, R) e GL(n, C) che si incontrano in fisica, come: il gruppo unitario n-dimensionale U (n) = {U ∈ GL(n, C) | U U ∗ = I}, il gruppo unitario speciale n-dimensionale SU (n) := {U ∈ SU (n)|detU = 1}2 , il gruppo ortogonale n-dimensionale O(n) := {R ∈ GL(n, R) | RRt = I} il gruppo ortogonale speciale n-dimensionale SO(n) := {R ∈ O(n) | detR = 1}, il gruppo lineare speciale SL(n, R) := SGL(n, R) := {A ∈ GL(n) | detA = 1}. (3) Vi sono gruppi topologici che, apparentemente, non sono gruppi matriciali, come il gruppo additivo R. In realt` a anche tale gruppo topologico, come il gruppo additivo Rn (delle traslazioni di Rn ) o il gruppo IO(n) delle isometrie di Rn , si possono realizzare come gruppi matriciali. Nel caso di Rn , la sua realizzazione matriciale `e data dal gruppo (sottogruppo di GL(n + 1, R) e 2 dotato della topologia indotta da R(n+1) ) delle matrici reali (n + 1) × (n + 1) della forma: + * 1 0t per ogni t ∈ Rn . M (t) := (11.38) t I Sopra I indica la matrice identit`a n × n. La funzione R t → M (t) `e un isomorfismo gruppale, ma anche un omeomorfismo, dotando il gruppo di matrici 2 suddette della topologia indotta da R(n+1) . (4) Il gruppo di Galileo e quello di Poincar´e, oltre che quello di Lorentz, sono gruppi topologici, che si possono costruire come gruppi matriciali. Esistono comunque gruppi topologici (che sono comunque gruppi di Lie), che non ammettono nessuna realizzazione matriciale, come il cosiddetto gruppo di rivestimento universale (vedi definizione 11.42) del gruppo conforme (matriciale) SL(2, R). Vogliamo ora specializzare la nozione di gruppo di simmetria al caso in cui il gruppo sia topologico, imponendo requisiti topologici anche sulla rappresentazione proiettiva associata. 2
Ricordiamo che speciale, nella teoria dei gruppi matriciali, significa con determinante 1 e si indica con la lettera S davanti al (o all’interno del) nome del gruppo di cui il gruppo speciale `e sottogruppo.
11.2 Introduzione ai gruppi di simmetria
549
Supponiamo dunque di avere una gruppo di simmetria G g → γg per il sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Se G `e un gruppo topologico, ci aspettiamo che l’omomorfismo gruppale g → γg sia continuo in qualche senso. Dobbiamo in particolare scegliere una topologia per lo spazio delle funzioni γg , che possiamo pensare, indifferentemente, come automorfismi di Kadison oppure di Wigner. Nel seguito adotteremo il punto di vista di Wigner. Diamo la nostra definizione che poi giustificheremo sia matematicamente che fisicamente. Definizione 11.29. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Sia G un gruppo topologico che ammette una rappresentazione proiettiva su H, G g → γg che soddisfa: lim tr (ρ1 γg (ρ2 )) = tr (ρ1 γg0 (ρ2 ))
g→g0
per ogni g0 ∈ G e ogni ρ1 , ρ2 ∈ Sp (HS ).
In tal caso G `e detto gruppo topologico di simmetria per S e G g → γg , `e detta rappresentazione proiettiva continua su Sp (HS ). Dal punto di vista fisico, la definizione `e ragionevole e afferma che la probabilit` a di transizione tra due arbitrari stati puri, di cui uno trasformato dall’azione del gruppo di simmetria, `e una funziona continua sotto l’azione del gruppo. Nell’ottica dell’analisi di Wigner della nozione di simmetria quantistica, questa definizione di continuit` a `e pi` u che ragionevole. Tuttavia la definizione data ha anche una sua naturalezza in termini matematici come andiamo a dimostrare. Nel seguito B1 (HS )R `e spazio vettoriale reale degli operatori autoaggiunti di classe traccia dotato della norma naturale di B1 (HS ), || ||1. Come sappiamo, dalla proposizione 11.15, ogni automorfismo di Wigner γg `e la restrizione sullo spazio Sp (HS ), di un operatore lineare (γ2 )g : B1 (HS )R → B1 (HS )R , unicamente individuato da γg e continuo nella norma || ||1. Consideriamo allora l’applicazione Γ : G g → (γ2 )g . Riferendoci alla topologia operatoriale forte in B1 (HS )R e quella di G nel dominio, diremo che Γ `e continua quando, per ogni ρ ∈ B1 (HS ) e g0 ∈ G vale: lim ||(γ2 )g (ρ) − (γ2 )g0 (ρ)||1 = 0 .
g→g0
Restringendoci a lavorare su Sp (HS ) e tornando quindi a alla nostra rappresentazione iniziale G g → γg in termini di automorfismi di Wigner, usando la topologia indotta, diremo che G g → γg `e continua, se per ogni ρ ∈ Sp (HS ) e g0 ∈ G vale: lim ||γg (ρ) − γg0 (ρ)||1 = 0 . g→g0
Apparentemente, questa nozione di continuit` a della rappresentazione proiettiva `e differente da quella usata nella definizione 11.29. In realt` a `e esattamente la stessa, come conseguenza della seguente proposizione.
550
11 Introduzione alle Simmetrie Quantistiche
Proposizione 11.30. Sia H spazio di Hilbert complesso. Se ||ρ||1 = tr(|ρ|) indica la norma dello spazio S(HS ) degli operatori di classe traccia, allora, riducendosi a lavorare con stati puri, vale: ||ρ − ρ ||1 = 2 1 − (tr(ρρ ))2 se ρ, ρ ∈ Sp (H). (11.39) Equivalentemente:
||ψ(ψ| ) − ψ (ψ | )||1 = 2 1 − |(ψ|ψ )|2
se ψ, ψ ∈ H e ||ψ|| = ||ψ || = 1. (11.40) Pertanto Sp (H) `e uno spazio metrico se dotato della funzione distanza: d(ρ, ρ ) := 2 1 − (tr(ρρ ))2 per ogni ρ, ρ ∈ Sp (H). Dimostrazione. Possiamo dimostrare la seconda affermazione dato che la prima `e, banalmente, una trascrizione della seconda e la terza `e ovvia, se valgono le prime due, dalle propriet`a generali delle norme. Per dimostrare la seconda `e sufficiente costruire una base ortonormale ψ1 , ψ2 dello spazio generato da ψ e ψ , assumendo ψ1 = ψ e decomponendo ψ sulla stessa base. Si vede allora che, se b := (ψ |ψ2 ), vale: ψ(ψ| ) − ψ (ψ | ) = −|b|ψ1(ψ1 | ) + |b|ψ2 (ψ2 | ) . Dato che quella ottenuta `e la decomposizione spettrale di ρ − ρ , deve essere: |ρ − ρ| = |b|ψ1(ψ1 | ) + |b|ψ2(ψ2 | ) = |b|I , e quindi, dato che 1 = ||ψ ||2 = |(ψ |ψ1 )|2 + |(ψ |ψ2 )|2 , vale: ||ψ(ψ| ) − ψ (ψ | )||1 = tr(|b|I) = 2|b| = 2 1 − |(ψ |ψ1 )|2 = 2 1 − |(ψ |ψ)|2 . Questo completa la dimostrazione.
Osservazione 11.31. L’ultima affermazione nella tesi della proposizione `e interessante perch´e Sp (H) non `e uno spazio normato, non essendo uno spazio vettoriale. Tuttavia risulta essere uno spazio metrico (definizione 2.88) e la funzione distanza ha un significato fisico, essendo legata all’ampiezza di probabilit` a. Possiamo allora concludere che vale il seguente risultato che riappacifica fisica e matematica. Proposizione 11.32. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Sia G un gruppo topologico. Una rappresentazione proiettiva su H, G g → γg `e continua nel senso della definizione 11.29, e quindi G `e un gruppo di simmetria topologico per S, se e solo se `e continua adottando: (i) la topologia di G nel dominio, (ii) la topologia operatoriale forte, ristretta a Sp (HS ), nel codominio. Cio`e: lim ||γg (ρ) − γg0 (ρ)||1 = 0
g→g0
per ogni ρ ∈ Sp (HS ) e g0 ∈ G.
(11.41)
11.2 Introduzione ai gruppi di simmetria
551
Dimostrazione. La (11.39) implica che: < ||γg (ρ) − γg0 (ρ)||1 = 2 1 − tr (γg (ρ)γg0 (ρ)) . Se G g → γg `e continua nel senso della definizione 11.29 allora deve valere limg→g0 tr (γg (ρ)γg0 (ρ)) = tr (γg0 (ρ)γg0 (ρ)) = 1. Sostituendo nell’identit` a di sopra, si ha che vale (11.41). Viceversa, dalla (11.39) si ha anche che usando la propriet` a ciclica della traccia: 1 tr (γg0 (ρ)γg (ρ)) = 1 − ||γg (ρ) − γg0 (ρ)||21 , 4 a dato che γg0 `e suriettiva), ponendo poi ρ1 := γg0 (ρ) (senza perdere generalit` e ρ2 := ρ, abbiamo: lim tr (ρ1 γg (ρ2 )) = 1 −
g→g0
1 1 lim ||γg0 (ρ) − γg (ρ)||21 = 1 − ||γg0 (ρ) − γg0 (ρ)||21 4 g→g0 4 = tr (ρ1 γg0 (ρ2 )) .
Quindi (11.41) implica la continuit` a della rappresentazione nel senso della definizione 11.29. 11.2.5 Rappresentazioni unitarie proiettive fortemente continue Consideriamo un sistema fisico S, descritto sullo spazio di Hilbert HS , un suo gruppo di simmetria topologico, G con una rappresentazione proiettiva G g → γg . Associamo al gruppo di simmetria topologico una rappresentazione unitaria proiettiva G g → Ug , nel senso che γg (ρ) = Ug ρUg−1 , per ogni ` stato puro ρ ∈ Sp (HS ) del sistema e per ogni elemento del gruppo g ∈ G. E evidente che se G g → Ug `e fortemente continua, allora G g → γg `e una rappresentazione proiettiva continua, dato che la definizione 11.29 `e sempre soddisfatta essendo, se ρi = ψi (ψi | ) con i = 1, 2: tr ρ1 Ug ρ2 Ug∗ = |(ψ1 |Ug ψ2 )| → |(ψ1 |Ug0 ψ2 )| = tr ρ1 Ug0 ρ2 Ug∗0 se g → g0 . Un problema interessante, che si pone immediatamente, `e allora quello di stabilire se, sapendo che G g → γg `e continua, sia possibile fissare le fasi arbitrarie per gli operatori unitari Ug in modo da ottenere una rappresentazione unitaria proiettiva che sia fortemente continua. Cio`e: Ug ψ → Ug0 ψ
se g → g0 e per ogni ψ ∈ H.
Il problema `e molto difficile nel caso generale, bench`e esista un risultato generale locale dovuto a Wigner. Mostreremo infatti che, se G `e un gruppo di simmetria topologico e G g → γg la sua rappresentazione proiettiva continua, allora `e possibile fissare i moltiplicatori ω di una sua rappresentazione
552
11 Introduzione alle Simmetrie Quantistiche
unitaria proiettiva G g → Ug , in modo tale che essa risulti fortemente continua in un intorno dell’elemento neutro del gruppo G ed i moltiplicatori stessi risultano continui in tale intorno. Tale risultato, in generale, non si estende a tutto il gruppo. Successivamente useremo questo risultato, restringendoci al caso di G = R, per provare che in quel caso, non solo il risultato detto si estende a tutto il gruppo, ma `e possibile porre tutti i moltiplicatori uguali a 1 ed ottenere una rappresentazione che `e, contemporaneamente, unitaria e fortemente continua. Le conseguenze fisiche di tale risultato sono molto profonde e riguarderanno la giustificazione del postulato di evoluzione temporale ed il legame tra l’esistenza di simmetrie e la presenza di quantit`a conservate sotto l’evoluzione temporale del sistema S: una formulazione quantistica del teorema di N¨other. Esamineremo pi` u avanti tali implicazioni, ora ci concentreremo solo sugli aspetti matematici. Proposizione 11.33. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS e sia G un gruppo topologico con rappresentazione proiettiva continua γ : G g → γg . Esistono un intorno aperto A ⊂ G dell’elemento neutro e ∈ G ed una rappresentazione unitaria proiettiva associata a γ, G g → Ug che `e continua su A nella topologia operatoriale forte. Infine i moltiplicatori: −1
ω(g, g ) = (Ug·g )
Ug Ug
per ogni g, g ∈ G
definiscono una funzione continua in un intorno aperto A di e con A ·A ⊂ A. Dimostrazione. Fissiamo φ ∈ H con ||φ|| = 1. Dato che G g → tr(φ(φ| ) γg (φ(φ| ))) `e continua e vale 1 per g = e, esiste un intorno aperto A0 di e in cui: tr(φ(φ| )γg (φ(φ| ))) = 0 . Rappresentiamo γ con una rappresentazione unitaria proiettiva V arbitraria, che esiste sempre per il teorema di Wigner. Per essa varr`a allora, nell’intorno A0 : 0 = tr(φ(φ| )γg (φ(φ| ))) = (φ|Vg φ) . Definiamo allora (e la condizione (φ|Vg φ) = 0 assicura che ci`o sia possibile): χg :=
(φ|Vg φ) |(φ|Vg φ)|
e quindi passiamo ad una nuova rappresentazione unitaria proiettiva, U , tale che: Ug := χg Vg per g ∈ A0 e Ug := Vg per g ∈ A0 . Con la scelta fatta risulta immediatamente che, in A0 : 0<
|(φ|Vg φ)|2 = (φ|Ug φ) |(φ|Vg φ)|
11.2 Introduzione ai gruppi di simmetria
553
e quindi: 0 < (φ|Ug φ) = |(φ|Ug φ)| = tr(φ(φ| )γg (φ(φ| )))
per ogni g ∈ A0 . (11.42)
La (11.42) ha due conseguenze, valide in qualche intorno aperto A di e con A ⊂ A0 : Ue = 1 , e Ug−1 = Ug−1 se g ∈ A. (11.43) Infatti, in generale deve essere Ue = χI per qualche χ ∈ U (1) e quindi (φ|Ue φ) = χ(φ|φ) = χ. Dato che (φ|Ue φ) > 0, l’unica possibilit` a `e χ = 1. Per quanto riguarda la seconda propriet` a, notiamo subito che deve essere Ug−1 = χg Ug−1 per qualche χg ∈ U (1), inoltre, essendo g → g−1 continua e valendo e−1 = e, ci deve essere un intorno aperto di e, A ⊂ A0 , per cui g−1 ∈ A0 se g ∈ A. Lavorando in A, vale, essendo (φ|Ug φ) reale per cui (φ|Ug φ) = (Ug φ|φ): 0 < (φ|Ug−1 φ) = χg (φ|Ug−1 φ) = χg (φ|Ug∗ φ) = χg (Ug φ|φ) = χg (φ|Ug φ) . a `e χg = 1. Abbiamo dimostrato Dato che (φ|Ug φ) > 0, l’unica possibilit` (11.43). Fissiamo ora ψ ∈ H con ||ψ|| = 1 non necessariamente coincidente con φ suddetto. Dalla continuit` a di γ, come nella definizione 11.29, con ρ1 = Us ψ(Us ψ| ) e ρ2 = ψ(ψ| ) segue che: lim |(Ur ψ|Us ψ)| = |(Us ψ|Us ψ)| = 1 .
r→s
(11.44)
e, scegliendo ρ1 = φ(φ| ) e ρ2 = ψ(ψ| ): lim |(φ|Ur ψ)| = |(φ|Us ψ)| .
r→s
(11.45)
Usando queste nelle identit`a generali: ||Us ψ − (Ur ψ|Us ψ)Ur ψ||2 = 1 − |(Ur ψ|Us ψ)|2 ,
(11.46)
si ottiene immediatamente che: lim (Ur ψ|Us ψ)Ur ψ = Us ψ
r→s
(11.47)
e quindi, in particolare, per ψ = φ: lim (Ur φ|Us φ)(φ|Ur φ) = (φ|Us φ) .
r→s
(11.48)
D’altra parte, con la nostra scelta di φ e della fase per U si ha: lim (φ|Ur φ) = lim |(φ|Ur φ)| = |(φ|Us φ)| = (φ|Us φ) ,
r→s
r→s
(11.49)
e dunque, usando la (11.49) in (11.48), si trova: lim (Ur φ|Us φ) = 1 .
r→s
(11.50)
554
11 Introduzione alle Simmetrie Quantistiche
Tenendo conto che, essendo Ut unitario, per ogni ψ ∈ H (quindi anche ψ = φ): ||Ur ψ − Us ψ||2 = 2 − 2Re(Ur ψ|Us ψ) ,
(11.51)
la (11.50) implica che, per r ∈ A, la funzione r → Ur φ `e continua, con la scelta di φ come all’inizio. Allora la funzione r → (Ur )−1 φ deve essere continua, dato che (11.48) deve valere anche per r sostituito da r −1 e s da s−1 essendo la funzione g → g−1 continua, e valendo infine (Ur )−1 = Ur−1 come provato in (11.43). Infine, dalla (11.47) segue allora che: lim (Ur ψ|Us ψ)(φ|Ur ψ) = (φ|Us ψ)
r→s
cio`e
lim (Ur ψ|Us ψ)((Ur )−1 φ|ψ) = (φ|Us ψ) ,
r→s
a di ma essendo ((Ur )−1 φ|ψ) → ((Us )−1 φ|ψ) = (φ|Us ψ) per la continuit` (Us )−1 φ vista sopra, deve risultare e dunque (Ur ψ|Us ψ) → 1 per r → s. Usando questo risultato nella (11.51), si ha infine: lim ||Ur ψ − Us ψ|| = 0 .
r→s
(11.52)
Per l’arbitrariet` a di ψ, abbiamo provato che A g → Ug `e fortemente continua. Proviamo la seconda affermazione della tesi. Valendo U (e) = 1 e Ug−1 = Ug−1 segue che su A: ω(g, e) = ω(e, g) = 1 . (11.53) Dall’uguaglianza: (Ur−1 φ|Us φ) = ω(r, s)−1 (φ|Ur·s φ) ,
(11.54)
e dal fatto che (φ|Ur·s φ) > 0 se r · s ∈ A, segue che (r, s) → ω(r, s)−1 `e continua se r, s, r · s ∈ A. Dato che il prodotto in G `e continuo e e · e = e, esiste sicuramente un intorno A ⊂ A di e per cui r, s ∈ A implica r · s ∈ A. Se A `e sufficientemente piccolo, anche A × A (r, s) → ω(r, s) = ω(r, s)−1 `e continua. 11.2.6 Il caso notevole del gruppo topologico R Enunceremo e proveremo qui una risultato molto importante, che riguarda le rappresentazioni continue del gruppo topologico additivo R dotato della topologia standard. Questo risultato `e di fondamentale importanza in fisica come vedremo in seguito. Teorema 11.34. Se R r → γr `e una rappresentazione proiettiva continua del gruppo topologico R nello spazio di Hilbert H, allora vale quanto segue. (a) Esiste un gruppo unitario ad un parametro fortemente continuo (nel senso della definizione 9.19) R r → Wr tale che: γr (ρ) = Wr ρWr−1
per ogni r ∈ R e ρ ∈ Sp (H).
(11.55)
11.2 Introduzione ai gruppi di simmetria
555
(b) Un altro gruppo unitario ad un parametro fortemente continuo R r → Ur soddisfa (11.55) (con Ur in luogo di Wr ) se e solo se esiste c ∈ R tale che: Ur = e−icr Wr
per ogni r ∈ R.
(c) Esiste un operatore autoaggiunto A : D(A) → H in H, unico a meno di una costante additiva tale che: γr (ρ) = e−irA ρeirA
per ogni r ∈ R e ρ ∈ Sp (H).
Dimostrazione. (a). Sia [−b, b] ⊂ A, con b > 0 un intervallo incluso nell’intorno aperto di 0, A ⊂ R, che soddisfa la tesi della proposizione 11.33 nel caso di G = R. Decomponiamo R come l’unione degli intervalli disgiunti (na, (n+1)a], con n ∈ Z, dove a = b/2. Quindi notiamo che, se r ∈ R allora r cade in uno solo degli intervalli disgiunti detti e quindi r = nr a+tr con un unico tr ∈ (0, a] per un unico nr ∈ Z. Allora deve valere, dato che γx γy = γx+y : γr = γnr a+tr = (γa )nr γtr . Di conseguenza si dovr` a anche avere, se R r → Ur `e la rappresentazione unitaria proiettiva individuata nella proposizione 11.33 e per ogni ρ ∈ Sp (HS ): −1
γr (ρ) = ((Ua )nr Utr ) ρ ((Ua )nr Utr )
.
Dato che, per t ∈ (−a − , a + ), per qualche > 0, la funzione t → Ut `e fortemente continua, si prova che la funzione: R r → Vr con Vr := (Ua )nr Utr dove nr ∈ Z e tr ∈ (0, a] sono determinati come detto sopra, `e una funzione fortemente continua. Gli unici punti di discontinuit` a possono essere gli estremi degli intervalli. Consideriamo dunque r ∈ (na, (n + 1)a] e verifichiamo che Vr `e continua in na. Se r− < na e r+ > na abbiamo: Vr− ψ = (Ua )(n−1)Utr− ψ
e
Vr+ ψ = (Ua )n Utr+ ψ .
Dato che (−a, a) t → Ut ψ `e continua, dalla definizione di V segue immediatamente che: lim Vr− ψ = Vna ψ . r− →na−
Per concludere non ci rimane che verificare che anche il limite destro coincide con quello sinistro. Dobbiamo cio`e provare che il limite di (Ua )(n−1)Utr− ψ, per tr− → a− coincide con il limite di (Ua )n Utr+ ψ per tr+ → 0−. Dimostriamo che `e vero. Vale: lim (Ua )n−1 Ut ψ =
t→a−
lim (Ua )n−1 ω(a, t − a)−1 Ua Ut−a ψ
t−a→0−
556
11 Introduzione alle Simmetrie Quantistiche
=
lim
t−a→0−
ω(a, t − a)−1 (Ua )n Ut−aψ = lim ω(a, τ )−1 (Ua )n Uτ ψ . τ→0−
Dalla dimostrazione della proposizione precedente sappiamo che (0, a] τ → ω(a, τ )−1 `e sicuramente continua, dato che a, τ, a + τ ∈ A per costruzione. Inoltre vale χ(a, 0) = 1 da (11.53). Sappiamo anche che (0, a] t → Ut ψ `e continua e pertanto: lim (Ua )n−1 Ut ψ = lim ω(a, τ )−1 (Ua )n Uτ ψ = lim ω(a, τ )−1 (Ua )n Uτ ψ
t→a−
τ→0−
τ→0+
= lim (Ua )n Ut ψ . t→0+
Abbiamo provato che: Vna ψ =
lim
r− →na−
Vr− ψ =
lim (Ua )(n−1)Utr− ψ =
tr− →a−
=
lim
r+ →na+
lim (Ua )n Utr+ ψ
tr+ →0+
Vr+ ψ ,
che `e quanto volevamo. Si noti ora che (Vr )−1 = (Utr )−1 (Ua )−nr = U−tr (Ua )−nr dove abbiamo usato la seconda identit` a in (11.43). Con una dimostrazione simile a quella fatta per Vr , si verifica che anche R r → (Vr )−1 `e continuo nella topologia operatoriale forte. Mostriamo ora che `e possibile fissare i moltiplicatori di V in modo che valgano tutti 1. Dimostriamo che i moltiplicatori di V definiscono una funzione continua R2 (r, s) → ω(r, s) ∈ U (1), usando il fatto che R t → Vt ψ e R t → (Vt )−1 ψ sono funzioni continue come appena provato. Poi mostreremo che tale funzione `e equivalente alla funzione che vale costantemente 1. Per definizione: ω(r, s)Vr+s = Vr Vs . Fissiamo r0 , s0 ∈ R. Devono esistere due vettori ψ, φ ∈ H \ {0} per i quali vale (ψ|Vr0 +s0 φ) = 0, se ci`o non fosse sarebbe Vr0 +s0 φ = 0 per ogni φ che `e impossibile per ipotesi, dato che Vt `e unitario. Per continuit` a, ci sar`a un intorno B di (r0 , s0 ) tale che, se (r, s) ∈ B, allora (ψ|Vr+s φ) = 0. Con questa scelta di vettori, vale: ω(r, s) =
((Vr )−1 ψ|Vs φ) . (ψ|Vr+s φ)
Concludiamo che R2 (r, s) → ω(r, s) ∈ U (1) `e continua nell’intorno di (r0 , s0 ), e quindi `e continua ovunque su R2 . Possiamo scrivere ω(r, s) = e−if(r,s) per qualche funzione f : R2 → R. Possiamo pensare la funzione continua ω come una funzione a valori sul cerchio di raggio unitario S1 , dato che U (1) `e omeomorfo a tale sottoinsieme di R2 . Si pu` o provare che `e sempre possibile scegliere la funzione f in modo che sia continua (dato che il gruppo
11.2 Introduzione ai gruppi di simmetria
557
fondamentale di R2 `e banale, applicando il teorema 18.2 in [Ser94II] sul sollevamento delle funzioni continue ai rivestimenti di spazi topologici, quanto detto `e immediato). L’equazione (11.30) diventa ora: f(s, t) − f(r + s, t) + f(r, s + t) − f(r, s) = 2πkr,s,t
per kr,s,t ∈ Z .
Dato che le funzioni continue trasformano insiemi connessi (R3 nel nostro caso) in insiemi connessi (un sottoinsieme di 2πZ con la topologia indotta da R, nel nostro caso), il secondo membro dell’identit`a scritta deve essere costante. Dato che per r = s = t = 0 il primo membro si annulla, deve allora valere: f(s, t) − f(r + s, t) + f(r, s + t) − f(r, s) = 0
per ogni r, s, t ∈ R . (11.56)
Fissiamo g : R → R differenziabile con continuit`a, con supporto compatto e tale che: dg g(x)dx = 1 e dx = 0 . (11.57) R R dx Definiamo infine la funzione continua: r dg dv − du f(u, v) f(r, v)g(v)dv , h(r) := − dv R R 0 e quindi poniamo χ(r) := e−ih(r) . Se cambiamo la rappresentazione V , passando alla nuova rappresentazione Wr = χ(r)Vr in modo tale che: e−if cio`e:
(r,s)
= ω (r, s) := ω(r, s)
χ(r)χ(s) , χ(r + s)
f (r, s) = f(r, s) − h(r + s) + h(r) + h(s) ,
il calcolo diretto di f (r, s), usando la definizione di h, (11.56), (11.57), e l’identit` a di facile verifica: r+s r s s du F (u) − du F (u) − du F (u) = du (F (u + r) − F (u)) , 0
0
0
0
produce f (r, s) = 0
cio`e χ (r, s) = 1 per ogni coppia (r, s) ∈ R2 ,
e quindi la nuova rappresentazione proiettiva unitaria R r → Wr `e unitaria. Dato che la funzione R x → χ(x) `e continua per costruzione e R r → Vr `e fortemente continua, concludiamo che la rappresentazione unitaria W = χV `e fortemente continua. In altre parole R r → Wr `e un gruppo unitario ad un parametro fortemente continuo, che soddisfa (11.55) e questo conclude la dimostrazione di (a).
558
11 Introduzione alle Simmetrie Quantistiche
(b). Si osservi innanzitutto che, se esiste un altro gruppo U unitario ad un parametro fortemente continuo che rappresenta γ, deve accadere che: U−r Wr ψ = χ(r)ψ
per ogni ψ ∈ H.
(11.58)
(L’indipendenza di χ(r) da ψ si dimostra facilmente come provato in altre simili situazioni.) Di conseguenza vale: Wr = χ(r)Ur . Moltiplicando membro a membro per Ws = χ(s)Us ed usando il fatto che sia W che U sono additivi nel parametro: Wr+s = χ(r)χ(s)Ur+s
e quindi U−(r+s) Wr+s = χ(r)χ(s)I .
Per confronto con U−(r+s) Wr+s = χ(r + s)I, troviamo che deve valere: χ(r + s) = χ(r)χ(s) .
(11.59)
L’identit` a (11.58) ha un’altra conseguenza: (Ur φ|Wr ψ) = χ(r)(φ|ψ) . Per il teorema di Stone (teorema 9.25), possiamo scrivere Ut = e−itB e Wt = e−itA, per due operatori autoaggiunti definiti su domini densi D(A) e D(B) rispettivamente. Scegliendo φ ∈ D(B) e ψ ∈ D(A) in modo che (φ|ψ) = 0 (e questo `e sempre possibile dato che i domini sono densi), ed applicando il teorema di Stone, dobbiamo concludere che R t → χ(r) deve essere derivabile valendo:
d d d
(Ur φ|Wr ψ) = Ur φ Wr ψ + Ur φ Wr ψ dt dt dt esiste e vale: (−iBUr φ|Wr ψ) + (Ur φ| − iAWr ψ) . Tenendo conto che χ `e derivabile e che vale (11.59), abbiamo immediatamente che: 1 1 d χ(x) = lim (χ(x + h) − χ(x)) = χ(x) lim (χ(h) − χ(0)) = χ(x)c . h→0 h h→0 h dx Dunque χ(x) = eicx per qualche reale c ∈ R e, di conseguenza: Wx = eicx Ux . Per computo diretto si vede subito che se, viceversa, W `e come in (a) e fissiamo c ∈ R, allora Ux := e−icx Wx `e un gruppo unitario ad un parametro fortemente continuo che rappresenta γ. (c). Il gruppo unitario ad un parametro fortemente continuo R r → Wr , che abbiamo costruito in (a), rappresenta γ ed ammette un generatore autoaggiunto A, per il teorema di Stone. Quindi Wr = e−irA . Se B : D(B) → H `e
11.2 Introduzione ai gruppi di simmetria
559
un secondo operatore autoaggiunto che rappresenta γ, allora il suo gruppo ad un parametro Ut = e−itB deve verificare quanto asserito in (b). Dunque deve esistere c ∈ R tale che: e−itA = e−itce−itB . Applicando il teorema di Stone si ha che il primo membro ammette derivata in senso forte, per t = 0, su D(A) ed essa vale −iA. Similmente, il secondo membro ammette derivata in senso forte, per t = 0, almeno su D(B), ed essa vale −icI − iB. Di conseguenza deve essere D(A) ⊂ D(B) e A = (cI + B)D(A) . Notiamo che cI + B `e autoaggiunto su D(B). Dato che A `e autoaggiunto, non ammette ulteriori estensioni autoaggiunte, per cui deve accadere che: D(A) = D(B) e A = B + cI. Esempi 11.35. (1) Consideriamo (1) in esempi 11.17. Il sistema fisico `e una particella quantistica senza spin, descritta sullo spazio di Hilbert L2 (R3 , dx), nel momento in cui si fissa un sistema di riferimento inerziale e si identifica R3 con lo spazio di quiete del riferimento, facendo uso di coordinate cartesiane ortonormali solidali con il riferimento. Il gruppo speciale delle isometrie ISO(3) di R3 pu` o essere definito come il gruppo delle funzioni (t, R) da R3 in R3 del tipo: (t, R) : R3 x → t + Rx ,
(11.60)
con t ∈ R3 e R ∈ SO(3). Abbiamo qui specializzato R ∈ SO(3) invece che R ∈ O(3), e questo spiega la lettera S in ISO(3). ISO(3) pu` o essere pensato come gruppo topologico nel seguente modo. Consideriamo il gruppo matriciale costituito dalle matrici reali 4 × 4: + * 1 0t g(t,R) := per ogni t ∈ Rn e R ∈ SO(3). (11.61) t R La topologia `e quella ereditata da GL(4, R) cio`e da R16 . Deve essere chiaro che le matrici g(t,R) sono in corrispondenza biunivoca con gli elementi di ISO(3) e che l’applicazione ISO(3) (t, R) → g(t,R) `e dunque un isomorfismo gruppale oltre che una rappresentazione lineare di ISO(3). Per esplicitare, in questa realizzazione, l’azione di ISO(3) sui punti di R3 , immaginiamo tali punti come i vettori colonna di R4 della forma (1, x1, x2 , x3 )t , dove x1 , x2 , x3 sono le coordinate cartesiane del punto x ∈ R3 . Ritroviamo in questo modo che l’azione di g(t,R) su R3 `e esattamente quella descritta in (11.60). Possiamo indifferentemente pensare ISO(3) come gruppo di funzioni (11.60) o come gruppo di matrici (11.61). In ogni caso, d’ora in poi lo pensiamo come gruppo topologico. Si osservi che possiamo realizzare tutto IO(3) come gruppo topologico matriciale, semplicemente permettendo a R di variare in tutto O(3). Nella nostra costruzione e con la topologia che abbiamo assegnato ai due gruppi, ISO(3) risulta essere un sottogruppo topologico di IO(3) che ne `e anche l’unica componente connessa che include l’elemento neutro (0, I). La rappresentazione lineare unitaria di ISO(3) su L2 (R3 , dx) che abbiamo visto nell’esempio (1) in esempi 11.17: (UΓ ψ) (x) := ψ(Γ −1 x)
per ogni Γ ∈ ISO(3) e ψ ∈ L2 (R3 , dx)
560
11 Introduzione alle Simmetrie Quantistiche
`e fortemente continua, dato che, come si prova facilmente: ||UΓ ψ − UΓ0 ψ|| = ||UΓ −1 ◦Γ ψ − ψ|| → 0 se Γ → Γ0 . 0
(11.62)
In questo modo si ha che la rappresentazione unitaria fortemente continua ISO(3) Γ → UΓ , pensando l’azione di UΓ sugli stati puri di H = L2 (R3 , dx): γΓ (ψ(ψ| )) := UΓ ψ (ψ| ) UΓ−1 , rende ISO(3) gruppo di simmetria topologico per la particella quantistica senza spin. (2) In questo esempio Pi `e l’operatore autoaggiunto che individua l’osservabile impulso l’ungo l’asse xi e P indica il vettore colonna di operatori (P1 , P2, P3 )t . In riferimento al precedente esempio, concentriamoci ora sul sottogruppo delle traslazioni lungo l’asse, generico, t ∈ R3 . Tale sottogruppo `e il gruppo unitario (t) ad un parametro fortemente continuo: R r → Ur , con: Ur(t)ψ (x) := ψ(x − rt) per ogni t ∈ R e ψ ∈ L2 (R3 , dx) . Si dimostra abbastanza facilmente che l’operatore simmetrico t · P S(R3 ) `e essenzialmente autoaggiunto e quindi (vedi il lemma 10.8) che: r e−i t·PS(R3 ) ψ (x) = ψ(x − rt) per ogni ψ ∈ L2 (R3 , dx). (11.63) Pertanto concludiamo che: l’operatore autoaggiunto, richiesto esistere in (c) del teorema 11.34, che genera il gruppo unitario ad un parametro fortemente continuo delle traslazioni lungo l’asse t `e, a parte la costante moltiplicativa −1 , l’operatore impulso in tale direzione, cio`e l’unica estensione autoaggiunta di 1 t · PS(R3 ) . Si osservi che tale generatore pu`o comunque essere modificato con una costante additiva. 11.2.7 Richiami sui gruppi e algebre di Lie In quest’ultima sezione assumeremo che il lettore sia familiare con la nozione di variet` a differenziabile, includendo il caso di variet` a analitica reale (le nozioni fondamentali sono richiamate con un certo dettaglio in Appendice B) e richiameremo di seguito alcuni risultati fondamentali [NaSt84, War75, Kir74] della teoria dei gruppi di Lie, dando qualche esempio, senza dimostrazioni. Definizione 11.36. Un gruppo di Lie reale di dimensione n `e una variet` a analitica reale di dimensione n, G, dotata di due applicazioni analitiche reali: G g → g −1 ∈ G e G × G (g, h) → g · h ∈ G ,
11.2 Introduzione ai gruppi di simmetria
561
(dove G × G `e dotata della struttura analitica reale prodotto) rispetto alle quali G risulti essere un gruppo con elemento neutro e. La dimensione del gruppo di Lie G `e la dimensione n di G nel senso delle variet` a differenziabili. Osservazione 11.37. La richiesta di analiticit` a nella definizione 11.36 pu` o essere indebolita fino a considerare G come una variet` a di classe C 0 con operazioni di gruppo continue rispetto alla topologia della variet` a (quindi gruppi topologici, di Hausdorff, paracompatti, localmente omeomorfi a Rn ). In effetti, un famoso teorema di Gleason, Montgomery e Zippin del 1952 – che fornisce una risposta al quinto problema di Hilbert– prova quanto segue. Teorema 11.38. (Di Gleason, Montgomery e Zippin.) Ogni gruppo topologico, che sia anche una variet` a topologica (cio`e di classe C 0 ), ammette sempre una sotto-struttura differenziabile reale analitica, rispetto alla quale le operazioni di gruppo sono funzioni analitiche reali. Tale struttura `e univocamente determinata dalla struttura C 0 e dalle operazioni gruppali. Quindi ogni gruppo di Lie `e sempre pensabile, ed in modo univoco, come gruppo di Lie analitico, anche quando `e definito usando solo la struttura di variet` a C 0 e richiedendo solo la continuit` a delle operazioni gruppali. Definizione 11.39. Consideriamo due gruppi di Lie G e G , con elementi neutri e ed e rispettivamente e leggi di composizione ·, ◦ rispettivamente. Un omomorfismo di gruppi di Lie `e un’applicazione analitica reale f : G → G che `e anche omomorfismo gruppale. Nel caso in cui l’omomorfismo di gruppi di Lie f : G → G sia biettivo ed f −1 sia a sua volta un omomorfismo di gruppi di Lie, f si dice isomorfismo di gruppi di Lie. In tal caso i gruppi di Lie G e G si dicono isomorfi (secondo f). Un omomorfismo locale di gruppi di Lie, `e un’applicazione analitica h : Oe → G , dove Oe ⊂ G `e un intorno aperto di e e vale h(g1 · g2) = h(g1 )◦ h(g2 ) purch`e g1 · g2 ∈ Oe . (Questo implica che h(e) = e3 ed anche h(g−1 ) = h(g)−1 se g, g−1 ∈ Oe .) Se l’omomorfismo locale h `e anche un diffeomorfismo analitico sulla sua immagine, data da un intorno aperto Oe di e in G , e la funzione inversa f −1 : Oe → G `e un omomorfismo locale, allora h `e detto isomorfismo locale di gruppi di Lie. In tal caso G e G si dicono localmente isomorfi (secondo h). Nello stesso spirito dell’osservazione precedente si possono indebolire le richieste di differenziabilit`a nella definizione di omomorfismo locale [NaSt84]. Proposizione 11.40. Siano G e G gruppi di Lie, e sia Oe ⊂ G un intorno aperto dell’elemento neutro e di G. 3 Infatti vale h(e) = h(e · e) = h(e) ◦ h(e) e quindi applicando h(e)−1 , si ha e = h(e).
562
11 Introduzione alle Simmetrie Quantistiche
Se h : Oe → G `e una funzione continua che soddisfa h(g1 · g2 ) = h(g1 ) ◦ h(g2) se g1 · g2 ∈ Oe , allora h `e analitica reale e quindi definisce un omomorfismo locale di Gruppi di Lie. Due nozioni importanti per le nostre applicazioni sono quelle di sottogruppo ad un parametro e di algebra di Lie, che ora richiameremo. Sia G un gruppo di Lie con elemento neutro e e legge di moltiplicazione ·. Lo spazio tangente ad un punto g ∈ G sar`a al solito indicato con Tg G. Ogni elemento g ∈ G definisce un’applicazione differenziabile (analitica reale) Lg : G h → g · h. Indichiamo con dLg : Th G → Tg·h G il differenziale di tale applicazione. Fissato T ∈ Te G, consideriamo il problema di Cauchy del prim’ordine su G: trovare una funzione differenziabile f : (−α, β) → G, con α, β > 0 tale che: df = dLf(t) A con f(0) = e. dt La soluzione massimale del problema posto, risulta essere sempre completa, cio`e con dominio (−α, β) = R. Indicheremo tale soluzione con con: R t → exp(tT ) e la chiameremo sottogruppo ad un parametro generato da A. Si dimostra che vale: exp(tT ) exp(t T ) = exp((t + t )T ) ,
(exp(tT ))−1 = exp(−tT ) se t, t ∈ R.
Consideriamo ora T ∈ Te G fissato e la classe di applicazioni parametrizzate per t ∈ R: Ft,T : G g → exp(tT ) g exp(−tT ) . Dato che `e Ft,T (e) = e, sar` a dFt,T |e : Te G → Te G. Il differenziale dFt,T |e , indicato con: Ad Ft,T : Te G → Te G , `e detto l’aggiunto di Ft,T . Il commutatore [War75] `e l’applicazione da Te G× Te G in Te G data da: [T, Z] :=
d |t=0 (Ad Ft,T ) Z dt
per ogni coppia T, Z ∈ Te G .
Valgono le seguenti propriet` a del commutatore, per a, b ∈ R e A, B, C ∈ Te G: linearit` a a sinistra : antisimmetria : identit` a di Jacobi:
[aA + bB, C] = a[A, C] + b[B, C] , [A, B] = −[B, A] , [A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0 .
Si osservi che la prima e la seconda identit` a implicano che il commutatore sia bilineare. L’identit` a di Jacobi deriva dall’associativit` a del prodotto gruppale. Fissiamo un sistema di coordinate locali x1 , . . . , xn compatibili con la struttura differenziabile (analitica) di G e definito in un intorno aperto U dell’elemento neutro e, avendo cura di fare coincidere e con l’origine delle coordinate. La
11.2 Introduzione ai gruppi di simmetria
563
legge di composizione gruppale, sviluppata con Taylor fino al secondo ordine, assume la forma in coordinate su U × U : 3/2 ψ(X, X ) = X + X + B(X, X ) + O |X|2 + |X 2 | , (11.64) dove X, X ∈ Rn indicano i vettori colonna delle coordinate di una coppia di corrispondenti elementi gruppali g, g ∈ U , ed il cui prodotto g · g appartenga ancora a U . L’applicazione B : Rn × Rn → Rn `e bilineare. Si dimostra abbastanza facilmente che il commutatore di Lie, espresso nella base di Te G relativa alle coordinate dette, assume la forma: [T, T ] = B(T, T ) − B(T , T ) ,
(11.65)
dove ora T e T indicano (i vettori colonna di componenti di) vettori di Te G. Definizione 11.41. La struttura algebrica data da uno spazio vettoriale V con un’applicazione, detta commutatore (di Lie), { , } : V ×V → V che `e lineare a sinistra, antisimmetrica e soddisfa l’identit` a di Jacobi, `e detta algebra di Lie. Date due algebre di Lie (V, {, }) e (V , {, } ), un’applicazione lineare φ : V → V `e detta omomorfismo di algebre di Lie se soddisfa {φ(A), φ(B)} = φ({A, B}) per ogni A, B ∈ V. Nel caso in cui φ sia biettiva, si dice isomorfismo di algebre di Lie. Se G `e un gruppo di Lie, l’algebra di Lie costituita dallo spazio tangente Te G insieme al commutatore [ , ] `e detta algebra di Lie del gruppo G. Una sottoalgebra di Lie V di un’algebra di Lie (V, [ , ]) `e un sottospazio vettoriale che `e chiuso rispetto al calcolo del commutatore di Lie: [A, B] ∈ V se A, B ∈ V . Un ideale J di un’algebra di Lie (V, [ , ]) `e una sottoalgebra di Lie che soddisfa la propriet` a: [A, B] ∈ J
se A ∈ J e B ∈ V.
Un’algebra di Lie V si dice semplice se non contiene ideali diversi da {0} e da V, e si dice semisemplice se `e somma diretta di algebre di Lie semplici. Una delle propriet` a dei gruppi di Lie, pi` u importanti per le applicazioni in fisica, `e che l’algebra di Lie di un gruppo di Lie determina quasi completamente il gruppo stesso, come stabilito dai seguenti celebri e classici risultati [NaSt84]. Premettiamo un richiamo di topologia generale. Definizione 11.42. Se X `e uno spazio topologico, uno spazio topologico R `e detto rivestimento di X se esiste una funzione continua suriettiva π : R → X, detta funzione di rivestimento, tale che, (i) per ogni x ∈ X, esiste un aperto U x tale che π −1 (U ) = ∪j∈J Aj con Aj ⊂ R aperto e Aj ∩ Ai = ∅ se i = j, per ogni i, j ∈ J, (ii) πAj : Aj → U `e un omeomorfismo, per ogni j ∈ J. Un rivestimento R di X `e detto rivestimento universale di X, se R `e semplicemente connesso (vedi appendice).
564
11 Introduzione alle Simmetrie Quantistiche
Se R e R sono rivestimenti universali di X, essi sono omeomorfi tramite un omeomorfismo f : R → R che soddisfa Π = f ◦Π , se Π : R → X e Π : R → X sono le due mappe di rivestimento. Similmente, se X ammette un rivestimento universale R ed un rivestimento R , con mappe di rivestimento Π : R → X e π : R → X, allora esiste una mappa di rivestimento p : R → R tale che: π ◦ p = Π. [Ser94II] Teorema 11.43. Se V `e un’algebra di Lie (reale) di dimensione finita, vale quanto segue. (a) Esiste un gruppo di Lie (reale), GV , connesso, semplicemente connesso, che ammette V come algebra di Lie del gruppo. (b) GV `e determinato a meno di isomorfismi di gruppi di Lie e risulta identificarsi con il rivestimento universale di ogni gruppo di Lie che ammette V come algebra di Lie, in modo tale che la mappa di rivestimento sia un omomorfismo di gruppi di Lie. (c) Se un gruppo di Lie G ammette V come algebra di Lie allora `e isomorfo ad un gruppo quoziente GV /HG , dove HG ⊂ GV `e un sottogruppo normale discreto che `e incluso nel centro di GV . Teorema 11.44. (Di Lie.) Se G e G sono gruppi di Lie (reali), con rispettive algebre di Lie V e V , vale quanto segue. (a) f : V → V `e un omomorfismo di algebre di Lie se e solo se esiste un omomorfismo locale di gruppi di Lie h : G → G tale che dh|e = f. Inoltre: (i) h `e individuato unicamente da f, (ii) f `e isomorfismo di algebre di Lie se e solo se h `e isomorfismo locale di gruppi di Lie. (b) Se G e G sono connessi e G `e semplicemente connesso, allora f : V → V `e un omomorfismo di algebre di Lie se e solo se esiste un omomorfismo di gruppi di Lie h : G → G tale che dh|e = f. Inoltre: (i) h `e individuato unicamente da f, (ii) se f `e isomorfismo di algebre di Lie allora h `e suriettiva, (iii) se f `e isomorfismo di algebre di Lie e G `e semplicemente connesso allora h `e isomorfismo di gruppi di Lie. Definizione 11.45. Se G `e un gruppo di Lie, G ⊂ G `e una sottovariet` a (embedded) di G e G `e gruppo rispetto alle operazioni di gruppo di G ristrette a G , allora G acquista naturalmente una struttura di gruppo di Lie indotta da quella di G. In tal caso G si dice sottogruppo di Lie di G. Si dimostra che l’algebra di Lie di G `e una sottoalgebra di Lie di G, nel senso che Te G `e sottospazio vettoriale di Te G e il commutatore su Te G `e la restrizione del commutatore di Te G a Te G [NaSt84]. Teorema 11.46. (Di Cartan.) Se G ⊂ G `e un sottogruppo chiuso del gruppo di Lie G, allora `e anche sottogruppo di Lie di G.
11.2 Introduzione ai gruppi di simmetria
565
Osservazioni 11.47. (1) A priori un’algebra di Lie pu` o non avere dimensione finita come spazio vettoriale, tuttavia la dimensione dell’algebra di Lie di un gruppo di Lie G, nel senso della teoria degli spazi vettoriali, `e sempre finita perch´e coincide con la dimensione del gruppo di Lie G. (2) Il teorema 11.46 include, ovviamente, il caso degenere di un sottogruppo discreto. In tal caso la variet`a differenziabile del sottogruppo di Lie ha dimensione zero. (3) Sia G `e un gruppo di Lie di dimensione n e {T1 , . . . Tn } una base nella sua algebra di Lie Te G. Dato che il commutatore `e bilineare sull’algebra ed `e a valori nell’algebra, avr` a una rappresentazione in componenti: [Ti , Tj ] =
dimT e G
Cijk Tk .
k=1
I numeri Cijk sono detti costanti di struttura del gruppo4 . La condizione di Jacobi equivale alla condizione sulle costanti di struttura (la prova `e ovvia): n
(CijsCskr + CjksCsir + Ckis Csjr ) = 0 per r = 1, . . . , n.
(11.66)
s=1
Se due gruppi di Lie hanno le stesse costanti di struttura, rispetto a due basi nelle rispettive algebre di Lie, allora sono localmente isomorfi nel senso dei teoremi 11.43 e 11.44. (La prova segue dal fatto che, se le costanti di struttura sono le stesse, l’applicazione lineare che identifica le due basi `e un isomorfismo di algebre di Lie.) Viceversa, se due gruppi di Lie sono localmente isomorfi, allora devono avere le stesse costanti di struttura in basi collegate dal differenziale dell’isomorfismo locale. Se G `e un gruppo di Lie l’applicazione, detta exponential map: exp : Te G T → exp(tT )|t=1 `e una funzione analitica reale. L’exponential map ha un’importante propriet` a sancita dal seguente teorema [NaSt84]. Teorema 11.48. Sia G un gruppo di Lie con elemento neutro e ed exponential map exp. Valgono i fatti seguenti. (a) Esistono un intorno aperto U del vettore nullo 0 ∈ Te G ed un intorno aperto V di e ∈ G, tali che expU : U → V `e un diffeomorfismo analitico reale (cio`e una funzione biettiva analitica reale con inversa analitica reale). 4 Tali costanti sono le componenti di un corrispondente tensore che viene detto tensore di struttura del gruppo di Lie.
566
11 Introduzione alle Simmetrie Quantistiche
(b) Se G `e compatto allora exp(Te G) = G. (c) Se G `e un gruppo di Lie, con exponential map exp , ed h : G → G `e un omomorfismo di gruppi di Lie, allora: h ◦ exp = exp ◦ dh|e . La propriet` a (a) stabilita nel teorema 11.48 ha la seguente utile conseguenza. Se fissiamo una base T1 , . . . , Tn nell’algebra di Lie di un gruppo di Lie G, l’inversa dell’applicazione: F : (x1 , . . . , xn) → exp
n
xn Tn
,
k=1
definisce una carta locale, compatibile con la struttura analitica, nell’intorno dell’elemento neutro. Tale sistema di coordinate si chiama sistema di coordinate normali. Le coordinate normali, in generale, non ricoprono G. In coordinate normali, un vettore T ∈ Te G ≡ Rn individua un punto di G nell’intorno di e. Pertanto la moltiplicazione gruppale tra elementi di G si esprime come una funzione ψ : Rn × Rn → Rn . Sviluppando con Taylor la funzione ψ nell’intorno dell’origine di Rn × Rn , si ha: 3/2 1 , ψ(T, T ) = T + T + [T, T ] + O |T |2 + |T 2 | 2
(11.67)
essendo [T, T ] : Rn × Rn → Rn il commutatore di Lie espresso nella base di Te G ×Te G associata alle coordinate normali. Lasciamo la prova come esercizio per il lettore. Il punto (a) ha anche la seguente utile conseguenza, la cui elementare dimostrazione `e lasciata per esercizio. Proposizione 11.49. Sia G un gruppo di Lie, con elemento neutro e e legge di composizione ·. Valgono i seguenti fatti. (a) Esiste un insieme aperto A e tale che, se g ∈ A, allora g = exp(tA) per qualche t ∈ R e A ∈ Te G. (b) Se G `e connesso e se g ∈ A, esiste un numero finito di elementi g1 , g2 , . . . , gn ∈ A tali che g = g1 · · · · · gn . Abbiamo infine la seguente fondamentale formula nota come formula di Baker-Campbell-Hausdorff [NaSt84]: exp(X) exp(Y ) = exp(Z(X, Y )) .
(11.68)
Essa vale per ogni gruppo G di Lie connesso e semplicemente connesso, se X e Y appartengono all’intorno aperto U del vettore nullo sul quale exp `e un diffeomorfismo locale a valori nell’intorno aperto dell’elemento neutro
11.2 Introduzione ai gruppi di simmetria
567
exp(U ) ⊂ G. Z(X, Y ) che appare in (11.68) `e definito dalla seguente serie: Z(X, Y ) = (−1)n−1 n
Nn>0
ri +si >0 ,1≤i≤n
n −1 ( i=1 (ri + si )) [X r1 Y s1 X r2 Y s2 . . . X rn Y sn ] r1 !s1 ! · · · rn !sn ! (11.69)
[X r1 Y s1 . . . X rn Y sn ] := [X, [X, · · · [X , [Y, [Y, · · · [Y, . . . [X, [X, · · · [X , [Y, [Y, · · · Y ]] · · ·]] 8 9: ;8 9: ; 8 9: ;8 9: ; r1 volte s1 volte rn volte sn volte
(11.70)
ed `e assunto che il secondo membro `e nullo se sn > 1 oppure se sn = 0 e rn > 1. Esempi 11.50. (1) M (n, R) indicher` a d’ora in poi l’insieme delle matrici reali n × n. La notazione M (n, C) ha l’analogo significato, sostituendo C a R. Il gruppo GL(n, R) delle matrici reali n × n invertibili `e un gruppo di Lie di dimensione n2 rispetto alla struttura di variet` a differenziabile analitica indotta 2 da Rn . L’algebra di Lie di GL(n, R) risulta essere data dall’insieme di matrici reali n × n, M (n, R) ed il commutatore risulta coincidere con il commutatore di matrici standard [A, B] := AB − BA, per ogni coppia A, B ∈ M (n, R). Una caratteristica importante di GL(n, R) `e che i suoi sottogruppi ad un parametro hanno la forma: R t → etA :=
+∞ k k=0
t k A , k!
per ogni A ∈ M (n, R), dove la convergenza della serie `e riferita ad ognuna 2 2 delle possibili norme equivalenti che possiamo mettere su Rn (o Cn ) per renderlo spazio di Banach (vedi la sezione 2.6). (2) Tutti i sottogruppi matriciali chiusi di qualche GL(n, R), che abbiamo gi`a incontrato come gruppi topologici, come O(n), SO(n), IO(n), ISO(n), SL(n, R), il gruppo di Galileo, di Lorentz e di Poincar´e, sono dunque gruppi di Lie. Dato che GL(n, C) pu` o essere visto come un sottogruppo di GL(2n, R) (banalmente decomponendo ogni elemento di ogni matrice in parte reale e complessa) anche i gruppi matriciali complessi, come U (n), SU (n) sono gruppi ` importante precisare che lavorare con gruppi di Lie matriciali di Lie reali. E non `e una fortissima restrizione, in quanto si pu` o provare [War75] che ogni gruppo di Lie compatto `e isomorfo ad un gruppo di Lie matriciale. Per i gruppi di Lie non compatti il teorema non vale, un controesempio tipico `e il rivestimento universale del gruppo SL(2, R).
568
11 Introduzione alle Simmetrie Quantistiche
(3) L’esponenziale di matrici A, B ∈ M (n, C) ha alcune interessanti propriet`a. Prima di tutto eA+B = eA eB = eB eA sotto l’ipotesi che AB = BA. La prova `e la stessa che si fornisce nel caso in cui A e B siano numeri, usando lo sviluppo di Taylor dell’esponenziale. C’`e per`o un’altra utilissima propriet` a. Se A ∈ M (n, C) e per ogni t ∈ C, vale: det etA = ettr A ,
in particolare
det eA = etr A .
Dimostriamo questa identit`a. Si consideri l’applicazione C t → det etA . Vogliamo calcolarne la derivata per t arbitrario. Ci interessa cio`e: lim
h→0
dete(t+h)A − detetA det(etA ehA ) − detetA = lim h→0 h h = detetA lim
h→0
detehA − 1 h
purch´e l’ultimo limite esista. Vale ehA = I + hA + ho(h) , dove o(h) → 0 se 2 h → 0 nella topologia naturale di Cn per cui: lim
h→0
det e(t+h)A − detetA det(I + hA + ho(h)) − 1 = detetA lim . h→0 h h
Vale lo sviluppo (che si pu`o dimostrare in vari modi) det(I + hA + ho(h)) = 1 + h ni=1 Aii + h0(h). Inserendo sopra troviamo che: ddetetA = detetA trA . dt Ci`o prova anche che la funzione considerata `e infinitamente differenziabile. Quindi la funzione fA : C t → det etA soddisfa l’equazione differenziale: dfA (t) = (tr A)fA (t) . dt La funzione gA : C t → ettr A soddisfa banalmente la stessa equazione differenziale. Entrambe le funzioni soddisfano la condizione iniziale fA (0) = gA(0) = 1, di conseguenza per il teorema di unicit`a delle soluzioni massimali delle equazioni differenziali del prim’ordine, deve essere detetA = ettr A per ogni t ∈ R. (4) Il gruppo delle rotazioni n-dimensionali O(n) := {R ∈ M (n, R)| RRt = I} `e un gruppo di Lie importante in fisica. Il fatto che tale gruppo sia un sottogruppo di Lie di GL(n, R) `e evidente dal fatto che L’insieme {R ∈ 2 M (n, R) | RRt = I} sia chiuso nella topologia di Rn come si prova imme` chiaro che O(n) contiene i suoi punti di accumulazione: se diatamente. (E 2 Ak ∈ O(n) e Ak → A ∈ Rn per k → ∞ allora banalmente Atk → At e
11.2 Introduzione ai gruppi di simmetria
569
I = Ak Atk → AAt .) L’algebra di Lie di O(n), indicata con o(n), `e data dallo spazio vettoriale delle matrici n × n reali antisimmetriche. Tale spazio (e quindi il gruppo di Lie O(n)) ha dimensione n(n − 1)/2. La dimostrazione di questa affermazione segue dal fatto che gli elementi dell’algebra di Lie si ˙ ottengono come i vettori R(0) tangenti all’elemento neutro del gruppo (la matrice identit` a) delle curve R = R(u) che soddisfano R(u)R(u)t = I e R(0) = I. t ˙ ˙ t = 0, Per definizione dunque, i vettori detti soddisfano: R(0)R(0) + R(0)R(0) t ˙ ˙ cio`e: R(0) + R(0) = 0. Tale spazio `e quello delle matrici antisimmetriche reali n × n che ha dimensione n(n − 2)/2 come si prova facilmente. Si osservi infine che O(n) `e compatto essendo chiuso e limitato: ⎛ ⎞ n n n 2 ⎝ ⎠ ||R|| = Rij Rij = δii = n per ogni R ∈ O(n) . i=1
j=1
i=1
Il gruppo di Lie matriciale di dimensione 3, O(3) ha due componenti connesse date rispettivamente da: il gruppo SO(3) := {R ∈ O(3)| detR = 1} di Lie matriciale compatto (e connesso) e l’insieme compatto (che non `e sottogruppo), dove P := −I `e l’inversione di parit` a: PSO(3) := {PR ∈ O(3) | R ∈ SO(3)}. (5) Nel caso di SO(3) l’exponential map ricopre tutto il gruppo come ora illustriamo. Introduciamo una base particolare di so(3), data dalle matrici (Ti )jk = −ijk , dove ijk = 1 se i, j, k `e una permutazione ciclica di 1, 2, 3; ijk = −1 se i, j, k `e una permutazione non ciclica di 1, 2, 3; ijk = 0 nei rimanenti casi. Esplicitamente ⎤ ⎤ ⎤ ⎡ ⎡ ⎡ 00 0 0 01 0 −1 0 T1 := ⎣ 0 0 −1 ⎦ , T2 := ⎣ 0 0 0 ⎦ , T3 := ⎣ 1 0 0 ⎦ . (11.71) 01 0 −1 0 0 0 0 0 Tali matrici sono antisimmetriche e quindi appartengono a so(3), inoltre `e immediato provare che sono linearmente indipendenti, per cui sono una base di so(3). Le costanti di struttura assumono una forma semplice in questa base: [Ti , Tj ] =
3
ijk Tk .
(11.72)
k=1
Vale la seguente rappresentazione esponenziale di SO(3). R ∈ SO(3) se e solo se esistono un versore n ∈ R3 e un numero θ ∈ R tale che R = eθn·T ,
dove n · T :=
3
ni Ti .
i=1
(6) Il gruppo SU (2), visto come gruppo di Lie reale, ha come algebra di Lie lo spazio vettoriale reale delle matrici antihermitiane con traccia nulla (quest’ultima condizione segue dalla richiesta che il determinate valga 1). Di
570
11 Introduzione alle Simmetrie Quantistiche
conseguenza, una base dell’algebra di Lie di SU (2) `e data dalle tre matrici − 2i σj , j = 1, 2, 3, dove le σk sono le matrici di Pauli σi definite in (11.10)(11.10). Il fattore 1/2 `e stato introdotto perch´e, con tale scelta, sono verificate le relazioni di commutazione: * +
3 iσi iσk iσj − = . (11.73) ijk − , − 2 2 2 k=1
In base a quanto osservato sotto il teorema 11.46, questo significa che le due algebre di Lie, quella di SU (2) e quella di SO(3) sono isomorfe. Dunque, in base ai teoremi 11.43 e 11.44 i due gruppi di Lie sono localmente isomorfi. Dato che SU (2) `e connesso e semplicemente connesso (si prova che `e omeomorfo al bordo S3 della palla unitaria di R3 ), mentre SO(3) non lo `e, SU (2) deve coincidere con il rivestimento universale di SO(3). L’isomorfismo di algebre di Lie si deve ottenere tramite il differenziale di un un omomorfismo suriettivo di gruppi di Lie da SU (2) a SO(3). Tale omomorfismo `e ben noto ed `e costruito come segue (vedi l’esercizio 11.16). Anche nel caso di SU (2) l’exponential map ricopre tutto il gruppo essendo SU (2) compatto. In pratica risulta che ogni matrice U ∈ SU (2) si scrive come, con ovvie notazioni, σ
U = e−iθn· 2
dove θ ∈ R e n `e un versore di R3 . L’omomorfismo suriettivo di cui sopra non `e altro che la mappa suriettiva: σ
R : SU (2) e−iθn· 2 → eθn·T ∈ SO(3) . Che l’applicazione non sia invertibile si vede chiaramente osservando che, sotto la trasformazione θ → θ + 2π, il secondo membro non cambia, mentre il primo cambia segno (per vederlo rapidamente basta ridursi al caso di n = e3 il versore della coordinata cartesiana x3 ). In effetti si prova facilmente che il nucleo dell’omomorfismo h contiene i due soli elementi ±I ∈ SU (2). 11.2.8 Gruppi di simmetria di Lie, teoremi di Bargmann, G˚ arding, Nelson, FS3 Per concludere la trattazione dei gruppi di simmetria ci occupiamo del caso in cui G `e un gruppo di Lie connesso. Per prima cosa osserviamo che ogni possibile rappresentazione proiettiva di G deve essere rappresentabile con operatori unitari e mai antiunitari. Vale infatti la seguente proposizione. Proposizione 11.51. Sia G un gruppo di Lie connesso. Per ogni rappresentazione proiettiva G g → γg gli elementi γg possono essere associati solo ad operatori unitari in base al teorema di Wigner (o Kadison). Dimostrazione. Per la proposizione 11.49, ogni elemento g ∈ G `e il prodotto di un numero finito di elementi di forma h = exp(tT ). Allora deve essere h = r · r con r = exp(tT /2). Applicando la proposizione 11.23 segue immediatamente la tesi.
11.2 Introduzione ai gruppi di simmetria
571
Ora ci occuperemo di illustrare brevemente qualche risultato generale interessante riguardante le rappresentazioni unitarie fortemente continue dei gruppi topologici che hanno struttura di Lie. Per prima cosa, dato che ci`o sar`a utile inseguito, osserviamo che ogni rappresentazione proiettiva di un gruppo topologico G si pu` o sempre vedere 6 come rappresentazione proiettiva del suo gruppo di rivestimento universale G. 6 → G `e l’omomorfismo continuo di rivestimento (la funzione Infatti, se π : G continua di rivestimento `e sempre pensabile come un omomorfismo continuo per i gruppi topologici [NaSt84]), e γ : G g → γg `e una rappresentazione 6 h → proiettiva continua di G nello spazio di Hilbert H, allora γ ◦ π : G 6 γπ(h) `e evidentemente una rappresentazione proiettiva continua di G, ed ha la 6 se π(h) = π(h ). In altre particolarit` a che non distingue due elementi h, h ∈ G −1 parole, se h · h ∈ Ker(π), allora γ ◦ π(h) = γ ◦ π(h ) cio`e: (γ ◦ π)(Ker(π)) = id, che equivale a dire Ker(π) ⊂ Ker(γ ◦ π). 6 il suo gruppo di rivestiProposizione 11.52. Sia G un gruppo topologico e G mento universale con omomorfismo di rivestimento π. Ogni rappresentazione proiettiva continua di G sullo spazio di Hilbert H, γ : G g → γg , si ottiene 6 g → γ su H da una opportuna rappresentazione proiettiva continua γ : G g che soddisfi Ker(π) ⊂ Ker(γ ), considerando la rappresentazione indotta su 6 G ≡ G/Ker(π). Osservazione 11.53. Nel seguito, quando ci far` a comodo studieremo le rap6 invece che quelle di G, dato che quelle presentazioni unitarie proiettive di G di secondo tipo sono individuate da quelle di primo tipo. Vogliamo ora provare un importante risultato dovuto a Bargmann [Bar54], che fornisce delle condizioni sufficienti affinch`e una rappresentazione proiettiva continua sia descrivibile da una rappresentazione unitaria. L’idea che precede il teorema `e quella gi` a discussa nella sezione 11.2.4, di vedere ogni rappresentazione unitaria proiettiva: G g → Ug di un gruppo G come restrizioni a G di una rappresentazione unitaria: ω g → Vg G ω di G. Questo `e sempre possibile in virt` di un’opportuna estensione centrale G u della proposizione 11.26. Assumiamo ora che G sia un gruppo di Lie e che la rappresentazione unitaria proiettiva G g → Ug induca una rappresentazione proiettiva continua. Sappiamo che possiamo scegliere le fasi degli operatori Ug in modo tale che nell’intorno dell’identit`a di G, la rappresentazione G g → Ug risulti essere continua per la proposizione 11.33. Tuttavia in generale non si riesce ad estendere questo risultato a tutto il gruppo G. Usando una ω e sfruttando la struttura di gruppo di Lie di G si ha pi` rappresentazione di G u fortuna, infatti sussiste il seguente importante risultato tecnico, che citiamo senza dimostrazione [Kir74].
572
11 Introduzione alle Simmetrie Quantistiche
Teorema 11.54. Si consideri un gruppo di Lie connesso G ed una rappresentazione proiettiva continua sullo spazio di Hilbert H, G g → γg . Esi ω ed una rappresentazione unitaria fortemente stono un’estensione centrale G continua: ω (χ, g) → V(χ,g) G con ω(e, e) = 1 e V(χ,e) = χI per ogni χ ∈ U (1) e vale quanto segue: ω risulta essere un gruppo di Lie connesso (con struttura differen(a) G ziabile differente da quella prodotto, nel caso generale), gli omomorfismi di ω e di proiezione canonica G ω → G sono inclusione canonica U (1) → G omomorfismi di gruppi di Lie. ω in un intorno dell’identit` (b) La struttura differenziabile di G a risulta essere quella prodotto della struttura differenziabile standard di U (1) e di quella di G e la funzione ω : G ×G → U (1) `e ottenuta da quella in proposizione 11.33 per mezzo di una trasformazione di equivalenza in modo che risulti C ∞ in un intorno di (e, e). (c) L’applicazione (1, g) → V(1,g) risulta essere una rappresentazione unitaria proiettiva fortemente continua che induce G g → γg . Cio`e: −1 γg (ρ) = V(1,g) ρV(1,g)
per ogni g ∈ G e ρ ∈ Sp (H).
Assumiamo dunque, in base al teorema citato, che ogni rappresentazione proiettiva fortemente continua di un gruppo di Lie G si possa ottenere come una rappresentazione unitaria proiettiva fortemente continua di un’estensione centrale G che sia a sua volta un gruppo di Lie. Questo risultato consente di provare il teorema di Bargmann menzionato sopra. Vediamo euristicamente l’idea fondamentale della dimostrazione. Consideriamo un gruppo di Lie G (che nel teorema sar`a connesso e semplicemente ω . Come detto sopra, le connesso) e le sue estensioni centrali tramite U (1), G rappresentazione unitarie proiettive di G si possono tutte vedere come rappresentazioni propriamente unitarie delle estensioni centrali di G tramite U (1). ω siano Ci chiediamo allora quando le rappresentazioni unitarie continue di G riconducibili a rappresentazioni unitarie continue di G stesso. L’algebra di Lie ω `e, come spazio vettoriale, la somma diretta R ⊕ Te G. Le relazioni di di G commutazione si possono scrivere: [r ⊕ T, r ⊕ T ] = α(T, T ) ⊕ [T, T ] , dove r ⊕ T indica l’elemento generico di R ⊕ Te G e α : Te G × Te G → Te G `e una funzione bilineare antisimmetrica. Un modo alternativo con cui si trova spesso scritta tale relazione `e il seguente, fissando una base di Ge T : [Ti , Tj ] = αij I +
n k=1
Cijk Tk ,
(11.74)
11.2 Introduzione ai gruppi di simmetria
573
dove, `e stato scelto r = r = 0 ed, ovviamente, αij := α(Ti , Tj ). Questi numeri soddisfano, per costruzione, la condizione di antisimmetria αij = αji, ed un’altra condizione dovuta all’identit` a di Jacobi (e corrispondente alla (11.78) nelle ipotesi del teorema di Bargmann sotto): αij = αji , n (Cijs αsk + Cjks αsi + Ckis αsj ) . 0=
(11.75) (11.76)
s=1
I numeri αij vengono spesso denominati cariche centrali. L’idea centrale del teorema di Bargmann `e di cercare di ridefinire l’insieme dei generatori: Tk → Tk := βk I + Tk in modo tale che che i numeri βk riassorbano le cariche centrali, riottenendo le regole di commutazione l’algebra di Lie di G: [Ti , Tj ] =
n
Cijk Tk .
k=1
ω Se questo `e possibile, ci si aspetta che una rappresentazione unitaria di G si possa pensare come rappresentazione unitaria di G stesso. In riferimento alla (11.74), si capisce che questo `e vero quando i coefficienti βk risolvono ω ): l’equazione (si noti che le Cijk e le αij sono assegnate una volta noto G αij =
n
Cijk βk .
(11.77)
k=1
L’ipotesi del teorema di Bargmann espressa con la (11.79) non `e altro che la trascrizione della (11.77), come si vedr`a nella dimostrazione. In effetti la funzione lineare β che appare nelle ipotesi `e completamente individuata dai coefficienti βk dalla richiesta β(Tk ) := βk . Teorema 11.55. (Di Bargmann.) Sia G un gruppo di Lie connesso e semplicemente connesso. Ogni rappresentazione proiettiva continua di G sullo spazio di Hilbert H `e indotta da una rappresentazione unitaria fortemente continua su H, se la seguente richiesta `e soddisfatta. Per ogni applicazione bilineare antisimmetrica: α : Te G × Te G → R che soddisfa: α ([T, T ], T )+α ([T , T ], T )+α ([T , T ], T ) = 0
per ogni T, T , T ∈ Te G, (11.78)
esiste un’applicazione lineare β : Te G → R tale che: α(T, T ) = β ([T, T ])
per ogni T, T ∈ Te G.
(11.79)
574
11 Introduzione alle Simmetrie Quantistiche
Dimostrazione. Consideriamo una rappresentazione proiettiva continua γ : G g → γg sullo spazio di Hilbert H. Sappiamo, per il teorema 11.54, che `e possibile, scegliendo opportunamente la funzione dei moltiplicatori, definire ω di G tramite U (1), che sia un gruppo di Lie, ed un’estensione centrale G una rappresentazione unitaria proiettiva V : G g → Vg su H, fortemente continua, che induce γ. Gli omomorfismi di inclusione e proiezione canonica ω sono di gruppi di Lie, la struttura differenziabile nell’intorno dell’identit` a di G `e quella del prodotto U (1)×G ed infine, la funzione ω `e differenziabile rispetto alla struttura differenziabile di G × G nell’intorno di (e, e). La funzione dei moltiplicatori `e normalizzata in modo tale che ω(e, e) = ω(e, g) = ω(g, e) = 1 ω `e (1, e). (Come sappiamo, ci si pu`o sempre e quindi l’elemento neutro di G ricondurre a tale situazione con una trasformazione di equivalenza tramite una funzione costante, come precisato precedentemente.) Dal punto di vista ω `e lo spazio della struttura di spazio vettoriale reale, l’algebra di Lie di G R ⊕ Te G, dove ⊕ indica la somma diretta (non ortogonale, visto che non abbiamo definito alcuna nozione di prodotto scalare). Indicheremo con r ⊕ T gli elementi di tale spazio vettoriale, con r ∈ R e T ∈ Te G. Dalla definizione di commutatore di Lie, con qualche calcolo e facendo uso di (11.65), si ha che, ω ha se [ , ] `e il commutatore di Lie su Te G, il commutatore [ , ]ω su T1⊕e G la forma: [r ⊕ T, r ⊕ T ]ω = α(T, T ) ⊕ [T, T ] (11.80) dove α : Te G × Te G → R `e una funzione bilineare antisimmetrica che soddisfa la (11.78), in virt` u dell’identit` a di Jacobi per [ , ]ω . Vogliamo ora dimostrare ω `e il gruppo di Lie R ⊗ G, dove ⊗ indica che il rivestimento universale di G il prodotto diretto dei due gruppi di Lie (R `e pensato come gruppo di Lie additivo). Si osservi che il prodotto diretto di due gruppi di Lie `e a sua volta un gruppo di Lie con la struttura analitica prodotto delle due strutture analitiche dei fattori. Il gruppo di Lie R⊗G, come spazio topologico, `e lo spazio topologico prodotto R×G ed `e pertanto semplicemente connesso dato che sia R che G sono semplicemente connessi. Per il teorema 11.43, deve quindi essere, a meno di isomorfismi di gruppi di Lie, l’unico gruppo di Lie semplicemente connesso con quella algebra di Lie e deve coincidere con il gruppo di rivestimento universale di tutti i gruppi di Lie che hanno l’algebra di Lie di R ⊗ G. Mostreremo che ω . L’algebra di Lie di R ⊗ G `e R ⊕ Te G come spazio vettoriale, uno di essi `e G mentre il commutatore di Lie vale: [r ⊕ T, r ⊕ T ]⊗ = 0 ⊕ [T, T ] .
(11.81)
Per dimostrare quanto detto `e sufficiente provare che esiste un isomorfismo di ω, algebre di Lie che trasformi l’algebra di Lie di R ⊗ G nell’algebra di Lie di G nell’ipotesi del nostro teorema, cio`e quando esiste la funzione β : Te G → R che soddisfi (11.79). Costruiamo tale isomorfismo di algebre di Lie. Fissiamo una base nell’algebra di Lie di G: T1 , . . . , Tn ed una corrispondente base: 1 ⊕ 0, 0 ⊕ T1 , . . . , 0 ⊕ Tn ∈ T(0,e) R ⊗ G
11.2 Introduzione ai gruppi di simmetria
575
nell’algebra di Lie di R ⊗ G. Consideriamo poi la nuova base nell’algebra di Lie di Gω , data da: 1 ⊕ 0, β(T1 ) ⊕ T1 , . . . , β(Tn ) ⊕ Tn ∈ T(1,e) Gω . Che questa sia una base `e evidente dal fatto che i vettori menzionati sopra sono linearmente indipendenti, se T1 , . . . , Tn sono una base per l’algebra di Lie di G. ω Consideriamo l’unica applicazione lineare biettiva f : T(0,e) R ⊗ G → T(1,e) G con: f(1 ⊕ 0) := 1 ⊕ 0 ,
f (0 ⊕ Tk ) := β(Tk ) ⊕ Tk
per k = 1, 2, . . . , n.
Dimostriamo che tale funzione conserva il commutatore di Lie, cio`e: [f(r ⊕ T ) , f(r ⊕ T )]ω = f([r ⊕ T , r ⊕ T ]⊗) , ed `e dunque un isomorfismo di Lie. Dato che f `e lineare ed i commutatori di Lie sono bilineari ed antisimmetrici, `e sufficiente provare questo fatto su coppie di elementi di base differenti. Evidentemente si ha che [f(1 ⊕ 0) , f(0 ⊕ Tk )]ω = 0 = f ([1 ⊕ 0 , 0 ⊕ Tk ]⊗ ). Per i rimanenti commutatori non banalmente nulli abbiamo che: [f(0 ⊕ Th ) , f(0 ⊕ Tk )]ω = [β(Th ) ⊕ Th , β(Tk ) ⊕ Tk ]ω = α(Th , Tk )[Th , Tk ] = β([Th , Tk ]) ⊕ [Th , Tk ] = β
n
Chks Ts
⊕
s=1
=
n s=1
Chks (β(Ts ) ⊕ Ts ) =
n
Chks f (0 ⊕ Ts ) = f
s=1
n
Chks Ts
s=1
n
Chks 0 ⊕ Ts
s=1
= f ([0, ⊕Th , 0 ⊕ Ts ]⊗ ) dove abbiamo indicato con Chks le constanti di struttura dell’algebra di Lie di G nella base T1 , . . . , Tn . Concludiamo che il gruppo di rivestimento universale di Gω `e R ⊗ G e che esiste un omomorfismo di gruppi di Lie suriettivo: ω , Π : R ⊗ G (r, g) → (χ(r, g), h(r, g)) ∈ G tale che (e questa condizione lo determina unicamente per il teorema 11.44): dΠ|(0,g) = f .
(11.82)
Ora studiamo l’omomorfismo Π in dettaglio, tenendo conto della struttura ω . Possiamo sempre di estensione centrale di G secondo U (1) che possiede G decomporre R ⊗ G (r, g) = (r, e) · (0, g) ,
576
11 Introduzione alle Simmetrie Quantistiche
dove (r, e) appartiene al sottogruppo di Lie R di R ⊗ G e (0, g) appartiene al sottogruppo di Lie G di R ⊗ G. Si dimostra facilmente che Π : (r, e) → (χ(r, e), e). Infatti Π trasforma (r, e) · (r, e) in: (χ(r, e), h(r, e)) · (χ(r, e), h(r, e)) = (χ(r, e)χ(r, e)ω(h(r, e), h(r, e)) , h(r, e)h(r, e)) . Dato che (r, e) · (r, e) = (2r, e) e che Π `e un omomorfismo, deve risultare che (χ(r, e)χ(r, e)ω(h(r, e), h(r, e)) , h(r, e)h(r, e)) = (χ(2r, e), h(r, e)) . Moltiplicando ambo i membri per (1, h(r, e)−1 ) si conclude, in particolare, che deve essere h(r, e) = e. Concludiamo che, se definiamo χ(r) := χ(r, e) allora deve valere: Π : (r, e) → (χ(r), e) e
χ(r)χ(r ) = χ(r + r ) per ogni r, r ∈ R.
La seconda identit`a segue subito dal fatto che ω(h(r, e), h(r , e)) = ω(e, e) = 1 e dal fatto che Π `e un omomorfismo. Definendo h(g) := h(0, g) e φ(g) := χ(0, g), possiamo allora scrivere che: ω . Π : R ⊗ G (r, g) → (χ(r)φ(g), h(g)) ∈ G
(11.83)
Studiamo ora l’applicazione h : (0, g) → g dimostrando che `e un isomorfismo di gruppi di Lie. Dato che Π `e un omomorfismo gruppale abbiamo che deve trasformare il prodotto (r, g) · (r , g ) nel prodotto delle immagini e pertanto vale: (χ(r), h(g)) · (χ(r), h(g )) = (χ(r + r )φ(g)φ(g )ω(h(g), h(g )) , h(gg )) . Si osservi che questo implica che la funzione h : G g ≡ (0, g) → h(g) ∈ G – dove il primo G `e pensato come sottogruppo di Lie di R ⊗ G – `e un omomorfismo gruppale. Dato che Π `e suriettiva, h deve essere suriettiva. Infine, dato ω (χ, s) → s ∈ G `e un omomorfismo suriettivo di gruppi di Lie che la funzione G per definizione di estensione centrale, concludiamo che h : G g → h(g) ∈ G `e un omomorfismo suriettivo di gruppi di Lie. Ricordando che vale la (11.82), si verifica facilmente che dh : 0 ⊕ Tk → Tk . Di conseguenza, per (iii) di (b) nel teorema 11.44, dh `e il differenziale, calcolato sull’identit`a, di un unico omomorfismo di gruppi di Lie da G (visto come sottogruppo di R ⊕ G) a G, che `e un isomorfismo di gruppi di Lie. Per costruzione, tale isomorfismo deve coincidere con h stesso. Per concludere studiamo la funzione dei moltiplicatori ω e la funzione φ : G → U (1). Vale φ(e) = 1, dato che Π : (0, e) → (1, e). Dato che Φ : (0, g) → (φ(g), h(g)) `e omomorfismo di gruppi di Lie e la struttura differenziabile (ana ω `e quella prodotto nell’intorno dell’identit` litica reale) di G a, la funzione φ sar`a
11.2 Introduzione ai gruppi di simmetria
577
differenziabile in un intorno dell’identit` a. La proiezione Π trasforma il prodotto (0, g) · (0, g ) nel prodotto delle immagini secondo Π. Di conseguenza deve essere: (φ(g)φ(g )ω(h(g), h(g )) , h(gg )) = (φ(gg ), h(gg )) , da cui: φ(g)φ(g )ω(h(g), h(g )) = φ(gg ) per ogni g, g ∈ G.
(11.84)
Possiamo allora concludere, esibendo una rappresentazione unitaria continua: U : G g → Ug che induce la rappresentazione proiettiva iniziale γ. Tenendo conto del fatto che che h : G → G `e un isomorfismo di gruppi di Lie, definiamo: Ug := φ(h−1 (g))Vg
per ogni g ∈ G.
Per costruzione questa rappresentazione unitaria proiettiva induce γ, dato che vale φ(h−1 (g)) ∈ U (1). D’altra parte vale anche, per (11.84): Ug Ug = φ(h−1 (g))φ(h−1 (g ))Vg Vg = ω(g, g )φ(h−1 (g))φ(h−1 (g ))Vgg = φ(gg )Vgg = Ugg . Pertanto la rappresentazione U `e una rappresentazione propriamente unitaria. Per concludere mostriamo che tale rappresentazione `e continua. Per costruzione, dato che la rappresentazione V `e continua, h−1 `e continuo, h−1 (e) = e e φ `e continua in un intorno di e, allora g → Ug = φ(h−1 (g))Vg `e sicuramente continua in un intorno A dell’elemento neutro e di G. Il fatto che U sia una rappresentazione di operatori unitari implica che sia continua (nella topologia operatoriale forte che stiamo considerando) ovunque. Infatti, se ψ ∈ H: ||Ug ψ − Ug0 ψ|| = ||Ug−1 (Ug ψ − Ug0 ψ)|| = ||Ug−1 g ψ − ψ|| → 0 se g → g0 . 0
0
g0−1 g
Abbiamo usato il fatto che ∈ A se g `e in un intorno sufficientemente piccolo di g0 essendo G un gruppo topologico. Osservazioni 11.56. (1) Si osservi che, in base ad un’osservazione fatta sopra, il teorema di Bargmann fornisce informazioni anche per il caso in cui il gruppo di Lie connesso non sia semplicemente connesso, pensando le sue rappresentazioni proiettive come rappresentazioni del rivestimento universale, che per costruzione `e sempre semplicemente connesso. (2) Esiste un modo alternativo e pi` u avanzato di enunciare il teorema di Bargmann facendo uso della teoria della coomologia dei gruppi di Lie. L’ipotesi di esistenza della funzione lineare β per ogni funzione bilineare antisimmetrica
578
11 Introduzione alle Simmetrie Quantistiche
α che soddisfi la (11.78) equivale a dire che il secondo gruppo di coomologia, H 2 (Te G, R), `e banale [BaRa86, Kir74]. Un risultato importante che si ottiene con tecniche di coomologia gruppale, `e che le ipotesi del teorema di Bargmann sono soddisfatte per in gruppo di Lie semplicemente connesso G, se la sua algebra di Lie `e semplice oppure semisemplice. Ora ci occuperemo del problema opposto, cio`e di come costruire delle rappresentazioni proiettive continue che rappresentino un gruppo di simmetria topologico individuato da un gruppo di Lie. Sappiamo che `e sufficiente saper costruire delle rappresentazioni unitarie continue delle estensioni centrali del gruppo. Per cui ci concentriamo sul problema di costruire rappresentazioni unitarie fortemente continue di un gruppo di Lie assegnato. L’idea `e quella di costruire tali rappresentazioni partendo da una rappresentazione dell’algebra di Lie del gruppo in termini di operatori autoaggiunti, con una procedura simile all’esponenziazione dei generatori di un gruppo di Lie. Dal punto di vista fisico, tale procedura `e interessante perch´e i generatori hanno spesso un preciso significato fisico. Nel prossimo capitolo vederemo che tali generatori (operatori autoaggiunti), rappresentano grandezze conservate durante il moto del sistema, se l’evoluzione temporale `e un sottogruppo del gruppo di simmetria. Per prima cosa ci occupiamo del problema di costruire una rappresentazione operatoriale dell’algebra di Lie di un gruppo di Lie, quando abbiamo una rappresentazione unitaria fortemente continua del gruppo di Lie. Consideriamo una rappresentazione unitaria fortemente continua del gruppo di Lie G: G g → Ug , sullo spazio di Hilbert H. Fissiamo, G, un sottogruppo ad un parametro R t → exp(tT ) associato all’elemento T ∈ Te G dell’algebra di Lie. Il teorema 9.25 di Stone ci assicura che vale: Uexp(tT ) = e−itAU (T )
per ogni t ∈ R,
(11.85)
dove AU (T ) `e un operatore autoaggiunto in H, non limitato nel caso generale (il segno − `e fissato per convenzione) con dominio D(AU (T )), completamente individuato dall’elemento T ∈ Te G. Diremo allora che che gli operatori autoaggiunti AU (T ), con T ∈ Te G sono i generatori della rappresentazione U . Essi sono definiti, dal teorema di Stone, come: AU (T )ψ := i
d |t=0 Uexp(tT ) ψ dt
se e solo se ψ ∈ D(AU (T )).
(11.86)
Riguardo al fatto che gli operatori −iAU (T ) definiscano una rappresentazione dell’algebra di Lie di G, possiamo dunque al massimo sperare che valgano relazioni del tipo: (AU (T )AU (T ) − AU (T )AU (T ))ψ = iAU ([T, T ])ψ
(11.87)
11.2 Introduzione ai gruppi di simmetria
579
per ψ ∈ D, dove D ⊂ D(AU (T )) e un sottospazio invariante sotto l’azione di tutti gli operatori AU (T ). In effetti `e ben noto [BaRa86] che un tale spazio D esista e sia denso in H. Una prima versione dello spazio in questione, che indicheremo con DG , si chiama spazio di G˚ arding, ed `e definito come il sottospazio di H che contiene tutti i vettori ψ tali che G g → Ug ψ e una funzione infinitamente differenziabile, calcolando le derivate nella topologia dello spazio di Hilbert ed in un qualsiasi sistema di coordinate locali su G. Si dimostra che, se ψ `e nello spazio di G˚ arding, allora DG risulta essere denso ed invariante sotto l’azione degli operatori AU (T ), inoltre l’applicazione Te G T → −iAU (T )DG `e una rappresentazione dell’algebra di Lie Te G, nel senso che si tratta di un’applicazione lineare che verifica la (11.87) [BaRa86]. Un risultato tecnicamente utile `e il seguente dovuto a G˚ arding [BaRa86] precisa, in particolare, che DG `e un core per i generatori. Teorema 11.57. (Di G˚ arding.) Sia G un gruppo di Lie e G g → Ug una rappresentazione unitaria fortemente continua sullo spazio di Hilbert H. Definito lo spazio DG e la rappresentazione dell’algebra di Lie Te G T → −iAU (T ) sullo spazio DG come precisato sopra, ogni operatore AU (T ) ed ogni polinomio p(AU (T )), per T ∈ Te G, `e essenzialmente autoaggiunto su DG . Esiste un secondo spazio DN con caratteristiche analoghe a quelle di DG , individuato da Nelson [BaRa86], che risulta pi` u utile dello spazio di G˚ arding per ricostruire la rappresentazione U , partendo dalla rappresentazione dell’algebra di Lie, ed esponenziandola. Per definizione, DN contiene i vettori ψ ∈ H tali che G g → Ug ψ sia una funzione analitica reale di g, cio`e sviluppabile in serie di potenze in un sistema di coordinate della struttura analitica del gruppo G nell’intorno di ogni punto. I vettori di DN si dicono vettori analitici della rappresentazione U e DN `e lo spazio dei vettori analitici della rappresentazione U . Dunque risulta che [BaRa86] DN ⊂ DG e, ancora, DN risulta essere invariante sotto l’azione degli operatori AU (T ) ed anche sotto l’azione di ogni Ug , g ∈ G. Infine, l’applicazione Te G T → −iAU (T )DN `e una rappresentazione dell’algebra di Lie Te G, nel senso che si tratta di un’applicazione lineare che verifica la (11.87) [BaRa86]. C’`e un importante legame tra vettori analitici nel senso di elementi di DN e vettori analitici nel senso del capitolo 9. Vale infatti la seguente importante proposizione dovuta a Nelson [BaRa86], che tra le altre cose implica immediatamente che DN `e denso in H, come detto sopra, dato che i vettori analitici di un operatore autoaggiunto formano un insieme denso come segue da (f) della proposizione 9.18. (Esso introduce un certo operatore, che diremo operatore di Nelson, che in certi casi `e legato agli operatori di Casimir [BaRa86] del gruppo che viene rappresentato.) Proposizione 11.58. Sia G `e un gruppo di Lie e G g → Ug `e una rappresentazione unitaria fortemente continua sullo spazio di Hilbert H. Sia T1 , . . . , Tn ∈ Te G una base dell’algebra di Lie di G. Definito l’operatore
580
11 Introduzione alle Simmetrie Quantistiche
di Nelson su DG : Δ :=
n
AU (Tk )2 ,
k=1
dove tutti gli operatori A(Tk ) sono pensati con dominio ristretto a DG , vale quanto segue. (a) Δ `e essenzialmente autoaggiunto. (b) Ogni vettore analitico dell’operatore autoaggiunto Δ `e un vettore analitico per la rappresentazione U (cio`e `e un elemento di DN ). (c) Ogni vettore analitico dell’operatore autoaggiunto Δ `e un vettore analitico per ogni operatore A(Tk ) (che `e quindi essenzialmente autoaggiunto su DN per il criterio di Nelson)5 . Possiamo enunciare il famoso teorema di Nelson che consente di associare a rappresentazioni dell’algebra di Lie delle rappresentazioni dell’unico gruppo di Lie semplicemente connesso associato a tale algebra di Lie. Teorema 11.59. (Di Nelson.). Si consideri un’algebra di Lie reale n-dimensionale, V , di operatori −iT (con ogni T simmetrico sullo spazio di Hilbert H, definito su un comune spazio vettoriale D in denso in H invariante sotto l’azione degli elementi di V ) e con commutatore di Lie `e dato l’ordinario commutatore di operatori. Sia T1 , · · · , Tn ∈ V una base di V e si definisca l’operatore di Nelson con dominio D: n Δ := Tk2 . k=1
Se Δ `e essenzialmente autoaggiunto, allora esiste una rappresentazione unitaria fortemente continua su H: GL g → Ug dell’unico gruppo di Lie GV , semplicemente connesso, che ammette V come algebra di Lie e tale rappresentazione `e unicamente determinata dalla richiesta che: T = AU (T ) per ogni T ∈ V. In particolare, gli operatori simmetrici T risultano essere essenzialmente autoaggiunti su D, essendo la loro chiusura autoaggiunta. Le ipotesi del teorema possono essere indebolite come provato da Flato, Simon, Snellman e Sternheimer come segue [BaRa86].
5
Gli asserti (a) e (b) costituiscono il teorema 2 nel capitolo 11 sezione 3 di [BaRa86]. Lo statement (c) segue dal lemma 7 nel capitolo 11 sezione 2 di [BaRa86] e da (c) in proposizione 9.18 di questo libro.
11.2 Introduzione ai gruppi di simmetria
581
Teorema 11.60. (FS3 (di Flato, Simon, Snellman e Sternheimer) .) Si consideri un’algebra di Lie reale n-dimensionale, V, di operatori −iT (con ogni T simmetrico sullo spazio di Hilbert H, definito su un comune spazio vettoriale D in denso in H invariante sotto l’azione degli elementi di V) e con commutatore di Lie `e dato l’ordinario commutatore di operatori. Sia T1 , · · · , Tn ∈ V una base di V. Se gli elementi di D sono vettori analitici per ogni operatore Tk , k = 1, . . . , n, allora esiste una rappresentazione unitaria fortemente continua su H: GL g → Ug dell’unico gruppo di Lie GV semplicemente connesso che ammette V come algebra di Lie e tale rappresentazione `e unicamente determinata dalla richiesta che: T = AU (T ) per ogni T ∈ V . In particolare gli operatori simmetrici T risultano essere essenzialmente autoaggiunti su D, essendo la loro chiusura autoaggiunta. Esempi 11.61. (1) Consideriamo due classi di operatori Pk e Xk , k = 1, 2, . . ., n, definiti su un sottospazio vettoriale denso D ⊂ H di uno spazio di Hilbert e supponiamo che risultino essere simmetrici su tale dominio. Assumiamo che tali operatori soddisfino, sul dominio detto, le relazioni di commutazione di Heisenberg discusse nel capitolo 10 (dove poniamo = 1): [−iXh , −iPk ] = −iδhk I
k, h = 1, . . . , n.
(11.88)
Possiamo allora completare le classi di operatori detti aggiungendo −iI tra i generatori. Gli operatori −iI, −iX1 , . . . , −iXn , −iP1 , . . . , −iPn formano in tal modo una base per l’algebra di Lie del gruppo di Heisenberg H (n) su R2n+1 introdotto al termine del capitolo 10. Tale gruppo di Lie `e semplicemente connesso. Il teorema di Nelson ci assicura che se, su D, l’operatore: Δ − I :=
n k=1
Xk2 +
n
Pk2
k=1
`e essenzialmente autoaggiunto (in realt`a si dovrebbe considerare Δ, ma d’altra parte `e evidente che Δ `e essenzialmente autoaggiunto se e solo se lo `e Δ − I), allora esiste un’unica rappresentazione unitaria e fortemente continua, H (n) (η, t, u) → H((η, t, u)) su H, che ammette gli operatori, che risultano dunque essere autoaggiunti: I, Xh =: Xh e Ph =: Ph , h = 1, . . . , n come generatori. Possiamo concludere che se la rappresentazione del gruppo di Heisenberg che abbiamo determinato `e irriducibile, allora, in base al teorema di Stone - von Neumann (ovvero al teorema 10.30), esiste una trasformazione unitaria da H a L2 (Rn , dx) che trasforma gli operatori Xh e Ph nei soliti operatori posizione ed impulso definiti nell’assioma A.5 del capitolo 10 (per il caso n = 3, oppure con l’ovvia generalizzazione negli altri casi). Un esempio elementare `e dato dal caso n = 1, con H = L2 (R, dx) e dagli operatori X , pensato come operatore moltiplicativo per la coordinata x, e
582
11 Introduzione alle Simmetrie Quantistiche
∂ P := −i ∂x , definendo D come lo spazio di Schwartz S(R). In questo caso, l’operatore Δ − I coincide con l’hamiltoniano dell’oscillatore armonico discusso nel capitolo 9. Δ − I ammette una base di autovettori date dalle funzioni di Hermite (che appartengono a S(R)), che formano una base hilbertiana di L2 (R, dx). Pertanto Δ − I (e quindi anche Δ, per la proposizione 9.18) ammette un insieme di vettori analitici (appunto le funzioni di Hermite) le cui combinazioni lineari finite sono dense nello spazio di Hilbert. Per il criterio di Nelson Δ − I `e essenzialmente autoaggiunto e quindi possiamo applicare il risultato di sopra. (2) Vale il seguente risultato sulla commutativit`a delle misure spettrali
Teorema 11.62. Siano A : D(A) → H e B : D(B) → H due operatori simmetrici. Se esiste un sottospazio denso D ⊂ D(A2 +B 2 )∩D(AB)∩D(BA) su cui A e B commutano e su cui A2 + B 2 `e essenzialmente autoaggiunto, allora A e B sono essenzialmente autoaggiunti su D e le misure spettrali di A e B commutano. La prova segue facilmente dal teorema 11.59 di Nelson.
11.2.9 Un esempio: il gruppo di simmetria SO(3) e lo spin Considereremo ora le rappresentazioni unitarie del gruppo SU (2), visto come gruppo di rivestimento universale di SO(3). Le rappresentazioni unitarie di SU (2) saranno usate per definire l’azione del gruppo di simmetria topologico (e di Lie) SO(3) – azione data da una rappresentazione proiettiva – sul sistema fisico dato da una particella di spin s. Consideriamo lo spazio di Hilbert L2 (R3 , dx) sul quale, fino ad ora, veniva descritto il sistema quantistico di una particella (dopo aver fissato un sistema di riferimento inerziale I, che identifica lo spazio R3 con il suo spazio di quiete, in relazione ad una terna di assi cartesiani ortonormali destrorsi, solidali con I stesso). L’esperienza mostra che questa descrizione non `e fisicamente adeguata: lo spazio di Hilbert L2 (R3 , dx) non `e sempre sufficiente a rendere conto della struttura fisica delle particelle reali. Le particelle reali possiedono una propriet` a fisica che si dice spin, individuata da un numero s costante che `e associato alla particella in modo simile alla massa, ma che pu`o assumere solo valori interi e semi interi s = 0, 1/2, 1, 3/2, . . .. Dal punto di vista fisico la propriet` a di avere spin significa che la particella ha un momento angolare intrinseco [CCP82] ed esistono osservabili, non rappresentabili tramite le osservabili fondamentali posizione ed impulso, che descrivono questo momento angolare intrinseco. Riassumiamo la struttura matematica coinvolta, rimandando a [CCP82] per un’esauriente discussione fisica su questo importantissimo argomento. Se la particella ha spin s = 0, la descrizione `e la solita di particella senza spin. Se la particella possiede spin s = 1/2, il suo spazio di Hilbert `e pi` u grande e coincide con il prodotto tensoriale L2 (R3 , dx) ⊗ C2 , dove C2 `e lo spazio (di
11.2 Introduzione ai gruppi di simmetria
583
Hilbert) dello spin. I tre operatori di spin sono le matrici hermitiane Sk := 2 σk , k = 1, 2, 3 e dove le matrici σk sono le matrici di Pauli introdotte precedentemente. In questo modo valgono le relazioni di commutazione: [−iSi , −iSj ] =
3
ijk (−iSk ) .
(11.89)
k=1
Le osservabili associate agli operatori di spin sono le tre componenti, rispetto agli assi del riferimento inerziale considerato, del momento angolare intrinseco della particella. Nel caso di spin s = 1/2, i valori possibili di ciascuna delle componenti sono solo −/2 e /2, come segue subito dal fatto che gli autovalori di ciascuna matrice di Pauli sono ±1. Nel caso di particelle con spin s generico, la descrizione `e la stessa, con l’eccezione che lo spazio di spin `e ora individuato da C2s+1 . In tale spazio, le matrici dei tre operatori di spin, Sk , non sono 2 σk , ma tre matrici hermitiane Sk che soddisfano ancora le relazioni (11.89) e tali che, ciascuna di esse, abbia 2s + 1 autovalori pari a: −s, −(s − 1), . . . , (s − 1), s, con autospazi di dimensione 1. Per la costruzione delle matrici Sk e l’analisi del concetto di spin rimandiamo a [CCP82]. Le uniche tre precisazioni che facciamo sono le seguenti. 3 (a) l’operatore S 2 := k=1 Sk2 risulta sempre soddisfare, se I : C2s+1 → C2s+1 `e la matrice identit` a: S 2 = 2 s(s + 1)I . (b) Lo spazio C2s+1 risulta essere irriducibile rispetto alla rappresentazione di SU (2) ottenuta esponenziando le matrici −iSk :
V (s) : SU (2) e−iθ 2 n·σ → e−iθn·S .
(11.90)
Al variare di s = 0, 1/2, 1, 3/2, . . ., a meno di equivalenza unitaria, le V (s) riproducono tutte le rappresentazioni irriducibili finito-dimensionale di SU (2). (c) La matrice S3 `e scelta in modo tale che coincida con diag(s, s − 1, . . . , −s + 1, −s). Solitamente la base hilbertiana di autovettori di S3 che viene quindi a coincidere con la base canonica di C2s+1 viene indicata con {|s, s3 }|s3|≤s . Gli stati puri Ψ (Ψ | ) della particella con spin s sono dunque individuati da un set di 2s + 1 funzioni d’onda ψs3 di L2 (R3 , dx) con norma unitaria, in modo tale che lo stato puro sia individuato dal vettore normalizzato a 1: Ψ= ψs3 ⊗ |s, s3 . |s3 |≤s
Dato che, in base alla decomposizione appena scritta, L2 (R3 , dx) ⊗ C2s+1 `e naturalmente isomorfo alla somma diretta ortogonale di 2s + 1 copie di L2 (R3 , dx), tali vettori si identificano con vettori colonna di funzioni d’onda: Ψ ≡ (ψs , ψs−1, · · · , ψ−s+1 , ψ−s )t
584
11 Introduzione alle Simmetrie Quantistiche
che nel gergo della Meccanica Quantistica vengono chiamati spinori di ordine s. Se s `e un numero intero, la rappresentazione SU (2) e−iθ 2 n·σ → e−iθn·S 2s+1 in C , associata alle tre matrici di spin, risulta essere una rappresentazione fedele di SO(3), dato che il nucleo ±I dell’omomorfismo di rivestimento SU (2) → SO(3) `e rappresentato dalla matrice I. Se s `e semi intero la rappresentazione scritta sopra risulta essere una rappresentazione fedele di SU (2). Ora mostreremo il legame che esiste tra momento angolare totale e gruppo SU (2), ovvero gruppo delle rotazioni SO(3). Nello spazio completo della particella con spin s, H = L2 (R3 , dx) ⊗ C2s+1 introduciamo gli operatori di momento angolare (totale): Jk = Lk ⊗ I + I ⊗ Sk ,
(11.91)
dove gli operatori di momento angolare orbitale, Lk , definiti in (9.97) e discussi nel capitolo 9, sono gli operatori le cui chiusure sono le osservabili associate alle tre componenti del momento angolare orbitale. I indica l’operatore identit` a: il primo su C2s+1 ed il secondo su L2 (R3 , dx). Il dominio `e dato dal sottospazio lineare invariante: D := S(R3 ) ⊗ C2s+1 . Per costruzione, questi operatori soddisfano le relazioni di commutazione dell’algebra di Lie di SO(3): [−iJi , −iJj ] =
3
ijk (−iJk ) .
(11.92)
k=1
Vogliamo ora applicare il teorema 11.59 di Nelson all’algebra di Lie che ha una base data dagli operatori Jk . Consideriamo l’operatore simmetrico: J2 =
3
2
(Lk ⊗ I + I ⊗ Sk )
k=1
definito su D. Tale operatore ammette una base hilbertiana di autovettori che si ottiene partendo dalla base hilbertiana di H data da tutti i prodotti tensoriali |l, m, sz , n := Yml ψn ⊗ |s, sz ∈ D ⊂ L2 (R3 , dx) ⊗ C2s+1 dove l = 0, 1, 2 . . .,, m = −l, −l + 1, . . . , l − 1, l, n = 0, 1, 2, . . . e sz = −s, −s+1, . . . , s−1, s e i vettori |s, sz ∈ C2s+1 sono gli autovettori di S3 , con norma 1 e con autovalore sz . Dato che S3 `e hermitiana, i 2s + 1 vettori |s, sz formano una base ortonormale di C2s+1 . La base hilbertiana di L2 (R3 , dx) di vettori Yml ψn (9.107) `e stata definita nel capitolo 9. La proposizione 9.36 assicura che i vettori Yml ψn ⊗|s, sz formino una base hilbertiana per lo spazio prodotto. La base hilbertiana degli |l, m, sz , n non `e composta da autovettori di J 2 . Esiste una procedura puramente algebrica, detta procedura di ClebschGordan6 [CCP82], che mostra che, prendendo combinazioni lineari finite di 6 Questa procedura `e, a volte, molto irriverentemente menzionata dagli studenti come il calcolo dei “coefficienti di Flash Gordon”.
11.2 Introduzione ai gruppi di simmetria
585
vettori |l, m, sz , n , si pu` o costruire una base hilbertiana di autovettori di J 2 , 2 Jz , L : |j, j3 , l, n dove |l +s| ≥ j ≥ |l −s|, l = 0, 1, 2, . . . j3 = −j, −j +1, . . . , j +1, j, n = 1, 2, . . . ed `e sottinteso sopra che i valori di j differiscano per numeri interi. Vale: J 2 |j, j3 , l, n = 2 j(j + 1)|j, j3 , n ,
J3 |j, j3 , n = jz |j, j3 , n ,
L2 |j, j3 , n = l(l + 1)|j, j3 , n . I vettori |j, j3 , l, n sono ancora in D essendo combinazioni lineari finite dei vettori |l, m, s, sz , n . Essendo autovettori di J 2 , tali vettori sono vettori analitici di J 2 . Per il criterio di Nelson, J 2 `e essenzialmente autoaggiunto su D. Applicando il teorema di Nelson, abbiamo anche che esiste una rappresentazione unitaria fortemente continua di SU (2) sullo spazio H, i cui generatori sono gli operatori autoaggiunti Jk := Jk = Lk ⊗ I + I ⊗ Sk . (Si osservi che Lk ⊗ I = Lk ⊗ I dato che l’operatore I, in quel caso, `e definito in uno spazio di Hilbert a dimensione finita.) Si dimostra (vedi esercizi) che la rappresentazione unitaria fortemente continua che si ottiene esponenziando gli operatori Jk , nel caso s = 0, `e in realt`a una rappresentazione di SO(3) e coincide la rappresentazione che gi`a conoscevamo da (1) in esempi 11.17 con Γ ∈ IO(3) specializzata a Γ = R ∈ SO(3) (Tale rappresentazione `e fortemente continua per quanto asserito in (1) in esempi 11.35.) Questo risultato implica facilmente che (vedi esercizi), nel caso generale di s = 0, la rappresentazione di SU (2) che si ottiene esponenziando i generatori Jk in base al teorema di Nelson, ha la forma: θ (11.93) SU (2) e−iθ 2 n·σ → e−iθn·J = e−iθn·L ⊗ V (s) e−i 2 n·σ dove Lk := Lk `e l’operatore autoaggiunto associato alla componente k-esima del momento angolare orbitale, come gi`a definito nel capitolo 9. Inoltre vale: −iθn·L e ψ (x) = ψ eθn·T x , (11.94) dove
SU (2) e−iθ 2 n·σ → e−θn·T ∈ SO(3)
`e l’omomorfismo suriettivo di rivestimento di SU (2) su SO(3) citato in (6) di esempi 11.50. Osservazione 11.63. Dal punto di vista fisico, si assume che la rappresentazione unitaria proiettiva di SO(3) indotta dalla rappresentazione unitaria di SU (2) (11.93) corrisponda all’azione di SO(3) sulla particella con spin s, pensando SO(3) come gruppo di simmetria per tale sistema. Concludendo, abbiamo trovato una rappresentazione proiettiva del gruppo SO(3) sulla particella di spin generico s = 0, 1/2, 1, 3/2, 2, . . . che si assume
586
11 Introduzione alle Simmetrie Quantistiche
essere l’azione del gruppo di simmetria SO(3) sul sistema fisico considerato. Si osservi che solo per s intero, la rappresentazione proiettiva di SO(3) `e inducibile da una rappresentazione unitaria di SO(3), nel caso di spin semi intero, la rappresentazione proiettiva `e invece indotta da una rappresentazione unitaria di SU (2). 11.2.10 Il gruppo di Galileo e le sue rappresentazioni unitarie proiettive In fisica classica, le trasformazioni tra coordinate cartesiane ortonormali solidali con due differenti sistemi di riferimento inerziali I e I sono descritte dal gruppo di Galileo, G . In questo senso le trasformazioni di Galileo sono viste come trasformazioni passive. Con ovvie notazioni, tali trasformazioni si possono scrivere: ⎧ ⎪ ⎨ t = t+c, 3 (11.95) x = c + tv + Rij xj , i=1,2,3 ⎪ i i i ⎩ j=1
dove c ∈ R (che non `e la velocit`a della luce), ci ∈ R e vi ∈ R sono costanti arbitrarie, ed i coefficienti costanti Rij definiscono una matrice R ∈ O(3). Ogni elemento del gruppo di Galileo, G , `e dunque individuato da una quaterna (c, c, v, R) ∈ R × R3 × R3 × O(3). Componendo due trasformazioni di Galileo, si vede che le quaterne dette si compongono come: (c2 , c2 , v2, R2 ) · (c1 , c1, v1 , R1) = (c1 + c2 , R2 c1 + c1 v2 + c2 , R2 v1 + v2 , R2 R1 ) .
(11.96)
Questa legge di composizione definisce una struttura di gruppo su R × R3 × R3 ×O(3), definendo, appunto il gruppo di Galileo. In particolare, l’elemento neutro `e (0, 0, 0, I) e l’elemento inverso `e dato da: (c, c, v, R)−1 = (−c, R−1 (cv − c), −R−1 v, R−1) .
(11.97)
Si pu` o anche interpretare il gruppo di trasformazioni di Galileo come un gruppo di trasformazioni attive, che agiscono spostando attivamente gli eventi dello spaziotempo, individuando gli eventi dello spaziotempo classico come vettori colonna (x, t)t , di coordinate in un sistema di coordinate cartesiane (ortonormali destrorse) di un riferimento inerziale fissato una volta per tutte. Il gruppo G agisce come un gruppo di matrici, se identifichiamo l’elemento generico (c, c, v, R) ∈ G con la matrice reale 5 × 5: ⎤ ⎡ Rvc ⎣ 0 1 c⎦ (11.98) 0 01
11.2 Introduzione ai gruppi di simmetria
587
e contemporaneamente identifichiamo i vettori colonna (x, t)t ∈ R4 con i corrispondenti vettori colonna (x, t, 1)t ∈ R5 . In questo modo G acquista naturalmente una struttura di gruppo di Lie (matriciale), indotta da quella di GL(5, R) (la struttura differenziabile analitica reale `e la stessa che si otterrebbe inducendola da quella di R × R3 × R3 × O(3)). Nel seguito ci restringeremo al cosiddetto gruppo di Galileo proprio, SG , che `e il sottogruppo di Lie, connesso, di G i cui elementi hanno matrici R con determinante positivo, cio`e R ∈ SO(3). Non considereremo dunque l’inversione di parit` a, che `e nota non essere sempre una simmetria per i sistemi quantistici e deve essere trattata a parte, almeno a livello quantistico. Il rivestimento universale di SG , C SG , si ottiene sostituendo a SO(3) il suo rivestimento universale SU (2) pensato come gruppo di Lie reale di dimensioC `e il gruppo di Lie con ne 3 (sottogruppo di Lie di GL(4, R)). Di fatto SG 3 struttura differenziabile (analitica reale) di R × R × R3 × SU (2) e con legge di composizione: (c2 , c2 , v2, U2 ) · (c1 , c1, v1 , U1 ) = (c1 + c2 , R(U2 )c1 + c1 v2 + c2 , R(U2 )v1 + v2 , U2 U1 ) ,
(11.99)
dove la funzione SU (2) U → R(U ) ∈ SO(3) , `e l’omomorfismo di rivestimento discusso in (6) di esempi 11.50 (e negli esercizi a fine capitolo). Questo gruppo di Lie `e il rivestimento universale di SG , essendo semplicemente connesso (perch´e prodotto di spazi semplicemente connessi), ed avendo la stessa algebra di Lie di SG . Una base fisicamente interessante dell’algebra di Lie di C SG `e costituita di 10 generatori (notare il segno − davanti al primo generatore dovuto ad una convenzione): −h , pi , ji , ki i=1,2,3, (11.100) dove accade che: (i) −h genera il sottogruppo ad un parametro R c → (c, 0, 0, I) delle traslazioni temporali, (ii) i tre pi generano il sottogruppo abeliano R3 c → (0, c, 0, I) delle traslazioni spaziali, (iii) i tre ji generano il sottogruppo SO(3) R → (0, 0, 0, R) delle rotazioni spaziali, (iv) i tre ki generano il sottogruppo abeliano R3 v → (0, 0, v, I) delle trasformazioni pure di Galileo. Abbiamo le seguenti regole di commutazione che individuano le costanti di struttura del gruppo: [pi , pj ] = 0 , [ji , pj ] =
3 k=1
[pi, −h] = 0 ,
ijk pk ,
[ji , jj ] =
[ji , −h] = 0 , 3
ijk jk ,
[ki , kj ] = 0 ,
[ji , kj ] =
k=1
[ki , −h] = pi ,
3
(11.101)
ijk kk , (11.102)
k=1
[ki , pj ] = 0 .
(11.103)
588
11 Introduzione alle Simmetrie Quantistiche
Il gruppo di Galileo `e il gruppo pi` u importante di tutta la fisica classica, dato che tutte le leggi fisiche classiche sono invarianti sotto l’azione attiva delle trasformazioni di tale gruppo. Questo `e un altro modo di affermare l’equivalenza fisica di tutti i sistemi di riferimento inerziali, interpretando in senso passivo le trasformazioni del gruppo. Ci si aspetta che il gruppo di Galileo (proprio), pensandolo d’ora in poi come gruppo di trasformazioni attive, sia un gruppo di simmetria per ogni sistema fisico quantistico, almeno nei regimi di basse velocit`a rispetto alla velocit` a della luce (quando gli effetti relativistici sono trascurabili). Le rappresentazioni unitarie proiettive di SG che rappresentano l’azione di SG pensato come gruppo di simmetria su un sistema fisico, sono ben note (vedi per esempio la discussione in [CCP82]). Per discuterle, cominciamo a considerare un sistema fisico, dato da una particella di spin s (vedi la sezione precedente) e massa m > 0, non soggetta a forze. Fissiamo un sistema di riferimento inerziale I, dotato di una terna di assi cartesiani solidali ortonormali destrorsi, in modo tale da poter identificare lo spazio di quiete del riferimento con R3 . Lo spazio di Hilbert H del sistema `e allora dato dal prodotto tensoriale L2 (R3 , dx) ⊗ C2s+1 . Gli stati puri del sistema sono individuati da funzioni d’onda con spin: ψs3 ⊗ |s, s3 . |s3 |≤s
Tale prodotto tensoriale `e isomorfo a L2 (R3 , dk) ⊗ C2s+1 , dove le funzioni d’onda ψ6 in L2 (R3 , dk) sono nella rappresentazione impulso, connesse a quelle, ψ, nella rappresentazione posizione tramite l’operatore unitario dato dalla trasformata di Fourier-Plancherel discussa nel capitolo 3: F : L2 (R3 , dx) → L2 (R3 , dk) , in modo tale che: ψ6 = Fψ. In particolare (vedi la proposizione 5.30), l’osservabile impulso, Pj , `e individuata in L2 (R3 , dk) dall’operatore P6j = FPj F che risulta essere l’operatore moltiplicativo per la coordinata kj agendo sugli elementi di L2 (R3 , dk). D’ora in poi porremo = 1 per semplicit`a. Assumiamo per il momento s = 0. In questa rappresentazione di H, l’azione di ciascun elemento del gruppo di simmetria SG separatamente, `e quella indotta dagli (m) operatori unitari Z (c,c,v,U ) : 2 c i(cv−c)·(k−mv) i 2m (m) 6 e (k−mv) ψ R(U )−1 (k − mv) . Z (c,c,v,U )ψ (k) := e (11.104) (m) vanno sostituite Nel caso in cui s = 0, le trasformazioni unitarie Z (c,c,v,U )
con
(s) (m) Z (U ) , (c,c,v,U ) ⊗ V
(11.105)
dove la rappresentazione V (s) `e stata introdotta in (11.90). Tornando in rappresentazione posizione, cio`e pensando gli stati puri della particella senza spin come individuati da elementi di L2 (R3 , dx) normalizzati
11.2 Introduzione ai gruppi di simmetria
589
(m) corrispondono, tramite la solita trasformata a 1, gli operatori unitari Z g (m) (m) F di Fourier-Plancherel, ad operatori unitari Zg := F−1 Z g . Nel seguito useremo indifferentemente le due rappresentazioni, anche se daremo solo nel (m) prossimo capitolo l’espressione esplicita dell’azione degli operatori Zg in rappresentazione posizione. Osservazioni 11.64. (1) Se consideriamo l’azione di (c, c, v, U )−1 invece che di (c, c, v, U ), essa ha una forma leggermente pi` u illuminante: c ic·(R(U )k+mv) −i 2m (R(U )k+mv)2 6 (m) 6 Z e ψ (R(U )k + mv) . (c,c,v,U )−1 ψ (k) := e (11.106) Per dare un significato fisico all’identit` a scritta sopra, decomponiamo (c, c, v, U )−1 come: (c, c, v, U )−1 = (0, 0, 0, U )−1 · (0, 0, v, I)−1 · (0, c, 0, I)−1 · (c, 0, 0, I)−1 , analizziamo quindi l’azione di ciascuna di queste trasformazioni. Cominciamo dalla prima: 2 c (m) 6 −1 Z ψ (k) = e−i 2m k ψ6 (k) . (c,0,0,I) c
2
Come vedremo nel prossimo capitolo, la moltiplicazione per la fase e−i 2m k eseguita sopra, corrisponde all’inversa di una traslazione temporale dell’intervallo di tempo c. Procedendo oltre abbiamo: c ic·k −i 2m k2 6 (m) Z e ψ (k) . (0,c,0,I)−1 ·(c,0,0,I)−1 ψ (k) = e La moltiplicazione per la fase eic·k eseguita sopra, corrisponde (sotto trasformazione di Fourier-Plancherel) una traslazione attiva della funzione d’onda di un vettore −c. Procedendo oltre troviamo: (m) 6 Z (0,0,v,I)−1·(0,c,0,I)−1·(c,0,0,I)−1 ψ (k) 2 c = eic·(k+mv)e−i 2m (k+mv) ψ6 (k + mv) .
Si osservi che k → k + mv `e proprio la trasformazione dell’impulso, interpretando k come un vettore d’impulso, sotto una trasformazione di Galileo che altera la velocit`a del sistema di riferimento, senza traslazioni, rotazioni e traslazioni temporali. Quindi la trasformazione descritta corrisponde ad una trasformazione attiva della funzione d’onda secondo una trasformazione pura di Galileo associata a −v. Infine, facendo agire anche la rotazione R(U ), cio`e eseguendo una trasformazione attiva della funzione d’onda secondo la rotazione R(U )−1 , abbiamo che: (m) 6 Z (0,0,0,U )−1·(0,0,v,I)−1·(0,c,0,I)−1·(c,0,0,I)−1 ψ (k) =
590
11 Introduzione alle Simmetrie Quantistiche 2 c eic·(R(U )k+mv) e−i 2m (R(U )k+mv) ψ6 (R(U )k + mv) .
Concludiamo che il secondo membro di (11.106) corrisponde all’azione combinata (secondo la legge di moltiplicazione del gruppo di Galileo) di tali sottogruppi di trasformazioni, in modo da associate all’elemento generico (c, c, v, R(U )) del gruppo di Galileo. Tenendo conto della (11.97), la discussione giustifica anche la (11.104). (m) (ovvero gli operatori Z (m) lavorando in rappresenta(2) Gli operatori Z g g C di SG piuttosto zione posizione) sono associati al rivestimento universale SG che al gruppo stesso. Abbiamo fatto questa scelta, per poter applicare la teoria sviluppata nelle sezioni precedenti. Sappiamo infatti che le rappresentazioni proiettive di un gruppo si possono ottenere comunque rappresentazioni proiettive del suo rivestimento universale. Questo `e particolarmente comodo a causa della presenza del sottogruppo SO(3) del gruppo di Galileo. Infatti, come abbiamo visto nella sezione precedente se lo spin s `e semi intero, le rappresentazioni unitarie proiettive di SO(3) che hanno interesse fisico sono rappresentazioni unitarie di SU (2). Il calcolo diretto mostra che, con la definizione (11.104), la rappresentazione (m) lavorando in C g → Zg(m) (ovvero, equivalentemente, C SG SG g → Z g rappresentazione impulso) `e unitaria proiettiva, dato che appare una funzione dei moltiplicatori, che si ottiene con un tedioso calcolo: 1
ω(m) (g , g) = eim(− 2 c v
2
−c (R(U )v)·v +(R(U )v)·c)
g = (c, c, v, U ), g = (c , c , v , U ) .
, (11.107)
Il risultato permane (ovviamente) anche nel caso in cui lo spin s sia differente (m) da 0, e gli operatori unitari Zg sono generalizzati dagli operatori unitari in (11.105), dato che la rappresentazione U → V (s)(U ) nello spazio di spin C2s+1 `e unitaria e quindi non contribuisce alla funzione dei moltiplicatori. Si dimostra facilmente che la rappresentazione unitaria proiettiva C SG (m) (m) C g → Z g (ovvero, equivalentemente, SG g → Z g in rappresentazione posizione) `e fortemente continua. A tal fine, dato che gli operatori sono unitari, che ω(m) definita sopra `e continua e vale ω(m) (e, e) = 1, `e sufficiente provare (m) ψ 6 → ψ6 per ogni ψ ∈ H, se g → e. Questo segue facilmente dalla che Z g (m) . forma esplicita degli operatori Z g Non `e affatto evidente se la rappresentazione unitaria proiettiva C SG g → Z (m) g si possa o meno ricondurre ad una rappresentazione unitaria tramite una trasformazione di equivalenza, cio`e moltiplicando gli operatori Z (m) g per opportune fasi χ(g). Il calcolo diretto dell’algebra di Lie del gruppo di Galileo dimostra che le ipotesi del teorema 11.55 di Bargmann non sono soddisfatte. Comunque, questo fatto non porta a concludere automaticamente che la rappresentazione unitaria proiettiva di C SG trovata non si possa ricondurre ad
11.2 Introduzione ai gruppi di simmetria
591
una rappresentazione unitaria, dato che le ipotesi del teorema di Bargmann sono sufficienti, ma non necessarie a tal fine. Dimostreremo ora direttamente che le rappresentazioni trovate sono intrinsecamente unitarie proiettive: non `e possibile ricondurle ad una rappresentazione unitaria con una modifica nella scelta delle fasi. Per maggiore generalit`a, considereremo tutte le possibili rappresentazioni C g → Zg(m) , su ogni possibile spazio di Hilbert, con unitarie proiettive SG moltiplicatori dati dalla (11.107), indipendentemente dal fatto che gli opera(m) tori unitari Zg abbiamo la forma (11.104) o (11.105) sullo spazio di Hilbert 2 3 L (R , dk) ⊗ C2s+1 . Proposizione 11.65. In riferimento alle rappresentazioni unitarie proiettive (m) C SG g → Zg con moltiplicatori dati dalla (11.107), vale quanto segue. (m) (a) Per m fissato, non `e possibile ridefinire le fasi degli operatori Zg in modo da ottenere una rappresentazione unitaria di C SG (il risultato vale indipendentemente dalla richiesta che le rappresentazioni considerate siano fortemente continue o meno). (b) Due rappresentazioni con m differenti non possono mai stare nella stessa classe. Dimostrazione. Dimostriamo (a) e (b) insieme. Se due rappresentazioni, con m1 > m2 , appartenessero alla stessa classe allora esisterebbe una funzione χ = χ(g) per cui: −1 χ(g · g) ω(m1 ) (g , g) ω(m2 ) (g , g) per ogni g, g ∈ C = SG . (11.108) χ(g )χ(g) Data la forma scritta sopra per i moltiplicatori, se m := m1 − m2 > 0, questa identit` a equivale a: ω(m) (g , g) =
χ(g · g) χ(g )χ(g)
SG . per ogni g, g ∈ C
(11.109)
Dimostriamo che, per ogni fissato m > 0 non c’`e alcuna funzione χ che soddisfa (11.109) e questo prova entrambi gli asserti nella tesi. (m) Se esistesse una tale funzione, definendo: Vg := χ(g)Zg , i moltiplicatori della nuova rappresentazione C SG g → Vg sarebbero tutti pari a 1 e tale rappresentazione sarebbe unitaria. Consideriamo allora tutti gli elementi di C SG che hanno la forma f := (0, 0, v, I) e g := (0, c, 0, I). Per computo diretto da (11.96), abbiamo che tali elementi commutano e pertanto vale: f −1 · g−1 · f · g = e. Se eseguiamo il corrispondente calcolo per la rappresentazione Z (m) , tenendo conto della forma (11.107) dei moltiplicatori, troviamo (m) (m) (m) (m) (m) invece: Zf −1 Zg−1 Zf Zg = eimc·v Ze . Nelle nostre ipotesi, questa identit`a si riscrive: −1 χ(f −1 )χ(g−1 )χ(f)χ(g) Vf −1 Vg−1 Vf Vg = eimc·v χ(e)−1 I ,
592
11 Introduzione alle Simmetrie Quantistiche
cio`e, tenendo conto che i moltiplicatori di V sono banali perch`e tale rappresentazione `e unitaria, che f · g = g · f e permutando l’ordine dei coefficienti χh :
−1 −1 χ(f −1 )χ(f)χ(g−1 )χ(g) Vf −1 ·f·g−1 ·g = χ(f −1 )χ(f)χ(g−1 )χ(g) Ve = eimc·v χ(e)−1 I .
Abbiamo trovato che: χ(f −1 · f) χ(g−1 · g) = χ(e)eimc·v . χ(f −1 )χ(f) χ(g−1 )χ(g) Usando (11.109), l’identit` a trovata si riscrive: ω(f, f −1 )ω(g, g −1 ) = χ(e)eimc·v . Il calcolo esplicito del primo membro, usando (11.107), porta subito all’identit` a: 1 = χ(e)eimc·v che deve valere per ogni valore di c, v ∈ R3 e quindi deve essere m = 0 e χ(e) = 1. Ma la possibilit` a m = 0 `e stata esclusa all’inizio. Abbiamo trovato una contraddizione e pertanto la funzione χ non esiste. In virt` u della proposizione appena provata, e dato che la grandezza m che etichetta le classi di rappresentazioni unitarie proiettive ha un preciso significato fisico, possiamo pensare che il gruppo di simmetria di un sistema fisico quantistico non relativistico di massa m non sia il gruppo di Galileo, ma sia proprio D Cm individuata dalla funzione dei moltiplicatori relal’estensione centrale SG tiva al valore m della massa. Ricordiamo infatti che, dalla teoria generale, la C g → Zg(m) si pu` rappresentazione SG o riottenere con i seguenti passaggi: (a) D C costruendo l’estensione centrale SG m tramite U (1) individuata dalla funzione dei moltiplicatori definita in (11.107) (e si osservi che possiamo assegnare a D C SG m la struttura differenziabile analitica di variet` a prodotto dato che la funC × SG C), (b) restringendo a SG C la rappresentazione zione ω(m) `e analitica su SG unitaria fortemente continua: D C SG m (χ, g) → χZg(m) . C In questo modo, le rappresentazioni intrinsecamente unitarie proiettive di SG D Cm . Il prezzo che si paga sono rimpiazzate da rappresentazioni unitarie di SG `e che `e necessario cambiare gruppo di simmetria quando si cambia il valore della massa. Consideriamo la rappresentazione unitaria fortemente continua: D C SG m (χ, g) → χZg(m) .
11.2 Introduzione ai gruppi di simmetria
593
Se ci restringiamo a lavorare sullo spazio D ⊂ L2 (R3 , dk) delle funzioni ψ6 = 6 ψ(k) complesse, infinitesimale differenziabili, a supporto compatto, si verifica facilmente, tenendo conto della (11.104), che ogni funzione: D (m) ψ C 6 SG m (χ, g) → χZ g `e infinitamente differenziabile se ψ6 ∈ D. Pertanto D `e un sottoinsieme dello D spazio di G˚ arding di C SG m . Con un piccolo abuso di notazione, indicheremo ancora con D il corrispondente spazio in L2 (R3 , dx) tramite la trasformata inversa di Fourier-Plancherel. Se consideriamo i sottogruppi ad un parametro della rappresentazione unitaria D Cm (χ, g) → χZ (m) SG g D Cm : associati agli undici generatori dell’algebra di Lie di SG 1 ⊕ 0, 0 ⊕ h, 0 ⊕ pi , 0 ⊕ ji , 0 ⊕ ki
dove i = 1, 2, 3
e valutiamo i generatori autoaggiunti associati restringendoci a lavorare su D, troviamo facilmente che essi sono, nello stesso ordine (notare il segno − davanti ad H): I, −HD , Pi D , Li D , Ki D
dove i = 1, 2, 3.
Pk ed Lk sono gli operatori autoaggiunti rappresentati l’impulso ed il momento angolare orbitale lungo l’asse k-esimo, che conosciamo gi`a. Gli operatori 6 F, detto operatore hamiltoniano, e Ki detto autoaggiunti H := F−1 H boost lungo l’asse i-esimo, sono definiti, rispettivamente, da: 6 ψ)(k) 6 (H := 6 := dove D(H)
2 3 6 ψ ∈ L (R , dk)
k2 6 ψ(k) 2m
R3
2 6 |k| |ψ(k)| dk < +∞ 4
(11.110)
e: Kj := −mXj .
(11.111)
Dato che D `e un core per ognuno di questi operatori, i generatori autoaggiunti D delle rappresentazioni dei sottogruppi ad un parametro di C SG m associati a: 1 ⊕ 0, 0 ⊕ h, 0 ⊕ pi , 0 ⊕ ji , 0 ⊕ ki
dove i = 1, 2, 3
devono coincidere con i corrispondenti operatori autoaggiunti: I, −H, Pi , Li , Ki
dove i = 1, 2, 3.
(11.112)
594
11 Introduzione alle Simmetrie Quantistiche
Si osservi che ognuno di questi operatori, come osservabile, ha un significato fisico preciso. Il significato dell’osservabile associata ad H lo discuteremo nel prossimo capitolo. Se passiamo a considerare le relazioni di commutazione, per esempio restringendoci a D, riscopriamo che stiamo lavorando con un’estensione centrale del gruppo di Galileo, dato che l’ultima relazione di commutazione `e differente dalla corrispondente per SG , a causa di una carica centrale che coincide con la massa: [−iPi , −iPj ] = 0 , [−iLi , −iPj ] =
[−iPi , iH] = 0 , 3
ijk (−iPk ) ,
[−iKi , −iKj ] = 0 ,
[−iLi , iH] = 0 , [−iLi , −iPj ] =
k=1
3
ijk (−iLk ) ,
k=1
[−iLi , −iKj ] =
3
ijk (−iKk ) ,
[−iKi , iH] = −iPi ,
k=1
[−iKi , −iPj ] = −imδij I . Osservazioni 11.66. (1) Si osservi che in virt` u del fatto che Kj = −mXj , risulta che la rappre (m) include degli operatori che soddisfano le sentazione unitaria (χ, g) → χZ g 2 3 relazioni di Weyl su L (R , dk). In virt` u di (b) nella proposizione 10.15, lo spazio L2 (R3 , dk) risulta essere irriducibile rispetto all’insieme di tali operaD (m) . In C (χ, g) → χZ tori e quindi rispetto a tutta la rappresentazione: SG m
g
questo senso la particella quantistica non relativistica a spin nullo `e un oggetto elementare rispetto al gruppo di Galileo. (2) Se consideriamo anche la parte di spazio di Hilbert dovuta allo spin, l’uD Cm nica differenza, rispetto a quanto scritto sopra, `e che, per avere l’azione SG sugli stati del sistema di dobbiamo rimpiazzare Lk con Jk = Lk + Sk in tutte le formule. In altre parole, la rappresentazione unitaria `e ora: D Cm (χ, g) → χZ (m) ⊗ V s (U ) , SG g dove g = (c, c, v, U ). L’irriducibilit` a vista per il caso s = 0 si estende in questo caso alla rappresentazione suddetta per la particella con spin s, considerando lo spazio completo L2 (R3 , dk) ⊗ C2s+1 . 11.2.11 La regola di Bargmann di superselezione della massa Consideriamo ora sistemi pi` u complessi di quelli di una particella libera. Rimandando al prossimo capitolo per la questione generale, ci limitiamo a dire qui che, quando si studia un sistema costituito da N particelle con masse m1 , . . . , mN che possono interagire tra di esse, ma costituiscono un sistema complessivo isolato esternamente, lo spazio di Hilbert della teoria si
11.2 Introduzione ai gruppi di simmetria
595
decompone nel prodotto: L2 (R3 , dx) ⊗ Hint ⊗ C2s1 +1 ⊗ · · · ⊗ C2sN +1 . a In tale decomposizione Hint `e uno spazio di Hilbert relativo ai gradi di libert` orbitali interni del sistema (le coordinate relative tra le particelle, per esempio in termini di coordinate di Jacobi [CCP82]). Lo spazio L2 (R3 , dk) `e lo spazio di Hilbert del centro di massa del sistema. N Il centro di massa si descrive come un’unica particella di massa M := n=1 mn ed individuato da osservabili posizione (del centro di massa) Xk ed impulso (totale del sistema) Pk , con k = 1, 2, 3, della forma solita su L2 (R3 , dx). Infine, ogni fattore C2sn+1 corrisponde allo spazio di spin della particella n-esima. Lo spazio L2 (R3 , dx), passando in trasformata di Fourier, pu` o essere equivalentemente sostituito con L2 (R2 , dk), cosa che supporremo d’ora in poi. In questo contesto – esattamente come accade in meccanica classica – l’azione del gruppo di simmetria SG `e la seguente: (M ) (int) C SG (c, c, v, U ) → Z(c,c,v,U )⊗VR(U ) Wc(int)⊗V (2S1 +1) (U )⊗· · ·⊗V (2SN +1) (U ).
Sopra: (int)
SO(3) R → VR
e
R c → Wc(int)
sono due rappresentazioni – entrambe unitarie e fortemente continue – rispettivamente del sottogruppo di SG delle rotazioni (quindi di elementi (0, 0, 0, R)), e del sottogruppo di SG delle traslazioni temporali (quindi di (int) (int) (int) (int) elementi (c, 0, 0, I)). Vale inoltre VR Wc = Wc VR per ogni scelta di R ∈ SO(3) e c ∈ R. Queste due rappresentazioni dipendono, rispettivamente, da come vengono definite le coordinate orbitali e dal tipo di inte(M ) razioni interne tra le particelle. La trasformazione Z(c,c,v,U ) agisce solo sui gradi di libert` a del centro di massa. Tenendo conto che tutte le rappresentazioni coinvolte sono unitarie eccetto la Z (M ) , si ha subito che la funzioni dei moltiplicatori, ω(M ) , della rappresentazione unitaria proiettiva complessiva su L2 (R3 , dk) ⊗ Hint ⊗ C2s1+1 ⊗ · · · ⊗ C2sN +1 `e la stessa di prima, usando come parametro m la massa totale M del sistema. Concludiamo che la proposizione precedente si estende anche a questo caso molto pi` u generale di sistema quantistico. Mettiamoci infine in un contesto ancora pi` u generale, considerando un sistema fisico S, ottenuto mettendo insieme sistemi fisici del tipo di quelli appena descritti in quantit` a arbitraria finita, ma non fissata. Il sistema complessivo pu` o ammettere valori di massa differenti mi , con i ∈ I insieme che assumeremo essere al pi` u numerabile. In questo contesto viene naturale associare alla massa un’osservabile quantistica, cio`e un operatore autoaggiunto M , il cui spettro sia l’insieme dei valori della massa. Sembra anche naturale definire uno spazio di Hilbert HS , per il sistema, che sia la somma diretta
596
11 Introduzione alle Simmetrie Quantistiche
hilbertiana dei vari autospazi dell’operatore massa, (m) HS = HS , m∈σ(M )
in ciascuno dei quali la massa del sistema ha un differente valore m > 0. Una tale descrizione sussiste effettivamente considerando sistemi fisici a numero non fissato di particelle. Cosa succede se agiamo sul sistema con il gruppo di Galileo proprio? In (m) ogni sottospazio HS agir` a una differente rappresentazione unitaria proiettiva dipendente da m. La rappresentazione del gruppo di Galileo proprio sar` a dunque del tipo: SG g → Zg := χ(m) (g)Zg(m) . (11.113) m∈σ(M )
Mostriamo che questa struttura della rappresentazione conduce ad una regola di superselezione. Dato che la rappresentazione deve essere unitaria proiettiva, il calcolo del moltiplicatore: Ω(g, g ) := Z(gg )−1 Z(g)Z(g ) con la formula (11.113) produce, dove gli ω(m) tengono conto delle eventuali nuove fasi χ(m) : Ω(g, g )I = ω(m) (g, g )I . m∈σ(M )
Questa identit` a implica che debba necessariamente essere: ω(m1 ) (g, g ) = ω(m2 ) (g, g ) = Ω(g, g )
per ogni m1 , m2 ∈ σ(M ) .
Ma questo `e impossibile perch´e, esplicitando le eventuali fasi χ(m) , questa identit` a implica la (11.108), che sappiamo essere falsa. Il risultato finale `e che, se vogliamo che il gruppo di Galileo sia un gruppo di simmetria per il nostro sistema fisico, siamo costretti a vietare stati puri (m) che corrispondono a combinazioni lineari di vettori in spazi HS con valori di m differenti. Abbiamo trovato una regola di superselezione legata alla massa, che `e nota come regola di superselezione di Bargmann della massa. I settori coerenti di questa regola di superselezione sono gli spazi a massa (m) fissata HS . Si osservi che la radice profonda di questo risultato risiede nel fatto che le rappresentazioni proiettive fisicamente interessanti del gruppo di Galileo non sono inducibili da rappresentazioni unitarie e la massa appare nella funzione dei moltiplicatori. Nel caso, fisicamente pi` u appropriato, in cui il gruppo di Galileo proprio venga rimpiazzato da quello di Poincar´e (ortocrono proprio), la regola di superselezione cessa di valere, perch´e le rappresentazioni proiettive del gruppo di Poincar´e si possono sempre indurre da rappresentazioni unitarie [BaRa86], e sono ammessi stati con massa (relativistica) non definita.
Esercizi
597
Esercizi 11.1. In riferimento all’esempio (1) in 11.17, e con IO(3) Γ = (t, R), dimostrare che: γΓ∗ (P) = UΓ−1 PUΓ = RP , (11.114) dove P indica la terna dei tre operatori corrispondenti alle tre componenti dell’impulso e l’identit`a di sopra vale restringendosi allo spazio di Schwartz S(R) come dominio per gli operatori impulso. 11.2. In riferimento agli esempi (1) e (2) in 11.17, e con le convenzioni dell’esercizio (1) per le notazioni, dimostrare che: ∗ γP (X) = P −1 XP = −X ,
∗ γP (P) = P −1 PP = −P
(11.115)
∗ γT (P) = T −1 PT = −P
(11.116)
mentre: ∗ (X) = T −1 XT = X , γT
dove P indica la terna dei tre operatori corrispondenti alle tre componenti dell’impulso e l’identit`a di sopra vale restringendosi allo spazio di Schwartz S(R) come dominio per gli operatori posizione ed impulso. 11.3. Considerare i tre operatori autoaggiunti L1 , L2 , L3 che rappresentano le tre componenti dell’operatore momento angolare orbitale (vedi cap 9). Se L indica il vettore colonna contenente i tre operatori menzionati, vale: LS(R3 ) = XS(R3 ) ∧PS(R3 ) . Dimostrare i seguenti fatti, dove i domini sono ristretti a S(R3 ): In riferimento all’esempio (1) in 11.17, e con SO(3) Γ = (0, R), dimostrare che vale quanto segue: γΓ∗ (L) = UΓ−1 LUΓ = RL , (11.117) ∗ γP (L) = P −1 LP = L , ∗ γT
(L) = T
−1
LT = −L .
(11.118) (11.119)
SO(3) `e il sottogruppo di O(3) contenente le matrici con determinante positivo (quindi pari a +1) ed il prodotto vettoriale `e definito sopra con la regola del determinante formale in riferimento ad una base destrorsa. 11.4. Si consideri lo spazio di Hilbert HS del sistema S e si assuma che sia decomposto in settori coerenti, in modo che lo spazio degli stati puri fisicamente ammissibili sia decomposto come: , Sp (HS )ammiss = Sp (HSk ) . k∈K
Si definisca su Sp (HS ) la distanza d(ρ, ρ ) := ||ρ − ρ ||1 := tr(|ρ − ρ |), dove || ||1 `e la norma naturale nello spazio degli operatori di classe traccia. Si provi
598
11 Introduzione alle Simmetrie Quantistiche
che gli insiemi Sp (HSk ) sono le componenti connesse di Sp (HS )ammiss . (Pu` o essere utile sapere che, come provato in questo capitolo, se ρ = ψ(ψ| ) e ρ = ψ (ψ | ) sono in Sp (HSk ), allora ||ρ − ρ ||1 = 2 1 − |(ψ|ψ )|2 .) Traccia di soluzione. Si considerino due stati puri ρ, ρ ∈ Sp (HSk ) con ρ = ψ(ψ| ) e ρ = ψ (ψ | ) e ψ non parallelo a ψ (altrimenti individuano lo stesso stato), si definisca ψt = tψ + (1 − t)ψ ed infine la curva [0, 1] t → ψt (ψt | ). Si provi che tale curva `e continua ed `e tutta contenuta in Sp (HSk ) ||ψt ||2 e quindi Sp (HSk ) connesso per archi e dunque connesso. Per provare che gli insiemi Sp (HSk ) sono sconnessi a due a due, `e sufficiente calcolare ||ρ − ρ ||1 quando ρ ∈ Sp (HSk ) e ρ ∈ Sp (HSk ) con k = k . Notare che in tal caso i vettori che individuano ρ e ρ sono sempre perpendicolari e pertanto ρ − ρ `e gi`a la decomposizione in parte positiva e parte negativa di ρ − ρ e quindi |ρ − ρ | = ρ + ρ , per cui ||ρ − ρ ||1 = 2. Consideriamo allora un aperto Ak ⊃ Sp (HSk ), unione di palle aperte di raggio 1/2 centrate sugli elementi di Sp (HSk ), ed un aperto Ak ⊃ Sp (HSk ), unione di palle aperte di raggio 1/2 centrate sugli elementi di Sp (HSk ). I due aperti non possono intersecarsi a causa della disuguaglianza triangolare e quindi Sp (HSk ) e Sp (HSk ) sono sconnessi. 11.5. Si dimostri che la distanza d(ρ, ρ ) tra stati puri introdotta nell’esercizio 11.4 soddisfa: d (ψ(ψ| ), ψ (ψ| )) = ||ψ(ψ| ) − ψ (ψ | )||B(H) per ogni coppia di vettori ψ, ψ ∈ H con ||ψ|| = ||ψ || = 1 e dove la norma || ||B(H) indica la norma operatoriale standard. 11.6. Sia U : H → H un operatore antiunitario sullo spazio di Hilbert H e sia A : D(A) → H un operatore autoaggiunto in H. Si dimostri che valgono i seguenti fatti: (a) U −1 AU : U −1 (D(A)) → H `e autoaggiunto, (b) σ(U −1 AU ) = σ(A), (A) (c) B(R) E → U −1 PE U `e la misura spettrale associata a U −1 AU dal teorema spettrale, cio`e: U −1 λdP (A)(λ)U = λd(U −1 P (A)U )(λ) , R
(d) U −1 eitA U = eitU
R −1
AU
.
Suggerimenti. (a) e (b) seguono dalla definizione di operatore autoaggiunto e spettro. (c) si ottiene provando che per funzioni f : R → C limitate, direttamente dalla definizione di integrale di funzioni limitate rispetto a una PVM (cap 8), vale U −1 R f(x)dP (A) (x)U = R f(x)d(U −1 P (A) U )(x); che per ogni operatore autoaggiunto vale T = s-limn→+∞ quindi osservando (T ) χ (x)dP (x). (d) si ottiene dal teorema di Stone, tenendo conto di R [−n,n] (a).
Esercizi
599
11.7. Dimostrare la (11.62). Traccia della soluzione. La prima identit` a in (11.62) segue dal fatto che −1 ed infine UΓ UΓ = UΓ ◦Γ . Pertanto, per UΓ `e unitario ed anche UΓ−1 = U Γ0 0 concludere `e sufficiente mostrare che, per ogni ψ ∈ L2 (R3 , dx): ||UΓ ψ − ψ|| → 0
se Γ → (0, I).
Proviamo prima la tesi per le funzioni φ continue a supporto compatto. Se φ `e una tale funzione, ISO(3) × R3 (Γ, x) → φ(Γ −1 x) `e continua. Allora, se Γ `e ristretto a variare in un intorno J a chiusura compatta dell’identit` a, esiste K ≥ 0 tale che |φ(Γ −1x)| ≤ K se (Γ, x) ∈ J ×R3 . Data la natura delle Γ esiste anche un compatto S ⊂ R3 che include tutti i supporti delle funzioni φ(Γ −1 ·). Pertanto esiste φ0 ∈ L2 (R3 , dx) che soddisfa |(UΓ φ)(x) − φ(x)| ≤ |φ0 (x)| se (Γ, x) ∈ J × R3 , basta scegliere φ0 continua che, in S, ha valore assoluto in ogni punto maggiore di 2K e si annulla rapidamente fuori da S. Dato che (UΓ φ)(x) → φ(x) puntualmente, dal teorema della convergenza dominata segue che ||UΓ ψ − ψ|| → 0 se Γ → (0, I), dove la norma `e quella di L2 . Passiamo al caso di ψ generica in L2 (R3 , dx). Se ψ ∈ L2 (R3 , dx) e > 0, sia φ continua a supporto compatto tale che ||ψ − φ|| < /3. Allora ||UΓ ψ − ψ|| ≤ ||UΓ ψ − UΓ φ|| + ||UΓ φ − φ|| + ||φ − ψ|| = ||UΓ φ − φ|| + 2||φ − ψ|| dato che UΓ `e isometrico e quindi ||UΓ ψ − UΓ φ|| = ||ψ − φ||. Scegliendo Γ abbastanza vicino a (0, I), in base a quanto provato sopra, possiamo avere ||UΓ φ − φ|| ≤ /3. Quindi, per ogni > 0, se Γ `e abbastanza vicino a (0, I), vale ||UΓ ψ − ψ|| ≤ . 11.8. Facendo uso del contenuto dell’esercizio 11.1, dimostrare che t · PS(R3) `e essenzialmente autoaggiunto. Suggerimento. Se t = 0 la tesi `e banale, mettiamoci dunque negli altri casi. Sappiamo che P1 S(R3 ) `e essenzialmente autoaggiunto. Considerare l’operatore unitario UR che rappresenta una rotazione attiva che porta l’asse t/|t| sul versore e3 . Provare che UR t · PS(R3 ) UR−1 = |t|P3S(R3 ) e concludere. 11.9. Facendo uso del contenuto dell’esercizio 11.1, dimostrare che vale la (11.63). Suggerimento. Dimostrare la tesi per P3 passando da funzioni d’onda nella variabile x a funzioni d’onda nella variabili k tramite la trasformata di Fourier. Poi estendere il risultato al caso generale usando una procedura analoga a quella adoperata per l’esercizio precedente. Si noto che se U `e unitario e A : D(A) → H `e chiudibile, definendo U AU −1 su U (D(A)), segue che U AU −1 `e chiudibile e: U AU −1 = U AU −1 .
600
11 Introduzione alle Simmetrie Quantistiche
11.10. Partendo dalla (11.30), dimostrare le identit` a (11.31). Suggerimento. Cominciare a sostituire al posto di g, g , g uno o pi` u elementi e (elemento neutro del gruppo) ed usare i risultati trovati. Poi sostituire g−1 a g e/o g . 11.11. Si consideri un gruppo topologico G connesso e una sua rappresentazione proiettiva fortemente continua (nel senso della proposizione 11.32) G g → γg sullo spazio di Hilbert HS , associato ad un certo sistema fisico. Si supponga che HS sia decomposto in settori coerenti HSk . Pu` o accadere che qualche γg trasformi un settore in un settore differente? Suggerimento. Decomporre Sp (H) nell’unione disgiunta degli stati puri di ciascun settore e dotare ciascuno spazio della topologia indotta da || ||1 . Ricordare, infine, che le funzioni continue trasformano insiemi connessi in insieme connessi. 11.12. Dimostrare che l’algebra di Lie di SU (2), pensato come gruppo di Lie reale, `e data dallo spazio vettoriale reale delle matrici anti hermitiane. Dimostrare quindi che SU (2) `e semplicemente connesso. Suggerimento. SU (2) `e un sottogruppo chiuso di GL(4, R) per cui `e un gruppo di Lie e quindi i gruppi ad un parametro sono del tipo R t → etA , con A che varia in tutta l’algebra di Lie di SU (2). Si imponga che etA (etA )∗ = I e che tr(etA ) = 1 per ogni t e si veda come deve essere fatta A. Viceversa se A `e anti hermitiana, mostrare che le due condizioni dette sono soddisfatte. Per la seconda domanda, parametrizzare il gruppo con 4 parametri reali in modo tale che le matrici di S(2) risultino essere in corrispondenza biunivoca con i punti sulla superficie della sfera unitaria in R4 . Mostrare che la parametrizzazione `e un omeomorfismo. 11.13. Dimostrare che se U ∈ SU (2) se e solo se esistono un versore n ∈ R3 ed un numero reale θ tale che: σ
U = e−iθn· 2 . Suggerimento. Usare il teorema spettrale per l’operatore unitario U ∈ SU (2) tenendo conto che le matrici di Pauli unitamente a I formano una base σ dello spazio reale delle matrici hermitiane. Se, viceversa, U = e−iθn· 2 quanto ∗ valgono U U e det U ?. 11.14. Dimostrare che le tre matrici T in (11.71) soddisfano: RTk Rt =
3
(Rt )ki Ti
per ogni R ∈ SO(3).
i=1
Suggerimento. Usare (Ti )jk = −ijk e scrivere la relazione di sopra in componenti. Tenere conto che i coefficienti ijk definiscono uno pseudotensore invariante sotto rotazioni proprie.
Esercizi
601
11.15. Dimostrare che R ∈ SO(3) se e solo se esistono un versore n ∈ R3 ed un numero reale θ tale che: R = eθn·T . Suggerimento. Dimostrare la relazione nel caso in cui n = e3 prendendo, come R ∈ SO(3), una rotazione attorno all’asse e3 . Dimostrare che ogni R ∈ SO(3) ammette sempre un autovettore n. Usare una rotazione degli assi che porti n su e3 e tenere conto del risultato trovato nell’esercizio precedente. Se, viceversa, R = e−iθn·T quanto valgono Rt R e det R? 11.16. Dimostrare che per ogni U ∈ SU (2) esiste un unica RU ∈ SO(3) tale che: U t · σU ∗ = (RU t) · σ per ogni t ∈ R3 . Verificare poi che la funzione: SU (2) U → RU ∈ SO(3) `e un omomorfismo gruppale suriettivo e coincide con: σ
R : SU (2) e−iθn· 2 → eθn·T ∈ SO(3) . Infine provare che il nucleo di tale omomorfismo `e {±I} ⊂ SU (2). Traccia della soluzione. Notare che |t|2 = det (t · σ) e concludere che ogni U ∈ SU (2) individua un unica trasformazione da R3 a R3 che associa ad ogni t un nuovo vettore t con |t| = |t | individuato da U t · σU ∗ = U t · σU ∗ . La trasformazione t → t `e dunque una matrice ortogonale R(U ) ∈ O(3). Il fatto che R : SU (2) U → R(U ) ∈ O(3) sia un omomorfismo gruppale `e σ3 di prova immediata per costruzione. Nel caso in cui Uθ = e−iθ 2 si verifica in vari modi (anche direttamente sviluppando gli esponenziali delle matrici) che R(Uθ ) = eθT3 . Il caso generale si ottiene facendo allora uso del risultato nell’esercizio (3), ruotando e3 su qualunque versore n. Il fatto che R(Uθ ) = eθn·T implica ovviamente che R(U ) ∈ SO(3). La suriettivit`a dell’omomorfismo segue dal fatto che ogni matrice di SO(3) si pu` o scrivere nella forma: eθn·T . Il calcolo del nucleo dell’omomorfismo si pu`o eseguire riducendosi a lavorare con il sottogruppo ad un parametro generato da σ3 , tramite una rotazione del versore n. Il risultato diventa allora ovvio per computo diretto. 11.17. In riferimento alla sezione 11.2.9, dimostrare che la rappresentazione unitaria fortemente continua di SU (2) che si ottiene esponenziando gli operatori Lk coincide la rappresentazione fortemente continua SO(3) R → UR definita in esempi 11.17 (dove ora abbiamo ristretto Γ ∈ IO(3) a Γ = R ∈ SO(3)) e che `e fortemente continua (vedi (1) in esempi 11.35) Suggerimento. Per il teorema 11.59 di Nelson `e sufficiente verificare che i gruppi ad un parametro θ → Ueθn·T x con n = e1 , e2 , e3 sono generati dagli operatori autoaggiunti L1 , L2 , L3 . Si tratta dunque di verificare ci` o.
602
11 Introduzione alle Simmetrie Quantistiche
Conviene lavorare in coordinate polari, usando il core per gli operatori L1 , L2 , L3 , dato dalle armoniche sferiche moltiplicate per gli elementi di una base di L2 (R+ , r 2dr). 11.18. Dimostrare che la rappresentazione di SU (2), che si ottiene esponenziando i generatori Jk in base al teorema di Nelson, ha la forma: θ SU (2) e−iθ 2 n·σ → e−iθn·J = e−iθn·L ⊗ V (s) e−i 2 n·σ . Suggerimento. Usare le propriet`a del prodotto tensoriale di operatori per dimostrare che vale θ e−iθn·J = e−iθn·L ⊗ V (s) e−i 2 n·σ . Quindi la tesi si prova verificando che la rappresentazione SO(3) R → UR considerata nell’esercizio precedente si pu` o esprimere come: Ueθn·T = e−iθn·L . Sappiamo che questo `e sicuramente vero, per esempio per n = e3 . Il caso generale si ottiene notando che, da una parte, ∗
UR∗ e−iθn·L UR = e−iθn·URLUR e tenendo conto dell’esercizio 11.3; dall’altra vale il risultato nell’esercizio 11.14.
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica Piantala di dire a Dio che cosa fare con i suoi dadi. Niels Bohr, rispondendo ad Einstein
In questo capitolo finale ci occuperemo di completare l’elenco degli assiomi della Meccanica Quantistica non relativistica, introducendo l’evoluzione temporale e la descrizione dei sistemi composti. Alcune delle nozioni che introduciamo qui formalmente sono state, di fatto, gi`a introdotte nell’ultima parte del capitolo precedente, discutendo i gruppi di simmetria. Nella prima sezione enunceremo l’assioma di evoluzione temporale, descritta da un gruppo unitario ad un parametro fortemente continuo, generato dall’operatore hamiltoniano del sistema. Nello stesso contesto, daremo la definizione di simmetria dinamica, come specializzazione della nozione di simmetria vista nel capitolo precedente. Quindi discuteremo la natura dell’equazione di Schr¨ odinger in questo contesto ed introdurremo l’importante nozione di stato stazionario. Come classico esempio del formalismo costruito espliciteremo l’azione del gruppo di Galileo (presentata in rappresentazione impulso nel capitolo precedente) in rappresentazione posizione. In tale sede saranno anche discusse le propriet`a di trasformazione della funzione d’onda sotto cambiamento di sistema di riferimento inerziale. Faremo quindi qualche osservazione sull’esistenza dell’evolutore temporale unitario in assenza di omogeneit`a temporale (esaminando le propriet` a di convergenza della serie di Dyson nel caso di hamiltoniano in B(H)), discuteremo la natura antiunitaria della simmetria di inversione del tempo e daremo una versione del cosiddetto Teorema di Pauli, riguardante la difficolt` a di definire l’operatore tempo come operatore autoaggiunto coniugato all’operatore hamiltoniano. A tal proposito commenteremo brevemente la nozione di POVM che pu`o essere usata per dare significato all’osservabile tempo in un senso pi` u debole. Nella sezione successiva, introdurremo la rappresentazione di Heisenberg delle osservabili e discuteremo la relazione tra simmetrie dinamiche e costanti del moto, presentando la versione quantistica del teorema di N¨ other e studiando il caso delle costanti del moto associate ai generatori di un gruppo di Lie che include l’evoluzione temporale come sottogruppo ad un parametro. Come intermezzo, in tale sede discuteremo brevemente i problemi matematici legati
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
604
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
al cosiddetto teorema di Ehrenfest. Lo studio esemplificativo delle costanti del moto associate al gruppo di Galileo concluder`a la sezione. La terza ed ultima sezione sar`a dedicata alla teoria dei sistemi quantistici composti: sistemi con struttura interna e sistemi a pi` u particelle. Discuteremo in particolare il concetto di stati entangled con un accenno alle problematiche connesse al cosiddetto paradosso EPR e, per finire, passeremo alla teoria generale dei sistemi di particelle identiche, accennando al teorema di correlazione spin-statistica.
12.1 La dinamica quantistica e le sue simmetrie Come brevemente ricordato nella sezione 7.2.2, i sistemi fisici evolvono nel tempo secondo la loro dinamica. Dal punto di vista classico, nella formulazione di Hamilton della meccanica, l’evoluzione nel tempo dello stato di un sistema fisico `e descritto nello spaziotempo delle fasi dalle soluzioni delle equazioni di Hamilton. Consideriamo la situazione, detta di omogeneit` a temporale, in cui la funzione hamiltoniana H non dipenda esplicitamente dal tempo nelle coordinate associate ad un fissato sistema di riferimento inerziale I. In tal caso le equazioni di Hamilton sono di tipo autonomo, cio`e il tempo non appare esplicitamente in esse, quando espresse in quel sistema di coordinate canoniche ed esiste una decomposizione naturale dello spaziotempo delle fasi in un prodotto cartesiano R × F, dove F `e lo spazio delle fasi. Le soluzioni delle equazioni di Hamilton individuano un gruppo ad un parametro di diffeomorfismi φτ : F → F , che trasforma lo stato iniziale (pensato per semplicit`a come stato sharp) r ∈ F del sistema al tempo 0, nello stato φτ (r) ∈ F al tempo τ . L’oggetto matematico fondamentale per costruire l’evolutore temporale – cio`e il gruppo ad un parametro {φτ }τ∈R – `e la funzione di Hamilton H del sistema fisico, che si identifica con l’energia meccanica totale del sistema nel riferimento I [FaMa94, CCP82]. Nel seguito discuteremo i concetti che corrispondono alla funzione hamiltoniana ed all’evolutore temporale per i sistemi quantistici. 12.1.1 Assioma A6: l’evoluzione temporale La situazione nel caso quantistico `e piuttosto simile a quella classica. L’evoluzione temporale di un sistema quantistico S, descritto nello spazio di Hilbert HS per un fissato sistema di riferimento inerziale I, `e descritta dal seguente assioma, che introduce la nozione di (operatore) hamiltoniano del sistema quantistico come generatore del gruppo ad un parametro di operatori unitari, che descrivono l’evoluzione temporale, cio`e la dinamica, dello stato quantistico. Attraverso la nozione di evoluzione temporale `e possibile trattare le simmetrie dinamiche e dare la versione quantistica del teorema di N¨ other, come vedremo successivamente.
12.1 La dinamica quantistica e le sue simmetrie
605
A6. Sia S un sistema quantistico descritto nello spazio di Hilbert HS associato al sistema di riferimento inerziale I. Esiste un operatore autoaggiunto H detto hamiltoniano del sistema S nel riferimento I, che corrisponde all’osservabile energia meccanica totale del sistema S nel riferimento I e che soddisfa: (i) σ(H) `e limitato dal basso, iτ (ii) posto Uτ := e− H , se lo stato del sistema al tempo t `e ρt ∈ S(HS ), lo stato al tempo t + τ `e allora dato da: ρt+τ = γτ(H) (ρt ) := Uτ ρt Uτ−1 .
(12.1)
Il gruppo unitario ad un parametro fortemente continuo: R τ → Uτ `e detto evolutore temporale del sistema S nel riferimento I e la rappresentazione (H) proiettiva continua di R indotta da U , R τ → γτ `e detto flusso dinamico del sistema S nel riferimento I. Osservazioni 12.1. (1) D’ora in poi, se non `e strettamente necessario per ragioni di chiarezza fisica, ometteremo di scrivere esplicitamente la costante nelle formule, assumendo = 1. (2) L’evoluzione temporale degli stati `e dunque data da una rappresentazione proiettiva continua del gruppo topologico abeliano R. Questa osservazione permette di enunciare in modo diverso l’assioma A6, sfruttando dei risultati generali che abbiamo ottenuto nel capitolo precedente. Volendo indebolire al massimo le richieste nell’assioma di evoluzione temporale, pensando l’evoluzione temporale come una funzione ρ → γτ (ρ) che associa stati a stati, per ogni fissato τ ∈ R, si pu` o richiedere che γτ soddisfi le seguenti ipotesi, che appaiono abbastanza ragionevoli dal punto di vista fisico: (i) conservi la struttura convessa dello spazio degli stati (simmetria di Kadison), oppure, equivalentemente, conservi le probabilit` a di transizione (simmetria di Wigner), (ii) sia additiva rispetto al tempo: γτ ◦ γτ = γτ+τ se τ, τ ∈ R, (iii) (pensando ogni simmetria γτ nel senso di Wigner) sia continua nel senso della definizione 11.29 oppure, equivalentemente, rispetto alla topologia naturale di Sp (HS ) indotta dalla norma || ||1 come in (11.41). Il teorema 11.34 prova allora che la rappresentazione proiettiva R τ → γτ deve avere la struttura assunta nella forma dell’assioma A6 data sopra. Uno dei possibili generatori autoaggiunti di tale rappresentazione – che esistono e differiscono per una costante additiva in base al teorema 11.34 – `e, per definizione, l’hamiltoniano del sistema. Bisogna comunque ancora imporre che lo spettro di tale operatore sia limitato dal basso. L’ambiguit`a nella definizione dell’hamiltoniano, dovuta alla possibile costante additiva, `e in realt` a un’ambiguit` a che esiste nella fisica stessa, dato che l’energia di un sistema fisico classico (non relativistico) `e assegnata a meno di una costante.
606
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
(3) La necessit`a dell’esistenza di un limite inferiore allo spettro dell’hamiltoniano dei sistemi fisici reali `e dovuta alla richiesta di stabilit` a termodinamica. A meno di non considerare un sistema fisico ideale perfettamente isolato, che non esiste nella realt`a (anche per motivazioni teoriche profonde, ma che richiedono la teoria quantistica dei campi per essere spiegate adeguatamente), il vincolo del limite inferiore allo spettro di H (l’energia meccanica del sistema) `e fisicamente obbligatorio. Se l’energia del sistema non fosse limitata dal basso, si potrebbero avere transizioni dello stato del sistema S verso stati con energia sempre pi` u bassa. In pratica il sistema collasserebbe cedendo energia all’esterno (in quantit` a infinita!) sotto forma di qualche tipo (particelle, onde elettromagnetiche). La presenza di un limite inferiore a σ(H) ha altre importanti conseguenze teoriche che discuteremo nel seguito. (4) L’operazione di simmetria inversa dell’evoluzione temporale si chiama traslazione temporale. Abbiamo gi` a incontrato questa simmetria studiando il gruppo di Galileo. Dal punto di vista fisico si tratta di una trasformazione attiva sul sistema S, cio`e, per τ fissato, una simmetria di Kadison (−H) γτ : S(HS ) → S(HS ), che ne altera lo stato ρ, al tempo generico t0 fissato, trasformandolo in un nuovo stato ττ (ρ), sempre allo stesso tempo t0 , (H) (−H) γτ (ρ) coincida con ρ. Per costruzione deve essere in modo tale che γτ −1 (−H) (H) (−H) = γτ . Evidentemente il generatore unitario di γτ `e −H come γτ la notazione suggerisce. Questo giustifica il segno − che abbiamo usato nell’analisi dei generatori autoaggiunti del gruppo di Galileo, per quanto riguarda il generatore della traslazione temporale. Mettiamoci ora nel caso in cui lo spazio HS sia decomposto in settori coerenti HSk con k ∈ K. Di conseguenza lo spazio degli stati puri fisicamente ammissibili Sp (HS )ammiss `e decomposto nell’unione disgiunta sugli insiemi Sp (HSk ) e gli stati misti possono essere solo combinazioni lineari convesse di elementi degli spazi S(HSk ). Sussiste allora il seguente risultato che mostra che il flusso dinamico preserva la struttura dei settori come ci si aspetta. Proposizione 12.2. Sia S un sistema quantistico descritto nello spazio di Hilbert HS associato al sistema di riferimento inerziale I, con flusso dinamico γ (H) . Si supponga che HS sia decomposto in settori coerenti HSk con k ∈ K. Il flusso dinamico trasforma stati puri in stati puri e stati misti in stati misti. Pi` u precisamente vale quanto segue. (H) (a) Se ρ ∈ S(HSk ), allora γt (ρ) ∈ S(HSk ) per ogni t ∈ R. (H) (b) Se ρ ∈ Sp (HSk ), allora γt (ρ) ∈ Sp (HSk ) per ogni t ∈ R. Dimostrazione. Deve essere chiaro che, risultando:
(H) ρt (ψ(ψ| )) = e−itH ψ e−itH ψ , la rappresentazione γ (H) trasforma stati puri in stati puri e quindi stati misti in stati misti. Restringiamo allora γ (H) a lavorare sugli stati puri. Fissiamo ρ ∈
12.1 La dinamica quantistica e le sue simmetrie
607
(H)
Sp (HSk ) e consideriamo la curva R t → γt (ρ). In base alla proposizione 11.32, essa `e continua i rispetto alla norma || · ||1. Sappiamo che gli insiemi Sp (HSk ) sono le componenti connesse di Sp (HS )ammiss rispetto alla topologia associata alla norma suddetta (vedi l’esercizio 11.4), pertanto la curva detta deve rimanere confinata in una di tali componenti connesse, tale componente deve essere Sp (HSk ), dato che la curva interseca tale componente per t = 0. Se Ut = e−itH , quanto appena provato implica che, se ψ ∈ HSk ha norma unitaria, allora Ut ψ ∈ HSk per ogni t. Consideriamo allora ρ ∈ S(HSk ) e la sua decomposizione spettrale ρ = j∈J pj ψj (ψj | ), dove la serie converge nella topologia operatoriale forte e dove, per costruzione, ψj ∈ HSk per ogni j ∈ J `e un vettore di norma 1. Possiamo concludere che, per ogni t ∈ R: (H) γt (ρ) = Ut pj ψj (ψj | )Ut−1 = pj Ut ψj (ψj |Ut∗ ) j∈J
=
j∈J
pj Ut ψj (Ut ψj | ) ∈ S(HSk ) .
j∈J
Questo conclude la dimostrazione.
Osservazione 12.3. D’ora in poi assumeremo che lo spazio di Hilbert del sistema HS non contenga settori coerenti. In realt`a ci`o `e una restrizione nei confronti di quanto diremo nel seguito, solo per quanto riguarda lo studio delle simmetrie dinamiche discrete. Lasciamo al lettore la facile generalizzazione delle definizioni e dei risultati che seguono, al caso in cui lo spazio di Hilbert ammetta settori coerenti. 12.1.2 Simmetrie dinamiche La nozione di evoluzione temporale, ci consente di perfezionare la nozione di simmetria vista nel capitolo precedente, fino a definire il concetto di simmetria dinamica. Consideriamo un sistema quantistico S con flusso dinamico γ (H) . Ammettiamo, come detto sopra, che lo spazio di Hilbert sia costituito da un unico settore coerente. Consideriamo una simmetria σ (di Kadison o Wigner) che agisce sugli stati del sistema, prestando ora attenzione al fatto che gli stati evolvono nel tempo secondo la dinamica prescritta dal flusso dinamico γ (H) . (H) (H) Se applichiamo σ allo stato evoluto γt (ρ), ottenendo ρt := σ(γt (ρ)), non `e affatto garantito che la funzione R t → ρt descriva ancora una possibile evoluzione secondo γ (H) di uno stato del sistema (che coincide necessariamen(H) te con ρ0 = σ(γ0 (ρ)) = σ(ρ)). Se, viceversa, ci`o accade (per ogni scelta dello stato iniziale ρ), la simmetria σ `e detta simmetria dinamica, perch´e, nel senso appena visto, la sua azione `e compatibile con la dinamica del sistema. (H) Una variante della richiesta che R t → σ(γt (ρ)) descriva ancora una possibile evoluzione di uno stato sistema S, si ha quando, al posto di un’unica simmetria σ, se ne consideri una classe σ (t) parametrizzata nel tempo t ∈ R.
608
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
La richiesta per avere una simmetria dinamica dipendente dal tempo `e allora (H) che R t → σ (t) (γt (ρ)) sia ancora un’evoluzione temporale secondo γ (H) di uno stato del sistema S. Possiamo dare formalmente le definizioni. Definizione 12.4. Sia S un sistema quantistico, descritto nello spazio di Hilbert HS , costituito da un unico settore coerente, associato al sistema di riferimento inerziale I con hamiltoniano H e flusso dinamico γ (H) . Una simmetria σ : S(HS ) → S(HS ) si dice simmetria dinamica per il sistema S se vale: (H)
γt
(H)
◦ σ = σ ◦ γt
per ogni t ∈ R.
(12.2)
Una classe di simmetrie etichettata nel tempo, {σ (t) }t∈R, `e detta simmetria dinamica dipendente dal tempo se: (H)
γt
(H)
◦ σ (0) = σ (t) ◦ γt
per ogni t ∈ R.
(12.3)
Abbiamo il seguente primo risultato che caratterizza le simmetrie dinamiche. La caratterizzazione (c) `e un effetto del limite inferiore allo spettro di H e sussiste quando σ(H) non limitato superiormente, e questo accade nella maggior parte dei sistemi fisici reali. Teorema 12.5. Sia S un sistema quantistico descritto nello spazio di Hilbert HS associato al sistema di riferimento inerziale I con hamiltoniano H (quindi con spettro inferiormente limitato) e flusso dinamico γ (H) . (a) Si consideri una classe di simmetrie etichettate nel tempo {σ (t) }t∈R (t) indotte da corrispondenti operatori V (σ ) : HS → HS unitari o antiunitari. {σ (t)}t∈R `e una simmetria dinamica dipendente dal tempo per S se e solo se: χt V (σ
(t)
) −itH
e
= e−itH V (σ
(0)
)
per ogni t ∈ R e qualche χt ∈ C con |χt | = 1.
(b) Si consideri una simmetria σ indotta da un operatore V (σ) : HS → HS unitario o antiunitario. σ `e una simmetria dinamica per S se e solo se: e−iat V (σ) e−itH = e−itH V (σ)
per ogni t ∈ R e qualche a ∈ R .
(c) Si consideri un simmetria σ indotta da un operatore V (σ) : HS → HS unitario o antiunitario e si assuma infine che σ(H) non sia superiormente limitato. σ `e una simmetria dinamica per S se e solo se: V (σ) e−itH = e−itH V (σ)
per ogni t ∈ R ,
oppure, equivalentemente, se e solo se valgono entrambe le condizioni: (i) V (σ) `e unitario e (ii) V (σ) H = HV (σ) .
12.1 La dinamica quantistica e le sue simmetrie
609
Dimostrazione. (a) e (b). Si tenga conto del fatto che, se S : HS → HS `e unitario (oppure antiunitario), allora vale Sψ(ψ|S −1 ·) = Sψ(ψ|S ∗ ·) = Sψ(Sψ|·). (t) Posto Ut := e−itH , e V (t) := V (σ ) e specializzando l’identit`a di sopra all’operatore unitario S := (V (t)Ut )−1 Ut V (0) , la (12.3) implica per ogni stato puro ρ = ψ(ψ| ):
(V (t) Ut )−1 Ut V (0)ψ (V (t) Ut )−1 Ut V (0)ψ = ψ(ψ| ) , e dunque, per qualche χt ∈ C con |χt | = 1: (V (t) Ut )−1 Ut V (0)ψ = χt ψ
per ogni ψ ∈ H.
Con la stessa dimostrazione usata per il teorema 11.10, si vede che χt non dipende da ψ. In definitiva abbiamo ottenuto che se σ (t) `e una simmetria dinamica dipendente dal tempo, allora: χt V (σ
(t)
)
Ut = Ut V (σ
(0)
)
per ogni t ∈ R e qualche χt ∈ C con |χt | = 1 .
Se, viceversa, vale questa condizione allora banalmente σ (t) `e una simmetria dinamica dipendente dal tempo. Il caso (b) `e un sottocaso di quanto appena provato, eccetto la prova di χt = eict per qualche c ∈ R che daremo nel seguito. (c). Dimostriamo che se σ `e una simmetria dinamica allora valgono (i) e (ii) insieme. Per (a), se σ `e una simmetria dinamica allora: χt V (σ) Ut = Ut V (σ)
per qualche χt ∈ C con |χt | = 1 . (12.4)
Per cui χt I = (V (σ) Ut )−1 Ut V (σ) e quindi: χt (ψ|φ) = V (σ) Ut φ Ut V (σ) ψ . Se scegliamo φ ∈ D(H) e ψ ∈ V (σ)−1 (D(H)) non ortogonali (e questo `e possibile perch´e D(H) `e denso), possiamo applicare il teorema di Stone e concludere che t → χt `e ovunque differenziabile. Possiamo poi riscrivere la (12.4) come: χt Ut = e±itV
(σ)−1
HV σ
,
(12.5)
dove il segno − appare se V (σ) `e unitario, se `e invece antiunitario, appare il segno +. Usando il teorema di Stone nella (12.5), concludiamo che: D(V (σ)−1 HV (σ) ) ⊂ D(H) = D(cI + H) e vale l’identit` a: ∓V (σ)−1 HV (σ) D(H) = cI + H
t dove c := i dχ dt |t=0 .
(12.6)
Si osservi che c deve essere reale, dato che ∓V (σ)−1 HV (σ) − H `e simmetrico su D(H). In realt` a (12.6) deve valere anche su tutto dominio di V (σ)−1 HV (σ) che, essendo autoaggiunto, non pu` o avere altre estensioni autoaggiunte (in questo caso cI + H) differenti da ∓V (σ)−1 HV (σ) stesso. Concludiamo che: V (σ)−1 HV (σ) = ∓cI ∓ H .
(12.7)
In particolare dovr` a anche essere (vedi esercizio 11.6 per il caso antiunitario): σ(H) = σ(V (σ)−1 HV (σ) ) = σ (∓cI ∓ H) = ∓c ∓ σ(H) .
610
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Se σ(H) `e limitato dal basso, ma non `e limitato superiormente, questa identit`a `e impossibile se a secondo membro appare il segno −, qualunque sia la costante c. In tal caso V (σ) deve dunque essere unitario. Deve quindi essere inf σ(H) = inf(c + σ(H)) = c + inf σ(H) e quindi c = 0, dato che inf σ(H) `e finito per ipotesi essendo σ(H) = ∅ ed essendo inferiormente limitato. Abbiamo ottenuto che se σ `e una simmetria dinamica, allora valgono (i) e (ii): V (σ) `e unitario e soddisfa V (σ) H = HV (σ) . Se vale questa condizione allora vale H = V (σ)−1 HV (σ) . Passando agli esponenziali: V (σ) e−itH = e−itH V (σ)
per ogni t ∈ R .
Osserviamo infine che, se vale questa identit`a, allora σ `e una simmetria dinamica e questo conclude la prova del fatto che le condizioni menzionate in (c) siano equivalenti. Dobbiamo completare la dimostrazione di (b). Nel caso in cui σ sia una simmetria, ma σ(H) sia limitato superiormente, usando la dimostrazione fatta per (c), si conclude che vale ancora la (12.7), ma non si pu` o pi` u concludere che c = 0. Esponenziando (12.7) otteniamo comunque: e−ict Ut = V (σ)−1 Ut V (σ) , da cui (dove a = ±c a seconda che V (σ) sia unitario o antiunitario): e−iat V (σ) e−itH = e−itH V (σ) . Questo risultato conclude la dimostrazione di (b) e del teorema.
12.1.3 L’equazione di Schr¨ odinger e gli stati stazionari Consideriamo il caso di uno stato iniziale puro ρ ∈ Sp (HS ). In questo caso, come gi`a notato, l’evoluzione temporale `e tale che ogni stato evoluto ρt `e ancora uno stato puro. Questa propriet` a, nel gergo dei fisici teorici1 , viene spesso menzionata dicendo che l’evoluzione degli stati quantistici `e unitaria. Se t → ρt ∈ Sp (HS ) `e l’evoluzione temporale di uno stato puro, possiamo individuare, a meno di una fase, ogni ρt con un vettore ψt normalizzato a 1. Scegliendo nel modo pi` u semplice possibile le fasi degli stati puri coinvolti, l’equazione di evoluzione temporale per stati puri si riduce quindi a (reintroducendo la costante ): ψt = e−
i(t −t) H
ψt .
Possiamo elaborare questa equazione per ottenerne un’altra di grande importanza storica. La condizione ψt ∈ D(H) `e equivalente a ψt ∈ D(H) per ogni 1
Specialmente in relazione a problemi di evoluzione di stati quantistici di campo in spaziotempo che includono buchi neri dinamici, dove l’evoluzione unitaria `e molto problematica.
12.1 La dinamica quantistica e le sue simmetrie
= (ψt |P (H)(E)ψt ) = D’altra parte vale banalmente:
611
(H) λ2 dμψt < +∞, R iτ iτ (ψt |e+ H P (H) (E)e− H ψt ), se t − t
altro tempo t ∈ R. Infatti, ψt ∈ D(H) significa (H) μψt (E)
iτ
dove = τ.
iτ
e+ H P (H) (E)e− H = P (H) (E) , (H) dato che P (H) (E) `e un proiettore della PVM di H. Per cui R λ2 dμψt < +∞ 2 (H) equivale a R λ dμψt < +∞, ossia ψt ∈ D(H). Assumiamo allora che ψt ∈ D(H) per un certo valore di t, da cui segue che ψt ∈ D(H) per ogni valore del tempo t . Dal teorema di Stone applicato all’equazione di evoluzione: ψt = e−
i(t −t) H
ψt ,
interpretando la derivata che segue nel senso della topologia operatoriale forte, segue subito che: d i ψt = Hψt . (12.8) dt Questa `e la celeberrima equazione temporale di Schr¨ odinger. Bisogna tuttavia notare che (12.8) vale solo se ψt ∈ D(H), mentre l’equazione di evoluzione (12.1) ha validit` a generale. Facciamo qualche osservazione sull’equazione di Schr¨odinger e poi passeremo a questioni di carattere pi` u generale. In conseguenza della discussione sul principio di corrispondenza di Dirac al termine del capitolo 10, ci si aspetta che l’hamiltoniano di un sistema fisico dato da una particella di massa m (per semplicit`a senza spin) sottoposta ad una forza associata ad un’energia potenziale V = V (x) sufficientemente regolare, nel riferimento inerziale I nel quale abbiamo fissato un sistema di coordinate ortonormali destrorse, corrisponda quantisticamente a qualche estensione autoaggiunta H dell’operatore simmetrico: 3
H0 :=
1 2 P + V (X) , 2m i=1 i
inizialmente definito in qualche spazio denso invariante in cui gli operatori Pi e Xi siano ben definiti. Si verifica facilmente che questa scelta soddisfa formalmente il principio di corrispondenza di Dirac, almeno considerando le relazioni di commutazione tra l’operatore scritto sopra e gli operatori Xk e Pk , lavorando in domini in cui tutti gli operatori in gioco sono ben definiti. Nella realt` a fisica si vede che l’intuizione `e corretta e le osservabili hamiltoniane hanno proprio la forma detta, considerando sistemi fisici di grande interesse come atomi e molecole [CCP82]. Identificheremo lo spazio di Hilbert della particella con L2 (R3 , dx) in modo che gli operatori posizione siano moltiplicativi. Se si lavora in uno spazio di funzioni abbastanza regolari, l’espressione di partenza per H `e, quindi H0 = −
2 Δ + V (x) , 2m
(12.9)
612
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
dove Δ `e il noto operatore di Laplace su R3 e l’operatore V (X) diventa moltiplicativo e corrisponde alla moltiplicazione per la funzione iniziale V = V (x). L’equazione di Schr¨ odinger `e riscrivibile in questo caso come: * + 2 ∂ − Δ + V (X) ψt (x) = i ψt (x) , 2m ∂t che `e la forma in cui l’ha scritta Schr¨ odinger nelle sue due memorabili comunicazioni del 1926. Tuttavia bisogna fare attenzione al fatto che l’equazione considerata non deve essere presa alla lettera come un’ordinaria equazione alle derivate parziali perch´e: (1) la derivazione in t `e relativa alla topologia dello spazio di Hilbert e non `e puntuale2 ; (2) l’equazione vale in realt` a a meno di insiemi di misura nulla nella variabile x, dato che le funzioni d’onda sono elementi dello spazio L2 (R3 , dx). Nel caso in cui si trovino soluzioni di tale equazione nel senso “ingenuo”, bisogna poi dimostrare che tali soluzioni sono anche soluzioni in senso proprio dell’equazione (12.8). Tornando al problema della buona definizione dell’operatore hamiltoniano, partendo dall’operatore differenziale simmetrico (12.9) definito su un dominio denso, bisogna verificare caso per caso se, su tale dominio, l’operatore ammetta estensioni autoaggiunte o se sia addirittura essenzialmente autoaggiunto. Si osservi a tal proposito che l’operatore simmetrico H0 commuta con la coniugazione C : L2 (R3 , dx) → L2 (R3 , dx) che rappresenta la coniugazione complessa delle funzioni di tale spazio. Di conseguenza, per il teorema 5.42 di von Neumann, ammette sicuramente estensioni autoaggiunte. La teoria generale delle estensioni autoaggiunte di operatori della forma di H0 `e stata sviluppata da T. Kato [Kat66], con importantissimi risultati. Nel caso di potenziali di grande interesse fisico, come il potenziale coulombiano attrattivo e l’oscillatore armonico, si dimostra che H0 `e essenzialmente autoaggiunto. Abbiamo visto questi risultati nella sezione 9.6, in esempi 9.58, come conseguenza di alcuni teoremi generali. Esiste una branca dell’analisi funzionale in spazi di Hilbert dedicata a questo genere di problemi. Citiamo qui solo il seguente teorema, che segue facilmente come corollario dal teorema 9.56. Teorema 12.6. (Di Kato.) Si consideri l’operatore differenziale su R3 : H0 := −
2 Δ + V (x) , 2m
(12.10)
definito su qualche dominio denso D(H0 ) ⊃ S(R3 ) e si supponga che: V (x) =
N j=1
2
gj + U (x) , |x − xj |
(12.11)
Si osservi che tuttavia, se la derivata esiste sia in senso ordinario che nella topologia di L2 , i due risultati devono coincidere in virt` u della proposizione 2.42 con p = 2.
12.1 La dinamica quantistica e le sue simmetrie
613
dove le gj sono costanti, xj ∈ R3 sono punti fissati e U : R3 → R `e misurabile e (essenzialmente) limitata. In tal caso vale quanto segue. (a) H0 `e essenzialmente autoaggiunto su D(H0 ), D(R3 ) e S(R3 ). (b) L’unica estensione autoaggiunta H0 degli operatori considerati in (a) coincide con l’operatore autoaggiunto −Δ + V definito su D(−Δ). (c) σ(H0 ) `e limitato dal basso. In generale, se l’operatore hamiltoniano H di un certo sistema fisico ammette spettro puntuale σp(H), ogni autovettore ψE di H con E ∈ σp (H) ha un’evoluzione temporale banale: Ut ψE = e−i
tE
ψE .
In altre parole, lo stato puro ρE := ψE (ψE | ) associato a ψE (con ||ψE || = 1) non evolve temporalmente. Questi stati particolarissimi vengono detti stati stazionari del sistema. Studiando i sistemi microscopici atomi e molecole, in prima approssimazione si descrive la parte pi` u pesante – i nuclei degli atomi – come un sistema classico che agisce con forze elettriche coulombiane sugli elettroni periferici, pensati come particelle quantistiche. Gli stati quantistici degli elettroni in questi sistemi sono stati stazionari del loro hamiltoniano. Faremo ulteriori commenti su questo punto in (3) di esempi 12.8. Osservazioni 12.7. (1) In riferimento al teorema 12.6, si pu`o provare [CCP82] che se qualche gj `e nullo, i rimanenti gj sono strettamente negativi allora si ha σp (H0 ) = ∅. (2) In virt` u del teorema 9.57, H0 continua ad essere essenzialmente autoaggiunto su D(R3 ) e la sua unica estensione autoaggiunta `e limitata dal basso, se U `e non negativa e limitata inferiormente. In tal caso [CCP82], se gj = 0 per ogni j e la funzione U `e sufficientemente regolare e tende all’infinito per |x| → +∞, accade anche che σ(H0 ) = σp (H0 ) = ∅. (3) Uno degli scogli maggiori che incontrano gli studenti alle prime armi con lo studio della Meccanica Quantistica `e quello di comprendere il perch´e delle condizioni che si impongono sulla regolarit` a delle soluzioni dell’equazione agli autovalori per l’hamiltoniano della teoria. Consideriamo l’equazione agli autovalori: H0 ψE = EψE , E ∈ R , ψE L2 (R3 , dx) che, rozzamente parlando dovrebbe determinare gli stati stazionari del sistema fisico il cui hamiltoniano `e determinato da H0 . Consideriamo, come accade di frequente in fisica, un operatore della forma (12.10) in cui U : R3 → R che appare in (12.11) `e una funzione continua eccetto che per alcune superficie regolari σk , k = 1, 2, . . . , N (che non si intersecano e non intersecano le altre singolarit` a isolate di V ) su cui possiede discontinuit` a finite, ed `e limitata (o pi` u debolmente solo inferiormente limitata tenendo conto dell’osservazione (2)). Sui manuali di meccanica quantistica viene richiesto che le funzioni ψE soddisfino ancora una certa serie di condizioni:
614
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
(1) fuori dalle singolarit` a di V le ψE sono funzioni C 2 (in realt` a C ∞ ), (2) le ψE soddisfano l’equazione H0 ψE = EψE in senso proprio per qualche E ∈ R, cio`e interpretando l’operatore come un operatore differenziale, fuori dalle singolarit` a di V , (3) sulle superficie di singolarit` a, σk , di U le ψE sono continue e lo `e la derivata di ψE normale ad esse, (4) nei punti di singolarit` a isolati di V esistono e sono finiti i limiti di ψE . Queste condizioni sono a volte giustificate in modo un po’ fantasioso nei manuali di fisica (in particolare le analoghe condizioni riducendosi a lavorare su R1 ). A commento precisiamo che, prima di tutto H0 non `e l’operatore che rappresenta l’osservabile hamiltoniana del sistema, perch´e H0 non `e autoaggiunto! L’operatore in questione `e invece qualche estensione autoaggiunta di H0 . Il teorema 12.6 assicura che, nelle ipotesi dette per H0 , esso `e essenzialmente autoaggiunto su D(R3 ), per cui esiste un’unica estensione autoaggiunta che coincide contemporaneamente con la chiusura e l’aggiunto di H0 : H0 = H0∗ . Gli stati stazionari del sistema si ottengono allora determinando lo spettro di H0∗, cio`e risolvendo l’equazione: H0∗ ψE = EψE ,
E ∈R,
ψE ∈ D(H0∗ ) .
o anche scrivere Questa equazione, dato che D(R3 ) `e denso in L2 (R3 , dx) si pu` come: (ϕ|H0∗ ψE ) = E(ϕ|ψE ) , E ∈ R , per ogni ϕ ∈ D(R3 ) e dove ψE ∈ D(H0∗ ) `e fissato. Ricordando la definizione di aggiunto, l’equazione di sopra si riscrive: (H0 ϕ|ψE ) = E(ϕ|ψE ) ,
E ∈R,
per ogni ϕ ∈ D(R3 ) e dove ψE ∈ D(H0∗ ) `e fissato. In altre parole, stiamo cercando delle funzioni ψE ∈ L2 (R3 , dx) tali che, per ogni ϕ ∈ D(R3 ): R3
−
2 Δϕ(x) + V (x)ϕ(x) − Eϕ(x) ψE (x) dx = 0 . 2m
(12.12)
Dunque le funzioni ψE non devono risolvere necessariamente l’equazione H0∗ψE = EψE , ma la devono risolvere solo in senso debole, cio`e devono soddisfare la (12.12) per ogni ϕ ∈ D(R3 ). A questo punto, esiste una trattazione generale di questo genere di problemi [ReSi80] essenzialmente legati alla teoria della regolarit` a ellittica, che provano che [CCP82] ψE ∈ L2 (R3 , dx) soddisfa (12.12), con le condizioni dette sul potenziale V , se e solo se verifica le condizioni (1)-(4) citate prima.
12.1 La dinamica quantistica e le sue simmetrie
615
Esempi 12.8. (1) L’esempio pi` u elementare possibile `e quello della particella senza spin, libera, di massa m > 0, descritta nello spazio di Hilbert L2 (R3 , dx) associato agli assi di un riferimento inerziale I. Gli stati puri sono rappresentati da funzioni d’onda, cio`e elementi ψ ∈ L2 (R3 , dx) con ||ψ|| = 1. In questo caso l’hamiltoniano `e semplicemente: 3
H :=
1 2 Pk 2S(R3 ) = − ΔS(R3 ) . 2m 2m
(12.13)
k=1
Discutiamo brevemente sull’autoaggiunzione di tale operatore. In realt`a, la discussione dovrebbe essere ovvia dal contenuto della proposizione 9.51, tuttavia `e interessante ripetere qualche osservazione. Il secondo membro della (12.13) `e autoaggiunto dato che l’operatore: 3
H0 :=
1 2 Pk 2S(R3 ) = − ΔS(R3 ) 2m 2m k=1
`e essenzialmente autoaggiunto. La prova `e diretta usando l’operatore unitario di Fourier-Plancherel F e notando che, nello spazio L2 (R3 , dk) delle funzioni trasformate ψ6 := F(ψ), l’operatore scritto sopra corrisponde all’operatore moltiplicativo per la funzione: k →
2 2 k , 2m
con dominio denso D(F−1 H0 F) := S(R3 ). Per costruzione l’operatore F−1 H0 F `e simmetrico, inoltre, si dimostra facilmente che tale operatore `e essenzialmente autoaggiunto, provando direttamente che Ker((F−1 H0 F)∗ ± I) = {0}, oppure mostrando che ogni vettore di D(R3 ) ⊂ S(R3 ) `e un vettore analitico per F−1 H0 F. Le stesse propriet`a sono soddisfatte da H0 dato che F `e unitario. 6 := F−1 H F, quest’ultimo agisce Per costruzione se H := H0 e si definisce H ancora come operatore moltiplicativo: dove 6 = D(H)
2 6 6 ψ6 (k) = k2 ψ(k) H , 2m
ψ6 ∈ L2 (R3 , dk)
R3
2 6 |k|4 |ψ(k)| dk < +∞
.
Una definizione alternativa di H si ottiene prendendo l’unica estensione autoaggiunta dell’operatore iniziale H0 definito su D(R3 ) invece che su S(R3 ): H0 :=
3 1 2 Pk 2D(R3 ) = − ΔD(R3 ) . 2m 2m k=1
616
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Tuttavia, anche in questo caso H0 `e essenzialmente autoaggiunto e la sua unica estensione autoaggiunta coincide con H precedentemente trovato. Infine 3 si potrebbe definire inizialmente H0 sullo spazio F(D(R )), trovando ancora lo stesso risultato. Tutto ci`o `e immediata conseguenza della proposizione 9.51. (2) Un caso fisicamente interessante su R3 `e quello in cui si modifica l’hamiltoniano libero tramite l’energia potenziale associata al potenziale coulombiano attrattivo: eQ V (x) = , |x| dove e < 0 e Q > 0 sono costanti e rappresentano le cariche elettriche della particella, e, e del centro attrattivo, Q. In questo caso le ipotesi del teorema 9.56 (o 9.54) di Kato sono verificate come si prova subito (m, > 0 sono costanti che non creano alcun problema nell’applicare il teorema detto, dato che si pu`o moltiplicare l’operatore per 2m/2 prima di applicare il teorema senza perdere generalit` a). Dunque l’operatore: H0 := −
2 Δ + V (x) 2m
risulta essere essenzialmente autoaggiunto se, indifferentemente, `e definito su D(R3 ) oppure S(R3 ). Se −Q = e `e la carica dell’elettrone (−1.60 · 10−19 C), e m = me `e massa dell’elettrone (9.11 · 10−31 Kg), l’unica estensione autoaggiunta, H0 , corrisponde all’hamiltoniano di un elettrone nel campo elettrico di un protone (trascurando gli effetti dovuti allo spin e considerando il protone come un oggetto classico di massa infinita). Abbiamo in questo modo la pi` u semplice descrizione quantistica dell’operatore hamiltoniano dell’atomo di idrogeno. Un risultato importante `e che, malgrado V non sia limitato dal basso, lo spettro dell’operatore considerato lo `e in ogni caso e, conseguentemente, lo sono i valori dell’energia fisicamente permessi. Questo significa che il sistema dell’atomo di idrogeno `e energeticamente stabile: non pu` o collassare verso livelli energetici sempre pi` u bassi emettendo una quantit` a, alla fine infinita, di energia interagendo con il campo elettromagnetico (cio`e nell’energia di fotoni emessi dall’atomo, in un modo che non discuteremo in questo libro, molto elementare dal punto di vista fisico). Si osservi che l’analogo modello classico, pensando l’elettrone ed il centro di attrazione come puntiformi, non avrebbe energia totale limitata dal basso3 . Lo studio dello spettro di H0 [CCP82], prova che σc (H0 ) = [0, +∞) mentre σp (H0 ) = {En }n=1,2,... dove, se R = me4 /(4πc3 ) `e la costante di Rydberg e c la velocit` a della luce: En = − 3
2πRc n2
n = 1, 2, 3, . . .
(12.14)
Un tale modello classico non sarebbe comunque consistente a causa della radiazione di frenamento dell’elettrone accelerato che, come ben noto, produce inconsistenze matematiche nel limite di raggio nullo dell’elettrone.
12.1 La dinamica quantistica e le sue simmetrie
617
Gli autovettori hanno una forma complicata [CCP82]. Per ognuno dei suddetti valori En , con n = 1, 2, 3, l’autospazio corrispondente ammette la seguente base hilbertiana finita, dove l = 0, 1, . . ., n − 1 e m = −l, −l + 1, . . . , l − 1, l e, lavorando in coordinate sferiche: ψnlm (r, θ, φ) = ! −
2 na0
2
(n − l − 1)! − nar 0 e 2n[(n + l)!]3
2r na0
l
L2l+1 n+l
2r na0
Ylm (θ, φ) .
(12.15)
Le Ylm sono le armoniche sferiche (9.101), a0 = 2 /e2 me = 0, 529 ˚ A `e il raggio della prima orbita di Bohr, e Lα (x), per x ≥ 0, ` e il polinomio associato di n Laguerre: * + n dα x d n −x Lα e (x) := (x e ) , con n ∈ N e α = 0, 1, . . ., n. n dxα dxn Studiando l’interazione tra i fotoni e l’atomo di idrogeno [CCP82], si vede che l’elettrone inizialmente in uno stato stazionario, individuato da un autovettore di H0 con autovalore En , pu` o cambiare il suo stato, passando ad un nuovo stato stazionario con energia Em < En , trasferendo la sua energia in eccesso ad un fotone. Pu` o anche avvenire il processo inverso in cui l’elettrone ricevendo l’energia da un fotone passa dallo stato di energia Em allo stato di energia En . Si dimostra che, a causa dell’interazione con i fotoni, solo lo stato relativo alla minima energia E1 = 2πRc, il cosiddetto livello fondamentale, `e stabile, gli altri sono instabili e l’elettrone decade sul livello fondamentale dopo un certo tempo di vita medio che pu`o essere calcolato. (Pertanto il termine stato stazionario non `e del tutto appropriato quando si considera il sistema complessivo di un atomo con il campo elettromagnetico, descritto dai fotoni e sarebbe pi` u preciso parlare semplicemente di autovalori dell’hamiltoniano dell’atomo di idrogeno.) Tutte le possibili differenze di energia En − Em determinano tutte le possibili frequenze dei fotoni, cio`e della luce, che un gas di atomi di idrogeno pu` o emettere o assorbire, attraverso la relazione di Einstein En − Em = hνn,m – che lega la frequenza νn,m dei fotoni emessi dall’atomo all’energia nel passare dal livello En al livello Em dei fotoni stessi (vedi il capitolo 6). Questi valori νn,m delle frequenze erano ben noti ed inspiegabili per i fisici spettroscopisti del 1800, molto tempo prima che fosse formulata la Meccanica Quantistica [CCP82]. Ritrovare tali valori e spiegarli per via completamente teorica `e stato sicuramente uno dei trionfi della fisica del secolo scorso. (3) Un secondo caso fisicamente interessante, sempre in R3 , `e quello in cui all’hamiltoniano della particella libera considerato nell’esempio (1) `e aggiunto il potenziale di Yukawa: −e−μ|x| V (x) = , |x|
618
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
dove μ > 0 `e ancora una costante positiva. Anche in questo caso l’operatore 2 Δ + V (x) risulta essere essenzialmente autoaggiunto se, indiffeH0 = − 2m rentemente, definito su D(R3 ) oppure S(R3 ), come segue dal teorema 9.56 (o 9.54) di Kato. Il potenziale di Yukawa descrive, in prima approssimazione, processi d’interazione tra un pione ed una sorgente di forza forte pensata, in questa approssimazione, come dovuta ad una sorgente macroscopica. (4) In riferimento all’esempio (1), l’azione dell’evolutore `e evidente in rappresentazione di Fourier: it it 2 6t ψ)(k) 6 6 (U = e− H ψ6 (k) = e− 2m k ψ(k) . (12.16) La dimostrazione si ottiene immediatamente usando le decomposizioni spet6 e tenendo conto del fatto che le misure spettrali di P1 , P2 , P3 trali di H commutano, da cui: it
it
2
it
2
it
2
e− H = e− 2m P1 e− 2m P2 e− 2m P3 , dove ogni P6j = F−1 Pj F `e l’operatore moltiplicativo: 6 . P6j ψ6 (k) = kj ψ(k) Torniamo in rappresentazione posizione e consideriamo l’evoluzione temporale della funzione d’onda ψ – cio`e una funzione d’onda che individua lo stato Ut ρUt∗ quando ρ = ψ(ψ| ) – `e: 2 eik·x 6 t −i t H ψ(t, x) := e ψ (x) = (12.17) ψ(k)e−i 2m k dk 3/2 (2π) 3 R dove:
ψ(x) = ψ(0, x) := R3
eik·x 6 ψ(k) dk , (2π)3/2
(12.18)
quando ψ ∈ S(R3 ), altrimenti, in generale, i due integrali si devono intendere nel senso della trasformata di Fourier-Plancherel. 12.1.4 L’azione del gruppo di Galileo in rappresentazione posizione La discussione in (4) in esempi 12.8 consente di esplicitare in rappresentazione posizione l’azione del gruppo di Galileo, discussa alla fine del capitolo 11 in rappresentazione impulso per la particella libera di spin s generico. Se (τ, c, v, U ) `e il generico elemento del rivestimento universale C SG del gruppo speciale di Galileo, la rappresentazione menzionata sopra `e quella indotta dagli (m) operatori unitari Z(τ,c,v,U ) che, in rappresentazione impulso, agiscono come (11.104): 2 τ i(τv−c)·(k−mv) i 2m (m) 6 e (k−mv) ψ6 R(U )−1 (k − mv) . Z (τ,c,v,U )ψ (k) := e
12.1 La dinamica quantistica e le sue simmetrie
619
Passando in rappresentazione posizione, eseguendo la trasformata di Fourier6 si ottiene facilmente che, se ψ ∈ L2 (R2 , dx), Plancherel inversa ψ = F−1 ψ, allora: (m) Ut Z(τ,c,v,U )ψ (x) ψ t − τ, R(U )−1 (x − c) − (t − τ )R(U )−1 c) . (m) In altre parole, se ψ (t, x) := Ut Z(τ,c,v,U )ψ (x) `e la funzione d’onda sulla quale ha agito a t = 0 l’elemento (τ, c, v, U ) del (rivestimento universale del) gruppo di Galileo e poi `e stata fatta evolvere fino al tempo t, tenendo conto di (11.97), abbiamo: = eim(v·x−v
2
t/2)
ψ (t, x) = eim(v·x−v
2
t/2)
ψ (τ, c, v, U )−1(t, x) .
(12.19)
Nel caso di particelle con spin s, come precisato nel capitolo precedente, fissando un riferimento inerziale, lo spazio di Hilbert `e L2 (R3 , dx) ⊗ C2s+1 e le funzioni d’onda sono i vettori normalizzati a 1 della forma: s
Ψ =
ψsz ⊗ |s, sz ,
sz =−s
dove i vettori |s, sz individuano la base canonica di C2s+1 rispetto alla quale l’operatore di spin Sz `e diagonale ed ha gli sz come autovalori. Come gi`a osservato, in base alla decomposizione appena scritta, L2 (R3 , dx) ⊗ C2s+1 risulta essere naturalmente isomorfo alla somma diretta ortogonale di 2s+1 copie di L2 (R3 , dx); di conseguenza i vettori Ψ si identificano con spinori di ordine s, cio`e con vettori colonna di funzioni d’onda di particella senza spin: Ψ ≡ (ψs , ψs−1 , · · · , ψ−s+1 , ψ−s )t . (m) Se definiamo Ψ (t, x) := Ut Z(τ,c,v,U ) ⊗ U Ψ (x), l’azione attiva del gruppo di Galileo `e allora:
im(v·x−v 2 t/2)
Ψ (t, x) = e
s
ψsz (τ, c, v, U )−1 (t, x) ⊗ U |s, sz . (12.20)
sz =−s
Ovvero, in termini di componenti spinoriali: ψs z (t, x) = eim(v·x−v
2
t/2)
s
Usz sz ψsz (τ, c, v, U )−1 (t, x) ,
(12.21)
sz =−s
dove Uij `e l’elemento matriciale di U sulla base canonica di C2s+1 . Il risultato ottenuto, pensando le trasformazioni di Galileo in senso passivo (m) e pensando quindi le trasformazioni Z(τ,c,v,U ) come operatori unitari tra differenti spazi di Hilbert associati a due differenti sistemi di riferimento per
620
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
descrivere lo stesso sistema fisico, consente di descrivere le trasformazioni degli stati quantistici tra due differenti sistemi di riferimento. L’idea di base `e che, se agisco su uno stato con una trasformazione attiva di Galileo e poi cambio sistema di riferimento e passo ad un nuovo sistema di riferimento che `e legato al precedente esattamente con la stessa trasformazione di Galileo con cui ho trasformato lo stato, nel nuovo riferimento, lo stato trasformato deve apparire come quello iniziale non trasformato. Pertanto la legge di trasformazione passiva degli stati (cambiamento di coordinate) deve corrispondere alle inverse delle trasformazioni attive viste sopra, nel senso che `e necessario rimpiazzare (τ, c, v, U ) con (τ, c, v, U )−1 in (12.21). Mettiamo ora in pratica questa ricetta. Consideriamo due sistemi di riferimento inerziali I e I , con coordinate solidali cartesiane ortogonali destrorse, rispettivamente, x1 , x2, x3 e x1 , x2 , x3 e coordinate temporali, rispettivamente, t e t . Si supponga che la legge di trasformazione tra le coordinate sia data dalla trasformazione di Galileo speciale: ⎧ ⎪ ⎨ t = t+τ , 3 (12.22) x = c + tv + Rij xj , i=1,2,3 ⎪ i i i ⎩ j=1
dove τ ∈ R, ci ∈ R, vi ∈ R e R ∈ SO(3). Considerando una particella di spin s, lo spazio di Hilbert della teoria si identifica con H := L2 (R3 , dx) ⊗ C2s+1 per il riferimento I, mentre si identifica con H := L2 (R3 , dx) ⊗ C2s+1 per il riferimento I . Gli spazi R3 e R3 sono identificati con gli spazi di quiete dei rispettivi riferimenti usando le coordinate cartesiane dette prima. Le basi canoniche degli spazi C2s+1 e C2s+1 sono identificate con basi hilbertiane di autovettori degli operatori di spin rispetto al terzo asse: S3 e S3 . Scegliamo una matrice U ∈ SU (2) tale che la sua immagine secondo l’omomorfismo di rivestimento di SU (2) su SO(3) coincida con R. (U `e determinata a meno del segno come notato nel capitolo precedente, ma tale segno pu`o al pi` u alterare i vettori che rappresentano stati puri per un segno che non altera lo stato rappresentato dal vettore.) Consideriamo poi uno stato puro del sistema, descritto nel riferimento I, dal vettore di norma unitaria Ψ , e la sua evoluzione temporale nel riferimento I. Lo stato Ψ corrisponder`a ad uno stato Ψ nel riferimento I , con una corrispondente evoluzione temporale. Il legame tra gli spinori Ψ e Ψ , al variare del tempo `e quindi, rimpiazzando (τ, c, v, U ) con (τ, c, v, U )−1 in (12.21) (tenendo conto del fatto che i parametri τ, c, v, U appaiono anche nella fase): ψs z (t , x ) = eim(v·R(U )x−v
2
t/2)
s
Usz sz ψsz (t + τ, R(U )x + τ v + c) ,
sz =−s
(12.23) e, in particolare, nel caso di spin s = 0: ψ (t , x ) = eim(v·R(U )x−v
2
t /2)
ψ (t + τ, R(U )x + τ v + c) ,
(12.24)
dove le coordinate (t, x) e (t , x ) sono legate tra di esse dalla relazione (12.22).
12.1 La dinamica quantistica e le sue simmetrie
621
2
Osservazione 12.9. A parte la fase eim(v·R(U )x−v t/2) (che non pu` o essere rimossa cambiando il rappresentate del raggio considerato, dato che dipende dalla variabile x), questa `e la trasformazione che ci si aspetta in termini intuitivi, immaginando che la funzione d’onda a spin s = 0 e ciascuna delle componenti di quella a spin s = 0, sia un campo scalare nello spaziotempo della fisica classica. L’interpretazione della funzione d’onda in rappresentazione posizione come un campo scalare sullo spaziotempo `e un’interpretazione non ovvia a priori, che si rivela profondamente falsa (non solo per una fase) nelle teorie relativistiche, dove si vede che le funzioni d’onda in rappresentazione posizione (nel cosiddetto formalismo di Newton-Wigner [BaRa86]) sono oggetti altamente non locali4. 12.1.5 L’evolutore temporale in assenza di omogeneit` a temporale e la serie di Dyson Torniamo sulla nozione di evolutore temporale, per presentarne una generalizzazione legata all’equazione di Schr¨ odinger. Un’osservazione importante sulla nozione di evolutore temporale che abbiamo dato nell’assioma A.6, `e che l’evolutore Uτ `e in realt` a indipendente dall’istante iniziale. Se fissiamo lo stato ρ al tempo iniziale t, Uτ ρUτ∗ sar`a lo stato al tempo t + τ . Se avessimo fissato lo stesso stato ρ al tempo iniziale t = t, Uτ ρUτ∗ sarebbe stato lo stato al tempo t + τ . Questa situazione implica che le leggi della dinamica del sistema non si modifichino nell’intervallo temporale [t, t ]. In altre parole l’assioma A.6 presuppone che, per il sistema fisico S descritto nel riferimento I, valga la propriet` a omogeneit` a temporale. Dal punto di vista classico questa situazione corrisponde alla situazione in cui la funzione di Hamilton non dipende esplicitamente dal tempo in coordinate solidali con un certo sistema di riferimento. Esistono situazioni dinamiche pi` u generali, in cui questa ipotesi non `e pi` u valida. Questo accade quando il sistema S interagisce con un esterno che si modifica nel tempo, viceversa se S `e isolato (ma questo non `e l’unico caso) e la descrizione avviene in un sistema di riferimento inerziale, vale l’omogeneit`a del tempo come accade in meccanica classica. Nel caso generale di assenza di omogeneit`a temporale, l’evoluzione temporale viene assiomatizzata come segue. A6’. Descrivendo il sistema fisico quantistico S in un riferimento inerziale I, con spazio degli stati HS , si assume che esista una famiglia di operatori unitari su HS , {U (t2 , t1 )}t2 ,t1∈R , detti evolutori temporali da t1 a t2 , che soddisfano le propriet` a:
4 Bisogna non confondere la funzione d’onda in rappresentazione posizione con il campo di seconda quantizzazione che `e invece un oggetto locale.
622
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
(i) U (t, t) = I, (ii) U (t , t )U (t , t) = U (t , t), (iii) U (t , t) = U (t, t )∗ e tali che la funzione R2 (t, t ) → U (t, t ) sia fortemente continua. Si assume infine che, se ρ `e lo stato del sistema al tempo t0 , lo stato evoluto al tempo t1 (che pu` o anche precedere t0 ) `e U (t1 , t0 )ρU (t1 , t0 )∗ . La differenza fondamentale rispetto al caso descritto dall’assioma A.6 `e che ora non si pu` o pi` u associare un generatore autoaggiunto alla famiglia {U (t2 , t1 )}t2 ,t1∈R e, in generale, non ha senso parlare di hamiltoniano del sistema. Tuttavia esso pu`o ancora essere introdotto (come hamiltoniano dipendente dal tempo) generalizzando l’equazione di Schr¨ odinger e definendo gli operatori U (t , t) come soluzioni operatoriali di tale equazione. Dal punto di vista formale, l’evolutore Uτ dell’assioma A6 soddisfa l’equazione (ponendo = 1): d s- Uτ = −iHUτ . dτ Nel caso dell’evolutore generalizzato U (t , t), si pu`o assumere che sussista un’analoga equazione: s-
d U (τ, t) = −iH(τ )U (τ, t) , dτ
(12.25)
quando ad ogni istante di tempo τ `e assegnata un’osservabile, detta hamiltoniano al tempo τ , che si identifica con l’energia del sistema fisico (nel riferimento considerato) all’istante τ . L’equazione (12.25) presenta alcuni delicati problemi tecnici per essere trattata rigorosamente a causa dei domini differenti dei vari operatori H(τ ), tuttavia `e utilissima in varie applicazioni pratiche. La cosiddetta serie di Dyson, fondamentale in elettrodinamica quantistica ed in teoria quantistica dei campi, `e una soluzione formale di tale equazione. Riportiamo a tal proposito la seguente proposizione, che illustra una situazione semplificata, in cui ogni hamiltoniano H(τ ) `e supposto limitato e definito su tutto lo spazio di Hilbert. In questo caso la classe degli operatori H(τ ) determina effettivamente una classe continua di evolutori temporali U (t , t) tramite l’equazione (12.25), rappresentati tramite la serie di Dyson. Proposizione 12.10. Sia H spazio di Hilbert e R t → H(t) ∈ B(H) continua nella topologia operatoriale forte. Si considerino gli operatori U (t, s) espressi dalla serie di Dyson: U (t, s) := I +
∞
(−i)n
n=1
t
t1
dt1 H(t1 ) s
s
dt2 H(t2 ) · · ·
tn−1
dtn−1 H(tn ) s
(12.26) dove gli integrali iterati sono definiti nel senso della proposizione 9.24 e la serie risulta convergere nella topologia uniforme. Vale quanto segue.
12.1 La dinamica quantistica e le sue simmetrie
623
(a) Gli U (t, s) soddisfano le condizioni (i) e (ii) di A6’. Vale anche (iii) se tutti gli operatori H(t) sono autoaggiunti, in qual caso ogni U (t, s) `e unitario. (b) La funzione R (t, s) → U (t, s) `e continua nella topologia operatoriale uniforme. (c) Vale l’equazione di Schr¨ odinger generalizzata: s-
d U (t, s) = −iH(t)U (t, s) dt
per ogni t, s ∈ R.
(12.27)
Dimostrazione. Prima di tutto notiamo che ogni termine dello sviluppo di Dyson: t t1 tn−1 dt1 H(t1 ) dt2 H(t2 ) · · · dtn−1 H(tn ) , Un (t, s) = (−i)n s
s
s
ha senso dato che – per (c) in proposizione 9.24 – ogni funzione integrale che appare a secondo membro, a partire da quella pi` u a destra (tn−1 , s) → tn−1 dtn−1H(tn ), definisce una funzione a valori in B(H) fortemente cons giuntamente continua nella coppia di estremi di integrazione (e quindi anche nell’estremo superiore separatamente) ed il prodotto (nel senso della composizione operatoriale puntuale) di due funzioni di tale tipo `e ancora una funzione a valori in B(H) fortemente continua, che pu`o essere a sua volta integrata. Usando le propriet` a dell’integrale definito in proposizione 9.24, dove ora la funzione L1 `e data dalla funzione caratteristica del considerato intervallo [s, tk ], si dimostra facilmente che l’n-esimo termine della serie di Dyson Un (t, s), con t, s ∈ [T, S], soddisfa la stima: n |b − a|n ||Un (t, s)|| ≤ Aa,b := sup ||H(τ )|| , (t, s) ∈ [a, b]2 . (12.28) n! τ∈[a,b] Come osservato nella dimostrazione della proposizione 9.24, dato che τ → H(τ ) `e continuo nella topologia operatoriale forte, supτ∈[a,b] ||H(τ )|| < +∞ per il teorema di Banach-Steinhaus. Pertanto 0 ≤ Aa,b < +∞. Dato che la serie di termine positivo generico Aa,b converge, concludiamo che la serie di Dyson converge nella topologia uniforme, uniformemente in (s, t) su ogni compatto. Di conseguenza, assumendo che ogni termine della serie di Dyson sia continuo nella topologia uniforme (come dimostreremo sotto) segue anche che (t, s) → U (t, s) `e continuo nella topologia uniforme. Per mostrare che i termini dell serie di Dyson sono continui nella topologia uniforme, si deve tenere conto della loro evidente relazione di ricorrenza: t Un (t, s) = −i H(τ )Un−1 (τ, s)dτ . (12.29) s
Da essa segue facilmente che, lavorando nel compatto [a, b] × [a, b]
t
||Un (t, s) − U (t , s )|| ≤
H(τ )Un−1 (τ, s)dτ
t
624
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
t
s
+
H(τ )(Un−1 (τ, s) − Un−1 (τ, s ))dτ
+
H(τ )Un−1 (τ, s )dτ
,
s
s
e quindi, in base ad (a) in proposizione 9.24: ||Un (t, s) − U (t , s )|| ≤ |t − t |
sup (τ,σ)∈[a,b]2
||H(τ )||||Un−1(τ, σ)||
+(b − a) sup ||H(τ )||||Un−1(τ, s) − Un−1 (τ, s )|| τ∈[a,b]
+|s − s |
sup (τ,σ)∈[a,b]2
||H(τ )||||Un−1(τ, σ)|| .
Si conclude che se (t, s) → Un−1 (t, s) `e continua nella topologia uniforme, allora lo deve anche essere (t, s) → Un (t, s), in particolare: sup ||H(τ )||||Un−1(τ, s) − Un−1 (τ, s )|| → 0 se s → s τ∈[a,b]
dato che (oltre ad esistere supτ∈[a,b] ||H(τ )|| < +∞ come osservato sopra), la continuit` a di (t, s) → Un−1 (t, s) sul compatto [a, b]2 implica l’uniforme continuit` a sullo stesso compatto. In base al principio di induzione `e allora t sufficiente provare che U1 (t, s) = −i s dt1 H(t1 ) `e continuo. Ma sappiamo che ci`o `e vero da (i) in (c) in proposizione 9.24. Abbiamo dimostrato (b) e parte di (a). Concludiamo la prova di (a). Per costruzione U (t, t) = I e, se ogni H(τ ) `e autoaggiunto: U (t, s)∗ = U (s, t). La relazione (ii), una volta trascritta la serie di Dyson come in (12.31) (la prova `e facile per induzione), si prova similmente a eA+B = eA eB quando le matrici A e B commutano, moltiplicando le serie di Dyson e raccogliendo opportunamente il risultato, lasciamo i dettagli al lettore. Nel caso in cui ogni H(τ ) `e autoaggiunto, abbiamo allora che U (s, t)U (s, t)∗ = U (s, t)U (t, s) = U (s, s) = I e, similmente U (s, t)∗ U (s, t) = I che implicano che U (s, t) sia unitario. Passiamo a provare (c). Applicando (b) di proposizione 9.24 ai singoli termini della serie di Dyson calcolata su un vettore ψ, differenziando termine a termine la serie e tenendo conto delle relazioni di ricorrenza (12.29), si arriva immediatamente a: d U (t, s)ψ = −iH(t)U (t, s)ψ , dt
cio`e s-
d U (t, s) = −iH(t)U (t, s) , (12.30) dt
ammesso che sia possibile scambiare il segno di derivata con quello di serie. Usando ancora la stima (12.28) unitamente a supt∈[a,b] ||H(t)|| < +∞ si ha che serie delle derivate converge uniformemente sui compatti nella topologia uniforme e quindi, uniformemente, anche in quella forte. Pertanto la serie di Dyson pu` o essere derivata in t (nella topologia forte) sotto il simbolo di somma provando (12.30).
12.1 La dinamica quantistica e le sue simmetrie
625
Osservazioni 12.11. (1) Lasciamo al lettore la semplice prova (per induzione) del fatto che la serie di Dyson (12.26) per l’evolutore U (t, s) pu` o essere riscritta come t +∞ (−i)n t t ··· T [H(t1 )H(t2 ) · · · H(tn )] dtn dtn−1 · · · dt1 . n! s s s n=0 (12.31) Dove abbiamo introdotto l’ordinatore cronologico di prodotti di operatori: U (t, s) =
T [H(t1 )H(t2 ) · · · H(tn )] := H(τn )H(τn−1 ) · · · H(τ1 ) u grande tra t1 , . . . , tn , mentre τn−1 ≤ τn `e il pi` u grande tra dove τn `e il pi` i rimanenti valori di t1 , . . . , tn dopo avere eliminato τn e via di seguito. La serie di Dyson scritta nella forma (12.31) assomiglia allo sviluppo in serie dell’esponenziale, ma con il riordinamento temporale. Per tale motivo la serie di Dyson si trova scritta alternativamente, ripristinando la costante : E i t F U (t, s) = T e− s H(τ)dτ . (12.32) Si osservi che nel caso di H non dipendente dal tempo, il secondo membro si (t−s) riduce proprio a e−i H come ci si aspetta. (2) Come gi`a osservato, l’uso della serie di Dyson `e di centrale importanza in teoria quantistica dei campi e comunque in teoria delle perturbazioni, quando l’hamiltoniano `e decomposto come H = H0 + V , dove V rappresenta una correzione a H0 ed alla dinamica da esso generata. In questa situazione si usa una procedura che si basa sulla cosiddetta rappresentazione d’interazione di Dirac [CCP82] in cui la serie di Dyson gioca un ruolo centrale. In generale, nelle applicazioni concrete, la serie di Dyson viene comunque adoperata in contesti in cui H non `e un operatore limitato. Per tale motivo il teorema provato sopra non pu` o essere applicato e la serie deve essere intesa in qualche senso debole [ReSi80]. 12.1.6 Inversione del tempo antiunitaria Ritorniamo ora a questioni di carattere pi` u generale, in riferimento all’assioma di evoluzione temporale A6, cio`e in presenza di omogeneit` a temporale, e mostriamo altre due importanti conseguenze della richiesta di esistenza di un limite inferiore allo spettro dell’hamiltoniano H. Sappiamo dal capitolo precedente che se un sistema fisico ammette una certa simmetria (se di Kadison o Wigner `e irrilevante per il teorema 11.12), essa `e descritta da una trasformazione unitaria oppure antiunitaria. Se un sistema fisico S con hamiltoniano H ammette come simmetria l’inversione del tempo o time reversal γT (vedi (2) in esempi 11.17), individuata dall’operatore T : HS → HS unitario oppure antiunitario (ammettiamo che lo spazio di
626
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Hilbert sia costituito da un unico settore coerente), questo operatore deve soddisfare, per definizione, l’ovvia richiesta (poniamo = 1 nel seguito): γT
(H)
γt
(H) (ρ) = γ−t (γT (ρ)) .
In altre parole, deve valere: e−itH T ρT −1 e−itH = T e+itH ρe−itH T −1
per ogni ρ ∈ S(HS ).
(12.33)
Si osservi che dunque l’inversione del tempo, quando esiste, non `e una simmetria dinamica nel senso della definizione 12.4, a causa dell’inversione del segno del tempo nel flusso dinamico. Abbiamo tuttavia il seguente risultato che, in parte, ripropone la tesi della proposizione 12.2. Teorema 12.12. Si consideri un sistema fisico S con hamiltoniano H (dunque con spettro limitato dal basso) sullo spazio di Hilbert HS . Se lo spettro di H `e illimitato superiormente, allora ogni operatore T : HS → HS che soddisfi la (12.33) – e quindi in particolare l’operatore che rappresenta la simmetria di inversione temporale, se esiste – deve essere antiunitario e deve soddisfare: T −1 HT = H . Dimostrazione. Si tenga conto del fatto che, se V : HS → HS `e unitario (oppure antiunitario), allora vale V ψ(ψ|V −1 ·) = V ψ(ψ|V ∗ ·) = V ψ(V ψ|·). Da cui, posto Ut := e−itH , per ogni stato puro ρ = ψ(ψ| ), specializzandoci all’operatore unitario V := (T U−t )−1 Ut T :
(T U−t )−1 Ut T ψ (T U−t )−1 Ut T ψ = ψ(ψ| ) , e dunque, per qualche χt ∈ C con |χt | = 1: (T U−t )−1 Ut T ψ = χt ψ
per ogni ψ ∈ H.
Con la stessa dimostrazione usata per il teorema 11.10, si vede che χt non dipende da ψ. Inoltre la funzione R t → χt `e differenziabile come si prova subito, scegliendo φ ∈ D(H), ψ ∈ T −1 D(H) con (φ|ψ) = 0 (e questo `e possibile perch´e D(H) `e denso) e calcolando la derivata di ambo membri dell’identit` a seguente, se T `e unitario: (T U−t φ|T −1 Ut T ψ) = χt (φ|ψ); oppure (T U−t φ|T −1 Ut T ψ) = χt (φ|ψ) se T `e antiunitario. Il teorema di Stone assicura che le derivate esistono. Concludiamo che esiste una funzione R t → χt ovunque derivabile e tale che: e−itH T = T χt eitH e, di conseguenza: T −1 e−itH T = χt eitH . Quindi, dove il segno − appare se T `e unitario e + appare se T `e antiunitario (vedi l’esercizio 11.6 per il caso antiunitario): e∓itT
−1
HT
= χt eitH .
12.1 La dinamica quantistica e le sue simmetrie
627
Si osservi che T −1 HT `e un operatore autoaggiunto e pertanto il primo membro, al variare di t ∈ R, definisce un gruppo unitario ad un parametro fortemente continuo. Applicando il teorema di Stone si ha subito che, D(T −1 HT ) ⊂ D(H) = D(cI + H) e vale l’identit` a: ∓T
−1
HT D(H) = cI + H
t dove c := −i dχ | . dt t=0
(12.34)
Si osservi che c deve essere reale, dato che ∓T −1 HT − H `e simmetrico su D(H). In realt`a (12.34) deve valere anche su tutto dominio di ∓T −1 HT che, essendo autoaggiunto, non pu` o avere altre estensioni autoaggiunte (in questo caso cI + H) differenti da ∓T −1 HT stesso. Concludiamo che: T −1 HT = ∓cI ∓ H . In particolare dovr` a anche essere (vedi l’esercizio 11.6 per il caso antiunitario): σ(H) = σ(T −1 HT ) = σ (∓cI ∓ H) = ∓c ∓ σ(H) . Se σ(H) `e limitato dal basso, ma non `e limitato superiormente, questa identit`a `e impossibile se a secondo membro appare il segno −, qualunque sia la costante c. In tal caso T deve dunque essere antiunitario e deve essere inf σ(H) = inf(c + σ(H)) = c + inf σ(H). Quindi c = 0, dato che inf σ(H) `e finito per ipotesi essendo σ(H) = ∅ ed essendo inferiormente limitato. 12.1.7 L’osservabile tempo ed il teorema di Pauli. Un accenno alle POVM Un’ulteriore conseguenza dell’esistenza del limite inferiore allo spettro di H riguarda la problematicit` a dell’esistenza di una osservabile quantistica che corrisponda alla grandezza classica tempo, che soddisfi relazioni di commutazione canoniche con l’hamiltoniana. L’esistenza di un tale operatore potrebbe essere suggerita dalla relazione d’indeterminazione di Heisenberg tempo-energia menzionata nel capitolo 6. Nel capitolo 10 abbiamo dedotto il principio di indeterminazione di Heisenberg per la posizione e l’impulso, come teorema, conseguenza delle relazioni di commutazione canonica: [X, P ] = iI . Ci si potrebbe aspettare che esista un operatore autoaggiunto T che corrisponde all’osservabile tempo (quando avviene o la durata di un certo fenomeno per un sistema quantistico), che soddisfi un’analoga relazione di commutazione, su qualche dominio, rispetto all’operatore hamiltoniano: [T, H] = iI , ed, in conseguenza di ci` o, esattamente come fatto per il caso posizione-impulso (vedi capitolo 10), esista la relazione di indeterminazione tempo-energia: (ΔH)ψ (ΔT )ψ ≥ /2 .
628
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Abbiamo visto nel capitolo 10 che, nel caso delle relazioni di commutazione canonica posizione-impulso, interpretando in senso forte tali relazioni, cio`e passando dagli operatori all’algebra degli esponenziali di essi, le relazioni di commutazione di questi ultimi determinavano gli operatori stessi a meno di trasformazioni unitarie, in virt` u del teorema di Stone-von Neumann. Nel caso h t ht t h in esame le relazioni dette sarebbero e−i T e−i H = ei e−i H e−i T . Nel caso in esame questo non `e possibile: non c’`e alcun modo di definire in modo univoco l’operatore tempo e quindi dare un senso preciso e generale alle relazioni di indeterminazione tempo-energia. Tuttavia `e possibile cercare di definire l’osservabile tempo, caso per caso ed anche usando altri approcci. Questo risultato negativo cade sotto il nome di teorema di Pauli. Enunciamo e proviamo la nostra versione del teorema di Pauli, mettendo insieme diversi risultati provati nei capitoli precedenti. Teorema 12.13. (Di Pauli.) Si consideri un sistema fisico S con hamiltoniano H (con spettro limitato dal basso per ipotesi) sullo spazio di Hilbert HS . Si supponga che esista un operatore autoaggiunto T : D(T ) → HS ed un sottospazio di HS , D ⊂ D(H) ∩ D(T ), sul quale T H e HT siano ben definiti e valgono le relazioni di commutazione canoniche (ponendo = 1): [T, H] = iI . Nessuno dei fatti seguenti pu` o essere vero. (a) D `e denso ed invariante per T e H e l’operatore simmetrico T 2 + H 2 , definito su D, `e essenzialmente autoaggiunto. (b) D `e denso ed invariante per T e H ed `e costituito da vettori analitici per T e H contemporaneamente. (c) Sussistono le relazioni di commutazione canoniche per gli operatori esponenziali: eihT eitH = eiht eitH eihT per ogni t, h ∈ R. Dimostrazione. Se valesse (a), in virt` u del teorema 11.59 di Nelson H D e T D sarebbero essenzialmente autoaggiunti (e quindi D sarebbe un core per entrambi gli operatori autoaggiunti H e T ) ed esisterebbe una rappresentazione unitaria fortemente continua dell’unico gruppo di Lie semplicemente connesso la cui algebra di Lie `e individuata dalle relazioni di commutazione canoniche e da quelle banali [T, I] = [H, I] = 0, che ammette I, H e T come generatori. Tale gruppo `e quello di Heisenberg H (2) come visto nel capitolo precedente, e questo implicherebbe la validit`a di (c). Se valesse (b) arriveremmo alla stessa conclusione applicando il teorema 11.60. Supponiamo quindi che valga (c). In tal caso, seguendo la discussione che segue il teorema 10.21, si prova subito che gli operatori W (t, h) := eiht/2 eitH eihT soddisfano le regole di commutazione di Weyl e soddisfano le ipotesi del teorema 10.20 di Mackey. Ne consegue che lo spazio di Hilbert HS si decompone in una somma diretta ortogonale di sottospazi chiusi HS = ⊕k Hk , che sono invarianti rispetto a eitH e eihT per ogni valore di t e di h; infine, per ogni k, esiste un operatore unitario
12.1 La dinamica quantistica e le sue simmetrie
629
Sk : Hk → L2 (R, dx) per cui, in particolare Sk eitH Hk Sk−1 = eitX , dove X `e l’operatore posizione standard su R. Applicando il teorema di Stone alla condizione di invarianza eitH Hs ⊂ Hs si ricava che che H(Hk ∩ D(H)) ⊂ Hk , che HHk ∩D(H) `e autoaggiunto come operatore sullo spazio di Hilbert Hk , ed infine eitH Hk = eitHHk ∩D(H) . A questo punto, la condizione soddisfatta dall’operatore Sk si pu` o scrivere: eitHHk ∩D(H) = Sk−1 eitX Sk . Applicando nuovamente il teorema di Stone, si ottiene: HHk ∩D(H) = Sk−1 XSk e dunque (dove, per avere la prima inclusione `e sufficiente usare la definizione di spettro): σ(H) ⊃ σ(HHk ∩D(H) ) = σ(Sk−1 XSk ) = σ(X) = R , che `e impossibile dato che σ(H) `e inferiormente limitato.
Il problema, sollevato dal teorema di Pauli, per definire un operatore autoaggiunto in qualche modo associato a coordinate temporali `e un problema difficile non ancora del tutto chiarito. Un tentativo di trovare una soluzione passa per un indebolimento della nozione di osservabile e di PVM, che hanno trovato varie applicazioni in MQ. Nella dimostrazione della proposizione 7.41, che permette di associare misure di probabilit`a a PVM, non abbiamo usato la propriet` a (a) in proposizione 7.36 che caratterizza le osservabili e, per quanto riguarda la propriet` a (d), abbiamo usato solo la convergenza in senso debole (implicata da quella forte). Possiamo allora riformulare tale proposizione come segue. Proposizione 12.14. Sia H uno spazio di Hilbert e {P (E)}E∈B(R) una classe di operatori in B(H) che soddisfano: (a)’ P (E) ≥ 0 per ogni E ∈ B(R); (b)’ P (E) = I; (c)’ per ogni insieme numerabile di boreliani di R, {En }n∈N a due a due disgiunti, vale: +∞ wP (En) = P (∪n∈NEn ) . n=0
Se ρ ∈ S(H), l’applicazione μρ : E → tr(ρP (E)) `e una misura di Borel di probabilit` a su R. I numeri μρ (E) sono le probabilit` a che il risultato di una misura dell’osservabile {P (E)}E∈B(R) cadano nei boreliani E. Come dicevamo sopra `e talvolta conveniente dare una definizione di osservabili generalizzate, assumendo che esse siano descritte da applicazioni E → P (E) che soddisfino le richieste (a)’, (b)’ e (c)’, pi` u deboli rispetto a quelle che possono essere usate per definire le PVM. In particolare, gli operatori P (E) non sono pi` u proiettori ortogonali, ma semplicemente operatori limitati e positivi. Un esempio interessante di applicazione di queste osservabili generalizzate `e quando si cerca di definire un’osservabile tempo. Per esempio come l’osservabile associata al tempo di arrivo di una particella in un detector. Dal teorema
630
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
di Pauli sappiamo che esistono serie difficolt`a a supporre che tale osservabile sia definita in termini di classi di proiettori, se si richiede che in qualche modo tale osservabile sia “coniugata” all’hamiltoniana del sistema. Tentativi di dare una definizione dell’osservabile tempo in termini di PVM sono invece risultati molto pi` u promettenti [Gia97, BF02]. Dal punto di vista matematico si ha la seguente definizione, rimandando a [Ber66] per una trattazione matematica generale e [BGL95] per una discussione generale riguardante le applicazioni alla MQ. Definizione 12.15. Siano H uno spazio di Hilbert e X uno spazio topologico. Un’applicazione A : B(X) → B(H) `e detta misura a valori operatoriali positivi (POVM) su X se soddisfa le seguenti richieste: (a)’ A(E) ≥ 0 per ogni E ∈ B(X); (b)’ A(X) = I; (c)’ per ogni insieme numerabile di boreliani di X, {En }n∈N a due a due disgiunti, vale: +∞ wA(En ) = A(∪n∈N En ) . n=0
Un’osservabile generalizzata su H `e una classe di operatori {A(E)}E∈B(R) tale che B(R) E → AE sia una misura a valori operatoriali positivi. Tentativi di dare una definizione dell’osservabile tempo in termini di POVM sono molto promettenti: candidati per l’operatore tempo (es. di arrivo di una particella), T , si ottengono [Gia97, BF02] fissando opportunamente una POVM {A(E)}E∈B(R) dipendente dal sistema fisico, e definendo (ψ|T φ) := R λμψ,φ (λ), dove μψ,φ (E) := (ψ|A(E)φ) per ogni E ∈ B(R), usando quindi la topologia debole e non quella forte. In tal caso T risulta essere simmetrico, ma non autoaggiunto, ed `e possibile provare che, su domini opportuni, vale la relazione (ΔT )ψ (ΔH)ψ ≥ /2 ed anche relazioni analoghe [Gia97, BF02]. Osservazioni 12.16. (1) Se A `e una POVM su H, essendo B(H) A(E) ≥ 0, ogni A(E) `e autoaggiunto per ogni boreliano E ∈ B(X) e ||A(E)|| ≤ 1 per ogni boreliano E. (2) Esiste un importante teorema, dovuto a Neumark che mostra lo stretto legame tra PVM e POVM. Teorema 12.17. (Di Neumark.) Sia X uno spazio topologico e H uno spazio di Hilbert. Se A : B(X) → B(H) `e una POVM, allora esiste uno spazio di Hilbert H , un operatore U : H → H una PVM P : B(X) → P(H ), tale che A(E) = U ∗ P (E)U , per ogni E ∈ B(H). In virt` u della condizione (b)’ e dell’analoga per le PVM, risulta che U ∗ U = IH e dunque U `e un’isometria (non surgettiva, altrimenti A sarebbe una PVM). ` importante Pertanto H si identifica con un sottospazio (proprio) chiuso di H . E
12.2 Relazione tra simmetrie dinamiche e costanti del moto
631
notare che, tuttavia, P (E) non ha, in generale, un diretto significato fisico, in quanto H non `e lo spazio di Hilbert del sistema. (3) Se consideriamo l’insieme degli operatori usati per costruire tutte le POVM su uno spazio di Hilbert H: operatori limitati, positivi A ∈ B(H), con 0 ≤ A(E) ≤ I, tale insieme `e parzialmente ordinato rispetto alla solita relazione d’ordine ≥, tuttavia non `e un reticolo (al contrario dell’insieme dei proiettori ortogonali). Questo fatto non permette di generalizzare allo spazio degli operatori limitati positivi l’interpretazione, data ai proiettori ortogonali, in termini di proposizioni sul sistema. Anche l”assioma A3 `e problematico da estendere in questo contesto. Non `e possibile stabilire in quale stato il sistema si trovi immediatamente dopo una misura, di cui si conosce l’esito E ∈ B(R), quando l’osservabile `e rappresentata da una POVM, {A(E)}E∈B(R) , se non si hanno ulteriori informazioni. Se `e assegnata una decomposizione di ogni elemento A(E) della POVM come A(E) = B(E)∗ B(E), con B(E) ∈ B(H), detto operatore di misurazione, lo stato dopo la misura su ρ con esito E si assume della forma (tr(A(E )ρ)−1 )B(E )ρB(E )∗ . Si veda [BGL95] per ulteriori approfondimenti.
12.2 Relazione tra simmetrie dinamiche e costanti del moto In questa sezione ci occuperemo di estendere alla Meccanica Quantistica i risultati dimostrati dalle varie formulazioni del teorema di N¨ other che, nella teoria classica, legano simmetrie dinamiche e costanti del moto. In Meccanica Quantistica questo legame `e il pi` u diretto possibile. Per enunciare il teorema che corrisponde a tale relazione `e necessario introdurre la cosiddetta rappresentazione di Heisenberg delle osservabili. 12.2.1 La rappresentazione di Heinsenberg e le costanti del moto Consideriamo il sistema quantistico S, descritto nel riferimento inerziale I, con evolutore temporale R τ → e−iτH . Fissiamo una volta per tutte l’istante t = 0 nel quale fissiamo le condizioni iniziali. Consideriamo quindi la (H) rappresentazione proiettiva continua di R ad esso associato R t → γt := −itH itH e ·e e la sua azione duale (vedi la sezione 11.1.6) sulle osservabili. Se A `e un’osservabile (eventualmente un proiettore ortogonale che rappresenta una propriet` a elementare del sistema S): (H)∗
AH (t) := γt
(A) = eitH Ae−itH
si dice rappresentazione di Heisenberg dell’osservabile A al tempo τ . Si osservi che, per costruzione σ(AH (τ )) = σ(A) e le misure spettrali delle (H)∗ osservabili soddisfano P (AH (t)) (E) = γt (P (A) (E)) per ogni E ∈ B(R).
632
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Lavorando con la rappresentazione di Heisenberg delle osservabili, in coerenza con l’idea dell’azione duale delle simmetrie introdotta nel capitolo 11, gli stati quantistici non evolvono temporalmente e la dinamica agisce sulle osservabili. In particolare, il valore di aspettazione dell’osservabile A sullo stato ρt , evoluzione temporale fino al tempo t dello stato iniziale ρ, pu` o essere indifferentemente calcolato come A ρt oppure AH (t) ρ , dato che, ammettendo di essere nelle ipotesi della proposizione 10.5 (ma il risultato sussiste nel caso (A) generale come si prova subito usando la misura μρ direttamente): A ρt = tr AUt ρUt−1 = tr Uτ−1 AUt ρ = AH (τ ) ρ . La stessa cosa accade per la probabilt`a che il risultato della misura di A eseguita al tempo τ cada nel boreliano E, se lo stato era ρ al tempo 0: (A)
(AH (t))
tr(PE ρt ) = tr(PE
ρ) .
Osservazioni 12.18. (1) Per distinguere la rappresentazione di Heisenberg da quella standard, in cui evolvono gli stati e non le osservabili, quest’ultima viene detta rappresentazione di Schr¨ odinger. Noi seguiremo questa convenzione. (2) Si deve notare che pu`o accadere che un’osservabile dipenda dal tempo anche in rappresentazione di Schr¨ odinger. Pi` u precisamente, `e spesso comodo considerare una famiglia di operatori autoaggiunti {At }t∈R dipendenti parametricamente dal tempo t e pensare tale famiglia come un’unica osservabile, indicandola con At . Si dice in tal caso che l’osservabile dipende esplicitamente dal tempo. In questa situazione, passando in rappresentazione di Heisenberg, la dipendenza temporale, tiene conto di entrambe le dipendenze: (H)∗
AHt (t) := γt
(At ) = eitH At e−itH .
(12.35)
Dopo aver introdotto l’evoluzione temporale delle osservabili nel senso della rappresentazione di Heisenberg di esse, possiamo introdurre la nozione di costante del moto, che ricalca la definizione classica. Definizione 12.19. Sia S un sistema quantistico descritto nello spazio di Hilbert HS associato al sistema di riferimento inerziale I con hamiltoniano H. Un’osservabile A – eventualmente esplicitamente dipendente dal tempo, At – si dice essere una costante del moto o anche un integrale primo, se la sua rappresentazione di Heisenberg `e indipendente dal tempo, cio`e: AH (t) = AH (0)
per ogni t ∈ R,
(12.36)
ovvero: AHt (t) = AH0 (0)
per ogni t ∈ R,
nel caso in cui l’osservabile dipenda esplicitamente dal tempo.
(12.37)
12.2 Relazione tra simmetrie dinamiche e costanti del moto
633
Osservazioni 12.20. (1) Per un’osservabile che non dipende esplicitamente dal tempo, il fatto che risulti essere una costante del moto, `e del tutto equivalente a dire che la sua rappresentazione di Heisenberg e la sua rappresentazione di Schr¨odinger coincidono. (2) Si pu` o estendere la definizione di rappresentazione di Heisenberg e di costante del moto al caso in cui non valga l’omogeneit`a temporale e dunque l’evolutore temporale abbia struttura U (t2 , t1 ). Noi non ce ne occuperemo. (3) L’identit` a (12.37) si trova spesso scritta sui testi di fisica come: ∂AHt + i[H, AHt (t)] = 0 , ∂t
(12.38)
dove la derivata parziale `e riferita alla sola dipendenza esplicita dal tempo, cio`e a quella rappresentata dall’indice Ht . In effetti, se non si presta attenzione ad i problemi di dominio, questa equazione deriva banalmente dalla (12.37), ed implica immediatamente la (12.37), se si tiene conto della (12.35). Tuttavia vi sono diversi problemi a voler provare rigorosamente questa equivalenza che, nel caso generale, non sussiste. In ogni caso, fisicamente parlando, `e chiaro che la nozione di costante del moto `e perfettamente formalizzato dall’identit`a (12.37), senza alcuna necessit`a di dover passare alle derivate temporali imbattendosi in problemi tecnici artificiali. Notazione 12.21. Per non sovraccaricare la notazione, nel caso di osservabili che dipendono esplicitamente dal tempo, ometteremo nel seguito di scrivere esplicitamente la prima dipendenza temporale, scrivendo AH (t) in luogo di AHt (t), se ci`o non dar` a luogo ad ambiguit` a. Mostriamo ora, come preannunciato, lo stretto legame che esiste tra costanti del moto e simmetrie dinamiche. In fisica classica `e noto che i gruppi ad un parametro di simmetrie corrispondono, nelle varie versioni del teorema di N¨other, a costanti del moto. Vogliamo mostrare che lo stesso legame sussiste in Meccanica Quantistica. Cominciamo da un caso semplice. Proposizione 12.22. Si consideri una simmetria dinamica σ(·) := V (σ) · V (σ)−1 , in cui V (σ) `e contemporaneamente unitario ed autoaggiunto. Allora V (σ) , pensata come osservabile, `e una costante del moto. Dimostrazione. Se Ut `e l’evolutore temporale, per (c) del teorema 12.5, deve essere Ut V (σ) Ut−1 = V (σ) , che `e la tesi. Non `e rarissimo che un operatore, di interesse fisico, sia insieme unitario e autoaggiunto (e quindi rappresenti contemporaneamente una simmetria ed un’osservabile). Esiste, in particolare, il caso dell’operatore unitario ed autoaggiunto che rappresenta l’inversione di parit` a, di cui si `e discusso negli esempi 11.17. Tale situazione `e del tutto differente da quanto accade in meccanica classica, in cui un sistema invariante sotto l’inversione di parit` a (o
634
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
un’altra simmetria discreta) non ha automaticamente una costante del moto associata. Occupiamoci ora del caso di gruppi ad un parametro di simmetrie continue dove il legame tra simmetrie dinamiche e costanti del moto risulta essere molto diretto. Per iniziare consideriamo un’osservabile esplicitamente dipendente dal tempo {At }t∈R , per un certo sistema fisico S con hamiltoniano H. Avremo allora che, se At `e una costante del moto, in base alle definizioni date: eitH At e−itH = A0 . Se esponenziamo gli operatori autoaggiunti che appaiono nei due membri, abbiamo: itH −itH e−iae At e = e−iaA0 , che, per le note propriet`a dell’esponenziale, equivale a: eitH e−iaAt e−itH = e−iaA0 , e cio`e: e−iaAt e−itH = e−itH e−iaA0
per ogni a ∈ R e ogni t ∈ R.
Questa identit` a ha un’interpretazione importante in termini di simmetrie di(A ) namiche. Infatti afferma che, per ogni fissato a ∈ R, le simmetrie {σa t }t∈R (At ) −iaAt iaAt con σa (·) := e ·e , costituiscono una simmetria dinamica dipendente dal tempo per il sistema S in base al teorema 12.5. Si osservi che, se ci restringiamo al caso in cui At = A non dipenda dal tempo, la stessa dimo(A) strazione prova che σa (·) := e−iaA · eiaA `e una simmetria dinamica per ogni a ∈ R. Tutto questo dimostra che le costanti del moto individuano simmetrie dinamiche, ma anche che individuano rappresentazioni proiettive di R continue: (A ) R a → σa t (·), dato che R a → e−iaAt `e fortemente continuo dato che la definizione 11.29 `e banalmente soddisfatta (vedi l’inizio della sezione 11.2.5). Il problema che ora ci poniamo `e se sia valido anche il risultato inverso: da(t) ta una classe di simmetrie dinamiche dipendenti dal tempo {σa }t∈R dove, per (t) ogni t ∈ R, la funzione R a → σa sia una rappresentazione proiettiva continua del gruppo topologico R, `e possibile scrivere ognuna di queste rappresenta(A ) zioni come σa t (·) := e−iaAt ·eiaAt , in modo tale che gli operatori autoaggiunti At individuino un’osservabile (esplicitamente dipendente dal tempo) che risulti essere una costante del moto? Per il teorema 11.34, `e sempre possibile (A ) trovare operatori autoaggiunti At per cui valga σa t (·) := e−iaAt · eiaAt per ogni a ∈ R. Tuttavia tali operatori sono determinati a meno di una costante additiva reale At → At := At − c(t)I. Quindi la questione `e, in definitiva, se sia possibile fissare tutte le funzioni c(t) in modo che: eitH At e−itH = A0 .
12.2 Relazione tra simmetrie dinamiche e costanti del moto
635
La risposta `e positiva ed `e stabilita dal seguente teorema, che corrisponde alla versione quantistica del teorema di N¨other. Teorema 12.23. (“Di N¨ other quantistico”.) Sia S un sistema quantistico descritto nello spazio di Hilbert HS associato al sistema di riferimento inerziale I con hamiltoniano H e flusso dinamico γ (H) . Valgono i seguenti fatti, riferendo le costanti del moto e le simmetrie dinamiche a γ (H) . (a) Se A `e una costante del moto, allora: σa(A) (·) := e−iaA · eiaA (A)
`e una simmetria dinamica per ogni a ∈ R e R a → σa (·) `e continua. (b) Sia {At }t∈R un’osservabile dipendente esplicitamente dal tempo che risulti essere costante del moto. σa(At ) (·) := e−iaAt · eiaAt , al variare di t ∈ R, `e una simmetria dinamica dipendente dal tempo per ogni (A ) a ∈ R e R a → σa t (·) `e continua ∀t ∈ R. (c) Se, ∀a ∈ R, σa `e una simmetria dinamica e R a → σa `e una rappresentazione proiettiva continua di R, allora esiste una costante del moto, A, tale che: σa (·) := e−iaA · eiaA per ogni a ∈ R. (t)
(d) Se, ∀a ∈ R, {σa }t∈R `e una simmetria dinamica dipendente dal tempo (t) e, ∀t ∈ R, R a → σa `e una rappresentazione proiettiva continua di R, allora esiste un’osservabile dipendente esplicitamente dal tempo, {At }t∈R , che `e costante del moto e soddisfa: σa(t) (·) := e−iaAt · eiaAt
per ogni a ∈ R e ogni t ∈ R.
Dimostrazione. L’unica cosa che rimane da provare `e (d), dato che (a) e (b) (t) sono stati provati sopra, mentre (c) `e un ovvio sottocaso di (d) ponendo σa = σa e quindi At = A per ogni t ∈ R. Dimostriamo dunque (d). In base al (t) teorema teorema 12.5, per ogni t ∈ R possiamo scrivere: σa (·) := e−iaAt · eiaAt per ogni a ∈ R, dove gli operatori autoaggiunti At sono individuati dal (t) corrispondente gruppo R → σa , e possono essere ridefiniti tramite costanti additive reali c(t) arbitrarie: At + c(t)I = At . Immaginiamo di avere fatto una scelta iniziale di tali operatori e lavoriamo con tale scelta. Per (a) del teorema 12.5 deve allora valere, per opportuni numeri complessi χ(t, a) con |χ(t, a)| = 1: χ(t, a) = e−iaAt e−itH eiaA0 eitH , (12.39) da cui: χ(t, 0) = 1 per ogni t ∈ R. Dunque vale anche:
χ(t, a)(ψ|φ) = eitH eiaAt ψ eiaA0 eitH φ .
636
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Scegliendo, per t ∈ R fissato, ψ ∈ (D(At )) e φ ∈ eitH (D(A0 )) non ortogonali (questo `e possibile perch´e i due domini sono densi essendo At autoaggiunto e eitH unitario), ed applicando il teorema di Stone al secondo membro rispetto alla variabile a, si ha che esiste la derivata in a del primo membro, per ogni a ∈ R. D’altra parte da (12.39) si ricava anche che, sempre per t ∈ R fissato:
χ(t, a + a ) = e−i(a+a )At e−itH ei(a+a )A0 eitH = e−iaAt e−ia At e−itH eia A0 eitH e−itH eiaA0 eitH
= e−iaAt χ(t, a )e−itH eiaA0 eitH = χ(t, a )χ(t, a) . Quindi, per t ∈ R fissato, la funzione R a → χ(t, a) `e differenziabile, soddisfa χ(t, a + a ) = χ(t, a)χ(t, a ) e dunque ∂χ(t,a) = ∂χ(t,a) ∂a ∂a |a=0 χ(t, a). Tenendo conto dei vincoli |χ(t, a)| = 1 e χ(t, 0) = 1 per ogni t ∈ R, l’equazione differenziale ha soluzione: χ(t, a) = eic(t)a con c(t) = −i ∂χ(t,a) ∂a |a=0 ∈ R. Abbiamo trovato che: eic(t)a = e−iaAt e−itH eiaA0 eitH , e quindi
e−ia(At +c(t)I)e−itH = e−itH e−iaA0 . Dalla (12.39) abbiamo anche che eic(0)a = 1 per ogni valore di a ∈ R e questo `e possibile solo se c(0) = 0. Ma allora l’identit` a trovata sopra pu` o essere riscritta: e−ia(At +c(t)I) e−itH = e−itH e−ia(A0 +c(0)I) . Dato che, come detto all’inizio, siamo liberi di ridefinire gli operatori At aggiungendo costanti reali arbitrarie, ridefinendo At := At + c(t)I, otteniamo la tesi: e−iaAt e−itH = e−itH e−iaA0 . Questo risultato conclude la dimostrazione.
12.2.2 Un accenno al teorema di Ehrenfest e ai problemi matematici a esso connessi Prima di esaminare le costanti del moto associate al gruppo di Galileo, vogliamo soffermarci su un argomento legato all’evoluzione temporale delle osservabili. Nei trattati di meccanica quantistica esiste un enunciato, noto come Teorema di Ehrenfest, riconosciuto di grande importanza euristica, specie nel rapportare la meccanica quantistica al suo limite classico. L’idea del teorema di Ehrenfest, dal punto di vista formale, `e molto diretta. Consideriamo un sistema fisico quantistico S descritto sullo spazio di Hilbert HS , un’osservabile rappresentata dall’operatore autoaggiunto A (per semplicit`a non dipendente esplicitamente dal tempo), fissiamo infine uno stato puro rappresentato dal
12.2 Relazione tra simmetrie dinamiche e costanti del moto
637
vettore unitario ψ e consideriamone l’evoluzione temporale secondo l’evolutore temporale e−itH del sistema. Lavorando del tutto formalmente, senza prestare alcuna attenzione ai domini, se ψt := e−itH ψ, troviamo: d A dt
ψt
=
d −itH
−itH e ψ Ae ψ = i (Hψt |Aψt ) − i (ψt |AHψt ) . dt
In altre parole, vale la relazione di Ehrenfest nella forma generale: d A dt
ψt
= i[H, A]
ψt
.
(12.40)
Per ottenere la (12.40) abbiamo tralasciato importanti dettagli matematici. In ogni caso, si dimostra facilmente (lo si provi per esercizio) che condizioni sufficienti affinch`e valga la relazione trovata sono le seguenti: (i) A ∈ B(H), (ii) ψτ ∈ D(H) in un intorno di t – che equivale a richiedere ψ ∈ D(H) dato che D(H) `e invariante sotto l’azione dell’evolutore temporale – e (iii) ψτ ∈ D(HA) in un intorno di t. Si deve osservare che non `e affatto facile dare ipotesi sui soli H, A e ψ, che abbiano qualche utilit` a nelle applicazioni fisiche, affinch`e tali richieste siano soddisfatte intorno a qualche t. Si possono comunque indebolire le richieste (i),(ii) e (iii), assumendo, oltre a A ∈ B(H), solo che ψ ∈ D(H), pur di interpretare il termine i[H, A] ψt , che appare a secondo membro di (12.40), nel senso delle forme quadratiche: i[H, A]
ψt
:= i(Hψt |Aψt ) − i(Aψt |Hψt ) ,
da cui abbiamo una forma indebolita di teorema di Ehrenfest: d A dt
ψt
= i(Hψt |Aψt ) − i(Aψt |Hψt ) .
(12.41)
Anche in questa versione l’enunciato del teorema di Ehrenfest rimane comunque ad un livello troppo astratto dato che, in Meccanica Quantistica, praticamente ogni osservabile A di interesse fisico non `e rappresentata da un operatore limitato. In effetti l’importanza dell’enunciato di Ehrenfest appare evidente proprio quando lo si applica agli operatori, non limitati, posizione ed impulso. Consideriamo a tal fine un sistema fisico costituito da una particella di massa m, senza spin e sottoposta ad un potenziale V , in un sistema di riferimento inerziale. L’hamiltoniano sar`a qualche estensione autoaggiunta dell’operatore 2 differenziale H0 := − 2m Δ + V . Assumendo di lavorare con τ → ψτ che , nell’intorno di t, appartiene a qualche dominio incluso in D(Xi H0 ) ∩ D(H0 Xi ), su cui l’hamiltoniano H0 agisce come operatore differenziale, si trova che (ripristinando la costante ovunque): " # 3 ∂ψ ∂2 [H0 , Xi ]ψ = − , 2 , xi ψ = − 2m j=1 ∂xj m ∂xi
638
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
da cui, usando (12.40): d (12.42) Xi ψt = Pi ψt . dt Nello stesso modo, assumendo di lavorare con τ → ψτ che, nell’intorno di t, appartiene anche a qualche dominio incluso in D(Pi H0 ) ∩ D(H0 Pi ), su cui l’hamiltoniano H0 agisce come operatore differenziale, si trova che: + * ∂V ∂ ψ = −i ψ, [H0 , Pi ]ψ = −i −V, ∂xi ∂xi m
da cui, usando (12.40): d Pi dt
G ψt
=−
∂V ∂xi
H .
(12.43)
ψt
L’enunciato classico del teorema di Ehrenfest consiste proprio nella coppia di identit` a (12.42) e (12.43), da cui si evince che i valori medi di posizione ed impulso hanno un comportamento simile a quello classico. Pi` u precisamente, se si assume che il gradiente del potenziale V vari poco sull’estensione spaziale della funzione d’onda ψt (x), si pu` o stimare il secondo membro di (12.43) con
G H
∂V ∂V
∂V
$ ψt (x) ψt (x) dx = ψt (x)ψt (x)dx ∂xi ψt ∂xi Xψ ∂xi Xψ R3 R3 t t
∂V
= , ∂xi Xψ t
che, sostituito in (12.43) produce l’equazione classica:
∂V
d . Pi ψt $ − dt ∂xi Xψ
(12.44)
t
In questo modo giungiamo ad una importante conclusione: assumendo la validit` a delle equazioni di Ehrenfest (12.42) e (12.43), quanto pi` u i pacchetti d’onde sono concentrati attorno al loro valore medio, assumendo una forza associata al potenziale che vari lentamente sull’estensione del pacchetto, tanto pi` u i valori medi di impulso e posizione si comportano secondo la legge di evoluzione della meccanica classica. Purtroppo tutta questa discussione `e piuttosto formale, dato che stabilire condizioni matematiche fisicamente sensate su H0 affinch`e tutti i passaggi fatti sopra che conducono alle (12.42) e (12.43) siano pienamente giustificati `e ancora un problema largamente aperto. Osservazioni 12.24. (1) Recentemente sono state date condizioni sull’hamiltoniano H e l’operatore A affinch`e (12.41) sia soddisfatta per A non limitato e nemmeno autoaggiunto, includendo il caso in cui A sia l’operatore posizione e l’operatore impulso. Riportiamo di seguito l’enunciato del teorema a cui ci stiamo riferendo [FK09].
12.2 Relazione tra simmetrie dinamiche e costanti del moto
639
Teorema 12.25. Siano, sullo spazio di Hilbert H, H : D(H) → H e A : D(A) → H densamente definiti tali che: (H1) H `e autoaggiunto e A `e hermitiano (quindi `e simmetrico); (H2) D(A) ∩ D(H) `e invariante sotto R t → e−itH per ogni t ∈ R; (H3) se ψ ∈ D(A) ∩ D(H) allora supI ||Ae−itH ψ|| < +∞, per ogni intervallo I ⊂ R limitato. Allora, per ogni ψ ∈ D(A) ∩ D(H) e definito ψt := e−itH ψ, la funzione t → A ψt `e differenziabile con continuit` a e vale: d A dt
ψt
= i(Hψt |Aψt ) − i(Aψt |Hψt ) .
Come preannunciato, le ipotesi scritte sopra includono il caso in cui A sia l’operatore posizione e l’operatore impulso su H = L2 (Rn , dx), anche se non `e affatto ovvio provarlo (vedi il corollario 1.2 nell’articolo citato). Affinch`e questo accada `e sufficiente che H sia l’unica estensione autoaggiunta di H0 = −Δ+V definito su D(Rn ) in cui V `e reale e (−Δ)-limitato con limite relativo a < 1, nel senso della definizione 9.48. (2) Dal punto di vista fisico `e impossibile costruire un apparato sperimentale in grado di valutare tutti i possibili valori di un’osservabile. Per esempio, nel caso dell’osservabile posizione, ci`o richiederebbe di riempire tutto l’universo di detectors! Pertanto ci si aspetta che ogni osservabile rappresentata dall’operatore autoaggiunto non limitato A sia – fisicamente parlando – indistinguibile dall’osservabile rappresentata dall’operatore autoaggiunto AN := σ(A)∩[−N,N] λdP (A) (λ) ∈ B(H), con N > 0 molto grande, ma finito. Il teorema di Ehrenfest nella sua forma generale (12.40) si pu` o applicare a tali classi di osservabili, assumendo le condizioni (ii) e (iii) oppure molto pi` u debolmente solo che ψ ∈ D(H) per avere (12.41). In questa situazione per` o non si possono sfruttare tanto facilmente le relazioni di commutazione formali degli operatori posizione ed impulso con un hamiltoniano della forma 2 − 2m Δ + V che porterebbero facilmente alle (12.42) e (12.43). 12.2.3 Costanti del moto associate a gruppi di Lie di simmetria e il caso del gruppo di Galileo Consideriamo un sistema fisico quantistico S, descritto sullo spazio di Hilbert HS , con hamiltoniano H nel riferimento inerziale I. Supponiamo che esista gruppo di Lie G che ammetta una rappresentazione G g → Ug unitaria fortemente continua sullo spazio di Hilbert del sistema HS e che l’evolutore temporale R t → e−itH coincida con la rappresentazione di un sottogruppo ad un parametro di G (ovviamente G `e allora un gruppo di simmetria topologico per S, dato che la rappresentazione U induce una rappresentazione proiettiva dello stesso gruppo.) Il risultato importante che vogliamo dimostrare `e che, in questo caso, ogni elemento T ∈ Te G individua una simmetria dinamica ed una costante del moto (in generale dipendente esplicitamente dal tempo). Infatti vale il seguente teorema.
640
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
Teorema 12.26. Sia S un sistema quantistico descritto sullo spazio di Hilbert HS , con hamiltoniano H (riferito a qualche riferimento inerziale). Sia G g → Ug una rappresentazione unitaria fortemente continua su HS del gruppo di Lie G di dimensione n e si supponga che l’evolutore temporale R t → e−itH coincida con la rappresentazione di un sottogruppo ad un parametro generato da qualche −h ∈ Te G: e−itH = Uexp(th)
per ogni t ∈ R.
Valgono i fatti seguenti. (a) Ad ogni elemento T ∈ Te G, `e associata una costante del moto, in generale dipendente esplicitamente dal tempo {Tt }t∈R ed una corrispondente simmetria dinamica. (b) Se [h, T ] = 0 allora la costante del moto {Tt }t∈R non dipende esplicitamente dal tempo. Dimostrazione. (a) Consideriamo la funzione da R in G: R a → exp(th) exp(aT ) exp(−th) . Essa `e sicuramente un sottogruppo ad un parametro per ogni valore di t ∈ R, pertanto si potr` a scrivere, se T1 , . . . Tn `e una base di T ∈ Te G e per opportune funzioni reali cj = cj (t): exp(th) exp(aT ) exp(−th) = exp(a
n
cj (t)T ) .
j=1
Applicando la rappresentazione U , e passando alla rappresentazione dell’algebra di Lie del gruppo G associata alla rappresentazione unitaria del gruppo stesso, Te G T → AU [T ] := AU (T ) DG dove lo spazio di G˚ arding DG `e invariante ed anche un core per gli operatori autoaggiunti AU (T ) (si veda il capitolo 11, in particolare il teorema 11.57), segue che: n
e−itH e−iaAU [T ] eitH = e−ia
j=1
cj (t)AU [Tj ]
.
(12.45)
Se ora definiamo la classe di operatori autoaggiunti parametrizzati nel tempo, Tt :=
n
cj (t)AU [Tj ] ,
j=1
l’identit` a (12.45) mostra che Tt `e una costante del moto che dipende esplicitamente dal tempo. Infatti (12.45) implica: eitH Tt e−itH = AU [T ] = T0
per ogni t ∈ R .
12.2 Relazione tra simmetrie dinamiche e costanti del moto
641
La stessa (12.45) mostra anche che: per ogni a ∈ R, la classe di simmetrie (t) σa := e−iaTt · e−iaTt `e una simmetria dinamica dipendente dal tempo. Infatti (12.45) implica:
e−iaTt e−itH = e−itH e−iaT0
per ogni t ∈ R,
e quindi il teorema 12.5 prova quanto asserito. (b) Assumendo che [T, h] = 0, facendo uso della formula di Baker-CampbellHausdorff (11.68), (11.69), (11.70), si trova subito che deve valere: exp(τ h) exp(aT ) = exp(aT ) exp(τ h)
(12.46)
purch`e |a|, |τ | < con > 0 sufficientemente piccolo da poter applicare la formula di Baker-Campbell-Hausdorff. In realt` a queste formule valgono per qualunque valore di a, τ ∈ R. Per provarlo `e sufficiente notare che, qualunque N N sia il valore di a e τ , possiamo sempre decomporre a = r=1 ar e τ = r=1 τr in modo tale che |ar |, |τr | < per ogni valore di r. Quindi, per esempio: exp(τ h) exp(aT ) = exp(τN h) · · · exp(τ2 h) exp(τ1 h) exp(a1 T ) exp(a2 T ) · · · exp(aN T ) = exp(τN h) · · · exp(τ2 h) exp(a1 T ) exp(τ1 h) exp(a2 T ) · · · exp(aN T ) ··· = exp(a1 T ) exp(τN h) · · · exp(τ2 h) exp(a2 T ) · · · exp(aN T ) exp(τ1 h) ··· = exp(a1 T ) exp(a2 T ) · · · exp(aN T ) exp(τN h) · · · exp(τ2 h) exp(τ1 ) = exp(aT ) exp(τ h) . Di conseguenza, applicando la rappresentazione U , si ricava che: e−itH e−iaAU [T ] eitH = e−iaAU [T ] , da cui la tesi.
Per esemplificare il risultato generale trovato, torniamo a considerare il gruppo di Galileo e le sue rappresentazioni unitarie proiettive considerate alla fine del precedente capitolo. Mostreremo che ci sono 10 costanti del moto per un sistema che ammette il gruppo di Galileo proprio SG come gruppo di simmetria topologico (descritto da una rappresentazione unitaria di una estensione C). In particolare consideriamo il centrale del suo rivestimento universale SG caso della particella a spin zero di massa m e riferiamoci alla rappresentazioD Cm che abbiamo ne unitaria del gruppo di Lie dato dall’estensione centrale SG visto nel capitolo 11. L’algebra di Lie di questo gruppo si ottiene estendendo
642
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
quella del gruppo C SG la quale ammette i 10 generatori −h, pi , ji , ki i=1,2,3, tali che: (i) −h genera il sottogruppo ad un parametro R c → (c, 0, 0, I) delle traslazioni temporali, (ii) i tre pi generano il sottogruppo abeliano R3 c → (0, c, 0, I) delle traslazioni spaziali, (iii) i tre ji generano il sottogruppo SO(3) R → (0, 0, 0, R) delle rotazioni spaziali, (iv) i tre ki generano il sottogruppo abeliano R3 v → (0, 0, v, I) delle trasformazioni pure di Galileo. Questi generatori verificano le relazioni di commutazione (11.103). Il passaggio C a quella di D Cm si ottiene aggiungendo un generadall’algebra di Lie di SG SG tore che commuta con quelli gi`a visti ed aggiungendo cariche centrali per le relazioni di commutazione tra i generatori ki e pj di valore pari alla massa m (vedi (11.112) e la discussione seguente). La rappresentazione unitaria D Cm : fortemente continua di cui noi ci occupiamo qui `e quella di SG D C (m) , SG m (χ, g) → χZ g (m) indotta dagli operatori unitari Z (c,c,v,U ) (11.104): 2 c i(cv−c)·(k−mv) i 2m (m) 6 Z e (k−mv) ψ6 R(U )−1 (k − mv) . (c,c,v,U )ψ (k) := e D Cm include il sottogruppo ad un parametro Si osservi che il gruppo di Lie SG generato da h, che corrisponde all’evolutore temporale quando rappresentato nello spazio di Hilbert del sistema HS . Le relazioni di commutazione che ci interessano qui tra quelle listate in (11.103) che individuano l’algebra di Lie C SG e che rimangono immutate passando all’algebra di Lie dell’estensione centrale D C SG m , sono solo le seguenti tre, che coinvolgono direttamente il generatore h: [pi , h] = 0 ,
[ji , h] = 0 ,
[ki , h] = −pi
per i = 1, 2, 3.
(12.47)
Dalle prime due identit` a, specializzando la dimostrazione del teorema 12.26 D Cm (χ, g) → χZg(m) si trova: alla rappresentazione unitaria SG
e
e−iτH e−iaPi = e−iaPi e−iτH
(12.48)
e−iτH e−iaLi = e−iaLi e−iτH .
(12.49)
Queste due identit`a, applicando il teorema 12.5 e la definizione 12.19, in conformit` a con il teorema 12.26, dicono che: (a) le tre componenti dell’impulso e le tre componenti del momento angolare orbitale sono costanti (indipendenti dal tempo) del moto,
12.2 Relazione tra simmetrie dinamiche e costanti del moto
643
(b) le simmetrie generate da tali costanti del moto cio`e, rispettivamente, le traslazioni lungo i tre assi (vedi esempi 11.35 per l’azione esplicita sulle funzioni d’onda) e rotazioni attorno ai tre assi (vedi la (11.94) per l’azione esplicita sulle funzioni d’onda), sono simmetrie dinamiche (indipendenti dal tempo). Passiamo all’analisi della terza identit` a in (12.47). L’uso diretto della formula di Baker-Campbell-Hausdorff non `e tecnicamente ovvio, anche se si potrebbe applicare, nel caso generale, con qualche sforzo. Per stabilire a cosa corrisponda la terza identit` a in (12.47) per i sottogruppi ad un parametro associati ai generatori considerati, studiamo direttamente la questione nel gruppo di Galileo. Il sottogruppo ad un parametro generato da −h `e la traslazione temporale: exp(τ h) = (−τ, 0, 0, I) τ ∈ R . Il sottogruppo ad un parametro generato da kj `e una trasformazione pura di Galileo lungo l’asse j-esimo, di versore ej : exp(akj ) = (0, 0, aej , I) a ∈ R . Ne consegue subito, usando la legge di composizione del gruppo di Galileo (11.96), che: exp(τ h) exp(akj ) exp(−τ h) = exp(a(τ pj + kj )) . Applicando la rappresentazione unitaria, queste relazioni diventano: e−iτH e−aKj eiτH = e−ia(τPj DG +Kj DG ) . Ne consegue che, se definiamo gli operatori autoaggiunti Kjt := tPj DG +Kj DG
per j = 1, 2, 3
ognuna di queste osservabili `e una costante del moto dipendente esplicitamente dal tempo ed inoltre ciascuna di esse definisce una simmetria dinamica per ogni a ∈ R essendo: e−iaKjt e−itH = e−itH e−iaKj0 . Il significato fisico della simmetria dinamica e−iaKjt `e quello di una trasformazione di Galileo pura nella direzione ej eseguita al tempo t. Osservazioni 12.27. (1) Pu` o essere interessante chiedersi il significato della legge di conservazione di Kjt , che non `e affatto ovvio. Ricordiamo che il boost `e definito come (vedi la (11.111)) Kj = −mXj . Scegliendo ψ ∈ DG e facendolo evolvere con l’evolutore temporale: ψt := e−itH ψ, la legge di conservazione di Kjt implica: t(ψt |Pj ψt ) − m(ψt |Xj ψt ) = cost.
644
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
In altre parole: d (12.50) Xj ψt . dt Dunque abbiamo ritrovato che l’impulso medio della particella `e, in un certo senso, dato dal prodotto della massa per la velocit` a della particella. Dove la velocit`a `e in realt` a quella della posizione media della particella. Si tratta di un risultato a priori non ovvio, dato che in meccanica quantistica l’impulso non `e il prodotto della massa per la velocit`a. (2) Nel caso in cui si lavori con sistemi a pi` u particelle, che ammettono il gruppo di Galileo come gruppo di simmetria topologico, descritto da una rappresentazione unitaria di un’estensione centrale associata alla massa totale M del sistema (vedi discussione nel capitolo 11), l’identit`a (12.50) `e ancora valida e si prova nello stesso modo. In tal caso per`o, Pj rappresenta la componente lungo ej dell’impulso totale del sistema e Xj la componente lungo ej del vettore posizione del centro di massa del sistema. Infine un’analoga relazione vale per sistemi fisici che siano invarianti sotto il gruppo di Poincar´e ed `e conseguenza dell’invarianza sotto trasformazioni pure di Lorentz. In tal caso per`o il termine corrispondente alla massa totale del sistema tiene conto dei contributi energetici dei singoli componenti (per esempio le energie cinetiche dei punti che costituiscono il sistema, se `e costituito da punti isolati), in conformit`a con l’equazione M = E/c2 . Pj
ψt
=m
Abbiamo esibito 9 costanti del moto, ma le costanti del moto sono 10 come detto sopra. Il lettore attento si sar`a accorto che esiste ancora una simmetria dinamica e corrispondente legge di conservazione. Si tratta dell’energia! Infatti sussiste anche la banale relazione di commutazione: [h, h] = 0 a livello di algebra di Lie, che corrisponde a [H, H] = 0 a livello di generatori autoaggiunti, ovvero [e−iτH , e−iτ H ] = 0 a livello di esponenziali. Quest’ultima identit`a, in conformit` a con la tesi del teorema 12.26, dice che, applicando il teorema 12.5 e la definizione 12.6: (a) l’hamiltoniano `e una costante del moto, (b) la simmetrie generata da −H cio`e la traslazione temporale, `e una simmetria dinamica. Ovviamente questo risultato `e del tutto generale e non dipende dal fatto che il sistema che abbiamo considerato avesse il gruppo di Galileo come gruppo di simmetria topologico, ma `e sufficiente che esista l’hamiltoniano del sistema.
12.3 Sistemi composti e loro propriet` a Abbiamo gi` a incontrato, nel capitolo 11, sistemi fisici composti da sottosistemi ed abbiamo visto che lo spazio di Hilbert del sistema complessivo `e individuato da un prodotto tensoriale di spazi di Hilbert relativi ai sottosistemi. Questo
12.3 Sistemi composti e loro propriet` a
645
`e in realt` a un assioma generale della teoria. I sistemi composti hanno diverse interessantissime propriet`a non classiche, che vedremo nel seguito di questa sezione. 12.3.1 Assioma A7: sistemi composti Possiamo qui enunciare il settimo assioma della MQ, concernente i sistemi quantistici composti. Per il contenuto matematico ci riferiamo alle definizioni teoriche ed ai risultati dati nella sezione 9.4.1. A7. Quando un sistema quantistico `e composto da un numero N finito di sottosistemi, descritti ciascuno di essi nello spazio di Hilbert Hi , con i =5 1, 2, . . . , N , il sistema complessivo viene descritto nello spazio di Hiln bert i=1 Hi . Ogni osservabile per il sottosistema i-esimo (incluse le osservabili elementari definite da proiettori ortogonali): Ai : D(Ai ) → Hi si identifica con l’osservabile: I ⊗ · · · ⊗ I ⊗ Ai ⊗ I ⊗ · · · ⊗ I del sistema complessivo. Ci sono due tipi di sistemi composti che abbiamo gi`a incontrato: i sistemi composti costituiti da particelle elementari con struttura interna e i sistemi a pi` u particelle elementari (con o senza struttura interna). Nel primo caso lo spazio di Hilbert ha la struttura L2 (R3 , dx) ⊗ H0 , dove H0 `e uno spazio di Hilbert finito dimensionale che descrive gradi di libert` a interni alla particella: spin e cariche di vario genere (vedi capitolo 10). L’elementarit`a della particella con struttura interna si riferisce al fatto che lo spazio interno `e finito dimensionale. In letteratura fisica, riferendosi a tali sistemi di particelle elementari con spazio H0 , L2 (R3 , dx) viene detto spazio orbitale o spazio dei gradi di libert` a orbitali e H0 viene detto spazio interno o spazio dei gradi di libert` a interni. Ricordiamo che, nel caso in cui lo spazio dei gradi di libert` a interni descriva la (un tipo di) carica della particella, `e necessario tenere conto di eventuali regole di superselezione. Vogliamo infine fare qualche commento sull’operatore hamiltoniano di sistemi a pi` u particelle, nel caso in cui lo spazio di Hilbert di ciascuna particella sia semplicemente L2 (R3 , dx), una volta fissato un sistema di riferimento inerziale ed identificando R3 con lo spazio di quiete del riferimento tramite coordinate cartesiane ortonormali. In questo lo spazio di Hilbert di un sistema di N particelle, con masse m1 , . . ., mN sar`a descritto da un prodotto tensoriale di N copie di tale spazio di Hilbert. Sappiamo, da (1) in esempi 9.38, che questo prodotto tensoriale `e isomorfo naturalmente a L2 (R3N , dx). Indichiamo con (x1 , . . . , xN ) l’elemento generico di R3N , dove, quindi xk = ((xk )1 , (xk )2 , (xk )3 ) individua una terna di coordinate cartesiane ortonormali nel k-esimo fattore di R3N = R3 ×· · ·×R3 . L’isomorfismo tra spazi di Hilbert sopra menzionato `e tale che (il lettore lo dimostri) gli operatori posizione ed impulso della k-esima particella sono: gli operatori moltiplicativi
646
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
della corrispondente terna di coordinate xk = ((xk )1 , (xk )2 , (xk )3 ) e l’unica estensione autoaggiunta, per esempio presa su D(R3N ), delle derivate (moltiplicate per −i) rispetto alle stesse coordinate. Gli operatori hamiltoniani di ciascuna particella, pensata come libera, coincidono con l’unica estensione autoaggiunta, per esempio presa su D(R3N ), del corrispondente operatore di 3 ∂2 2 Laplace −Δk = i=1 ∂(x 2 moltiplicato per − /(2mk ). Basandosi sulle idee k )i presentate nella sezione 10.4, nel caso in cui le particelle scambiano interazioni, descritte classicamente da un potenziale V = V (x1 , . . . , xN ), ci si aspetta che l’hamiltoniano sia qualche estensione autoaggiunta dell’operatore: H0 :=
N k=1
−
2 Δk + V (x1 , . . . , xN ) . 2mk
Per esempio, nel caso di particelle con cariche ek che interagiscono tra di esse con forze coulombiane ed interagiscono anche con cariche esterne Qk , ci si aspetta che l’hamiltoniano sia un’estensione autoaggiunta dell’operatore: H0 :=
N k=1
−
Qk ek ei ej 2 Δk + + . 2mk |xk | |xi − xj | N
N
k=1
i<j
Come chiarito nella sezione 9.6 e negli esempi 9.58, in conseguenza di importanti risultati dovuti principalmente a Kato, sotto naturali ipotesi su V , non solo l’operatore H0 risulta essere essenzialmente autoaggiunto su domini standard come D(R3N ) o S(R3N ), ma l’unica estensione autoaggiunta ammessa risulta essere limitata dal basso, rendendo energeticamente stabile il sistema. In particolare questo accade per l’operatore con interazione coulombiana presentato sopra (vedi esempi 9.58). Se le N particelle del sistema possiedono una struttura interna, descritta da un corrispondente spazio di Hilbert interno H0k , lo spazio di Hilbert del sistema complessivo sar`a comunque isomorfo a L2 (R3N ) ⊗N k=1 H0k e la descrizione dei possibili operatori hamiltoniani sar` a in generale pi` u complicata. Rimandiamo alla letteratura specifica per esempi di questo genere [CCP82, Pru81, ReSi80]. 12.3.2 Stati entangled e il cosiddetto “paradosso EPR” Un apparato di misura non `e necessariamente localizzato in un punto dello spazio. Anzi, se vogliamo misurare grandezze definite nello spazio, prima fra tutte la posizione di una particella quantistica, dobbiamo riempire lo spazio di strumenti di misura: rivelatori di particelle nel caso della posizione. Il processo di riduzione dello stato descritto dall’assioma A3 `e “istantaneo”. Questo significa che una volta che uno degli strumenti ha rivelato la particella in un punto p e in un istante t, a partire dall’istante successivo, non c’`e pi` u alcuna possibilit` a che un altro strumento di misura, arbitrariamente lontano
12.3 Sistemi composti e loro propriet` a
647
da quello che ha rivelato la particella, possa rivelare ancora la particella. La riduzione dello stato sembra quindi essere un processo non locale: apparentemente implica la trasmissione “istantanea” di informazioni tra luoghi lontani nello spazio. Ci` o sembrerebbe violare i principi della teoria della relativit`a. Nel 1935, Einstein, Podolsky e Rosen [Des80, Bon97, Ghi97, Alb00], considerando sistemi fisici composti da due particelle, mostrarono che la questione pu` o essere messa in termini fisicamente operativi in cui tale violazione sembra effettivamente comparire [EPR35]. L’assioma A7 descrive i possibili stati di un sistema quantistico composto. Consideriamo il caso di un sistema S composto da due sottosistemi A e B. Lo spazio di Hilbert di S sar`a dato da HS = HA ⊗HB con ovvie notazioni. I vettori di HA ⊗ HB non sono solo del tipo fattorizzato ψA ⊗ ψB in cui compare un unico prodotto tensoriale elementare, ma ci sono vettori dati da combinazioni lineari di vettori fattorizzati, per esempio: Ψ =
ψA ⊗ ψB − ψA ⊗ ψB √ . 2
(12.51)
Gli stati puri corrispondenti a vettori di norma unitaria che, come quello di sopra, non sono un unico prodotto tensoriale elementare, ma sono combinazioni lineari di tali prodotti tensoriali, sono detti stati puri entangled5. Consideriamo lo stato entangled associato al vettore Ψ scritto in (12.51) e facciamo l’ipotesi che ψA e ψA siano autostati normalizzati a 1 di qualche osservabile GA a spettro discreto sul sistema A corrispondenti, rispettivamente, a due autovalori distinti: a e a . Facciamo un’analoga ipotesi per quanto riguarda i vettori ψB e ψB : assumiamo che siano autostati normalizzati a 1 di qualche osservabile GB a spettro discreto sul sistema B, corrispondenti a due autovalori distinti: b e b rispettivamente. Le osservabili a spettro discreto GA e GB sono, per esempio, relative a gradi di libert` a interni, rispettivamente, del sistema A e B. Tipicamente possono essere componenti dello spin o della polarizzazione di ciascuna particella. In tal caso, gli spazi HA e HB sono a loro volta fattorizzati in spazio orbitale e spazio interno. Fino a quando non misuriamo GA , la la grandezza GA non `e definita sul sistema, se questo `e nello stato individuato dal vettore Ψ , ma sono possibili due valori a e a con probabilit` a 1/2 per ciascuno di essi. La stessa situazione sussiste per l’osservabile GB . Nel momento della misura di GA , con esito (imprevedibile per principio a priori) diciamo a, lo stato del sistema complessivo cambier`a, in conformit` a con l’assioma A3, diventando lo stato puro rappresentato dal vettore unitario: ψA ⊗ ψB . Il punto cruciale `e che, se lo stato iniziale `e lo stato entangled descritto da Ψ , la misura di GA determina anche l’esito della misura di GB : nello stato puro 5 Si pu` o dare un’analoga definizione per gli stati misti: ρ ∈ S(HA ⊗ HB ) `e detto entangled se non `e della forma ρA ⊗ ρB con ρA ∈ S(HA ) e ρB ∈ S(HB ).
648
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
associato a ψA ⊗ψB il valore di GB `e definito e vale, con le nostre convenzioni, b. Una misura di GB pu` o unicamente produrre il risultato b. Consideriamo ora, secondo la celebre analisi di Einstein Podolsky e Rosen, sistemi composti da due particelle A e B, preparate nello stato puro entangled individuato dal vettore Ψ definito in (12.51), che si allontanano reciprocamente a grande velocit` a (in altre parole, la parte orbitale dello stato `e costituita dal prodotto di due pacchetti molto concentrati che si allontanano velocemente l’uno dall’altro). In linea di principio possiamo eseguire le misure di GA e GB sulle rispettive particelle in luoghi distanti e in intervalli di tempo tanto brevi che nessun segnale fisico, che viaggi con velocit`a non superiore a quella della luce, possa trasmettersi dal luogo di uno dei due esperimenti all’altro in tempo utile. Se l’assioma A3 `e comunque valido, si dovr` a comunque riscontrare una correlazione tra gli esiti dell misure: tutte le volte che la misura di GA ha esito a (rispettivamente a ), la misura di GB avr` a esito b (rispettivamente b ). Come pu` o il sistema A comunicare al sistema B l’esito della misura di GA in tempo utile per produrre le correlazioni dette, senza violare gli assunti di base della teoria della relativit` a? Queste situazioni sono comuni anche per sistemi classici ed in tal caso la spiegazione `e molto semplice: non c’`e alcuna comunicazione superluminare tra i due sistemi, le correlazioni esistono in quanto sono dovute ad uno stato di cose gi` a esistente prima delle misurazioni. Per esempio, supponiamo che le grandezza osservate GA e GB siano qualche tipo di “carica” delle due particelle e supponiamo di sapere che il sistema complessivo S abbia carica 0 nello stato in cui `e stato preparato, mentre le due particelle possano avere ciascuna carica ±1 corrispondenti ai numeri a, a e b , b visti sopra. In questa situazione, se ragioniamo con particelle classiche, dobbiamo concludere che una particella deve avere carica 1 e l’altra carica −1. Se i valori delle cariche sono preesistenti, prima ed indipendentemente dal fatto che si esegua un esperimento per osservare la carica, possiamo essere certi che, se una particella risulta avere carica 1 quando la sua carica `e misurata, l’altra dovr` a avere carica −1 quando la si osserver`a, indipendentemente dal luogo e dal tempo in cui si misurano le cariche, perch´e tali valori sono stati fissati prima delle due misure. Tuttavia la situazione descritta dalla MQ `e differente: anche se lo stato associato a Ψ ha carica totale G = GA + GB definita pari a 0, le cariche dei due sottosistemi non sono definite nello stato associato ad Ψ e vengono fissate al momento della misura (di una delle due). Dunque le correlazioni previste dalla MQ non possono essere imputate ad uno stato di cose preesistente al processo di misura, se si accetta l’interpretazione standard della MQ. L’idea di Einstein, Podolsky e Rosen era che, se tali correlazioni si fossero effettivamente osservate (come richiesto dalla stessa Meccanica Quantistica), l’impossibilit`a di violare l’ipotesi di localit` a relativistica avrebbe implicato che la ragione delle correlazioni fosse dovuta ad uno stato di cose preesistente alle operazioni di misura sulle due particelle. Essendo tale stato di cose indescrivibile all’interno della formulazione standard della Meccanica Quantistica, ci`o
12.3 Sistemi composti e loro propriet` a
649
avrebbe dimostrato che la formulazione standard della Meccanica Quantistica sarebbe stata, per sua natura, incompleta. (Inoltre le probabilit` a usate in meccanica quantistica si sarebbero ridotte a mere probabilit` a epistemiche). J. Bell, in un geniale articolo del 1964 [Bel64][Bon97, Ghi97], dimostr`o che, con un misurazioni di almeno tre tipi di“cariche” (nella realt`a si misurano le tre componenti dello spin di particelle massive o stati di polarizzazione di fotoni) che danno luogo alle correlazioni suddette, `e possibile distinguere sperimentalmente tra le due situazioni in cui i valori delle due cariche: (i) sono fissate prima delle misure, oppure (ii) vengono fissate al momento delle misure. Bell dimostr` o che la situazione (i) vale solo se sono verificate una serie di disuguaglianze tra gli esiti delle misure: le famose disuguaglianze di Bell. ` importante precisare che le disuguaglianze di Bell valgono indipendenE temente dal fatto che si assuma come vera o falsa la formulazione standard della Meccanica Quantistica e quindi indipendentemente dalla ragione delle correlazioni che, se osservate, potrebbero, in linea di principio, essere spiegate senza l’uso della Meccanica Quantistica. Rimane il fatto che la Meccanica Quantistica prevede la presenza di tali correlazioni. La Meccanica Classica invece, almeno in riferimento alla nozione usuale di particella, non le prevede. A partire dal 1972 sono stati fatti diversi esperimenti (in particolare l’esperimento decisivo `e stato fatto nel 1982 da A. Aspect, J. Dalibard e G. Roger [Bon97, Ghi97]) per testare l’esistenza delle correlazioni suddette insieme alla validit` a o alla violazione delle disuguaglianze di Bell. Gli esperimenti hanno dimostrato, nell’ambito degli errori sperimentali, che (a) le correlazioni previste dalla MQ esistono, (b) le disuguaglianze di Bell sono violate. Quindi, a meno di non voler negare la validit` a degli esperimenti suddetti, indipendentemente dall’accettare o meno la formulazione standard della Meccanica Quantistica, si deve concludere che le correlazioni previste dalla Meccanica Quantistica esistono e gli esiti delle misure sono fissati al momento delle misurazioni. Rimane ancora la domanda posta sopra: come pu` o il sistema A comunicare al sistema B l’esito della misura di GA, in tempo utile per produrre le correlazioni dette senza violare gli assunti di base della teoria della relativit` a? La risposta `e abbastanza complessa e sicuramente non definitiva. Chiariamo prima di tutto che la domanda `e malposta, perch´e presuppone che l’esito della misura di GA sia la causa dell’esito della misura di GB . Tuttavia bisogna notare che le regioni spaziotemporali in cui avvengono (o possono avvenire) le due distinte misurazioni sono, con linguaggio relativistico, causalmente separate: non possono essere connesse da curve nello spaziotempo di “tipo tempo” o “luce” orientate verso il futuro Come ben noto dalla teoria della relativit` a, in tale situazione, esiste un sistema di riferimento inerziale in cui la misura di A avviene prima della misura di B, mentre ne esiste un altro in cui la situazione si inverte: la misura di B precede temporalmente quella di A. In questo modo non ha alcun senso dire che l’esito dell’esperimento su A sia la causa
650
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
dell’esito dell’esperimento su B, ma neppure che l’esito dell’esperimento su B sia la causa dell’esito dell’esperimento su A. Tuttavia ci si potrebbe appellare alla parziale convenzionalit` a della procedura di sincronizzazione di Einstein per sostenere che ci`o non sia necessariamente un problema. In realt`a, indipendentemente dalle scelte convenzionali alla base della formulazione della relativit` a speciale, `e noto che le correlazioni tra eventi causalmente separati sono comunque “pericolose” nelle teorie relativistiche, perch´e possono essere fonte di paradossi causali: con una catena di eventi a due a due causalmente separati si pu` o congiungere una coppia di eventi lungo la storia di un fissato sistema fisico in qualsiasi ordine temporale. Se queste correlazioni tra eventi causalmente separati possono essere usate per trasmettere informazione nei due sensi, si potrebbe in definitiva comunicare con il passato (all’interno del cono di luce), costruendo alla fine paradossi causali6 . 12.3.3 Impossibilit` a di trasmettere informazione tramite le correlazioni EPR ` possibile provare (vedi [Bon97] e le referenze citate in esso per un’anaE lisi dettagliata) che, se si accetta la formulazione standard della Meccanica Quantistica per sistemi composti in stati entangled come (12.51) (ma anche stati misti entangled del tutto generali), non `e possibile trasmettere alcun tipo di informazione dal luogo (pi` u precisamente l’evento) X in cui avviene una misura di una parte del sistema al luogo (l’evento) Y in cui avviene una misura sull’altra parte del sistema, misurando coppie di grandezze qualsiasi e sfruttando le correlazioni quantistiche tra gli esiti delle misure. Non solo, ma osservando gli esiti delle misure su una parte di sistema, non `e possibile nemmeno stabilire se sull’altra parte sono state fatte o si stanno facendo o si faranno delle misure. Consideriamo due possibilit`a per trasmettere informazione da X a Y tramite le correlazioni EPR. (a) In primo luogo consideriamo le singole coppie di misure su A e B delle osservabili GA e GB rispettivamente, che sappiamo avere esiti correlati. Non `e possibile trasmettere informazione da X a Y sfruttando tale correlazione, ` come avere perch´e l’esito delle misure, anche se correlato `e del tutto casuale. E due monete A e B che presentano la notevole propriet` a che ogni qualvolta una di esse fornisce l’esito “testa” oppure “croce” sotto un lancio, l’altra fornisca l’esito opposto, cio`e “croce” o rispettivamente “testa”, indipendentemente dal 6
Si potrebbe cercare di risolvere il problema dichiarando che esiste un sistema di riferimento privilegiato, nella classe tutti i sistemi inerziali della relativit`a speciale, nel quale l’ordine temporale coincide con l’ordine causa-effetto per la propagazione e gli effetti di segnali superluminari (tachioni) usati per descrivere il processo di collasso a distanza di stati quantistici entangled. Tuttavia questa soluzione appare, all’autore di questo libro, in diretto contrasto con il postulato relativistico e non pu` o pertanto essere accettata, se non in presenza di forti evidenze sperimentali, che d’altra parte minerebbero alla base la teoria della relativit` a.
12.3 Sistemi composti e loro propriet` a
651
fatto che le due monete siano lontanissime una dall’altra e che i lanci durino tempi brevi e che, rispetto ad un fissato riferimento, avvenga prima il lancio di A e dopo quello di B, oppure accada il viceversa rispetto ad un altro riferimento. Le monete per`o sono di natura quantistica per cui `e fisicamente impossibile costringere una di esse a fornire un esito voluto dal lanciatore: l’esito dei lanci `e solo probabilisticamente determinato in completa indipendenza dalla volont` a del lanciatore. In questo modo le due monete, ovvero il nostro sistema quantistico composto dalle due parti A e B, non pu` o essere usato come telegrafo Morse per trasmettere informazione tra X e Y . (b) Come seconda possibilit`a possiamo considerare non le singole misure di GA e GB , ma un gran numero di esse e valutare le propriet` a statistiche delle distribuzioni degli esiti. Potrebbe accadere che la statistica degli esiti delle misure di GA , sia differente a seconda che sia anche misurato GB oppure non lo sia, oppure sia invece misurata una nuova grandezza GB . In questo modo, misurando oppure non misurando GB (e misurando GB o non misurando nulla) in Y , possiamo inviare un segnale elementare in X, di tipo “si” oppure “no”, che ricaviamo controllando sperimentalmente la statistica degli esiti delle misure di A. Mostriamo che, anche con questa procedura, non `e possibile trasmettere alcuna informazione, visto che la statistica degli esiti delle misure di GA `e esattamente la stessa nel caso in cui si misuri anche GB (o qualsiasi altra GB ) oppure nel caso in cui non si misuri GB . Consideriamo lo stato ρ ∈ S(HA ⊗ HB ) del sistema composto di A e B. Supponiamo che GA = G(A) ⊗ IB , dove G(A) `e un operatore autoaggiunto in (A) (A) (A) HA , abbia spettro discreto e finito: {g1 , g2 , . . . , gn }, associato ai corrispondenti autospazi Hg(A) ⊂ HA ⊗ HB , immagine dei proiettori ortogonali (G )
k
(A)
Pk A := PkG ⊗ IB . Similmente GB = IA ⊗ G(B) , dove G(B) `e un operatore (B) (B) (B) autoaggiunto in HB , abbia spettro discreto e finito: {g1 , g2 , . . . , gm }, associato ai corrispondenti autospazi Hg(B) ⊂ HA ⊗ HB immagine dei proiettori (G )
k
(B)
ortogonali Pk B := IA ⊗ PkG . Se misuriamo GB sullo stato ρ ottenendo (B) l’esito della misura gk , lo stato successivo alla misura `e, come sappiamo: tr
1 (G ) (G ) Pk B ρPk B
Pk(GB ) ρPk(GB ) .
Tenendo conto di tutti i possibili esiti della misura di B, nel caso in cui misuriamo (nel giudizio di un certo riferimento) prima B e poi A, il sistema che vogliamo sottoporre alla misura di A sar`a allora dato dalla la miscela: ρ =
m k=1
(GB )
dove pk = tr(Pk
(GB )
ρPk
tr
pk (G ) (G ) Pk B ρPk B
Pk(GB ) ρPk(GB ) (B)
) `e la probabilit` a di esito gk
per la misura di B.
652
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
In definitiva: ρ =
m
(GB )
Pk
(GB )
ρPk
.
k=1 (A)
Quindi, la probabilit` a di avere l’esito gh per la misura di A, quando `e stata misurata B (indipendentemente dall’esito di quest’ultima misura) `e allora: m (G ) (G ) (G ) (A) (GA ) B B A P(gh |B) = tr(ρ Ph . ) = tr Pk ρPk Ph k=1
Dalle propriet` a di linearit` a e di ciclicit`a della traccia abbiamo che: (A)
P(gh |B) =
m
(GB )
tr(Pk
(GB )
ρPk
(GA )
Ph
)=
k=1
m
(GB )
tr(ρPk
(GA )
Ph
(GB )
Pk
)
k=1
=
m
(GB )
tr(ρPk
(GB )
Pk
(GA )
Ph
).
k=1 (G )
(G )
Nell’ultimo passaggio abbiamo tenuto conto del fatto che Pk B Ph A = (G ) (G ) (G ) Ph A Pk B a causa della struttura di tali proiettori. D’altra parte Pk B (GB ) (GB ) (GB ) Pk = Pk e k Pk = I per il teorema spettrale. In definitiva: m m (G ) (G ) (A) (GB ) (GA ) B A = tr ρ tr ρPk Ph Pk Ph P(gh |B) = k=1
k=1
(GA )
= tr ρPh
(A)
= P(gh ) . (A)
Il risultato finale `e che: la probabilit` a di ottenere gh misurando A quando `e stata misurata anche la grandezza B (ottenendo qualsiasi risultato possibile), (A) coincide con la probabilit` a di ottenere gh misurando A senza che sia stato misurato B. Dunque, anche considerando la statistica degli esiti delle misure di A, non vi `e alcun modo di trasmettere informazione tramite le correlazioni EPR: eseguendo misure sulla parte B del sistema, la presenza o l’assenza di tali correlazioni `e del tutto irrilevante osservando solo la parte A di sistema. Osservazione 12.28. In questo modo la Meccanica Quantistica e la Relativit` a sembrano coesistere pacificamente. In realt`a la discussione di sopra prescinde completamente dal fatto che lo spaziotempo sia quello classico oppure quello relativistico. La lezione che si impara potrebbe essenzialmente essere che i processi riguardanti i sistemi quantistici composti non sono descrivibili nello spaziotempo. Solo gli esiti delle misure, interpretati come stati di sistemi macroscopici (detectors, contatori, ecc...) sono descrivibili nello spaziotempo in termini di eventi. Lo spaziotempo `e una struttura a posteriori sulla quale
12.3 Sistemi composti e loro propriet` a
653
si registrano fenomeni macroscopici, in taluni casi legati a fenomeni microscopici. (Per un altro interessante punto di vista vedi [Dop09]). Questo punto di vista `e un punto di partenza e non un punto finale, fino a quando non si chiarir` a cosa sia un sistema macroscopico e cosa sia un sistema microscopico e quali siano le ragioni della transizione da un regime all’altro. Il chiarimento, a parere dell’autore, dovr` a essere, prima di tutto, di carattere sperimentale. 12.3.4 Assioma A8: sistemi di sottosistemi identici Le particelle elementari della meccanica quantistica sono particelle identiche. L’indistiguibilit` a di esse viene formalizzata, nella formulazione della Meccanica Quantistica, in modo molto preciso e tenendo conto dell’assioma A7, come illustreremo tra poco. Dobbiamo premettere qualche semplice risultato tecnico. Definizione 12.29. Il gruppo delle permutazioni di n oggetti Pn `e l’insieme delle funzioni σ : {1, 2, . . . , n} → {1, 2, . . ., n} biettive (dette permutazioni di n oggetti), con prodotto gruppale dato dalla composizione di funzioni. σ ∈ Pn `e detta permutazione di due oggetti se `e l’identit` a quando ristretta a qualche sottoinsieme di {1, 2, . . ., n} contenente n − 2 elementi. Ad ogni σ ∈ Pn viene associato un numero in (−1)σ ∈ {−1, +1}, detto la parit` a di σ. Se σ `e composizione di un numero pari di permutazioni di due oggetti (−1)σ := 1, se σ `e composizione di un numero dispari di permutazioni di due oggetti (−1)σ := −1. Malgrado il numero di permutazioni di due oggetti in cui si decompone σ non sia univocamente determinato, la parit` a `e invece univocamente determinata come si prova facilmente. Consideriamo ora uno spazio 5n di Hilbert H ed il prodotto tensoriale di n copie di tale spazio: H⊗n := i=1 H. σ ∈ Pn induce un operatore unitario Uσ : H⊗n → H ⊗n come segue. Scegliamo una base hilbertiana N per H. Come sappiamo dalla proposizione 9.36, i vettori ψ1 ⊗ · · · ⊗ ψn con ψk ∈ N per ` ovvio che, se σ `a k = 1, 2, . . . , n, formano una base hilbertiana per H⊗n . E una permutazione arbitraria, anche gli elementi ψσ(1) ⊗· · ·⊗ψσ(n) con ψk ∈ N per k = 1, 2, . . ., n formeranno una base hilbertiana per H⊗n . Anzi, tale base, a parte un riordinamento degli elementi, `e proprio la stessa di prima data la natura della funzione σ. Definiamo Uσ : H⊗n → H⊗n come l’unico operatore limitato che soddisfa: Uσ (ψ1 ⊗ · · · ⊗ ψn ) := ψσ(1) ⊗ · · · ⊗ ψσ(n) ,
con ψk ∈ N per k = 1, 2, . . . , n.
Uσ `e unitario perch´e trasforma una base hilbertiana in una base hilbertiana; inoltre se φ1 , . . . φn ∈ H sono vettori arbitrari (non necessariamente in N ) allora, decomponendo i vettori sulla base dei ψi ed usando linearit` a e continuit` a,
654
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
risulta ancora che: Uσ (φ1 ⊗ · · · ⊗ φn ) := φσ(1) ⊗ · · · ⊗ φσ(n) . Di fatto abbiamo provato met` a della seguente proposizione. 5n e un Proposizione 12.30. Si consideri lo spazio H⊗n := i=1 H, dove H ` arbitrario spazio di Hilbert, ed il gruppo delle permutazioni di n oggetti Pn . Vale quanto segue. (a) Se σ ∈ Pn esiste un unico operatore unitario Uσ : H⊗n → H⊗n tale che: Uσ (φ1 ⊗ · · · ⊗ φn ) := φσ(1) ⊗ · · · ⊗ φσ(n) ,
(12.52)
per ogni scelta di φ1 , . . . , φn ∈ H. (b) U : Pn σ → Uσ `e una rappresentazione unitaria fedele del gruppo Pn . Dimostrazione. (a). La tesi `e conseguenza della discussione fatta prima di enunciare la proposizione, definendo Uσ rispetto ad una base hilbertiana, si verifica facilmente che soddisfa (12.52) per ogni scelta di φ1 , . . . , φn ∈ H. Due operatori limitati che godono della propriet` a (12.52), coincidono su una base e quindi coincidono ovunque (essendo entrambi limitati). (b). Per computo diretto si vede che (Uσ Uσ )(φ1 ⊗· · · ⊗φn ) = Uσ◦σ (φ1 ⊗· · · ⊗ φn ) Per linearit` a e continuit`a segue che Uσ Uσ = Uσ◦σ . Pertanto σ → Uσ `e una rappresentazione (unitaria) di Pn . La rappresentazione `e fedele perch´e l’applicazione U `e iniettiva, dato che Uσ = I implica che valga φσ(1) ⊗ · · · ⊗ φσ (n) = φ1 ⊗· · ·⊗φn per ogni scelta di φ1 , . . . , φn ∈ H a due a due ortonormali, che a sua volta implica σ = id. Dal punto di vista fisico, se Ψ ∈ H⊗n rappresenta uno stato puro di un sistema costituito da n sottosistemi identici, descritti ciascuno separatamente sullo spazio di Hilbert H, lo stato puro associato a Uσ Ψ ha la naturale interpretazione dello stato del sistema fisico in cui i ruoli degli n sottosistemi siano stati scambiati, secondo la permutazione σ. L’azione di Uσ si estende agli stati generici ρ ∈ S(H⊗n ) tramite la trasformazione che associa ρ a Uσ ρUσ−1 . Si verifica facilmente che, dato che Uσ `e unitario, questa trasformazione preserva la positivit` a di ρ e la sua traccia (Uσ ρUσ−1 `e di classe traccia se lo `e ρ dato che gli operatori di classe traccia sono un ideale bilatero), per cui Uσ ρUσ−1 ∈ S(H⊗n ) se ρ ∈ S(H⊗n ). L’azione del gruppo delle permutazioni sugli stati del sistema ha un’azione duale sulle proposizioni P ∈ P(H⊗n ) relative al sistema fisico. Tale azione duale `e, al solito, descritta dalla trasformazione che associa P a Uσ−1 P Uσ . Si osservi che essendo Uσ unitario, Uσ−1 P Uσ `e un proiettore ortogonale se P `e un proiettore ortogonale. Si osservi che dalle propriet` a della traccia ((c) in proposizione 4.34) risulta che tr Uσ−1 P Uσ ρ = tr P Uσ ρUσ−1 .
12.3 Sistemi composti e loro propriet` a
655
Per cui, come al solito, fare agire il gruppo delle permutazioni sugli stati oppure sulle proposizioni sul sistema `e fisicamente equivalente, ai fini del calcolo delle probabilit` a che le proposizioni siano verificate in seguito a misura di esse. L’interpretazione naturale della trasformazione che associa P a Uσ−1 P Uσ `e quella di trasformare la proposizione P scambiando il ruolo dei sottosistemi secondo la permutazione σ. L’azione di Uσ sulle proposizioni induce un’azione su ogni misura a valori di proiezione {P (A)(E)}E∈T (R) (associata all’osservabile A), che viene trasformata in una corrispondente misura a valori di proiezione {Uσ−1 P (A) (E)Uσ }E∈T (R) . Si verifica subito, dal teorema spettrale, che questa azione corrisponde alla trasformazione dell’osservabile A nell’osservabile Uσ−1 AUσ . Tale trasformazione ha un ovvio significato fisico alla luce delle osservazioni precedenti. Possiamo ora enunciare l’assioma relativo a sistemi composti da sottosistemi identici. A8. Se un sistema fisico S `e composto da n < +∞ sottosistemi identici, ciascuno descritto in una copia dello spazio di Hilbert H, le proposizioni fisicamente ammissibili sul sistema corrispondono al sottoinsieme di P(H⊗n ) contenente i proiettori ortogonali invarianti sotto l’azione del gruppo delle permutazioni definita nella proposizione 12.30. In altre parole P ∈ P(H⊗n ) ha senso fisico sul sistema solo se: Uσ−1 P Uσ = P ,
per ogni σ ∈ Pn .
Conseguentemente le osservabili A, fisicamente ammissibili sul sistema S, sono quelle le cui misure spettrali soddisfano il requisito detto che equivale a dire Uσ−1 AUσ = A , per ogni σ ∈ Pn . A titolo di esempio, se si lavora con un sistema di due particelle identiche di (1) (2) massa m di coordinate xi e xi rispettivamente, un’osservabile fisicamente (1) (1) ammissibile `e la componente i-esima della posizione media: (Xi + Xi )/2. (1) Senza entrare nei dettagli diciamo solo che, usando le misure spettrali di Xi (2) e Xi , si pu` o, per esempio, costruire una proposizione ammissibili (proiettore ortogonale che commuta con ogni Uσ ) che corrisponde all’affermazione “una delle due particelle ha coordinata i-esima che cade nel boreliano E”. Viceversa proposizioni del tipo “la particella 1 ha coordinata i-esima che cade nel boreliano E” non risultano essere ammissibili. 12.3.5 Bosoni e Fermioni Vogliamo infine mostrare una conseguenza notevole dell’assioma A.8. Consideriamo per il solito sistema fisico S costituito da n sottosistemi identici. Quindi per σ ∈ Pn , consideriamo il sottospazio di H⊗n , autospazio con
656
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
autovalore λ di Uσ : (σ)
(H⊗n )λ := {Ψ ∈ H⊗n | Uσ Ψ = λΨ } . Si osservi, che essendo Uσ unitario, deve essere |λ| = 1 Ogni proposizione fisicamente sensata deve commutare con Uσ , pertanto se inizialmente lo stato del sistema `e puro ed individuato dal vetto(σ) re Ψ ∈ (H⊗n )λ , in seguito ad una misura secondo la proposizione ammissibile P (che risulta essere verificata), lo stato successivo alla misura (σ) sar`a descritto da P Ψ/||P Ψ || che apparterr` a ancora a (H⊗n )λ , dato che Uσ P Ψ P Uσ Ψ PΨ PΨ Uσ ||P e dunque possibiΨ || = ||P Ψ || = ||P Ψ || = λ ||P Ψ || . Eseguendo misure non ` (σ)
le “fare uscire il sistema” dallo spazio (H⊗n )λ se era, immediatamente prima (σ) della misura, in uno stato puro descritto da un vettore in (H⊗n )λ . Nemmeno l’evoluzione temporale permette di “fare uscire il sistema” dallo spazio (σ) (H⊗n )λ se era, al tempo iniziale, in uno stato puro descritto da un vetto(σ) re in (H⊗n )λ . Infatti l’osservabile hamiltoniana H avr` a, essendo fisicamente ammissibile, una misura spettrale che commuta con Uσ . Di conseguenza −itH −ih (H) Uσ = e dP (h)Uσ = Uσ e−ih dP (H)(h) = Uσ e−itH . e σ(H)
σ(H)
Se Uσ Ψ = λΨ , allora: Uσ Ψt = Uσ e−itH Ψ = e−itH Uσ Ψ = e−itH λΨ = λΨt , e (σ) quindi Ψt ∈ (H⊗n )λ , per ogni tempo t ∈ R. Concludiamo che vale il seguente risultato. Proposizione 12.31. Se un sistema fisico S `e composto da n < +∞ sottosistemi identici, ciascuno descritto in una copia dello spazio di Hilbert H e, al tempo t0 arbitrario, il sistema si trova in uno stato puro rappresenta(σ) to da un vettore nel sottospazio (H⊗n )λ per qualche σ ∈ Pn , in seguito ad evoluzione temporale oppure a processo di misura, il sistema continuer` a ad essere descritto da uno stato puro rappresentato da un vettore nel sottospazio (σ) (H⊗n )λ . Questo risultato `e, non solo, sperimentalmente osservato, ma l’evidenza sperimentale mostra che gli stati puri di un sistema di particelle identiche sono individuati da vettori che appartengono solamente a due sottospazi costruiti (σ) intersecando i sottospazi (H⊗n )λ (ed anche gli stati misti sono sovrapposizioni incoerenti di stati puri che appartengono a uno dei due sottospazi detti). Per illustrare questo fatto dobbiamo ancora fare qualche considerazione. Se consideriamo il caso in cui δ ∈ Pn sia una permutazione di due soli elementi, allora δ ◦ δ = id e pertanto Uδ Uδ = I. Dato che Uδ `e unitario, l’identit` a trovata mostra che Uδ `e anche autoaggiunto. Pertanto Uδ `e un’osservabile e pi` u precisamente una costante del moto (provarlo per esercizio). Non solo, dovendo essere σ(Uδ ) contemporaneamente incluso in R (perch´e Uδ `e autoaggiunto) e nella circonferenza di raggio 1 in C (perch´e Uδ `e unitario),
12.3 Sistemi composti e loro propriet` a
657
concludiamo che σ(Uδ ) ⊂ {−1, 1}. Deve anche essere σ(Uδ ) = σp (Uδ ) perch`e ` facile provare che in effetti lo spettro `e costituito da uno o due punti isolati. E σp(Uδ ) = {−1, 1}. Infatti, se δ scambia il k-esimo elemento con il j-esimo elemento, ogni vettore di H⊗n del tipo: (ψ1 ⊗ · · · ⊗ ψk ⊗ · · · ⊗ ψj ⊗ · · · ⊗ ψn ) ± (ψ1 ⊗ · · · ⊗ ψj ⊗ · · · ⊗ ψk ⊗ · · · ⊗ ψn ) `e autovettore di Uδ con autovalore ±1. Da questo risultato segue immediatamente che, per ogni ogni σ ∈ Pn , Uσ ammette almeno gli autovalori (eventualmente coincidenti) 1 e (−1)σ . Basta infatti decomporre Uσ = Uδ1 · · · Uδm dove le σi sono permutazioni di due soli elementi. Le intersezioni: (σ)
(δ )
⊗n )+1i (H⊗n )+ := ∩m i=1 (H
e
(σ)
(δ )
⊗n (H⊗n )− := ∩m )−1i i=1 (H
sono autospazi di Uσ , rispettivamente, con autovalore +1 e (−1)σ come segue immediatamente dalla decomposizione Uσ = Uδ1 · · · Uδm . Lo spazio H⊗n ha due sottospazi chiusi interessanti dal punto di vista fisico che (σ) si ottengono intersecando, rispettivamente, tutti sottospazi di tipo (H⊗n )+ (σ) e tutti i sottospazi (H⊗n )− al variare di σ ∈ Pn . Questi due spazi sono il sottospazio completamente simmetrico: (H⊗n )+ := {Ψ ∈ H⊗n | Uσ Ψ = Ψ , ∀σ ∈ Pn } ed il sottospazio completamente antisimmetrico: (H⊗n )− := {Ψ ∈ H⊗n | Uσ Ψ = (−1)σ Ψ , ∀σ ∈ Pn } . La rilevanza fisica di questi due sottospazi `e nel fatto che tutti i sistemi di particelle identiche noti hanno stati puri descritti da vettori in (H⊗n )+ oppure in (H⊗n )− . Pi` u precisamente risulta che le particelle della prima classe, dette Bosoni (i cui stati misti sono sovrapposizioni incoerenti di stati puri in (H⊗n )+ ), hanno sempre spin intero, viceversa, le particelle della seconda classe (i cui stati misti sono sovrapposizioni incoerenti di stati puri in (H⊗n )− ), dette Fermioni, hanno sempre spin semi intero. Questo risultato viene spesso indicato come correlazione spin statistica. All’interno della formulazione non relativistica della meccanica quantistica non esiste una dimostrazione di questa restrizione fisica per la struttura degli stati e nemmeno del legame con il valore dello spin. In essa si riesce solo a provare, usando la proposizione 12.31, che se un sistema di particelle ha comportamento fermionico oppure bosonico ad un tempo t0 , lo avr` a per sempre fino a quando `e descritto da stati puri). All’interno della formulazione non relativistica, sono comunque compatibili con la proposizione 12.31, stati per sistemi di particelle identiche che non sono simmetrici e nemmeno antisimmetrici. Si dice, in gergo, che tali sistemi soddisfano una parastatistica. Particelle che soddisfano parastatistiche non sono mai state osservate.
658
12 Alcuni argomenti pi` u avanzati di Meccanica Quantistica
La formulazione relativistica (nello spaziotempo a 4 dimensioni) della meccanica quantistica ha prodotto, ad opera di vari autori (principalmente W. Pauli), un famoso teorema, detto appunto teorema di correlazione spin statistica, in cui si dimostra che la restrizione dello spazio degli stati puri e correlazione spin statistica osservata sperimentalmente sono in realt`a conseguenze, tra le altre ipotesi, del requisito della teoria di essere invariante sotto il gruppo di Poincar´e invece che quello di Galileo. Per concludere menzioniamo il fatto che, trattando sistemi costituiti da infiniti sottosistemi, identici ciascuno descritto nello spazio di Hilbert H, gli spazi di Hilbert naturali per sviluppare la teoria sono i due sottospazi dello spazio di Fock (vedi (3) in esempi 9.38): F+ (H) :=
+∞ -
(Hn⊗ )+
e
n=0
F− (H) :=
+∞ -
(Hn⊗ )− ,
n=0
lo spazio di Fock bosonico e lo spazio di Fock fermionico, rispettivamente, generati da H. Al solito abbiamo assunto (H0⊗ )± := C e l’unico stato puro individuato da (H0⊗ )± si dice stato di vuoto del sistema. In tale descrizione ricade la trattazione della teoria quantistica dei campi, in cui ad ogni campo viene “sostituito” un sistema di infinite particelle identiche bosoniche o fermioniche.
Esercizi 12.1. Considerare uno stato misto ρ ∈ S(H) ed una somma diretta ortogonale di sottospazi di H: H = ⊕k∈K Hk , con K finito o numerabile, associata a corrispondenti proiettori ortogonali {Pk }k∈K . Dimostrare che, se definiamo, usando la topologia operatoriale forte: ρ := sPk ρPk k
allora ρ `e be definito e vale: ρ ∈ S(H).
Suggerimento. Notare che Pk Ph = 0 se k = h, s- k Pk = I, ed infine ||ρ2 || ≤ 1 e questo consente di dimostrare che la serie converge nella topologia operatoriale forte sfruttando propriet`a note di serie di vettori ortogonali. Il fatto che ρ sia positivo e che ||ρ || ≤ 1 segue facilmente dalla costruzione e dalle analoghe propriet` a per ρ. Infine, usando una base Hilbertiana N di H che `e unione di analoghe basi hilbertiane di ciascuno dei sottospazi Hk , si dimostra, dalla proposizione 4.27 che ρ `e di classe traccia e che trρ = trρ = 1. 12.2. In riferimento alla discussione della sezione 12.3.3, in cui si prova che (A) la probabilit` a di misurare il valore gk per la grandezza GA sulla parte A di un sistema quantistico `e indipendente dal fatto che sia misurata o meno
Esercizi
659
la grandezza GB sulla parte B = A del sistema, dimostrare che il risultato `e valido anche per osservabili arbitrarie (con spettro anche continuo ed illimitato). Assumere che lo strumento di misura di GB ammetta come risultati (G ) possibili una classe numerabile di boreliani Ek B a due a due disgiunti e tali che la loro unione coincide con σ(GB ). 12.3. Considerare un sistema di n particelle identiche descritte in H⊗n . Provare che in virt` u dell’assioma A8, se δ ∈ Pn `e una permutazione di due soli elementi, allora Uδ `e una costante del moto. 12.4. Provare che (H⊗n )+ e (H⊗n )− sono ortogonali e che, se n = 2, vale H⊗2 = (H⊗2 )+ ⊕ (H⊗2 )− , ma che, gi`a per n = 3, la relazione `e falsa.
Appendice A Relazioni d’ordine, topologia, gruppi
A.1 Relazioni d’ordine, insiemi parzialmente ordinati, lemma di Zorn Se X `e un insieme arbitrario, una relazione ≥ su X viene detta relazione d’ordine parziale quando `e riflessiva (per x ∈ X, x ≥ x), transitiva (per x, y, z ∈ X, se x ≥ y e y ≥ z allora x ≥ z) e antisimmetrica (per x, y ∈ X, se x ≥ y e y ≥ x allora x = y). In tal caso (X, ≥) si dice insieme parzialmente ordinato. Al posto di a ≥ b si scrivere equivalentemente b ≤ a. La relazione d’ordine parziale ≥ si dice relazione d’ordine totale se vale ulteriormente la propriet` a: per ogni coppia x, y ∈ X, x ≥ y oppure y ≥ x. Se (X, ≥) `e un insieme parzialmente ordinato: (i) Y ⊂ X `e limitato superiormente (inferiormente) se ammette un maggiorante (minorante), cio`e x ∈ X tale che x ≥ y (y ≥ x) se y ∈ Y , (ii) un elemento x0 ∈ X tale che non esiste in X alcun x = x0 con x ≥ x0 , si dice elemento massimale di X. (Si noti che un elemento massimale di X pu` o non essere un maggiorante di X). Se (X, ≥) `e un insieme parzialmente ordinato, Y ⊂ X si dice ordinato se ≥ ristretta a Y × Y `e una relazione d’ordine totale. Ricordiamo il lemma di Zorn equivalente all’Assioma della Scelta (o di Zermelo). Teorema A.1. (“Lemma di Zorn”.) Se in un insieme parzialmente ordinato (X, ≥) ogni sottoinsieme ordinato `e limitato superiormente, allora X ammette almeno un elemento massimale. Tra le nozioni utili nella teoria degli insiemi parzialmente ordinati ci sono anche quelle di estremo superiore ed estremo inferiore. Se (X, ≥) `e un insieme parzialmente ordinato: Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
662
Appendice A Relazioni d’ordine, topologia, gruppi
(i) a `e detto estremo superiore dell’insieme A ⊂ X e si scrive a = sup A, se a `e un maggiorante di A e se ogni altro maggiorante di A, a , soddisfa a ≤ a , (ii) a `e detto estremo inferiore dell’insieme A ⊂ X e si scrive a = inf A, se a `e un minorante di A e se ogni altro minorante di A, a , soddisfa a ≤ a. ` immediato verificare che ogni sottoinsieme A ⊂ X ammette al pi` E u un estremo superiore ed al pi` u un estremo inferiore.
A.2 Richiami di topologia generale elementare Una coppia (X, T ), dove X `e un insieme e T una classe di sottoinsiemi di X, si dice spazio topologico se valgono i seguenti fatti: (i) ∅ ∈ T , (ii) l’unione di elementi (in quantit` a arbitraria) di T `e un elemento di T , (iii) l’intersezione di una quantit` a finita di elementi di T `e un elemento di T . In questo caso gli insiemi di T vengono detti (insiemi) aperti, T viene detta topologia su X. Una base topologica di (X, T ) `e un sottoinsieme B ⊂ T , tale che ogni aperto si ottiene come unione di elementi in B. Gli insiemi chiusi di X sono, per definizione, i complementi rispetto a X degli aperti. Si osservi che, di conseguenza, l’intersezione di una classe di insiemi chiusi `e un insieme chiuso e l’unione finita di insiemi chiusi `e un chiuso. La chiusura, S, di un sottoinsieme S ⊂ X, `e definita come l’insieme S := ∩{A ⊃ S , A ⊂ X | A `e chiuso} . Risulta che S `e un insieme chiuso, che S = S, che S `e chiuso se e solo se S = S e che S ⊂ T implica S ⊂ T . Se p ∈ X, dove (X, T ) `e uno spazio topologico, un intorno aperto di p `e un qualsiasi A ∈ T tale che p ∈ A. Un punto x ∈ A `e detto essere interno ad A ⊂ X, quando esiste un intorno aperto U di x che soddisfa U ⊂ A. L’interno, Int(A) di un insieme A ⊂ X, `e definito come: Int(A) := {x ∈ X | x `e interno ad A} . Una successione {xn }n∈N ⊂ X, dove X `e uno spazio topologico, `e detta convergere ad un punto x ∈ X, che `e detto il limite della successione, se e solo se, per ogni intorno aperto A di x esiste NA ∈ R tale che xn ∈ A se n > NA . Un punto x ∈ X `e detto punto di accumulazione di un insieme S ⊂ X se ogni intorno aperto di x contiene un punto di S distinto da x.
A.2 Richiami di topologia generale elementare
663
In uno spazio topologico X risulta che la chiusura A di un sottoinsieme A ⊂ X coincide con l’unione di A e dell’insieme dei punti di accumulazione di A. Un sottoinsieme U di uno spazio topologico X `e detto essere denso in X, se per ogni x ∈ X e per ogni intorno aperto A di x, vale U ∩ A = ∅. Uno spazio topologico `e detto essere separabile se ammette un sottoinsieme denso e numerabile. Se A ⊂ X `e un insieme arbitrario e (X, T ) `e uno spazio topologico, `e possibile indurre su A una topologia, TA , tramite T . Ponendo infatti: TA := {B ∩ A | B ∈ T }, si verifica subito che (A, TA ) `e ancora uno spazio topologico. TA `e detta topologia indotta (da T ) su A. Se (X, T ) e (X , T ) sono spazi topologici, una funzione f : X → X `e detta continua, se `e tale che f −1 (A) ⊂ T quando A ∈ T (cio`e la controimmagine di un aperto dello spazio di arrivo `e un aperto nello spazio di partenza). Se (X, T ) e (X , T ) sono spazi topologici e p ∈ X, una funzione f : X → X `e detta continua in p se, per ogni intorno aperto Bf(p) di f(p), esiste un intorno aperto Ap di p tale che f(Ap ) ⊂ Bf(p) . Si verifica facilmente che f : X → X `e continua se e solo se `e continua in ogni punto p ∈ X. Si prova che se i due spazi X, X usati sopra sono Rn ed Rm rispettivamente, oppure sottoinsiemi di tali spazi, dotati delle rispettive topologie euclidee (vedi sotto), la definizioni classiche di funzione continua e continua in un punto sono equivalenti a quelle generali date sopra. Se (X, T ) e (X , T ) sono spazi topologici, una funzione f : X → X `e detta omeomorfismo quando `e continua, biettiva e l’inversa `e continua. Uno spazio topologico (X, T ) `e detto spazio di Hausdorff o spazio T2 o spazio separabile di secondo tipo, se per ogni coppia di punti p, q ∈ X ci sono due intorni aperti Up p e Vq q con Up ∩ Vq = ∅. Uno spazio topologico (X, T ) `e detto essere a base numerabile o numerabile di secondo tipo se ammette una base topologica numerabile B ⊂ T . Se (X, T ) `e a base numerabile vale il lemma di Lindel¨ of: se {Uα }α∈I `e una classe di aperti che ricopre l’insieme B ⊂ X, cio`e ∪α∈I Uα ⊃ B, allora `e possibile estrarre un sotto ricoprimento numerabile da {Uα }α∈I . In altre parole esiste una scelta di indici αn ∈ I, con n ∈ N tale che ∪n∈N Uαn ⊃ B. Rn e Cn , dotati della topologia standard, sono sia di Hausdorff che a base numerabile. Un sottoinsieme K ⊂ X dello spazio topologico X (eventualmente coincidente con X stesso) `e detto essere compatto, se da ogni classe di aperti {Aα }α∈I
664
Appendice A Relazioni d’ordine, topologia, gruppi
con ∪α∈I Aα ⊃ K `e possibile estrarre una sottoclasse finita {Aαi }i=1,2,...,n tale che ∪i=1,...,n Aαi ⊃ K. K `e detto relativamente compatto se la sua chiusura `e un insieme compatto di X. Lo spazio stesso X `e detto localmente compatto se ogni punto di X ammette un intorno aperto relativamente compatto. In uno spazio topologico di Hausdorff ogni insieme compatto `e chiuso. Viceversa, in ogni spazio topologico ogni sottoinsieme chiuso di un insieme compatto `e compatto. Le funzioni continue tra due spazi topologici trasformano insiemi compatti in insiemi compatti. Un insieme K ⊂ Y , con Y ⊂ X dotato della topologia indotta da X, `e compatto rispetto a Y se e solo se lo `e rispetto ad X. Sia f : K → R (o C), dove K ⊂ X `e un compatto nello spazio topologico X e R (risp. C) `e dotato della topologia standard), se f `e continua, allora f `e limitata. La prova `e immediata dalle definizioni date o anche dal fatto che le funzioni continue trasformano compatti in compatti e vale quanto segue. In Rn e Cn , dotati della topologia standard (nel secondo caso, tale topologia `e quella di R2n ), i compatti sono tutti e soli gli insiemi chiusi e limitati (cio`e contenuti in palle aperte di raggio arbitrario ma finito) per il teorema di Heine-Borel. Se {(Xi , Ti )}i∈F `e una classe di spazi topologici, si definisce una topologia, T , su loro prodotto cartesiano X := ×i∈F Xi che viene detta topologia prodotto. Tale topologia `e definita nel modo che segue. Si tratta dell’unica topologia in cui gli aperti sono i seguenti sottoinsiemi di X. Per ogni per ogni i ∈ F , fissiamo un aperto Ai di Xi in modo tale che Ai = Xi tranne che per un numero finito di indici i. ∅ e le unioni arbitrarie di tutti i prodotti cartesiani ×i∈F Ai sono, per definizione, gli aperti della topologia prodotto T . Per costruzione, le proiezioni canoniche πi : X → Xi sono continue e la topologia prodotto `e meno fine fra tutte quelle che rendono le proiezioni canoniche continue (cio`e `e inclusa in tutte le topologie con quella propriet` a). La topologia standard di Rn `e la topologia prodotto ottenuta ponendo sui fattori R la topologia standard. Teorema A.2. (Di Tychonoff.) Il prodotto cartesiano (di una quantit` a arbitraria) di spazi topologici compatti `e compatto nella topologia prodotto. Uno spazio topologico X si dice connesso se non `e l’unione di due aperti disgiunti. Un sottoinsieme A ⊂ X si dice insieme connesso se `e tale rispetto alla topologia indotta da X. Definendo la relazione di equivalenza x ∼ x se e solo se x, x ∈ C, dove C `e un qualsiasi sottoinsieme connesso dello spazio topologico X, le classi di equivalenza che ne risultano sono i sottoinsiemi connessi massimali di uno spazio topologico e sono dette le componenti connesse di X. Di conseguenza le
A.2 Richiami di topologia generale elementare
665
componenti connesse di X sono disgiunte e la loro unione `e X. Si dimostra che le componenti connesse sono insiemi chiusi. Risulta che le funzioni continue tra due spazi topologici trasformano insiemi connessi in insiemi connessi. Un sottoinsieme A di uno spazio topologico X `e detto connesso per archi se, per ogni coppia p, q ∈ A esiste un’applicazione continua γ : [0, 1] → A tale che γ(0) = p, γ(1) = q. Ogni insieme connesso per archi `e necessariamente connesso. Risulta che un insieme aperto connesso non vuoto di Rn `e connesso per archi. Un sottoinsieme A di uno spazio topologico X `e detto semplicemente connesso se, per ogni coppia p, q ∈ A e per ogni coppia di curve continue γi : [0, 1] → A, i = 0, 1, tali che γi (0) = p, γi (1) = q, esiste una funzione continua (detta omotopia) γ : [0, 1] × [0, 1] → A tale che γ(0, t) = γ0 (t), γ(1, t) = γ1 (t) per t ∈ [0, 1]. Si dimostra che lo spazio topologico prodotto di due spazi topologici semplicemente connessi `e a sua volta semplicemente connesso. Uno spazio metrico `e un insieme X dotato di una funzione d : X × X → R, detta distanza o metrica, che soddisfa: (i) d(x, y) = d(y, x), (ii) d(x, y) ≥ 0 dove = vale se solo se x = y, (iii) d(x, z) ≤ d(x, y) + d(y, x) per x, y, z ∈ X. Una palla metrica (aperta) di raggio δ > 0 e centro x0 ∈ X, Bδ (x0 ) ⊂ X `e definita come: Bδ (x0 ) := {x ∈ X | d(x, x0 ) < δ}. Una funzione f : X → X con X, X spazi metrici con distanze, d e d rispettivamente `e detta isometria se conserva le distanze, cio`e: d(x, y) = d (f(x), f(y)) per ogni coppia x, y ∈ X. Uno spazio metrico (X, d) ha una struttura naturale di spazio topologico di Hausdorff, quando si definiscono gli aperti come l’insieme vuoto e tutti i sottoinsiemi di X costruiti unendo una quantit` a arbitraria di palle aperte di raggio arbitrario e centro arbitrario. Questa topologia `e detta topologia metrica indotta da d. Un importante risultato tecnico per gli spazi metrici `e che: uno spazio metrico, come spazio topologico, `e separabile se e solo se ammette una base numerabile. Esattamente come nel caso di uno spazio topologico generale, in uno spazio metrico (X, d), una successione {xn }n∈N ⊂ X `e detta convergere a x ∈ X, se vale limn→+∞ xn = x rispetto alla topologia metrica di (X, d); nel caso specifico, la definizione equivale alla richiesta: per ogni > 0 esiste N ∈ N tale che, se n > N allora d(xn , x) < .
666
Appendice A Relazioni d’ordine, topologia, gruppi
In uno spazio metrico (X, d), una successione {xn }n∈N ⊂ X `e detta essere di Cauchy se accade che, per ogni > 0 esiste N ∈ N tale che, se n, m > N allora d(xn , xm ) < . Ovviamente ogni successione che converge `e anche una successione di Cauchy, ma non vale il viceversa. Uno spazio metrico (X, d) `e detto essere completo quando ogni successione di Cauchy converge a qualche elemento di X. Rn e Cn sono spazi metrici quando si dotano della distanza euclidea o distanza standard: n d((x1 , . . . , xn ), (y1 , . . . , yn )) := |xk − yk |2 . k=1
Rn e Cn ammettono quindi una topologia naturale detta topologia euclidea o anche topologia standard, i cui aperti sono, oltre all’insieme vuoto, gli insiemi dati dalle unioni arbitrarie di palle aperte di centro e raggio arbitrario. Tali spazi topologici sono completi. Le nozioni topologiche elementari di Rn e Cn studiate nei corsi di analisi sono sottocasi delle nozioni generali date sopra.
A.3 Richiami di teoria dei gruppi In gruppo `e una struttura algebrica, (G, ◦), dove G `e un insieme e ◦ : G×G → G `e una funzione detta prodotto (gruppale). Inoltre le seguenti tre condizioni devono essere soddisfatte. (1) ◦ `e associativo, cio`e: g1 ◦ (g2 ◦ g3 ) = (g1 ◦ g2 ) ◦ g3 ,
per ogni g1 , g2 , g3 ∈ G .
(2) Esiste l’elemento neutro, cio`e esiste e ∈ G tale che: e◦g =g◦e=g,
per ogni g ∈ G .
(3) Ogni elemento g ∈ G ammette un elemento inverso, cio`e: per ogni
g∈G
esiste
g−1 ∈ G con
g ◦ g−1 = g−1 ◦ g = e .
L’elemento neutro e l’elemento inverso risultano essere unici come si prova facilmente. Un gruppo (G, ◦) `e detto essere commutativo oppure, equivalentemente, abeliano se g ◦ g = g ◦ g per ogni coppia di elementi g, g ∈ G; altrimenti `e detto non commutativo o non abeliano. Un sottoinsieme G ⊂ G di un gruppo `e chiamato sottogruppo se `e un gruppo rispetto alla restrizione a G × G del prodotto gruppale. Un sottogruppo N di un gruppo G `e detto normale se `e invariante sotto coniugazione, cio`e, per ogni elemento n ∈ N ed ogni elemento g ∈ G, l’elemento g ◦ n ◦ g −1 appartiene a N.
A.3 Richiami di teoria dei gruppi
667
Se N `e un sottogruppo normale del gruppo G, G/N `e l’insieme delle classi di equivalenza in G quando la relazione di equivalenza `e g ∼ g se e solo se g = ng per n ∈ N . Si prova facilmente che G/N acquista naturalmente una struttura di gruppo da quella di G. Il centro, Z, di G `e sottogruppo commutativo G, costituito da tutti gli elementi z che commutano con tutti gli elementi di G – in altre parole z ∈ Z se e solo se z ◦ g = g ◦ z per ogni g ∈ G. Se (G1 , ◦1 ) e (G2 , ◦2 ) sono gruppi, un omomorfismo (gruppale) da G1 a G2 , detto anche rappresentazione di G1 in (termini di) G2 `e una funzione h : G1 → G2 che preserva le strutture di gruppo, cio`e vale la seguente richiesta: h(g ◦1 g ) = h(g) ◦2 h(g )
per ogni g, g ∈ G1 .
Di conseguenza, con ovvie notazioni, vale h(e1 ) = e2 ed inoltre vale anche h(g−11 ) = (h(g))−12 per ogni g ∈ G1 . Il nucleo di un omomorfismo, h : G → G , `e il sottogruppo Ker(h) ⊂ G i cui elementi g verificano h(g) = e , dove e `e l’elemento neutro di G . Si osservi che Ker(h) `e un sottogruppo normale. Ovviamente, h `e iniettivo se e solo se il suo nucleo contiene solo l’elemento neutro di G. Risulta che l’immagine h(G) di un omomorfismo h : G → G sia un sottogruppo di G isomorfo a G/Ker(h). Un isomorfismo gruppale `e un omomorfismo biettivo di gruppi. Un isomorfismo h : G → G `e detto automorfismo su G. L’insieme, Aut(G), degli automorfismi sul gruppo G risulta essere un gruppo rispetto alla legge di composizione delle funzioni da G in G. Se G1 e G2 sono gruppi, il loro prodotto diretto, G1 ⊗ G2 , `e un altro gruppo definito come segue. Gli elementi di G1 ⊗ G2 sono gli elementi (g1 , g2 ) del prodotto cartesiano dei due insiemi G1 e G2 . Infine, la legge di composizione `e: (g1 , g2 ) ◦ (f1 , f2 ) := (g1 ◦1 f1 , g2 ◦2 f2 )
(g1 , g2 ), (f1 , f2 ) ∈ G1 × G2 .
Ovviamente l’elemento neutro di G1 ⊗ G2 `e (e1 , e2 ), dove e1 e e2 sono gli elementi neutri di G1 e G2 rispettivamente. Si osservi che G1 e G2 risultano essere sottogruppi normali del gruppo G1 ⊗ G2 . La struttura di prodotto diretto si indebolisce nella seguente struttura, che risulta essere molto importante per le applicazioni fisiche. Siano (G1 , ◦1 ) e (G2 , ◦2 ) gruppi e si supponga che, per ogni g1 ∈ G1 , esista un isomorfismo gruppale ψg1 : G2 → G2 che soddisfa le seguenti propriet`a: (i) ψg1 ◦ ψg1 = ψg1 ◦1 g1 e (ii) ψe1 = idG2 , dove ◦ `e la solita legge di composizione di funzioni e e1 `e l’elemento neutro di G1 . (in altre parole, ψg ∈ Aut(G2 ) per ogni g ∈ G1 e la funzione G1
668
Appendice A Relazioni d’ordine, topologia, gruppi
g → ψg `e un omomorfismo gruppale da G1 a Aut(G2 ).) In questo caso una struttura naturale di gruppo pu` o essere assegnata al prodotto cartesiano G1 × G2 , semplicemente definendo la legge di composizione gruppale di due elementi (g1 , g2 ), (f1 , f2 ) ∈ G1 × G2 , come: (g1 , g2 ) ◦ψ (f1 , f2 ) := (g1 ◦1 f1 , g2 ◦2 ψg1 (f2 )) . Si dimostra facilmente che la definizione `e ben posta e che (G1 ⊗ψ G2 , ◦ψ ) `e un gruppo, che si chiama il prodotto semidiretto di G1 e G2 . Notare che l’ordine con cui vengono elencati i due gruppi ha rilevanza. Considerando il prodotto semidiretto (G ⊗ψ N, ◦ψ ), si dimostra che N `e un sottogruppo normale di G ⊗ψ N e che: ψg (n) = g ◦ψ n ◦ψ g−1
per ogni g ∈ G e n ∈ N.
La propriet` a pu` o essere invertita nel senso che segue. Consideriamo un gruppo (H, ◦), sia N un sottogruppo normale di H e sia infine G un generico sottogruppo di H. Supponiamo che N ∩ G = {e}, dove e `e l’elemento neutro di H, e che H = GN , nel senso che, per ogni h ∈ H, esistono g ∈ G e n ∈ N tali che h = gn. Si riesce allora facilmente a dimostrare che (g, n) `e unicamente determinato da h e che H `e isomorfo a G ×ψ N , dove: ψg (n) := g ◦ h ◦ g−1
per ogni g ∈ G e n ∈ N .
Se V `e uno spazio vettoriale (reale o complesso), GL(V) indica il gruppo delle funzioni lineari biettive f : V → V. La legge di composizione gruppale `e la solita composizione di funzioni. GL(V) `e detto gruppo lineare su V. Se V := Rn o Cn allora GL(V) si indica con GL(n, R) o GL(n, C), rispettivamente. Diamo la definizione di rappresentazione lineare di un gruppo. Sia (G, ◦) un gruppo e V uno spazio vettoriale. Una rappresentazione (lineare) di G su V `e un omomorfismo ρ : G → GL(V). Se ρ : G → GL(V) `e una rappresentazione, essa si dice: (1) fedele se `e iniettiva, (2) libera se, per ogni v ∈ V\{0}, il sottogruppo di G costituito dagli elementi hv che ρ(hv )v = v contiene solo l’elemento neutro di G, (3) transitiva se, per ogni coppia v, v ∈ V\{0} esiste g ∈ G con v = ρ(g)v, (4) irriducibile se non esiste alcun sottospazio proprio S ⊂ V che `e invariante sotto l’azione di ρ(G), cio`e che soddisfa ρ(g)S ⊂ S per tutti i g ∈ G. Nel caso in cui V sia spazio di Hilbert o spazio di Banach e la rappresentazione ρ sia data in termini di operatori limitati e definiti su tutto V, l’irriducibilit` a `e definita richiedendo che non esistano sottospazi chiusi di V che siano invarianti sotto l’azione di ρ(G).
Appendice B Elementi di geometria differenziale
Se n, m = 1, 2, . . . e k = 0, 1, . . . sono fissati, sia Ω ⊂ Rn un insieme aperto e non vuoto. Una funzione f : Ω → Rm `e detta essere di classe C k , e si scrive in tal caso f ∈ C k (Ω; Rn ), se tutte le derivate parziali (incluse quelle miste) delle componenti di f esistono e sono continue fino all’ordine k incluso. Si pone C k (Ω) := C k (Ω; R). f : Ω → Rm `e detta di classe C ∞ se `e di classe C k per ogni k = 0, 1, . . . e si definisce: 0 C ∞(Ω; Rn ) := C k (Ω; Rn ) . k=0,1,...
Si pone C ∞ (Ω) := C ∞(Ω; R). Infine f : Ω → Rm `e detta di classe C ω o anche analitica reale, se `e di classe C ∞ ed inoltre, per ogni punto p ∈ Ω, f pu` o essere sviluppata in serie di Taylor (di pi` u variabili reali) in una palla aperta di raggio finito centrata in p ed inclusa in Ω. Solitamente quando non `e menzionata esplicitamente la classe di differenziabilit`a k di una funzione (oppure di una variet` a) si sottintende che k = ∞. Notazione B.1. In questa sezione, come di consueto nella geometria differenziale, enumereremo con indici alti le coordinate di Rn e le componenti dei vettori (controvarianti). In questo modo, per esempio, le coordinate standard di Rn saranno indicate con x1 , . . . , xn invece di x1 , . . . , xn .
B.1 Variet` a differenziabili, variet` a differenziabili prodotto, funzioni differenziabili Lo strumento matematico pi` u generale e potente atto a descrivere le propriet`a generali dello spaziotempo, dello spazio fisico tridimensionale e dello spazio astratto in cui descrivere i sistemi fisici delle teorie classiche, `e la nozione di variet` a differenziabile. Si tratta in essenza di un insieme di oggetti arbitrari, indicati con il nome generico di punti, che pu` o essere ricoperto localmente con sistemi di coordinate i quali identificano i punti dell’insieme con n-ple di Rn . Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
670
Appendice B Elementi di geometria differenziale
Definizione B.2. Una variet` a differenziabile di dimensione n e classe C k , con n = 1, 2, 3, · · · e k = 1, 2, ..., ∞, ω fissati, `e un insieme M i cui elementi sono detti punti, dotato di alcune strutture geometriche con propriet` a che precisiamo di seguito. (1) L’insieme M deve essere dotato di una struttura differenziabile di classe C k e dimensione n, A = {(Ui , φi )}i∈I cio`e, una collezione di coppie (Ui , φi ), dette carte locali o sistemi di coordinate locali, in cui Ui `e sottoinsieme di M e φi `e un’applicazione con dominio Ui a valori in Rn e vale: (i) ∪i∈I Ui = M , ogni φi `e iniettiva e φi (Ui ) aperto in Rn , (ii) le carte locali in A devono essere C k -compatibili a due a due. Due applicazioni iniettive φ : U → Rn e ψ : V → Rn con U, V ⊂ M sono dette C k -compatibili (o pi` u brevemente k-compatibili) se vale U ∩ V = ∅ e le funzioni φ ◦ ψ−1 : ψ(U ∩ V ) → φ(U ∩ V ) e ψ ◦ φ−1 : φ(U ∩ V ) → ψ(U ∩ V ) sono entrambe di classe C k , oppure se vale U ∩ V = ∅, (iii) A `e massimale ossia soddisfa: se U ⊂ M `e aperto e φ : U → Rn `e compatibile con ogni carta di A , allora (U, φ) ∈ A . (2) Dal punto di vista topologico, si richiede che: (i) M sia uno spazio topologico di Hausdorff a base numerabile, (ii) lo spazio topologico M sia, tramite le carte di A , localmente omeomorfo a Rn . In altre parole, se (U, φ) ∈ A , allora U `e aperto e φ : U → φ(U ) `e un omeomorfismo. Una variet` a differenziabile di ordine ω `e, equivalentemente, detta variet` a analitica (reale). Osservazioni B.3. (1) Ogni carta locale (U, φ) permette di assegnare biunivocamente una n-pla di numeri reali (x1p , · · · , xnp ) = φ(p) ad ogni punto p di U . Gli elementi della n-pla sono le coordinate di p nella carta (U, φ). I punti in U sono quindi in corrispondenza biunivoca con le n-ple di φ(U ) ⊂ Rn . (2) Nell’ipotesi U ∩ V = ∅, la k-compatibilit` a di carte locali (U, φ) e (V, ψ) implica che la matrice jacobiana di φ ◦ ψ−1 , essendo invertibile, abbia determinante ovunque non nullo. Viceversa, se φ ◦ ψ−1 : ψ(U ∩ V ) → φ(U ∩ V ) `e biettiva, di classe C k , con determinante della matrice jacobiana non nullo su ψ(U ∩ V ), allora ψ ◦ φ−1 : φ(U ∩ V ) → ψ(U ∩ V ) `e anch’essa C k e quindi le due carte locali sono k-compatibili. La prova di ci` o si basa sul noto [Giusti03II]: Teorema B.4. (Della funzione inversa) Sia f : D → Rn , con D ⊂ Rn aperto non vuoto, una funzione di classe C k , con k = 1, 2, . . . , ∞ fissato. Se la matrice jacobiana di f, valutata in p ∈ D, ha determinante non nullo allora esistono un intorno aperto U ⊂ D di p ed un intorno aperto V di f(p) tali che: (i) f U : U → V sia biettiva (ii) la sua inversa f −1 U : V → U sia di classe C k . (3) Le due richieste sul tipo di topologia in (2)(i) (che valgono per la topologia standard di Rn ) sono di carattere tecnico e assicurano, rispettivamente,
B.1 Variet` a differenziabili
671
l’unicit` a delle soluzioni di problemi basati su equazioni differenziali su M (necessaria dal punto di vista fisico quando queste equazioni descrivono l’evoluzione di sistemi fisici) e la fattibilit`a della teoria dell’integrazione su M . La richiesta in (2)(ii) corrisponde invece al requisito intuitivo che M “sia continuo come” Rn nell’intorno di ogni punto. Classici controesempi mostrano che la propriet` a di Hausdorff di Rn non `e trasportata su M dagli omeomorfismi locali dati e pertanto deve essere imposta separatamente. (4) Sia M spazio topologico di Hausdorff a base numerabile. Una collezione di carte locali A su M che soddisfi (i) e (ii) in (1) ma non necessariamente (iii), e che soddisfi (ii) in (2), `e detto atlante su M di dimensione n e classe C k . Si dimostra facilmente che per ogni atlante A su M esiste un unico atlante massimale che lo include. Si osservi che due atlanti su M tali che ogni carta di uno sia compatibile con ogni carta dell’altro, inducono la stessa struttura differenziabile su M . Quindi per assegnare una struttura differenziabile `e sufficiente assegnare un atlante non massimale, uno dei possibili che la individua. L’unica struttura differenziabile associata nel modo detto ad un fissato atlante si dice essere indotta dall’atlante. (5) Si pu` o provare che se 1 ≤ k < ∞, si possono eliminare alcune carte dalla struttura differenziabile (un numero infinito di carte!), in modo tale che l’insieme risultate sia ancora un atlante con k = ∞. Esempi B.5. 1. L’esempio pi` u semplice di variet` a differenziabile, di classe C ∞ e dimensione n, `e ogni sottoinsieme non vuoto e aperto di Rn (includendo Rn stesso) con una struttura differenziabile standard individuata dalla funzione identit` a (che da sola definisce un atlante). 2. Si consideri sfera unitaria S2 (dotata della topologia ereditata da R3 ) in R3 , centrata nell’origine e quindi di equazione, in coordinate canoniche x1 , x2, x3 di R3 :
1 2 S2 := (x1 , x2 , x3 ) ∈ R3 (x1 )2 + (x2 )2 + (x3 )2 = 1 . S2 acquista una struttura di variet` a differenziabile, di dimensione 2 e classe C ∞, da quella di R3 , definendo un atlante su S2 costituito da 6 carte locali (i) (S2(i)±, φ± ) (i = 1, 2, 3) ottenute come segue. Considerato l’asse xi (i = 1, 2, 3) e la coppia di emisferi aperti S2(i)± con asse sud-nord dato dall’asse xi , si (i)
considerano le carte locali φ± : S2(i)± → R2 che associano ad ogni p ∈ S2(i)± le coordinate di esso sul piano a xi = 0. Si pu` o provare (vedi sotto) che `e impossibile dotare S2 di una carta globale a differenza di R3 (o di ogni suo sottoinsieme aperto). Questo fatto dimostra che la classe delle variet`a differenziabili non si riduce ai soli sottoinsiemi non vuoti aperti degli Rn ed `e pertanto interessante. Un esempio analogo `e quello di una circonferenza in R2 . Date due variet` a differenziabili M ed N , di dimensione m ed n rispettivamente, ed entrambe di classe C k , si pu` o costruire una terza variet` a differenziabile
672
Appendice B Elementi di geometria differenziale
di classe C k e dimensione m+n sull’insieme di punti M ×N dotato della topologia prodotto. (Tale spazi topologico `e quindi ancora di Hausdorff ed a base numerabile.) Tale variet`a `e detta variet` a prodotto di M e N e si indica semplicemente con M × N . La struttura differenziabile di M × N , detta struttura differenziabile prodotto, `e quella che si ottiene come segue. Se (U, φ) e (V, ψ) sono due carte locali su M ed N rispettivamente, `e immediato verificare che U × V (p, q) → (φ(p), ψ(q)) =: φ ⊕ ψ(p, q) ∈ Rm+n
(B.1)
`e un omeomorfismo locale. Inoltre, se (U , φ ) e (V , ψ ) sono altre due carte locali su M ed N rispettivamente, k-compatibili con le rispettive precedenti, le carte (U × V, φ ⊕ ψ) e (U × V , φ ⊕ ψ ) risultano essere banalmente k-compatibili. Infine, al variare delle carte (U, φ) e (V, ψ) nelle strutture differenziabili di M e N , le carte (U × V, φ ⊕ ψ) definiscono un atlante su M × N . La struttura differenziabile da esso generata `e, per definizione, la struttura differenziabile prodotto. Possiamo dunque dare la seguente definizione. Definizione B.6. Date due variet` a differenziabili M ed N , di dimensione m ed n rispettivamente, ed entrambe di classe C k , la variet` a prodotto M ×N `e la variet` a sull’insieme M × N , dotato della topologia prodotto, e con struttura differenziabile indotta dalle carte locali (U ×V, φ⊕ψ) definite in (B.1), quando (U, φ) e (V, ψ) variano nelle strutture differenziabili di M e N . Dato che una variet` a differenziabile, localmente `e indistiguibile da Rn , la struttura di variet` a differenziabile permette di dare senso alla nozione di funzione differenziabile definita su un insieme che non sia un Rn oppure un suo sottoinsieme, ma che abbia la struttura di variet` a differenziabile. L’idea `e banalmente quella di ridursi, localmente, alla definizione standard in Rn di funzione differenziabile, usando la struttura di carte locali che ricoprono ogni variet` a differenziabile. Definizione B.7. Siano M, N variet` a differenziabili di dimensione m, n e classe C p e C q (p, q ≥ 1). Una funzione continua f : M → N `e di classe C k (0 ≤ k ≤ p, q eventualmente k = ∞ oppure k = ω) se ψ ◦ f ◦ φ−1 `e di classe C k , come funzione da Rm in Rn , per ogni scelta delle carte locali (U, φ), (V, ψ), rispettivamente in N e M . La classe delle funzioni differenziabili di classe k = 0, 1, 2, . . . , ∞, ω da M ad N `e indicata con C p(M ; N ); se N = R si scrive semplicemente C k (M ). Un k-diffeomorfismo f : M → N tra due variet` a M, N `e una funzione di classe C k , biettiva, con inversa di classe C k . Se M ed N sono connesse da un k-diffeomorfismo f si dicono variet` a k-diffeomorfe (tramite f). Osservazioni B.8. (1) Si noti che abbiamo ammesso il caso di funzioni differenziabili di classe C 0 , che in realt`a corrisponde a funzioni solamente continue ed a omeomorfismi nel caso di 0-diffeomorfismi. Ovviamente ogni k-diffeomorfismo `e anche un
B.1 Variet` a differenziabili
673
omeomorfismo per cui, per esempio, non ci possono essere diffeomorfismi tra S2 e R2 (oppure ogni suo sottoinsieme non vuoto e aperto), essendo il primo compatto ed il secondo no. Questo fatto prova che non possono esistere carte globali su S2 . (2) Si dimostra facilmente che, affinch`e f : M → N sia C p , `e sufficiente che ψ ◦ f ◦ φ−1 siano funzioni C k al variare delle carte locali (U, φ), (V, ψ) in due atlanti, rispettivamente su M ed N , senza dover controllare la validit` a di tale condizione per tutte le possibile carte locali delle due variet`a. Un altro utile concetto `e quello di sottovariet` a embedded. Rn `e una sottovariet` a m embedded di R con m > n. In coordinate canoniche x1 , · · · , xm di Rm , Rn si identifica con il sottoinsieme individuato dalle condizioni xn+1 = · · · = xm = 0 e le prime n coordinate di Rm , x1 , · · · , xn , sono identificate con le coordinate standard di Rn . L’idea `e quella di generalizzare, in senso locale, questa situazione usando coordinate locali e considerando variet` a N ed M in luogo di Rn e Rm . Definizione B.9. Sia data una variet` a differenziabile M , di dimensione m > n e classe C k (k ≥ 1). Una sottovariet` a embedded di M di dimensione n e classe C k , N , `e una variet` a differenziabile (di dimensione n e classe C k ) costituita come segue. (a) N `e un sottoinsieme di M dotato della topologia indotta da M . (b) La struttura differenziabile di N `e dell’atlante {(Ui , φi )}i∈I con: (i) Ui = Vi ∩ N e φi = ψVi ∩N per una opportuna carta locale (Vi , φi ) su M; (ii) nelle coordinate x1 , · · · , xm associate a (Vi , φi ), l’insieme Vi ∩ N `e individuato dalla richiesta xn+1 = · · · = xm = 0 e le rimanenti coordinate x1 , · · · , xn sono coordinate locali associate a φi . Per concludere citiamo (vedi per es. [doC92, Wes78]), un importante teorema che permette di stabilire quando un sottoinsieme di una variet`a differenziabile pu` o essere dotato della struttura di sottovariet` a embedded. La dimostrazione del teorema `e una diretta conseguenza del teorema del Dini [Giusti03II]. Teorema B.10. (Dei valori regolari.) Sia M una variet` a differenziabile di dimensione m e classe C k . Si consideri l’insieme N determinato da c(< m) costanti, vj , e da c funzioni di classe C k , fj : M → R N := {p ∈ M | fj (p) = vj , j = 1, · · · , c} . Se, nell’intorno di ogni punto p ∈ N , esiste una carta locale (U, φ) di M tale che la matrice jacobiana di coefficienti ∂(fj ◦ φ−1 )/∂xi |φ(p) (con j = 1, · · · , c e i = 1, · · · , m) abbia rango r, allora l’insieme N pu` o essere dotato della struttura di sottovariet` a differenziabile embedded di M di dimensione n := m − c e classe C k . Se in particolare, la matrice quadrata c × c di elementi ∂fj ◦ φ−1 , ∂xk
j = 1, . . . , c e k = m − c + 1, m − c + 2, . . . , m
674
Appendice B Elementi di geometria differenziale
`e non singolare in φ(p) con p ∈ N , le prime n coordinate x1 , . . . , xn definiscono un sistema di coordinate della struttura differenziabile di N in un intorno di p in N .
B.2 Spazio tangente e cotangente. Campi vettoriali covarianti e controvarianti Consideriamo la variet`a differenziabile M di dimensione n e classe C k (k ≥ 1). Consideriamo ogni fissato spazio C k (M ), come uno spazio vettoriale sul campo R rispetto alle combinazioni lineari di funzioni definite come, se a, b ∈ R e f, g ∈ C k (M ): (af + bg)(p) := af(p) + bg(p) ,
per ogni p ∈ M .
Fissato un punto p ∈ M , una derivazione in p, `e un’applicazione R-lineare Lp : C k (M ) → R che gode della propriet` a di Leibniz: Lp (fg) = f(p)Lp (g) + g(p)Lp (f) ,
per ogni f, g ∈ C k (M ).
(B.2)
Una combinazione lineare di derivazioni in p, aLp + bLp (a, b ∈ R) con: (aLp + bLp )(f) := aLp (f) + bLp (f) ,
per ogni f, g ∈ C k (M ),
`e ancora una derivazione. Pertanto le derivazioni in p formano uno spazio vettoriale sul campo R, che indichiamo con Dpk . Ogni carta locale (U, φ) con U ∈ p definisce automaticamente n derivazioni in p come segue. Se x1 , . . . , xn sono le coordinate associate a φ, definiamo la derivazione rispetto alla coordinata k-esima:
∂
∂f ◦ φ−1
: f → , per ogni f, g ∈ C 1 (M ). (B.3) ∂xk p ∂xk φ(p)
Le n derivazioni in p, ∂x∂ k p , sono linearmente indipendenti: se 0 indica la
n ck ∂ k = 0, allora derivazione nulla e c1 , c2 , · · · , cn ∈ R sono tali che: k=1
∂x
p
scegliendo una funzione differenziabile che coincide con la funzione coordinata xl in un intorno aperto
cui chiusura `e inclusa in U ) e si annulla fuori di n di p (la ∂ esso, la richiesta: k=1 ck ∂x f = 0, implica che cl = 0. Dato che possiamo k p r scegliere l arbitrariamente, concludiamo che ogni
coefficiente c `e nullo per ∂ r = 1, 2, . . . , n. In definitiva le n derivazioni ∂xk p formano una base per un o in realt` a provare che, nel caso di sottospazio di Dpk di dimensione n (si pu` k = ∞, questo sottospazio coincide con Dp∞ stesso). Cambiando carta locale ed usando (V, ψ) con V p e con coordinate y1 , . . . , yn , le nuove derivazioni rispetto alle nuove coordinate sono legate alle vecchi dalla relazione:
n ∂
∂xk
∂
= . (B.4) ∂yi p ∂yi ψ(p) ∂xk p k=1
B.2 Spazio tangente e cotangente
675
La dimostrazione di questo fatto `e immediata dalle definizioni date. Dato che
∂xk la matrice jacobiana di coefficienti ∂yi `e biettiva per definizione di carte ψ(p)
∂ locali, concludiamo che il sottospazio di Dpk generato dalle derivazioni ∂y i p
coincide con quello generato dalle derivazioni ∂x∂ k p . Tale sottospazio `e quindi intrinseco. Definizione B.11. Data una variet` a differenziabile di dimensione n e classe C k (k ≥ 1), si consideri un punto p ∈ M . Il sottospazio vettoriale delle derivazioni in p ∈ M generato dalle n derivazioni
∂ , con k = 1, 2, . . . , n, riferite ad un qualsiasi sistema di coordinate locali ∂xk p (U, φ) con U p, `e detto spazio tangente in p ad M e si indica con Tp M . Gli elementi dello spazio tangente in p di dicono vettori tangenti in p ad M o vettori controvarianti in p. Ricordiamo che se V `e uno spazio vettoriale sul campo R, lo spazio V ∗ delle funzioni lineari da V in R `e detto spazio duale(algebrico) di V . Se la dimensione di V `e finita, `e tale anche quella di V ∗ e le due dimensioni coincidono. In particolare, se {ei }i=1,...,n `e una base per V , la base duale in V ∗ `e la base di V ∗ , {e∗j }j=1,...,n , completamente individuata dal requisito di linearit`a e dalle richieste: e∗j (ei ) = δij per i, j = 1, . . . , n. Se f ∈ V ∗ e v ∈ V , si usa la notazione: v, f := f(v). Definizione B.12. Data una variet` a differenziabile di dimensione n e classe C k (k ≥ 1), si consideri un punto p ∈ M . Lo spazio duale di Tp M `e detto spazio cotangente in p ad M e si indica con Tp∗ M . Gli elementi dello spazio cotangente in p di dicono vettori cotangenti in p a M o vettori covarianti in p o 1-forme in p. Per ogni base di elementi ∂ in Tp M , gli n elementi della base duale in Tp∗ M vengono indicati con ∂xk p dxi |p. Per definizione: H G ∂ i = δki . | , dx | p p ∂xk Possiamo ora dare la nozione di campo vettoriale differenziabile sulla variet` a M. Se M `e una variet` a differenziabile di classe C k (incluse le possibilit`a k = ∞ e k = ω) e dimensione n, un campo vettoriale di classe C r o campo vettoriale controvariante di classe C r , con r = 0, 1, . . . , k `e un’assegnazione di un vettore v(p) ∈ Tp M per ogni p ∈ M , in modo tale che, per ogni carta locale (U, φ) con coordinate x1 , . . . , xn , per cui
n ∂
i 1 n v (xq , . . . , xq ) , v(q) = ∂xi q i=1 le n funzioni vi = vi (x1 , . . . , xn ) sono di classe C r su φ(U ). Un campo covettoriale di classe C r o campo vettoriale covariante di classe C r con
676
Appendice B Elementi di geometria differenziale
r = 0, 1, . . . , k `e un’assegnazione di un covettore ω(p) ∈ Tp M per ogni p ∈ M , in modo tale che, per ogni carta locale (U, φ) con coordinate x1 , . . . , xn, per cui n
ω(q) = vi (x1q , . . . , xnq ) dxi q , i=1 1
le n funzioni ωi = ωi (x , . . . , xn ) sono di classe C r su φ(U ). Osservazione B.13. Sia v ∈ Tp M e si considerino due carte locali (U, φ) e (V, ψ) con U ∩ V p e con coordinate, rispettivamente,
n i ∂ x1 , . . . , xn e x1 , . . . , xn . In tal caso deve valere v = i=1 v ∂xi p =
n i ∂ n n ∂ j ∂ j ∂xi
j=1 v i v ∂xi p = j,i=1 v ∂xj p . Pertanto ∂xj ∂xi p , da cui ψ(p)
n n ∂xi
∂ ∂ i j v i=1 v − j=1 ∂xj ∂xi p = 0. Dato che le derivazioni ∂xi p soψ(p)
no linearmente indipendenti, concludiamo che vale la legge di trasformazioni delle componenti di uno stesso vettore in Tp M , al variare delle coordinate,
n ∂xi
j v = v .
j ∂x ψ(p) j=1 i
(B.5)
Con la stessa procedura si ottiene l’analoga formula per i vettori covarianti:
n ∂xj
ω j , (B.6) ωi = ∂xi ψ(p) j=1
quando: ω =
n i j i=1 ωi dx p = j=1 ω j dx p .
n
B.3 Differenziali, curve e vettori tangenti Consideriamo un campo scalare f : M → R di classe C r sulla variet` a M di classe C k e dimensione n e valga k ≥ r > 1. Il differenziale di f, df `e il campo vettoriale covariante di classe C r−1 individuato, in ogni carta locale (U, ψ) da:
n ∂f
dxi |p . df|p = i ∂x ψ(p) i=1 Consideriamo una curva di classe C r nella variet` a M di classe C k , cio`e un’apr plicazione di classe C (r = 0, 1, . . . , k), γ : I → M , dove I ⊂ R `e un intervallo aperto pensato come sottovariet`a differenziabile di R. Supponiamo esplicitamente che r > 1. Se p ∈ γ(I), possiamo definire il vettore tangente a γ in p come, se γ(tp ) = p:
n dxi
∂
, γ(p) ˙ := dt tp ∂xi p i=1
B.4 Pushforward e pullback
677
in una qualsiasi carta locale definita nell’intorno di p. La definizione in realt` a non dipende dalla carta scelta. Infatti, se definissimo:
n dxj
∂
γ˙ (p) := , dt tp ∂xj p j=1 in riferimento ad un secondo sistema di coordinate definite nell’intorno di p, attraverso la (B.5) otterremmo subito che: γ(p) ˙ = γ˙ (p) . Possiamo allora dare la seguente definizione. Definizione B.14. Una curva di classe C r , r = 0, 1, . . . , k nella variet` a differenziabile M di dimensione n e classe C k , `e un’applicazione di classe C r , γ : I → M , dove I ⊂ R `e un intervallo aperto (pensato come sottovariet` a differenziabile embedded di R). Se r > 1, il vettore tangente a γ in p = γ(tp ) per qualche t ∈ I, `e il vettore γ(p) ˙ ∈ Tp M definito da
n dxi
∂
γ(p) ˙ := , (B.7) dt tp ∂xi p i=1
in una qualsiasi carta locale definita nell’intorno di p.
B.4 Pushforward e pullback Siano M ed N sono variet`a differenziabili (almeno di classe C 1 ), di dimensione m e n rispettivamente, e f : N → M una funzione differenziabile (almeno di classe C 1 ). Per un punto p ∈ N consideriamo carte locali (U, φ) in N e (V, ψ) in M rispettivamente attorno a p e f(p). Indichiamo con (y1 , . . . , yn ) le coordinate definite in tal modo in U e con (x1 , . . . , xm) le coordinate definite in tal modo in V . Definiamo ancora f k (y1 , . . . , yn ) = yk (f ◦ φ−1 ) per k = 1, . . . , m. Si definiscono allora: (i) il pushforward dfp : Tp N → Tf(p) M , data in coordinate da: n
n m ∂f j
∂
i ∂ i
u → u , (B.8) dfp : Tp N ∂yi p ∂yi φ(p) ∂xj p i=1
j=1
i=1
∗ (ii) il pullback fp∗ : Tf(p) M → Tp∗ N , data in coordinate da: ⎛ ⎞
m n m j ∂f ∗
⎝ M ωj dxj |f(p) → ωj ⎠ dyi |p . fp∗ : Tf(p) ∂yi j=1
i=1
j=1
(B.9)
φ(p)
Si verifica immediatamente che le definizioni non dipendono dalle coordinate usate attorno a p e f(p). Il pushforward `e anche indicato con fp∗ : Tp N → Tf(p) M .
Appendice C Teoria della misura
In questa sezione richiameremo le nozioni ed i risultati pi` u elementari della teoria della misura astratta [Rud82, Hal69] e alcuni risultati fondamentali di analisi reale concernenti la misura di Lebesgue in sulla retta reale. Dimostreremo anche la forma pi` u elementare del teorema che permette lo scambio del simbolo di integrale con quello di derivata.
C.1 Misure positive σ-additive Una σ-algebra sull’insieme X, Σ(X), `e una collezione di sottoinsiemi di X che soddisfa le richieste seguenti: (a) X ∈ Σ(X), (b) se E ∈ Σ(X) allora X \ E ∈4Σ(X), (c) se {Ek }k∈N ⊂ Σ(X) allora k∈N Ek ∈ Σ(X). Si noti che (c) include il caso dell’unione di un numero finito di insiemi, quando solo un numero finito di Ek sono distinti. Una collezione di sottoinsiemi di X, Σ(X), `e detta algebra di insiemi su X nel caso in cui valgano (a), (b), mentre (c) venga4indebolito in: (c)’ se {Ek }k∈F ⊂ Σ(X), con F finito, allora k∈F Ek ∈ Σ(X). Uno spazio misurabile `e la coppia (X, Σ(X)), dove X `e un insieme e Σ(X) una σ-algebra su X. Dalla definizione di σ-algebra risulta subito che l’intersezione di σ-algebre su X `e una σ-algebra su X. Inoltre, l’insieme dei sottoinsiemi di X `e una σ-algebra su X. Pertanto se A `e una collezione di sottoinsiemi di X, `e ben definita l’intersezione di tutte le σ-algebre su X che includono A . Tale σ-algebra `e detta σ-algebra generata da A . Nel caso particolare in cui X `e uno spazio topologico con topologia T , la σalgebra su X generata da T `e detta σ-algebra di Borel su X e la indicheremo con B(X) sottintendendo la topologia.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
680
Appendice C Teoria della misura
Se (X, Σ(X)) e (Y, Σ(Y)) sono spazi misurabili, una funzione f : X → Y `e detta misurabile (rispetto alla due σ-algebre) quando f −1 (E) ∈ Σ(X) per ogni E ∈ Σ(Y). Nel caso in cui Y sia R o C, se non si precisa altrimenti, si suppone tacitamente che Σ(Y) sia la σ-algebra di Borel B(Y), individuata dalla topologia standard su Y (che `e quella di R2 nel caso di C). Se Σ(X) = B(X) `e la σ-algebra di Borel e Y = R o C, le funzioni misurabili da X a Y sono dette Borel misurabili o funzioni di Borel. In questo caso f : X → Y risulta essere (Borel) misurabile, se e solo se f −1 (E) ∈ B(X) per ogni E ∈ T (Y), dove T (Y) indica la topologia di Y . Le funzioni continue da X a R o C sono dunque, sempre, Borel misurabili. Le funzioni misurabili da X a Y = R o C formano uno spazio vettoriale, chiuso rispetto alla moltiplicazione punto per punto delle funzioni e chiuso rispetto alla coniugazione complessa (se Y = C), al calcolo del valore assoluto, all’estrazione di parte reale ed immaginaria. Inoltre il limite puntuale di una successione di funzioni misurabili e, se Y = R, l’estremo superiore di tale successione, l’estremo inferiore di tale successione, `e una funzione misurabile. Nel seguito considereremo il caso in cui Y = [−∞, ∞] := R := R∪{−∞, +∞}, dove R `e quindi esteso aggiungendo i simboli ±∞, estendendo l’ordinamento in modo che −∞ < r < +∞ per ogni r ∈ R e definendo su R la topologia generata che ammette come base gli intervalli aperti di R e gli insiemi (con ovvie notazioni) [−∞, a), (a, +∞] per ogni a ∈ R. Inoltre si definiscono: | − ∞| := | + ∞| =: +∞. Nel caso in cui Y = R, risulta che f : X → R `e misurabile se e solo se f −1 ((a, +∞]) `e misurabile per ogni a ∈ R (e sono vere le analoghe proposizioni in cui si sostituisce (a, +∞] con [a, +∞], oppure con [−∞, a), oppure con [−∞, a].) Se (X, Σ(X)) `e uno spazio misurabile, una misura positiva (σ-additiva) su X (rispetto a Σ(X)), `e un’applicazione μ : Σ(X) → [0, +∞] tale che: (a) μ(∅) 4 = 0, (b) μ n∈N En = n∈N μ(En ) se {En }n∈N ⊂ Σ(X) e En ∩ Em = ∅ quando n = m (propriet` a di σ-additivit` a). Si osservi che la serie `e ben definita e riordinabile a piacimento essendo una serie di termini non negativi. In tal caso (X, Σ(X), μ) `e detto spazio con misura (positiva σ-additiva). Risulta che μ(E) ≤ μ(F ), se E ⊂ F con E, F ∈ Σ(X) (propriet` a di isotonia) e μ (∪n∈N En ) ≤ n∈N μ(En ) se {En }n∈N ⊂ Σ(X) (propriet` a di subadditivit` a). Un importante teorema di estensione di misure [Hal69] `e il seguente. Teorema C.1. Sia Σ0 (X) un’algebra di insiemi su X e μ0 : Σ0 (X) → [0, +∞] una funzione che soddisfi (a), e (b) nel caso in cui ∪n∈N En ∈ Σ0 (X). Valgono i fatti seguenti.
C.1 Misure positive σ-additive
681
(i) Se Σ(X) `e la σ-algebra generata da Σ0 (X):
Σ(X) R → μ(R) := inf μ0 (Sn ) {Sn }n∈N ⊂ Σ0 (X) , ∪n∈NSn ⊃ R
n∈N
(C.1) `e una misura positiva σ-additiva su X rispetto a Σ(X) che si riduce a μ0 su Σ0 (X). (ii) Se X = ∪n∈N Xn , con Xn ⊂ X e μ0 (Xn ) < +∞ per ogni n ∈ N, allora μ `e l’unica misura positiva σ-additiva su X rispetto a Σ(X) che si riduce a μ0 su Σ0 (X). Se X spazio topologico e Σ(X) = B(X) `e la σ-algebra di Borel, il supporto di una misura μ positiva σ-additiva su B(X), `e l’insieme chiuso supp(μ) ⊂ X dato dal complemento all’unione di tutti gli aperti A ⊂ X per cui μ(A) = 0. Se (X, Σ(X), μ) `e uno spazio con misura, tale spazio e la sua misura μ sono detti, rispettivamente: (i) finiti se μ(X) < +∞, (ii) σ-finiti, se X = ∪n∈N En , En ∈ Σ(X) e μ(En ) < +∞ per ogni n ∈ N, (iii) di probabilit` a se μ(X) = 1, (iv) di Borel se Σ(X) = B(X) con X spazio di Hausdorff localmente compatto. Una misura di Borel μ su X (quindi con X di Hausdorff e localmente compatto) `e detta internamente regolare se, per ogni E ∈ B(X) vale: μ(E) = sup{μ(K) | K ⊂ E ,
K
`e compatto} ,
ed `e detta esternamente regolare se, per ogni E ∈ B(X) vale: μ(E) = inf{μ(V ) | V ⊃ E ,
V
`e aperto} .
La misura di Borel μ su X di Hausdorff e localmente compatto, si dice regolare quando risulta essere contemporaneamente internamente ed esternamente regolare. Se (X, Σ(X), μ) `e uno spazio con misura, un insieme E ∈ Σ(X) `e detto di misura nulla, se μ(E) = ∅. Uno spazio con misura (X, Σ(X), μ) e la sua misura μ sono detti completi, se per ogni E ∈ Σ(X) di misura nulla, ogni sottoinsieme di E appartiene a Σ(X) (e quindi ha misura nulla per l’isotonia). Ogni spazio con misura ammette un completamento, cio`e un nuovo spazio con misura (X, Σ (X), μ ) che `e completo e dove Σ (X) ⊃ Σ(X) e μ Σ(X)= μ. Σ (X) `e la collezione di tutti gli E ⊂ X tali che esistono AE , BE ∈ Σ(X) con BE ⊂ E ⊂ AE e μ(AE \ BE ) = 0 e μ (E) := μ(AE ).
682
Appendice C Teoria della misura
Si dimostra facilmente che Σ (X) `e la pi` u piccola σ-algebra completa rispetto a μ che include Σ(X). Se (X, Σ(X), μ) `e uno spazio con misura una propriet` a P si dice che vale quasi ovunque (rispetto a μ), e si scrive q.o., se P vale per ogni punto di X, escluso un insieme E di misura nulla. Si dimostra che se f(x) = limn→+∞ fn (x) q.o. su X, dove fn : X → R o C sono funzioni misurabili, allora f `e misurabile. Passiamo a definire l’integrale di una funzione rispetto ad una misura positiva σ-additiva. Nell’insieme [0, +∞] := [0, +∞) ∪ {+∞} si danno le seguenti definizioni: +∞ · 0 := 0 mentre +∞ ± r := +∞ se r ∈ [0, +∞) e +∞ · r := +∞ se r ∈ (0, +∞). Una funzione s : X → R `e detta funzione semplice, se `e misurabile ed assume un numero finito di valori in [0, +∞]. Si vede che pu` o allora essere scritta come, per certi s1 , . . . , sn ∈ [0, +∞) ∪ {+∞}: si χEi s= i=1,...,n
dove E1 , E2 , . . . En sono elementi di Σ(X) e χEi le corrispondenti funzioni caratteristiche. Ogni funzione scrivibile in questo modo, viceversa, `e una funzione semplice. s(x)dμ(x) := si μ(Ei ) X
i=1,2,...,n
`e l’integrale della funzione semplice s rispetto a μ. La definizione non dipende da altre eventuali decomposizioni della stessa s differenti da s = i=1,...,n si χEi . Risulta che, se f : X → [0, +∞] `e misurabile, e f ≥ 0, allora esiste una successione di funzioni semplici 0 ≤ s1 ≤ s2 ≤ · · · ≤ sn ≤ f con sn → f puntualmente. La definizione di integrale si estende a tutte le funzioni misurabili non negative. Se f : X → [−∞, +∞] `e misurabile e f ≥ 0, si definisce l’integrale di f rispetto a μ:
f(x)dμ(x) := sup sn (x)dμ(x)
s ≥ 0 `e semplice e s ≤ f . X
X
Si noti che l’integrale pu` o risultare +∞. Se (X, Σ(X), μ) `e uno spazio con misura (positiva σ-additiva), una funzione misurabile f : X → C oppure f : X → [−∞, +∞] `e detta integrabile rispetto a μ o μ-integrabile, se vale: |f(x)|dμ(x) < +∞ . X
C.1 Misure positive σ-additive
683
In tal caso si definisce l’integrale di f rispetto a μ come il numero complesso, che risulta essere sempre finito e la definizione si prova essere un’estensione delle definizioni gi` a date: f(x)dμ(x) X
=
Re(f)+ dμ(x) − Re(f)− dμ(x) + i
X
Im(f)+ dμ(x) −
X
X
Im(f)− dμ(x) ,
X
dove, se g : X → R, abbiamo definito le funzioni non negative: g+ (x) := sup{g(x), 0} e
g− (x) := − inf{g(x), 0} per ogni x ∈ R.
Si dimostra che se f = g q.o. su X e le funzioni sono misurabili, allora sono entrambe μ-integrabili oppure entrambe non sono μ-integrabili e, nel primo caso: f(x)dμ(x) = X
g(x)dμ(x) . X
L’integrale riferito a (X, Σ(X), μ) soddisfa le seguenti propriet` a, per f, g : X → C, a, b ∈ C. (1) se f, g sono integrabili, allora lo `e anche af + bg e vale:
af(x) + bg(x)dμ(x) = a X
f(x)dμ(x) + b X
g(x)dμ(x) , X
(2) se f ≥ 0 q.o. `e integrabile, allora: f(x)dμ(x) ≥ 0 ; X
e l’integrale `e nullo solo se f = 0 q.o., (3) se f `e integrabile, allora:
f(x)dμ(x) ≤ |f(x)|dμ(x) .
X
X
I tre teoremi fondamentale della teoria della misura sono i seguenti [Rud82]. Teorema C.2. (Della convergenza monotona di Beppo-Levi.) Sia (X, Σ(X), μ) `e uno spazio con misura (positiva σ-additiva) e {fn }n∈N una successione di funzioni misurabili X → R tale che 0 ≤ fn (x) ≤ fn+1 (x) q.o. su X per ogni n ∈ N. Allora, dove l’integrale `e quello per funzioni non negative: lim f(x)dμ(x) = lim fn (x)dμ(x) ≤ +∞ . X n→+∞
n→+∞
X
684
Appendice C Teoria della misura
Teorema C.3. (“Lemma di Fatou”.) Sia (X, Σ(X), μ) uno spazio con misura (positiva σ-additiva) e {fn }n∈N una successione di funzioni misurabili fn : X → [0, +∞]. Allora, dove l’integrale `e quello per funzioni non negative: lim inf f(x)dμ(x) ≤ lim inf fn (x)dμ(x) ≤ +∞ . X
n→+∞
n→+∞
X
Teorema C.4. (Della convergenza dominata di Lebesgue.) Sia (X, Σ(X), μ) uno spazio con misura (positiva σ-additiva) e {fn }n∈N una successione di funzioni misurabili fn : X → C, con fn (x) → f(x) q.o. su X per n → +∞. Se esiste g : X → C μ-integrabile tale che |fn | ≤ |g| q.o. su X per ogni n ∈ N, allora f `e μ-integrabile e valgono: f(x)dμ(x) = lim fn (x)dμ(x) e lim |f(x) − fn (x)| dμ(x) = 0 . n→+∞
X
X
n→+∞
X
Per concludere citiamo il fondamentale teorema di Riesz per misure di Borel. Ricordiamo che Cc (X) indica lo spazio vettoriale complesso delle funzioni continue a valori complessi, definite sullo spazio topologico X, che abbiano supporto compatto. Teorema C.5. (Di Riesz per misure di Borel positive.) Sia X uno spazio topologico di Hausdorff localmente compatto. Se Λ : Cc (X) → C `e lineare e Λf ≥ 0 se f ∈ Cc(X) soddisfa f ≥ 0, allora esiste una misura positiva σ-additiva μΛ sulla σ-algebra di Borel B(X) tale che: Λf = fdμΛ se f ∈ Cc(X) e μΛ (K) < +∞ se K ⊂ X `e compatto. X
Tale misura `e unica se si richiede anche che μΛ sia regolare.
C.2 Misura di Lebesgue su Rn Su Rn esiste un’unica misura di Borel positiva μn che soddisfi le seguenti condizioni (teorema 2.20 in [Rud82])): (i) μn (K) < +∞ se K ⊂ Rn `e compatto, (ii) μn (×nk=1 [ak , bk ]) = (b1 −a1 )(b2 −a2 ) · · · (bn −an ) se ak ≤ bk , ak , bk ∈ R, (iii) μn (E + t) = μn (E) se E ∈ B(Rn ) e t ∈ Rn . ` possibile rendere completo (Rn , B(Rn ), μn ) estendendo la σ-algebra e la E misura stessa, ottenendo (Rn , M(Rn ), mn ), in modo tale che (vedi il teorema 2.20 in [Rud82]) la misura ottenuta alla fine sia, oltre che completa, regolare e continui ad essere invariante per traslazioni e sia, pi` u fortemente, invariante sotto tutto il gruppo delle isometrie di Rn . M(Rn ) `e completamente caratterizzata dalla seguente richiesta: se A ⊂ Rn allora A ∈ M(Rn ) se e solo se
C.2 Misura di Lebesgue su Rn
685
F ⊂ A ⊂ G con μn (F \ G) = 0, dove F, G ∈ B(Rn ) sono, rispettivamente, un’unione numerabile di insiemi chiusi e un’intersezione numerabile di insiemi aperti. Di conseguenza M `e inclusa nel completamento di B(Rn ) rispetto a μn . Essendo M completa, concludiamo che: (Rn , M(Rn ), mn ) non `e altro che il completamento di (Rn , B(Rn), μn ). La misura mn e la σ-algebra M(Rn ) si chiamano, rispettivamente, misura di Lebesgue su Rn e σ-algebra di Lebsgue su Rn . Una funzione f → Rn → C (o R) che sia misurabile rispetto a M(Rn ) e B(C) (o B(R)) `e detta essere Lebesgue misurabile. Nel libro abbiamo indicato con mn (A) = A dx la misura di Lebesgue. Si osservi che le funzioni f : Rn → C Borel-misurabili sono dunque Lebesgue misurabili, ma, in generale, non vale il viceversa. Le funzioni continue f : Rn → C appartengono banalmente ad entrambe le classi. Un risultato classico `e che, se f : Rn → R `e una funzione nulla fuori dal compatto K e continua su di esso, allora: f(x)dx = f(x)dxR (x) , Rn
K
dove l’integrale a secondo membro `e quello nel senso di Riemann. I due teoremi fondamentali del calcolo si estendono all’integrale di Lebesgue sulla retta reale nel modo seguente. Prima di tutto, ricordiamo che, se a, b ∈ R, f : [a, b] → C `e detta essere a variazione limitata su [a, b] se, comunque scagliamo un numero finito arbitrario di punti in detto intervallo: a = x0 < x1 < · · · < xn = b, vale: n
|f(xk ) − f(xk−1 )| ≤ C
k=1
dove C ∈ R non dipende dalla scelta dei punti xk e dal loro numero. Le fun` zioni a variazione limitata su un intervallo formano uno spazio vettoriale. E facile verificare che una funzione f : [a, b] → C che sia derivabile (in particolare con derivata sinistra e destra agli estremi) `e a variazione limitata su [a, b] se la derivata f `e limitata. Una sottoclasse delle funzioni a variazione limitata `e quella delle funzioni assolutamente continue. Se a, b ∈ R, f : [a, b] → C `e detta essere a assolutamente continua su [a, b] se, per ogni > 0, esiste δ > 0 tale che, comunque scegliamo una famiglia finita di sottointervalli aperti (ak , bk ), k = 1, 2, . . ., n, a due a due non intersecantesi: n n se (bk − ak ) < δ allora |f(bk ) − f(ak )| < . k=1
k=1
Le funzioni assolutamente continue su [a, b] sono a variazione limitata e uniformemente continue (ma non vale il viceversa) e formano uno spazio vettoriale. I due risultati fondamentali sono dati nel seguente teorema [KoFo80].
686
Appendice C Teoria della misura
Teorema C.6. Se a, b ∈ R con a < b, vale quanto segue. (a) Se F : [a, b] → C `e assolutamente continua, esiste F ∈ L1 ([a, b], dx) che coincide quasi ovunque con la derivata di F e vale: x F (t)dt = F (x) − F (a) per ogni x ∈ [a, b]. a 1
(b) Se f ∈ L ([a, b], dx), allora la funzione: [a, b] x → assolutamente continua, e vale: x d f(t)dt = f(x) quasi ovunque su [a, b]. dx a
x a
f(t)dt `e
C.3 Misura prodotto Se (X, Σ(X), μ) e (Y, Σ(Y), ν) sono spazi con misura, indichiamo con Σ(X) % Σ(Y) la σ-algebra su X × Y generata dalla famiglia di tutti i rettangoli E × F con E ∈ Σ(X) e F ∈ σ(Y). Se G ∈ Σ(X) % Σ(Y), definiamo: Gx := {y ∈ Y | (x, y) ∈ G} e
Gy := {x ∈ X | (x, y) ∈ G} .
Si dimostra che tali insiemi sono sempre misurabili nei rispettivi spazi. Se la funzione f : X × Y → C `e misurabile, allora risulta che X x → f(x, y) e Y y → f(x, y) sono funzioni misurabili comunque fissiamo y ∈ Y e x ∈ X rispettivamente. Se μ e ν sono σ-finite, si pu` o allora definire una misura σ-finita su X × Y, μ % ν, definendo per ogni G ∈ Σ(X) % Σ(Y): (μ % ν)(G) := ν(Gx)dμ(x) X
che si dimostra coincidere con Y
ν(Gy )dν(y) .
Il completamento dello spazio con misura (X ×Y, Σ(X)%Σ(Y), μ%ν) si indica con (X × Y, Σ(X) ⊗ Σ(Y), μ ⊗ ν) e μ ⊗ ν si chiama misura prodotto di μ e ν. La misura prodotto delle misure di Lebesgue su Rn e su Rm coincide con la misura di Lebesgue su Rn+m [Rud82]. Valgono i teoremi di Fubini e Tonelli che noi citiamo insieme. Teorema C.7. (Di Fubini e Tonelli.) Se (X, Σ(X), μ) e (Y, Σ(Y), ν) sono spazi con misura σ-finita e completa e f : X × Y → C, vale quanto segue. (a) Se f `e μ ⊗ ν-integrabile, allora: (i) fx : Y y → f(x, y) e fy : X x → f(x, y) sono integrabili per quasi tutti gli x ∈ X e quasi tutti gli y ∈ Y, rispettivamente, (ii) F : X x → Y fy (x)dν(y) e G : Y y → X fx (y)dμ(x) sono integrabili su X e su Y, rispettivamente, e vale:
f(x, y)dμ ⊗ dν(x, y) = f(x, y)dν(y) dμ(x) X×Y
X
Y
C.4 Derivazione sotto il segno di integrale
= Y
687
f(x, y)dμ(x) dν(y) .
X
(b) Se f `e misurabile, allora: (i) fx : Y y → f(x, y) e fy : X x → f(x, y) sono misurabili per quasi tutti gli x ∈ X e quasi tutti gli y ∈ Y, rispettivamente; (ii) se vale ulteriormente:
|f(x, y)|dν(y) dμ(x) < +∞ , X
Y
oppure Y
X
|f(x, y)|dμ(x) dν(y) < +∞
allora f `e μ ⊗ ν-integrabile.
C.4 Derivazione sotto il segno di integrale In questa sezione enunciamo e proviamo il teorema fondamentale riguardante la derivazione sotto il segno di integrale per una misura positiva generale. Teorema C.8. (Derivazione sotto il segno di integrale.) In riferimento allo spazio con misura (X, Σ(X), μ), si consideri una famiglia di funzioni {ft }t∈A ⊂ L1 (X, μ) dove A ⊂ Rm `e un insieme aperto e t = (t1 , . . . , tm ). Se valgono le seguenti due condizioni: (i) per un certo valore k in {1, 2, . . ., n} esistono le derivate: ∂ht (x) , ∂tk
per ogni x ∈ X e t ∈ A ,
(ii) esiste g ∈ L1 (X, μ) con g ≥ 0 quasi ovunque su X e tale che:
∂ht (x)
∂tk ≤ g(x) , quasi ovunque su X, per ogni t ∈ A , allora seguono i seguenti risultati: 1 t (a) X x → ∂h ∂tk ∈ L (X, Σ(X), μ), (b) si possono scambiare i simboli di integrale con quello di derivata per ogni t ∈ A: ∂ ∂ht (x) ht (x)dμ(x) = dμ(x) . (C.2) ∂tk X ∂tk X Se infine: (iii) per una fissata g la condizione in (ii) vale contemporaneamente per tutti i valori di k = 1, 2, . . . , m, quasi ovunque in x ∈ X e tutte le funzioni (per ogni t ∈ A fissato) ∂ht (x) A t → ∂tk
688
Appendice C Teoria della misura
sono continue, allora (c) la funzione
A t →
X
ht (x)dμ(x)
`e in C 1 (A). t Dimostrazione. Notiamo che, per ogni t ∈ A, le funzioni X x → ∂h so∂tk no sicuramente misurabili essendo limite (usando la definizione di derivata come limite del rapporto incrementale) di funzioni misurabili. Inoltre sono μ-integrabili dato che sono maggiorate, in valore assoluto, da una funzione integrabile per l’ipotesi (ii). Fissiamo t ∈ A. Considerando il rapporto incrementale si ha, dove scriviamo, un po’ impropriamente, t + τk al posto di (t1 , . . . , tk−1, tk + τk , tk+1, . . . , tm ):
∂
ht+τk (x) − ht (x) ht (x)dμ(x) = lim dμ(x) . τk →0 X ∂tk t X τk
D’altra parte, per il teorema di Lagrange (restringendosi a lavorare in un intorno aperto e convesso di t ) e tenendo conto dell’ipotesi (ii) abbiamo:
ht +τk (x) − ht (x)
∂ht (x)
=
≤ g(x) ,
∂t
τk t(τk ,x) dove t(τk , x) `e un punto che si trova tra t e (t1 , . . . , tk−1 , tk + τk , tk+1 , . . . , tm ) sul segmento che unisce tale coppia di punti. Possiamo allora applicare il h (x)−h (x) teorema della convergenza dominata per: fτk (x) := t +τk τk t , ottenendo che esiste il limite
ht +τ k (x) − ht (x) ∂
lim dμ(x) =: ht (x)dμ(x) , τk →0 X τk ∂tk t X e vale:
ht+τk (x) − ht (x) lim dμ(x) =: τ →0 τk k X
X
∂ht (x)
dμ(x) . ∂tk t
La tesi `e stata provata per quanto riguarda (a) e (b). La dimostrazione di (c) `e immediata: dal teorema della convergenza dominata tenendo conto dell’ipotesi (ii) si ha che ogni funzione, per k = 1, . . . , m, ∂ A t → ht (x)dμ(x) ∂tk X `e continua, da cui la tesi.
Osservazione C.9. L’enunciato del teorema `e vero anche rimpiazzando la misura positiva μ con una misura complessa (o con segno). La prova `e diretta.
Bibliografia
[AbCi97] [Alb00] [Bar54] [Bar61]
[BaRa86]
[Bel64] [Ber66] [BiSo87]
[Bon97] [BrKh95] [BrRo02]
[BF02] [Bre86] [BGL95] [CCP82]
Abbati, M.C., Cirelli, R.: Metodi Matematici per la fisica, Operatori Linerari negli spazi di Hilbert. Citt` a Studi Edizioni, Torino (1997) Albert, D-Z.: Meccanica Quantistica e senso comune. Adelphi, Milano (2000) Bargmann, V.: On Unitary Ray Representations of Continuous groups. Ann. Math. 59, 1 (1954) Bargmann, V.: On a Hilbert Space of Analytic Functions and an Associated Integral Transform. Communications on Pure and Applied Mathematics 14, 187-214 (1961) Barut, A.O., Raczka, R.: Theory of group representations and applications (Second Revised Edition). World Scientific Publishing, Singapore (1986) Bell, J.S.: On the Einstein Podolsky Rosen Paradox. Physics 1, 195-200 (1964) Berberian, S.K.: Notes on Spectral Theory. D. Van Nostrand Company, Inc., Princeton (1966) Birman, M.S., Solomjak, M.Z.: Spectral Theory of Self-Adjoint Operators in Hilbert Space. D. Reidel Publishing Company, Dordrecht (1987) Boniolo, G. (a cura di): Filosofia della fisica. Bruno Mondadori, Milano (1997) Braginsky, V.D., Khalili, F.YA.: Quantum measurements (First Paperback Edition). Cambridge University Press, Cambridge (1995) Bratteli, O., Robinson, D.W.: Operator Algebras and Quantum Statistical Mechanics (Vol I and II, Second Edition). Springer-Verlag, Berlin (2002) Brunetti, R., Fredenhagen, K.: Remarks on time energy uncertainty relations. Reviews in Mathematical Physics 14, 897-906 (2002) Brezis, H.: Analisi Funzionale. Liguori Editore, Napoli (1986) Busch, P., Grabowski, M., Lahti, P. J.: Operational Quantum Physics. Springer-Verlag, Berlin (1995) Caldirola, P., Cirelli, R., Prosperi, G.M.: Introduzione alla Fisica Teorica. UTET, Torino (1982)
690
Bibliografia
[DCGi02]
Dalla Chiara, M.L., Giuntini, R.: Quantum Logics. In Gabbay, D., Guenthner, F. (editors): Handbook of Philosophical Logic (Vol. 6, 129228). Kluwer Academic Publishers, Dordrecht (2002) [Des80] D’Espagnat, B.: I Fondamenti Concettuali della Meccanica Quantistica. Bibliopolis, Napoli (1980) [Dir30] Dirac, P.A.M.: The principles of Quantum Mechanics. Oxford University Press, Oxford (1930). Ristampa in traduzione italiana: Dirac, P.A.M.: I Principi della Meccanica Quantistica. Bollati Boringhieri, Torino (1976) [Dix56] Dixmier, J.: Sur la Relation i(P Q − QP ) = I. Compos. Math. 13, 263-269 (1956) [DiUh77] Diestel, J., Uhl, J.J.Jr.: Vector Measures. American Mathematical Society, Providence, USA (1977) [doC92] do Carmo, J.J.: Riemannian Geometry. Birkh¨auser, Boston (1992) [Dop09] Doplicher, S.: The Principle of Locality. Effectiveness, fate and challenges. Journal of Mathematical Physics (2010) in stampa [DI08] Doring, A., Isham, C.J.: A Topos foundation for theories of physics. I,II,III and IV: Journal of Mathematical Physics 49, 053515 (2008), 49, 053516 (2008), 49, 053517 (2008) e 49, 053518 (2008) [EGL09] Engesser, K., Gabbay, D. M., Lehmann D. (editors): Hanbook of Quantum Logic and Quantum Structures. Elsevier, Amsterdam (2009) [EPR35] Einstein, A., Podolsky, B., Rosen, N.: Can Quantum-Mechanical Description of Physical Reality Be Considered Complete? Physical Review 47, 777-780 (1935) [FaMa94] Fasano, A., Marmi, S.: Meccanica Analitica. Bollati Boringhieri, Torino (1994) [FK09] Friesecke, G., Koppen, M.: On the Ehrenfest theorem of quantum mechanics. Journal of Mathematical Physics 50, 082102-082102-6 (2009) [Fug50] Fuglede, B.: A commutativity theorem for normal operators. Proceedings of the National Academy of the Sciences of the United States of America 36, 35-40 (1950) [Ghi97] Ghirardi, G.C.: Un’occhiata alle carte di Dio. Il Saggiatore, Milano (1997) [Gia97] Giannitrapani, R.: Positive-operator-valued time observable in quantum mechanics. Internat. J. Theoret. Phys. 36, 1575–1584 (1997) [Giusti03I] Giusti, E.: Analisi Matematica 1. Bollati Boringhieri, Torino (2003) [Giusti03II] Giusti, E.: Analisi Matematica 2. Bollati Boringhieri, Torino (2003) [Gle57] Gleason, A.M.: Measures on the closed subspaces of a Hilbert space. Journal of Mathematics and Mechanics 6, 885-893 (1957) [Haa96] Haag, R.: Local Quantum Physics (Second Revised and Enlarged Edition). Springer-Verlag, Berlin (1996) [Hal69] Halmos, P.R.: Measure Theory. Van Nostrand Reinhold, New York (1969) [HLS09] Heunen, C., Landsman, N.P., Spitters, B.: A topos for algebraic quantum theory. Communications in Mathematical Physics 291 (1) 63-110 (2009) [Kad51] Kadison, R.: Isometries of Operator Algebras. Annals of Mathematics 54 325-338 (1951)
Bibliografia [KaAk80] [Kat66] [KoFo80] [Kir74] [KiGv83] [Mac63] [Mar82] [Mor99]
[Mrr01] [NaSt84] [Nel59] [Neu32]
[NiOu82] [Pru81] [ReSi80] [RR69]
[Rud82] [Rud91] [Sch60] [Ser94I] [Ser94II] [StWi00] [Str05]
[Vla81]
691
Kantorovic, L.V., Akilov, G.P.: Analisi Funzionale. Editori Riuniti, Roma (1980) Kato, T.: Perturbation for Linear Operators. Springer-Verlag, Berlin (1966) Kolmogorov, A.N., Fomin, S.V.: Elementi di teoria delle funzioni e di analisi funzionale. Editori Riuniti, Roma (1980) ´ ements de la th´eorie des repr´esentations. MIR, Mosca Kirillov, A.A.: El´ (1974) Kirillov,A.A, Gvisiani, A.D.: Teoremi e problemi dell’analisi funzionale. MIR, Mosca (1983) Mackey G.:The Mathematical Foundations of Quantum Mechanics. Benjamin, New York (1963) Martucci, G.: Spazi di Hilbert con elementi di meccanica quantistica. Pitagora Editrice Bologna, Bologna (1982) Moretti, V.: Local ζ-function techniques vs point-splitting procedures: a few rigorous results. Communications in Mathematical Physics 201, 327-364 (1999) Morrison, T.J.: Functional analysis: An introduction to Banach space theory. Wiley-Interscience, New York (2001) Najmark, M.A., Stern, A.I.: Teoria delle rappresentazioni dei gruppi. Editori Riuniti, Roma (1984) E. Nelson, E.: Analytic Vectors. Ann. Math. 70, 572-614 (1959) von Neumann, J.: Mathematische Grundlagen der Quantenmechanik. Springer-Verlag, Berlin (1932). Ristampa in traduzione italiana: von Neumann, J.: I fondamenti matematici della meccanica quantistica (a cura di Boniolo, G.). Il Poligrafo, Padova (1998) Nikiforov, A., Ouvarov, V.: Fonctions Sp´eciales de la physique math´ematique. MIR, Moscou (1982) Prugovecki, E.: Quantum Mechanics in Hilbert Space (Second Edition). Academic Press, New York (1981) Reed, M., B. Simon, B.: Methods of Modern Mathematical Physics, Vol I, II and IV. Academic Press, New York (1980) Roberts, J.E., Roepstorff, G.: Some basic concepts of algebraic quantum theory. Communications in Mathematical Physics 11, 321-338, (1969) Rudin, W.: Analisi reale e complessa. Bollati Boringhieri, Torino (1982) Rudin, W.: Fuctional Analysis (Second Edition). McGraw-Hill, Boston (1991) Schatten, R.: Norm ideals of completely continuous operators. Springer-Verlag, Berlin (1960) Sernesi, E.: Geometria 1. Bollati Boringheri, Torino (1994) Sernesi, E.: Geometria 2. Bollati Boringheri, Torino (1994) Streater, R.F., Wightman, A.S.: PCT,Spin and Statistics, and All That (Revised Edition). Princeton University Press, Princeton (2000) Strocchi, F.: An Introduction To The Mathematical Structure Of Quantum Mechanics: A Short Course For Mathematicians. World Scientific Publishing, Singapore (2005) Valdimirov, V.S.: Le distribuzioni nella fisica matematica. MIR, Mosca (1981)
692
Bibliografia
[War75] [Wei99] [Wes78] [Wig59] [ZFC05]
Warner, F.W.: Foundation of Differentiable Manifolds and Lie Groups. Springer-Verlag, New York (1975) Weinberg, S.: La Teoria Quantistica dei Campi. Vol 1,2,3. Zanichelli, Bologna (1999) von Westenholtz, C.: Differential Forms in Mathematical Physics. North-Holland, Amsterdam (1978) Wigner, E.: Group Theory and its Applications to the Quantum Theory of Atomic Spectra. Academic Press, Boston (1959) Zachos, C., Fairlie, D., Curtright, T.: Quantum Mechanics in Phase Space. World Scientific Publishing, Singapore (2005)
Indice analitico
AHt(t), 632 ⊕α∈AHα , 357 a arbitraria, 98 i∈I con I di cardinalit` (A|B)2 con A, B operatori di Hilbert-Schmidt, 172 ( | ), 4, 92 (σ) (H⊗n )λ , 655 ⊗n (σ) (H )± , 657 (a, +∞], 680 :=, 4 < K >, 93 < X1 , · · · , Xn >, 63 A, A , N , 400, 479 A ⊂ B con A e B operatori, 204 A∗∗···∗, 211 Aut(G), 667 Br (x0 ), 18 C(K), 27 C(K; Kn ), 26 C(X), 31 C ∗ -algebra, 116 C ∞ (A) con A operatore, 227, 409 C ∞ (Rn ), 59 C k (Ω), 669 C k (Ω; Rn ), 669 C0 (X), 32 Cb (X), 31 Cc (X), 31 D(T ), 204 G(T ), 65, 204 GL(V ), 668 GL(n, C), 548 GL(n, R), 548, 567
Hn polinomio di Hermite, 110 IO(3), 534 IO(n), 548 Int(S), 59 J 2 , 584 Jk , 585 K ⊥, 88 Ki, 593 Ker(T ), 113 L(X), 31 L2 , 440 L2 (Rn , dx), 214 L2 (X, μ), 93 Lα n (x), 617 Lp (X, μ), 33 L3 , 442 M (X), 300 M (n, C), 567 M (n, R), 567 M α (x), 132 Mb (X), 31, 300, 324 O(3), 527 O(n), 548, 568 (A) PE , 296 (A) PE , 296 P (T ) con T operatore autoaggiunto non necessariamente limitato, 389 P (T ) con T operatore limitato normale, 348 (f ) PE , 261 Pi, 403, 440 Pj , 217 Pk , 472
694
Indice analitico
Rλ (A), 311 Ran(T ), 113 S(X), 300, 334 SL(n, R), 548 SO(3), 570, 582 SO(n), 548, 569 SU (2), 569, 582 SU (n), 548 SG , 587 T ≥ U con T, U operatori limitati su uno spazio di Hilbert, 118 T ∗ , 113 T ∗ con T operatore non limitato, 207 TK , 160 U (n), 548 U (t, t ), 621 W ((t, u)), 479 W (z), 488 Xi, 214, 403, 440, 471 Ylm , 442 [−∞, ∞], 680 [−∞, a), 680 [−∞, a], 680 [a, +∞], 680 ΔAρ, 305, 468 Δ operatore di Laplace, 453 Δf , 376 ΦT , 323 ⇒ (implicazione materiale), 260 C, 4 N, 4 R +n, 4 k=1 Hk con n = 1, 2, . . . , +∞ e Hk spazi di Hilbert, 435 ,4 A (A), 409 B(X), 256, 679 DG , 579 DN , 579 G1 ⊗ψ G2 , 668 G1 ⊗ G2 con G1 , G2 gruppi, 667 H (n), 504 Jk , 584 L2 , 440 Li , 440 G , 586 (negazione logica), 260 δij , 473 p(N), 35
p(X), 35 exp per un gruppo di Lie, 565 B(X), 37 B(X, Y), 37 B1 (H), 180 B2 (H), 169 B∞ (X), 155 B∞ (X, Y), 155 L(X), 37 L(X, Y), 37 M , 117 P(H), 267 S(H), 284 Sp(H), 289 Sp(H)ammiss , 294 γ ∗ se γ `e una simmetria (automorfismo di Kadison o di Wigner), 532 inf, 662 X f dμ con μ misura complessa, 43 f (x) dP (x) con f misurabile limitata, X 336 f (x)dP (x) con f funzione Borel X misurabile non necessariamente limitata, 377 f (x)dP (x) con f funzione misurabile X non necessariamente limitata, 386 s(x) dP (x) con s funzione semplice, X 334 f (t)Vt dt con {Vt }t∈Rn classe di Rn operatori fortemente continua in t, 418 Aρ, 305, 468 ran ess(f ), 461 (T ) μψ , 394 μψ , 341 μA ρ , 468 μψ,φ , 341 ¬, 264 A con A operatore, 205 S con S insieme, 15, 662 R, 680 c, 4 ⊥, 207 φT , 322 ρ(A), 311 H(C), 110 H⊗n , 653 H1 ⊗ · · · ⊗ Hn con Hi spazi di Hilbert, 432
Indice analitico HS , 276 Hψ , 227 X, 37 X∗, 37 X1 ⊕ · · · ⊕ Xn , 63 σ(A), 311 σc(A), 311 σd (T ), 395 σi , i = 1, 2, 3, 282 σp (A), 311 σp (T ), 162 σr (A), 311 σess(T ), 395 σpa (T ), 395 σ √rp (T ), 395 A, 126, 448 ⊂, ⊃, 4 sup, 662 τ , 206 |A|, 130, 449 |μ| con μ misura complessa, 42 ||A||1 con A operatore di classe traccia, 180 ||A||2 con A operatore di Hilbert-Schmidt, 169 || ||, 92 (P ) || ||∞ , 332 || ||2 , 93 || ||∞ , 43
ω , 545 G
139 F, SG , 587 {A} con A operatore, 211 {f, g}, 508 ∗ -algebra, 116 ∗ -isomorfismo, 116 ∗ -omomorfismo, 116, 323 a ∧ b, 263 a ∨ b, 263 d±(A), 223 dzdz, 110 f (T ) con T autoaggiunto non necessariamente limitato e f misurabile non necessariamente limitata, 394 f (T ) con T limitato normale e f misurabile limitata, 327 p( ), 18 q.o., 682
695
r(a), 316 s- lim, 55 sing(A), 167 supp(P ), 332 supp(μ), 341, 681 trA con A operatore di classe traccia, 184 v1 ⊗ · · · ⊗ vn dei vettori v1 , . . . , vn, con vi vettori, 430 w-∂ α, 216 w- lim, 55 w ∗- lim, 55 W (X, σ), 490 D(Rn), 132 E (congiunzione logica), 260 F f , 134 Ft, 257 F−g, 134 Hn+1 , 257 Lp (X, μ), 32 O (disgiunzione logica), 259 Pn , 653 S(Rn ), 59, 132 σ-additivit` a, 680 σ-algebra, 32, 679 σ-algebra di Boole, 264 σ-algebra di Borel, 256, 679 σ-algebra generata, 679 σ-finito, 681 algebra, 29 – commutativa o abeliana, 29 – con unit` a, 29 – di Banach, 30, 116 – di Boole, 264 – di insiemi, 679 – di Lie, 508, 563 – di von Neumann, 117, 118 – di von Neumann generata da un operatore, 211 – di Weyl, 490 – normata con unit` a, 29 – isomorfe, 30 alternativa di Fredholm, 192 ampiezza di probabilit` a, 289 – di transizione, 289, 467 armoniche sferiche, 442 assioma – della scelta, 661
696
Indice analitico
– di Zermelo, 661 atlante, 670 atomo di idrogeno, 616 automorfismo – di Kadison, 516 – di Wigner, 519 – gruppale, 667 autospazio, 119 autovalore, 119 autovettore, 119 azione duale di una simmetria sulle osservabili, 532 base – canonica di uno spazio simplettico, 487 – hilbertiana, 97, 99 – topologica, 14, 57, 662, 663 boost lungo l’asse i-esimo, 593 boreliano o insieme di Borel, 256 bosoni, 657 C∗-algebra di Weyl associata ad uno spazio simplettico, 494 carica centrale, 573, 594 carta locale, 670 CCR, 473 centro di un gruppo, 667 chiusura – di un insieme, 15, 662 – di un operatore, 205 collasso della funzione d’onda, 291 combinazione lineare convessa, 284 commutante, 117 – di un’algebra di Lie, 562 – di un operatore, 211 compatto, 25, 663 – sequenzialmente, 152 completamento di una misura, 681 componenti connesse, 664 condizioni di imprimitivit` a, 535 congiunzione logica, 260 coniugazione di carica, 538 conseguenza logica (implicazione materiale), 260 coordinate simplettiche, 257 core di un operatore, 213 correlazione spin statistica, 657
costante – del moto, 632 – di Planck, 239 costanti – di struttura del gruppo di Galileo, 587 – di struttura di un’algebra di Lie, 565 decomposizione polare di un operatore limitato, 130, 132 derivata in senso debole, 216 diffeomorfismo, 672 disgiunzione logica, 259 distanza, 56, 665 – euclidea (o standard), 666 distribuzione di Schwartz, 59 disuguaglianza – di Bell, 649 – di Bessel, 99 – di Cauchy-Schwarz, 88 – di H¨ older, 32 – di Minkowski, 32 – triangolare, 18, 56 dominio – di un operatore, 204 – naturale, 204 duale – algebrico, 37, 675 – topologico, 37 effetto – Compton, 242 – fotoelettrico, 241 elementi separanti, 48 elemento – estremale di un insieme convesso, 285 – hermitiano o autoaggiunto, 116 – normale, 116 equazione – di Fredholm di prima specie, 189 – di Fredholm di seconda specie, 191 – di Fredholm di seconda specie a nucleo hermitiano, 190 – di Hamilton, 257 – di Liouville, 258 – di Schr¨ odinger, 247 – di Schr¨ odinger temporale, 611 – di Volterra, 177 – di Volterra di seconda specie, 195
Indice analitico – di Volterra omogenea su C([a, b]), 73 – risolvente, 312 estensione – centrale di un gruppo tramite U (1) tramite una funzione dei moltiplicatori, 545 – di un operatore, 204 estremo – inferiore, 662 – superiore, 662 – superiore essenziale, 35 evolutore – temporale, 605 – temporale in assenza di omogeneit` a temporale, 621 exponential map di un gruppo di Lie, 565 famiglia – di operatori irriducibile, 476 – equicontinua di operatori, 50 fermioni, 657 flusso dinamico, 605 forma – bilineare debolmente non degenere, 487 – canonica di una forma simplettica, 487 – simplettica, 487 formula – di Campbell-Hausdorff-Baker, 478, 566 – di Gelfand del raggio spettrale, 317 formulazione hamiltoniana della meccanica classica, 257 funzionale – continuo, 39 – limitato, 37 funzione – μ-integrabile, 682 – a variazione limitata, 685 – analitica a valori su uno spazio di Banach, 310 – aperta, 61 – assolutamente continua, 685 – biettiva, 5 – Borel misurabile, 256, 680 – caratteristica, 110 – congiuntamente continua, 21
697
– – – – – – –
continua, 16, 19, 57, 663 d’onda, 289, 472 d’onda di Schr¨ odinger, 246 di classe C k , 669 di Laguerre, 110 di rivestimento, 563 essenzialmente limitata rispetto ad una PVM, 332 – intera, 110 – isometrica, 20 – Lebesgue misurabile, 685 – localmente a quadrato integrabile, 457 – localmente integrabile, 215 – localmente lipschitziana, 76, 396 – misurabile, 680 – semplice, 300, 334, 682 – sequenzialmente continua, 20 funzioni di Hermite, 110, 401, 480 generatore (autoaggiunto) di un gruppo ad un parametro fortemente continuo di operatori unitari, 425 generatori – di una ∗-algebra di Weyl, 490 – di una rappresentazione unitaria di un gruppo di Lie, 578 grafico di un operatore, 65, 204 grandezze compatibili ed incompatibili, 250, 254 gruppo, 666 – ad un parametro debolmente continuo di operatori, 414 – ad un parametro di operatori, 414 – ad un parametro di operatori unitari, 414 – ad un parametro fortemente continuo di operatori, 414 – commutativo o abeliano, 666 – delle isometrie di R3 , 534 – delle permutazioni di n oggetti, 653 – di Galileo, 548, 586, 618, 639 – di Galileo proprio, 587 – di Lie, 560 – di Lorentz, 548 – di Poincar´e, 548 – di simmetria, 538, 539 – di Weyl-Heisenberg, 504 – lineare n-dimensionale, 548
698
Indice analitico
– ortogonale n-dimensionale, 548 – ortogonale speciale n-dimensionale, 548 – quantistico associato ad un gruppo, 547 – topologico, 535, 547 – unitario n-dimensionale, 548 – unitario speciale n-dimensionale, 548 hamiltoniano dell’oscillatore armonico, 399 ideale bilatero e ∗-ideale, 159 identit` a – del parallelogramma, 89 – di De Morgan, 264 – di polarizzazione, 89 indici di difetto, 223 iniezione canonica di un’estensione centrale, 545 insieme – aperto, 14, 18, 56, 662 – assorbente, 52 – bilanciato o equilibrato, 51 – chiuso, 15, 662 – connesso, 664 – convesso, 51, 93, 284 – denso, 15, 663 – di misura nulla, 681 – di prima categoria, 59 – di seconda categoria, 59 – limitato, 18, 154 – limitato inferiormente, 661 – limitato superiormente, 661 – magro, 59 – non magro, 59 – numerabile, 98 – ordinato, 661 – ortogonale, 99 – ortonormale, 99 – ortonormale completo, 99 – ovunque non denso, 59 – parzialmente ordinato, 661 – relativamente compatto, 25, 664 – risolvente, 311 integrale – di una funzione misurabile limitata rispetto ad una PVM, 336
– di una funzione misurabile, non necessariamente limitata, rispetto ad una PVM, 386 – di una funzione rispetto ad una misura, 683 – di una funzione semplice rispetto a una PVM, 334 – primo, 632 interno di un insieme, 59, 662 interpretazione – di Copenaghen, 248, 255 intorno aperto di un punto, 15, 662 inversione – del tempo, 536 – del tempo o time reversal, 625 – di parit` a, 536 involuzione, 116 isometria, 20, 91, 221, 665 isomorfismo – di σ-algebre di Boole, 264 – di algebre, 30 – di algebre di Boole, 264 – di algebre di Lie, 563 – di gruppi di Lie, 561 – di spazi con prodotto scalare, 91 – di spazi di Hilbert, 92, 118 – di spazi normati, 20 – gruppale, 667 – locale di gruppi di Lie, 561 isotonia, 332 lemma – di Banach, 157 – di Du Bois-Reymond, 216 – di Fatou, 684 – di Lindel¨ of, 331, 663 – di Nussbaum, 227 – di Schur, 476 – di Zorn, 104, 661 limite di una successione, 19, 57 livello fondamentale dell’atomo di idrogeno, 617 logica quantistica, 275 lunghezza d’onda di de Broglie, 246 maggiorante, 661 matrice densit` a, 466 matrici di Pauli, 282, 525, 583 metrica, 56, 665
Indice analitico minorante, 661 miscela, 289 misura – a valori di proiezione, 296, 332 – a valori di proiezione limitata, 332 – a valori di proiezione su R, 299 – a valori operatoriali positivi, 630 – che conta i punti, 35 – complessa, 42 – completa, 681 – con segno, 42 – di Borel, 256, 257, 681 – di Dirac, 256 – di Lebesgue su Rn , 685 – di probabilit` a, 256, 681 – di Radon, 109 – esternamente regolare, 681 – finita, 681 – internamente regolare, 681 – positiva σ-additiva, 32 – prodotto, 686 – regolare, 43, 681 – separabile, 109 – spettrale associata ad un vettore, 341 – spettrale complessa associata a due vettori, 341 – spettrale congiunta o joint spectral measure, 406, 467 – spettrale su R, 299 – spettrale su X, 332 – non distruttive o indirette, 291 molteplicit` a di un valore singolare, 167 moltiplicatori di una rappresentazione unitaria proiettiva, 541 momento – angolare orbitale, 440 – angolare totale di una particella con spin, 584 multindice, 58 negazione logica, 260 norma, 17 – essenziale rispetto ad una PVM, 332 – operatoriale, 38 – equivalente, 67 nucleo – di un omomorfismo gruppale, 667 – di un operatore, 113 numerabile di secondo tipo, 663
699
omeomorfismo, 16, 663 omomorfismo – di σ-algebre di Boole, 264 – di algebre, 30 – di algebre di Boole, 264 – di algebre di Lie, 563 – di gruppi di Lie, 561 – gruppale, 539, 667 – locale di gruppi di Lie, 561 omotopia, 665 operatore – aggiunto (caso generale), 207 – aggiunto o coniugato hermitiano, 113 – antiunitario, 225, 517 – autoaggiunto, 118, 210 – chiudibile, 205 – chiuso, 205 – compatto, 155 – completamente continuo, 155 – coniugato o aggiunto (nel senso degli spazi normati), 42 – continuo, 39 – degenere, 179 – di classe traccia, 180 – di coniugazione, 225, 517 – di creazione, 399, 479 – di distruzione, 399, 479 – di Hilbert-Schmidt, 169 – di Volterra, 177 – essenzialmente autoaggiunto, 210 – hamiltoniano, 605 – hermitiano, 209 – idempotente, 65 – impulso, 217, 403, 440, 471 – isometrico, 118 – limitato, 37 – momento angolare orbitale, 440 – normale, 118, 210 – nucleare, 180 – numero di occupazione, 399, 479 – positivo, 118 – posizione, 214, 403, 440, 471 – risolvente, 311 – simmetrico, 209 – statistico, 466 – unitario, 92, 118 operatori – commutanti, 467 – commutati, 211
700
Indice analitico
– di spin, 583 ordinatore cronologico, 625 ortocomplemento, 264 osservabile, 296, 467 osservabili – compatibili, 467 – coniugate, 473 – incompatibili, 467 palla – aperta, 18 – metrica aperta, 60 paradosso EPR, 646 parastatistica, 657 parentesi di Poisson, 508 particelle identiche, 653 polinomi di Legendre, 108 polinomio – associato di Laguerre, 617 – di Hermite, 110 – di Laguerre, 110 potenziale – coulombiano attrattivo, 458, 616 – di Yukawa, 459, 617 POVM, 630 preparazione di sistema in uno stato puro, 292 principio – della limitatezza uniforme, 49 – di corrispondenza di Dirac, 506 – di indeterminazione di Heisenberg, 248 – di sovrapposizione degli stati, 289 probabilit` a di transizione, 289 procedura di ortogonalizzazione di Gramm-Schmidt, 107 prodotto – diretto gruppale, 667 – scalare hermitiano, 88 – semidiretto gruppale, 534, 668 – tensoriale di vettori, 430 – tensoriale hilbertiano di spazi di Hilbert, 432 proiettore, 65 – canonica, 63 – canonica di un’estensione centrale, 545 – ortogonale, 122
proposizione – sulle misure e spazi Lp separabili, 109 – sulle misure di Borel e spazi Lp separabili, 109 proposizioni – compatibili ed incompatibili, 266 – incompatibili, 267 propriet` a di ciclicit` a della traccia, 185 pullback, 677 punto di accumulazione, 16, 662 pushforward, 677 PVM, 296 – su R, 299 – su X, 332 quantizzazione ` a la Weyl, 509 quasi ovunque, 682 radice – quadrata di un operatore, 124 – quadrata positiva, 126 rango – di un operatore, 113 – essenziale, 461 rapporto giromagnetico dell’elettrone, 7 rappresentazione – di Heisenberg, 631 – di Schr¨ odinger, 632 – di un’algebra di Weyl, 493 – fedele, 539, 668 – GNS, 493 – gruppale, 667 – impulso, 536 – irriducibile, 668 – libera, 668 – lineare di un gruppo, 668 – proiettiva continua, 549 – proiettiva di un gruppo di simmetria, 539 – transitiva, 668 – (propriamente) unitaria di un gruppo di simmetria, 541 – unitaria proiettiva di un gruppo di simmetria, 541 – unitaria proiettiva irriducibile, 541 rappresentazioni – irriducibili unitariamente equivalenti delle CCR, 503
Indice analitico – unitarie proiettive del gruppo di Galileo, 590 – unitarie proiettive equivalenti, 541 – unitarie proiettive fortemente continue, 552 regola – di superselezione del momento angolare, 294 – di superselezione della carica elettrica, 293 – di superselezione di Bargmann della massa, 596 regole di superselezione, 293, 515 relazione – d’ordine parziale, 661 – d’ordine totale, 661 relazioni – di commutazione canonica, 473 – (di commutazione) di Weyl, 490 – di Heisenberg, 473, 581 – di Weyl, 479 reticolo, 263 – σ-completo, 264 – distributivo, 263 – limitato, 264 – ortocomplementato, 264 rivestimento – di uno spazio topologico, 563 – universale di uno spazio topologico, 563 scarto quadratico, 468 semi prodotto scalare hermitiano, 88 semigruppo fortemente continuo di operatori, 425 seminorma, 17 serie di Dyson, 622 settori coerenti (di superselezione), 293, 515 sfera di Poincar´e, 525 simmetria – dinamica, 608 – dinamica dipendente dal tempo, 608 – nel senso di Kadison, 516 – nel senso di Wigner, 518 – quantistica, 512 simplettoisomorfismo, 487 sistema – di coordinate normali, 566
701
– di imprimitivit` a, 535 – di riferimento inerziale, 471 – quantistico composto, 645 somma – diretta, 63 – diretta hilbertiana, 206, 357, 435 sottoalgebra, 30 sottogruppo, 666 – delle rotazioni spaziali, 587 – delle trasformazioni pure di Galileo, 587 – delle traslazioni spaziali, 587 – delle traslazioni temporali, 587, 606 – di Lie, 564 – normale, 666 sottospazio – invariante, 668 – irriducibile rispetto ad una famiglia di operatori, 476 – vettoriale, 4 sottovariet` a embedded, 673 sovrapposizione – coerente, 289 – incoerente, 289 spazi di Hilbert anti isomorfi, 97 spazio – a base numerabile, 331 – Bargmann Fock Hilbert , 110 – con misura, 32, 680 – con misura completo, 681 – con prodotto scalare, 88 – connesso, 664 – connesso per archi, 665 – cotangente, 674 – dei vettori analitici di una rappresentazione unitaria di un gruppo di Lie, 579 – di Banach, 22 – di Fock, 436, 658 – di Fock bosonico, 658 – di Fock fermionico, 658 – di Fr´echet, 58 – di G˚ arding, 422, 579 – di Hausdorff, 257 – di Hausdorff (o T 2 o separabile di secondo tipo), 15, 18, 31, 663 – di Hilbert, 92 – di Hilbert associato ad un sistema fisico, 276
702
Indice analitico
– di Hilbert di una particella non relativistica con spin 0 e massa m > 0, 471 – di Hilbert separabile, 105 – di proiezione, 65 – di Schwartz su Rn , 58, 132 – duale topologico, 97 – localmente compatto, 257 – localmente convesso, 52 – metrico, 56, 665 – metrico completo, 57, 60, 666 – misurabile, 256, 679 – normato, 17 – normato completo, 22 – ortogonale, 88 – proiettivo, 285 – riflessivo, 49, 96 – semplicemente connesso, 665 – simplettico, 487 – tangente, 674 – topologico, 14, 662 – topologico a base numerabile, 57, 331, 663 – topologico localmente compatto, 25, 31, 664 – topologico metrizzabile, 57 – topologico separabile, 15, 663 – vettoriale topologico, 52 spaziotempo delle fasi, 257 spettrale, 316 spettro – congiunto o joint spectrum, 406 – continuo di un operatore, 311 – dell’hamiltoniano dell’atomo di idrogeno, 616 – di un operatore, 311 – discreto, 395 – essenziale, 395 – puntuale approssimato, 395 – puntuale di un operatore, 311 – residuo puro, 395 spin, 251, 582 stati entangled, 646 stato – misto, 289, 466 – probabilistico, 258 – puro, 289, 466 – quantistico, 277, 283, 466 – sharp, 258
struttura – differenziabile, 670 – differenziabile prodotto, 672 subadditivit` a, 18, 332, 680 successione – convergente, 16, 19, 57, 662, 665 – di Cauchy, 22, 666 – equicontinua di funzioni, 27 supporto di una misura, 341, 681 – a valori di proiezione, 332 teorema – corrispondente al Principio di indeterminazione di Heisenberg, 474 – corrispondente al Principio di indeterminazione di Heisenberg con ipotesi indebolite, 502 – corrispondente al Principio di indeterminazione di Heisenberg per stati misti, 502 – dei valori regolari, 673 – del completamento per spazi di Hilbert, 92 – del doppio commutante di von Neumann, 118 – del punto fisso, 70 – dell’applicazione aperta (di Banach-Schauder), 61 – dell’operatore inverso di Banach, 62 – della convergenza dominata di Lebesgue, 684 – della convergenza monotona di Beppo-Levi, 683 – di Arzel` a-Ascoli, 27 – di Baire, 59 – di Banach-Mazur, 29 – di Banach-Steinhaus, 49 – di Bargmann, 573 – di caratterizzazione delle misure complesse, 43 – di Cartan, 564 – di Darboux, 487 – di decomposizione polare di un operatore limitato, 130 – di decomposizione polare per operatori chiusi e densamente definiti, 449
Indice analitico – di decomposizione spettrale per operatori autoaggiunti non limitati, 389 – di decomposizione spettrale per operatori normali, 348 – di derivazione sotto il segno di integrale, 687 – di Ehrenfest, 636 – di esistenza ed unicit` a locale, 76 – di Fischer-Riesz, 33 – di Fischer-Riesz per L∞ , 36 – di Fubini-Tonelli, 686 – di Fuglede, 366 – di G˚ arding, 579 – di Gelfand-Mazur, 316 – di Gelfand-Naimark, 319 – di Gleason, 281 – di Gleason-Montgomery-Zippin, 561 – di Hadamard, 318 – di Hahn-Banach, 45 – di Heine-Borel, 25, 664 – di Hellinger-Toeplitz, 210 – di Hilbert sugli operatori compatti, 162 – di Hilbert sullo sviluppo spettrale degli operatori compatti, 164 – di Hille-Yoshida, 425 – di Kadison, 527 – di Kato, 455, 612 – di Kato-Rellich, 451 – di Lidiskii, 187 – di Lie, 564 – di Liouville, 258 – di Mackey, 488 – di N¨ other quantistico, 635 – di Nelson per l’essenziale autoaggiunzione (criterio di Nelson), 228 – di Nelson sull’esistenza di rappresentazioni unitarie di gruppi di Lie, 580 – di Nelson sulla commutativit` a di misure spettrali, 582 – di Neumark, 630 – di Paley-Wiener, 143 – di Pauli, 628 – di Plancherel, 140
703
– di Radon-Nikodym, 43 – di rappresentazione spettrale per operatori autoaggiunti non limitati, 405 – di rappresentazione spettrale per operatori in B(H) normali, 357 – di Riesz per misure complesse su Rn , 44 – di Riesz per misure di Borel positive, 684 – di Riesz per spazi di Hilbert, 96 – di Schr¨ oder-Bernstein, 105 – di Stone, 420, 578 – di Stone-von Neumann, 487 – di Stone-von Neumann in formulazione alternativa, 488 – di Stone-Weierstrass, 32, 108 – di sviluppo di un operatore compatto rispetto ai suoi valori singolari, 167 – di Tychonoff, 664 – di von Neumann per l’esistenza di estensioni autoaggiunte (criterio di von Neumann), 226 – di von Neumann sulla continuit` a di gruppi ad un parametro di operatori unitari, 416 – di Wigner, 520 – FS3 (di Flato, Simon, Snellman e Sternheimer) sull’esistenza di rappresentazioni unitarie di gruppi di Lie, 581 – sugli autovalori degli operatori compatti in spazi normati, 157 – sull’esistenza delle misure spettrali congiunte, 406 – sulla commutativit` a di misure spettrali, 426 – sulle soluzioni dell’equazione di Fredholm di seconda specie a nucleo hermitiano, 190 topologia, 14, 662 – debole su uno spazio normato, 53 – indotta, 15, 663 – naturale di uno spazio metrico, 56 – naturale di uno spazio normato, 18, 56 – operatoriale ∗-debole, 53 – operatoriale debole, 53
704
Indice analitico
– operatoriale forte, 53 – operatoriale uniforme, 53 – prodotto, 17, 21, 64, 205, 206, 664 – standard, 15, 666 traccia di un operatore di classe traccia, 185 trasformata – di Cayley, 221 – di Fourier, 134 – di Fourier-Plancherel, 139 – inversa di Fourier, 134 trasformazione – attiva, 513 – di Segal-Bargmann, 510 – passiva, 514 – unitaria, 92
valore – assoluto di un operatore, 130 – medio, 468 – singolare di un operatore compatto, 167 variazione totale di una misura, 42 variet` a – analitica, 670 – differenziabile, 670 vettore – analitico, 226, 409 – controvariante, 675 – covariante, 675 – di unicit` a, 227 – normale, 88 – ortogonale, 88
8daaVcV Jc^iZmi " AV BViZbVi^XV eZg ^a ( ' a cura di A. Quarteroni (Editor-in-Chief) P. Biscari C. Ciliberto G. Rinaldi W.J. Runggaldier Kdajb^ ejWWa^XVi^# A partire dal 2004, i volumi della serie sono contrassegnati da un numero di identificazione. I volumi indicati in grigio si riferiscono a edizioni non più in commercio. A. Bernasconi, B. Codenotti Introduzione alla complessità computazionale 1998, X+260 pp, ISBN 88-470-0020-3 A. Bernasconi, B. Codenotti, G. Resta Metodi matematici in complessità computazionale 1999, X+364 pp, ISBN 88-470-0060-2 E. Salinelli, F. Tomarelli Modelli dinamici discreti 2002, XII+354 pp, ISBN 88-470-0187-0 S. Bosch Algebra 2003, VIII+380 pp, ISBN 88-470-0221-4 S. Graffi, M. Degli Esposti Fisica matematica discreta 2003, X+248 pp, ISBN 88-470-0212-5 S. Margarita, E. Salinelli MultiMath - Matematica Multimediale per l’Università 2004, XX+270 pp, ISBN 88-470-0228-1
A. Quarteroni, R. Sacco, F.Saleri Matematica numerica (2a Ed.) 2000, XIV+448 pp, ISBN 88-470-0077-7 2002, 2004 ristampa riveduta e corretta (1a edizione 1998, ISBN 88-470-0010-6) 13. A. Quarteroni, F. Saleri Introduzione al Calcolo Scientifico (2a Ed.) 2004, X+262 pp, ISBN 88-470-0256-7 (1a edizione 2002, ISBN 88-470-0149-8) 14. S. Salsa Equazioni a derivate parziali - Metodi, modelli e applicazioni 2004, XII+426 pp, ISBN 88-470-0259-1 15. G. Riccardi Calcolo differenziale ed integrale 2004, XII+314 pp, ISBN 88-470-0285-0 16. M. Impedovo Matematica generale con il calcolatore 2005, X+526 pp, ISBN 88-470-0258-3 17. L. Formaggia, F. Saleri, A. Veneziani Applicazioni ed esercizi di modellistica numerica per problemi differenziali 2005, VIII+396 pp, ISBN 88-470-0257-5 18. S. Salsa, G. Verzini Equazioni a derivate parziali -Complementi ed esercizi 2005, VIII+406 pp, ISBN 88-470-0260-5 2007, ristampa con modifiche 19. C. Canuto, A. Tabacco Analisi Matematica I (2a Ed.) 2005, XII+448 pp, ISBN 88-470-0337-7 (1a edizione, 2003, XII+376 pp, ISBN 88-470-0220-6) 20. F. Biagini, M. Campanino Elementi di Probabilità e Statistica 2006, XII+236 pp, ISBN 88-470-0330-X
21. S. Leonesi, C. Toffalori Numeri e Crittografia 2006, VIII+178 pp, ISBN 88-470-0331-8 22. A. Quarteroni, F. Saleri Introduzione al Calcolo Scientifico (3a Ed.) 2006, X+306 pp, ISBN 88-470-0480-2 23. S. Leonesi, C. Toffalori Un invito all’Algebra 2006, XVII+432 pp, ISBN 88-470-0313-X 24. W.M. Baldoni, C. Ciliberto, G.M. Piacentini Cattaneo Aritmetica, Crittografia e Codici 2006, XVI+518 pp, ISBN 88-470-0455-1 25. A. Quarteroni Modellistica numerica per problemi differenziali (3a Ed.) 2006, XIV+452 pp, ISBN 88-470-0493-4 (1a edizione 2000, ISBN 88-470-0108-0) (2a edizione 2003, ISBN 88-470-0203-6) 26. M. Abate, F. Tovena Curve e superfici 2006, XIV+394 pp, ISBN 88-470-0535-3 27. L. Giuzzi Codici correttori 2006, XVI+402 pp, ISBN 88-470-0539-6 28. L. Robbiano Algebra lineare 2007, XVI+210 pp, ISBN 88-470-0446-2 29. E. Rosazza Gianin, C. Sgarra Esercizi di finanza matematica 2007, X+184 pp,ISBN 978-88-470-0610-2 30. A. Machì Gruppi - Una introduzione a idee e metodi della Teoria dei Gruppi 2007, XII+350 pp, ISBN 978-88-470-0622-5
31 Y. Biollay, A. Chaabouni, J. Stubbe Matematica si parte! A cura di A. Quarteroni 2007, XII+196 pp, ISBN 978-88-470-0675-1 32. M. Manetti Topologia 2008, XII+298 pp, ISBN 978-88-470-0756-7 33. A. Pascucci Calcolo stocastico per la finanza 2008, XVI+518 pp, ISBN 978-88-470-0600-3 34. A. Quarteroni, R. Sacco, F. Saleri Matematica numerica (3a Ed.) 2008, XVI+510 pp, ISBN 978-88-470-0782-6 35. P. Cannarsa, T. D’Aprile Introduzione alla teoria della misura e all’analisi funzionale 2008, XII+268 pp, ISBN 978-88-470-0701-7 36. A. Quarteroni, F. Saleri Calcolo scientifico (4a Ed.) 2008, XIV+358 pp, ISBN 978-88-470-0837-3 37. C. Canuto, A. Tabacco Analisi Matematica I (3a Ed.) 2008, XIV+452 pp, ISBN 978-88-470-0871-3 38. S. Gabelli Teoria delle Equazioni e Teoria di Galois 2008, XVI+410 pp, ISBN 978-88-470-0618-8 39. A. Quarteroni Modellistica numerica per problemi differenziali (4a Ed.) 2008, XVI+560 pp, ISBN 978-88-470-0841-0 40. C. Canuto, A. Tabacco Analisi Matematica II 2008, XVI+536 pp, ISBN 978-88-470-0873-1
41. E. Salinelli, F. Tomarelli Modelli Dinamici Discreti 2009, XIV+382 pp, ISBN 978-88-470-1075-8 42. S. Salsa, F.M.G. Vegni, A. Zaretti, P. Zunino Invito alle equazioni a derivate parziali 2009, XIV+440 pp, ISBN 978-88-470-1179-3 43. S. Dulli, S. Furini, E. Peron Data mining 2009, XIV+178 pp, ISBN 978-88-470-1162-5 44. A. Pascucci, W.J. Runggaldier Finanza Matematica 2009, X+264 pp, ISBN 978-88-470-1441-1 45. S. Salsa Equazioni a derivate parziali – Metodi, modelli e applicazioni (2a Ed.) 2010, XVI+614 pp, ISBN 978-88-470-1645-3 46. C. D’Angelo, A. Quarteroni Matematica Numerica – Esercizi, Laboratori e Progetti 2010, VIII+374 pp, ISBN 978-88-470-1639-2 47. V. Moretti Teoria Spettrale e Meccanica Quantistica – Operatori in spazi di Hilbert 2010, XVI+704 pp, ISBN 978-88-470-1610-1